طبق توضیحات OpenAI، هدف از بهروزرسانی اخیر این بود که شخصیت پیشفرض مدل طبیعیتر و مؤثرتر به نظر برسد، اما این تغییرات بیشتر بر اساس بازخوردهای کوتاهمدت طراحی شده بودند
پس از انتشار بهروزرسانی جدید مدل GPT-4o در ChatGPT، کاربران بهسرعت متوجه تغییرات غیرمنتظره در رفتار این ربات شدند. بهطور خاص، چتبات به گونهای پاسخ میداد که گویی با هر حرف و تصمیمی، حتی اشتباهات یا مواضع خطرناک، موافق است. این تغییرات به سرعت تبدیل به سوژهای برای طنز در شبکههای اجتماعی شد. در واکنش به این انتقادها، سم آلتمن، مدیرعامل OpenAI، اعلام کرد که این رفتار غیرعادی ناشی از مشکل در نسخهی جدید است و تیم توسعه بهسرعت در حال بررسی آن است. تنها دو روز پس از این اعلامیه، نسخهی جدید مدل بهطور کامل بازگشت و OpenAI قول داد تغییراتی برای بهبود شخصیت مدل اعمال کند. طبق توضیحات OpenAI، هدف از بهروزرسانی اخیر این بود که شخصیت پیشفرض مدل طبیعیتر و مؤثرتر به نظر برسد، اما این تغییرات بیشتر بر اساس بازخوردهای کوتاهمدت طراحی شده بودند و تأثیر تعاملات بلندمدت کاربران را در نظر نمیگرفتند. چتبات ChatGPT حالا مهارت بیشتری در خرید کردن دارد اشتباه در ساختار مدل جدید باعث شد تا GPT-4o رفتار چاپلوسانه و غیرصادقانهای از خود نشان دهد؛ رفتاری که میتواند برای کاربران ناراحتکننده و حتی مضر باشد. OpenAI با پذیرش این اشتباه اعلام کرد در حال بازبینی روشهای آموزش و طراحی دستورهای سیستمی است تا از بروز چنین مشکلاتی جلوگیری شود. در نهایت، OpenAI در تلاش است تا ابزارهایی را فراهم کند که کاربران از طریق آنها بتوانند بازخورد لحظهای ارائه دهند، شخصیت دلخواه خود را انتخاب کنند و تجربهای شخصیتر از ChatGPT داشته باشند. این شرکت همچنین میخواهد بازخوردهای فرهنگی و دموکراتیک را در طراحی رفتار پیشفرض مدل وارد کند تا به کاربران کنترل بیشتری داده شود.