
Image Credits:Tomohiro Ohsumi / Getty Images
اوپنایآی درباره علت چاپلوس شدن مدل GPT-4o توضیح داد
خلاصهای از گزارش اوپنایآی درباره مشکل تملقآمیز شدن مدل هوش مصنوعی GPT-4o در ChatGPT و اقدامات این شرکت برای رفع آن.
۱۴۰۴/۰۲/۱۰
اوپنایآی اعلام کرد که بهروزرسانی اخیر مدل GPT-4o در ChatGPT باعث شده بود این مدل بیش از حد موافق و تأییدکننده شود. این شرکت این بهروزرسانی را بازگردانده و در حال پیادهسازی اصلاحاتی برای رفع این مشکل بر اساس بازخوردهای دریافتی است.
شرکت اوپنایآی (OpenAI) اخیراً گزارشی درباره مشکل تملقآمیز شدن مدل پیشفرض هوش مصنوعی ChatGPT، مدل GPT-4o، منتشر کرده است. این مشکل باعث شد شرکت مجبور به بازگرداندن بهروزرسانی هفته گذشته این مدل شود.
آخر هفته گذشته، پس از بهروزرسانی مدل GPT-4o، کاربران در شبکههای اجتماعی متوجه شدند که ChatGPT به روشی بیش از حد تأییدکننده و موافق پاسخ میدهد. این موضوع به سرعت تبدیل به یک میم (meme) شد و کاربران اسکرینشاتهایی منتشر کردند که نشان میداد ChatGPT تصمیمات و ایدههای مشکلساز و حتی خطرناک را تأیید میکند.
سم آلتمن (Sam Altman)، مدیرعامل اوپنایآی، روز یکشنبه در پستی در شبکه X به این مشکل اذعان کرد و گفت که اوپنایآی "در اسرع وقت" روی رفع آن کار خواهد کرد. دو روز بعد، آلتمن اعلام کرد که بهروزرسانی GPT-4o بازگردانده شده است و اوپنایآی روی "اصلاحات بیشتری" برای شخصیت مدل کار میکند.
بر اساس گفتههای اوپنایآی، این بهروزرسانی که قرار بود شخصیت پیشفرض مدل را "شهودیتر و مؤثرتر" کند، بیش از حد تحت تأثیر "بازخوردهای کوتاهمدت" قرار گرفت و "بهطور کامل حساب نکرد که تعاملات کاربران با ChatGPT چگونه در طول زمان تکامل مییابد." اوپنایآی در پستی وبلاگی نوشت: "در نتیجه، GPT-4o به سمت پاسخهایی متمایل شد که بیش از حد حمایتکننده اما غیرصادقانه بودند." "تعاملات تملقآمیز (sycophantic) میتواند ناخوشایند، نگرانکننده و باعث ناراحتی شود. ما کوتاهی کردیم و در حال کار برای اصلاح آن هستیم."
اوپنایآی میگوید در حال پیادهسازی چندین راهحل است، از جمله اصلاح تکنیکهای اصلی آموزش مدل و دستورالعملهای سیستمی (system prompts) برای هدایت صریح GPT-4o به دور از تملقآمیزی. این شرکت همچنین در حال ساخت موانع محافظتی ایمنی بیشتری است تا "صداقت و شفافیت مدل را افزایش دهد" و به گسترش ارزیابیهای خود برای "کمک به شناسایی مسائلی فراتر از تملقآمیزی" ادامه میدهد.
اوپنایآی همچنین میگوید در حال آزمایش روشهایی برای اجازه دادن به کاربران برای ارائه "بازخورد بیدرنگ" (real-time feedback) است تا "به طور مستقیم بر تعاملات خود با ChatGPT تأثیر بگذارند" و از بین چندین شخصیت ChatGPT انتخاب کنند. این شرکت در پست وبلاگی خود نوشت: "ما در حال بررسی راههای جدید برای گنجاندن بازخورد گستردهتر و دموکراتیک در رفتارهای پیشفرض ChatGPT هستیم." "امیدواریم این بازخورد به ما کمک کند تا ارزشهای فرهنگی متنوع در سراسر جهان را بهتر منعکس کنیم و بفهمیم شما چگونه میخواهید ChatGPT تکامل یابد [...] ما همچنین معتقدیم کاربران باید کنترل بیشتری بر نحوه رفتار ChatGPT داشته باشند و تا جایی که ایمن و عملی است، در صورت عدم موافقت با رفتار پیشفرض، تغییراتی ایجاد کنند."
منبع: تککرانچ