TOKYO, JAPAN - FEBRUARY 3: Open AI CEO Sam Altman speaks during a talk session with SoftBank Group CEO Masayoshi Son at an event titled "Transforming Business through AI" in Tokyo, Japan, on February 03, 2025. SoftBank and OpenAI announced that they have agreed a partnership to set up a joint venture for artificial intelligence services in Japan today. (Photo by Tomohiro Ohsumi/Getty Images)

Image Credits:Tomohiro Ohsumi / Getty Images

اوپن‌ای‌آی درباره علت چاپلوس شدن مدل GPT-4o توضیح داد

خلاصه‌ای از گزارش اوپن‌ای‌آی درباره مشکل تملق‌آمیز شدن مدل هوش مصنوعی GPT-4o در ChatGPT و اقدامات این شرکت برای رفع آن.

۱۴۰۴/۰۲/۱۰

اوپن‌ای‌آی اعلام کرد که به‌روزرسانی اخیر مدل GPT-4o در ChatGPT باعث شده بود این مدل بیش از حد موافق و تأییدکننده شود. این شرکت این به‌روزرسانی را بازگردانده و در حال پیاده‌سازی اصلاحاتی برای رفع این مشکل بر اساس بازخوردهای دریافتی است.

شرکت اوپن‌ای‌آی (OpenAI) اخیراً گزارشی درباره مشکل تملق‌آمیز شدن مدل پیش‌فرض هوش مصنوعی ChatGPT، مدل GPT-4o، منتشر کرده است. این مشکل باعث شد شرکت مجبور به بازگرداندن به‌روزرسانی هفته گذشته این مدل شود.

آخر هفته گذشته، پس از به‌روزرسانی مدل GPT-4o، کاربران در شبکه‌های اجتماعی متوجه شدند که ChatGPT به روشی بیش از حد تأییدکننده و موافق پاسخ می‌دهد. این موضوع به سرعت تبدیل به یک میم (meme) شد و کاربران اسکرین‌شات‌هایی منتشر کردند که نشان می‌داد ChatGPT تصمیمات و ایده‌های مشکل‌ساز و حتی خطرناک را تأیید می‌کند.

سم آلتمن (Sam Altman)، مدیرعامل اوپن‌ای‌آی، روز یکشنبه در پستی در شبکه X به این مشکل اذعان کرد و گفت که اوپن‌ای‌آی "در اسرع وقت" روی رفع آن کار خواهد کرد. دو روز بعد، آلتمن اعلام کرد که به‌روزرسانی GPT-4o بازگردانده شده است و اوپن‌ای‌آی روی "اصلاحات بیشتری" برای شخصیت مدل کار می‌کند.

بر اساس گفته‌های اوپن‌ای‌آی، این به‌روزرسانی که قرار بود شخصیت پیش‌فرض مدل را "شهودی‌تر و مؤثرتر" کند، بیش از حد تحت تأثیر "بازخوردهای کوتاه‌مدت" قرار گرفت و "به‌طور کامل حساب نکرد که تعاملات کاربران با ChatGPT چگونه در طول زمان تکامل می‌یابد." اوپن‌ای‌آی در پستی وبلاگی نوشت: "در نتیجه، GPT-4o به سمت پاسخ‌هایی متمایل شد که بیش از حد حمایت‌کننده اما غیرصادقانه بودند." "تعاملات تملق‌آمیز (sycophantic) می‌تواند ناخوشایند، نگران‌کننده و باعث ناراحتی شود. ما کوتاهی کردیم و در حال کار برای اصلاح آن هستیم."

اوپن‌ای‌آی می‌گوید در حال پیاده‌سازی چندین راه‌حل است، از جمله اصلاح تکنیک‌های اصلی آموزش مدل و دستورالعمل‌های سیستمی (system prompts) برای هدایت صریح GPT-4o به دور از تملق‌آمیزی. این شرکت همچنین در حال ساخت موانع محافظتی ایمنی بیشتری است تا "صداقت و شفافیت مدل را افزایش دهد" و به گسترش ارزیابی‌های خود برای "کمک به شناسایی مسائلی فراتر از تملق‌آمیزی" ادامه می‌دهد.

اوپن‌ای‌آی همچنین می‌گوید در حال آزمایش روش‌هایی برای اجازه دادن به کاربران برای ارائه "بازخورد بی‌درنگ" (real-time feedback) است تا "به طور مستقیم بر تعاملات خود با ChatGPT تأثیر بگذارند" و از بین چندین شخصیت ChatGPT انتخاب کنند. این شرکت در پست وبلاگی خود نوشت: "ما در حال بررسی راه‌های جدید برای گنجاندن بازخورد گسترده‌تر و دموکراتیک در رفتارهای پیش‌فرض ChatGPT هستیم." "امیدواریم این بازخورد به ما کمک کند تا ارزش‌های فرهنگی متنوع در سراسر جهان را بهتر منعکس کنیم و بفهمیم شما چگونه می‌خواهید ChatGPT تکامل یابد [...] ما همچنین معتقدیم کاربران باید کنترل بیشتری بر نحوه رفتار ChatGPT داشته باشند و تا جایی که ایمن و عملی است، در صورت عدم موافقت با رفتار پیش‌فرض، تغییراتی ایجاد کنند."

منبع: تک‌کرانچ

هوش مصنوعی هوش مصنوعی مولد ال ال ام اوپن ای آی