
Image Credits:picture alliance / Getty Images
هوش مصنوعی جمینای گوگل بازی پوکمون بلو را به پایان رساند (با کمک)
مدل هوش مصنوعی گرانقیمت گوگل به نظر میرسد به یک نقطه عطف مهم رسیده است: شکست دادن یک بازی ویدیویی ۲۹ ساله. شب گذشته، ساندار پیچای، مدیرعامل گوگل، پستی منتشر کرد.
۱۴۰۴/۰۲/۱۳
گزارشها حاکی از آن است که مدل هوش مصنوعی جمینای ۲.۵ پرو گوگل موفق به پایان رساندن بازی کلاسیک پوکمون بلو شده است. این اقدام توسط یک مهندس نرمافزار مستقل با کمک گوگل انجام شد و نشاندهنده تواناییهای هوش مصنوعی در انجام کارهای غیرمنتظره است.
به نظر میرسد گرانترین مدل هوش مصنوعی گوگل به یک نقطه عطف مهم دست یافته است: پایان رساندن یک بازی ویدیویی ۲۹ ساله.
شب گذشته، ساندار پیچای، مدیرعامل گوگل، با انتشار پستی در ایکس (X)، با ابراز پیروزی نوشت: «چه پایانی! جمینای ۲.۵ پرو فقط بازی پوکمون بلو را تکمیل کرد!»
برای روشن شدن موضوع، پخش زنده «جمینای پوکمون بازی میکند» (Gemini Plays Pokemon) توسط فردی با نام «جوئل ز» (Joel Z) ایجاد شده است که به گفته خودش «یک مهندس نرمافزار ۳۰ ساله و نامرتبط با گوگل» است. با این حال، مدیران گوگل از این تلاش حمایت کردهاند.
به عنوان مثال، لوگان کیلپاتریک (Logan Kilpatrick)، سرپرست محصول استودیوی هوش مصنوعی گوگل، ماه گذشته پستی منتشر کرد مبنی بر اینکه جمینای «پیشرفت زیادی در تکمیل پوکمون داشته» و «پنجمین نشان خود را کسب کرده است (بهترین مدل بعدی تا کنون فقط ۳ نشان دارد، هرچند با یک رابط عامل (agent harness) متفاوت)»، که منجر به شوخی پیچای شد که گفت: «ما در حال کار بر روی API، هوش مصنوعی پوکمون مصنوعی (Artificial Pokemon Intelligence) هستیم.»
چرا پوکمون؟ در ماه فوریه، شرکت آنتروپیک (Anthropic) پیشرفتهایی را که مدلهای هوش مصنوعی کلاد (Claude) آن در «پوکمون رد» (Pokemon Red) داشتهاند، برجسته کرد و نوشت که «تفکر گسترده و آموزش عامل» کلاد «تقویت بزرگی» در کارهای «غیرمنتظرهتر»، مانند انجام یک بازی کلاسیک، به آن میدهد. («پوکمون رد» و «بلو» نسخههای متفاوتی از یک عنوان گیمبوی (GameBoy) هستند که اولین بار در سال ۱۹۹۶ منتشر شدند و به مجموعه طولانیمدت پوکمون مرتبط هستند). حتی یک کانال توییچ (Twitch) به نام «کلاد پوکمون بازی میکند» (Claude Plays Pokemon) وجود دارد که جوئل ز از آن به عنوان الهامبخش یاد کرده است.
با وجود پیشرفتهایش، به نظر نمیرسد کلاد هنوز «پوکمون رد» را شکست داده باشد. آیا این بدان معناست که جمینای به طور عینی در این بازی بهتر است؟ در صفحه توییچ خود، جوئل ز از بینندگان درخواست کرد: «لطفاً این را یک معیار برای میزان خوب بازی کردن پوکمون توسط یک مدل زبان بزرگ (LLM) در نظر نگیرید. نمیتوانید مقایسههای مستقیمی انجام دهید – جمینای و کلاد ابزارهای متفاوت و اطلاعات متفاوتی دریافت میکنند.»
و هر دو مدل هوش مصنوعی برای بازی کردن نیاز به کمک دارند – اینجاست که رابطهای عامل (agent harness) ذکر شده وارد میشوند، که اسکرینشاتهای بازی را با اطلاعات اضافی روی هم قرار میدهند و به مدل اجازه میدهند تصمیم بگیرد چگونه پاسخ دهد (که ممکن است شامل فراخوانی عوامل تخصصی شود)، و سپس دکمه مربوط به دستور هوش مصنوعی را فشار میدهد.
جوئل ز اذعان کرد که «مداخلات توسعهدهنده» دیگری نیز برای کمک به جمینای در تکمیل بازی وجود داشته است، اما اصرار داشت که این تقلب نیست.
او میگوید: «مداخلات من تواناییهای تصمیمگیری و استدلال کلی جمینای را بهبود میبخشند. من نکات خاصی نمیدهم – هیچ راهنما یا دستورالعمل مستقیمی برای چالشهای خاص مانند کوه مون (Mt. Moon) وجود ندارد. تنها چیزی که حتی نزدیک به آن است، این است که به جمینای اطلاع دهیم که برای به دست آوردن کلید آسانسور (Lift Key) باید دو بار با یک سرباز راکت (Rocket Grunt) صحبت کند، که این یک باگ بود که بعداً در پوکمون یلو (Pokemon Yellow) رفع شد.»
او همچنین گفت: «پخش زنده جمینای پوکمون بازی میکند هنوز فعالانه در حال توسعه است و چارچوب آن به تکامل خود ادامه میدهد.»
منبع: تککرانچ