23 April 2022, Hessen, Frankfurt/Main: The Pokemon Pikachu, taken at the Pokemon European Championship, which is taking place again after a break of several years. Played with trading cards, on video game consoles and cell phones. Pokemon is all about collecting and training the monsters. Spectators were also allowed in the Frankfurt exhibition halls. Photo: Hannes P. Albert/dpa (Photo by Hannes P. Albert/picture alliance via Getty Images)

Image Credits:picture alliance / Getty Images

هوش مصنوعی جمینای گوگل بازی پوکمون بلو را به پایان رساند (با کمک)

مدل هوش مصنوعی گران‌قیمت گوگل به نظر می‌رسد به یک نقطه عطف مهم رسیده است: شکست دادن یک بازی ویدیویی ۲۹ ساله. شب گذشته، ساندار پیچای، مدیرعامل گوگل، پستی منتشر کرد.

۱۴۰۴/۰۲/۱۳

گزارش‌ها حاکی از آن است که مدل هوش مصنوعی جمینای ۲.۵ پرو گوگل موفق به پایان رساندن بازی کلاسیک پوکمون بلو شده است. این اقدام توسط یک مهندس نرم‌افزار مستقل با کمک گوگل انجام شد و نشان‌دهنده توانایی‌های هوش مصنوعی در انجام کارهای غیرمنتظره است.

به نظر می‌رسد گران‌ترین مدل هوش مصنوعی گوگل به یک نقطه عطف مهم دست یافته است: پایان رساندن یک بازی ویدیویی ۲۹ ساله.

شب گذشته، ساندار پیچای، مدیرعامل گوگل، با انتشار پستی در ایکس (X)، با ابراز پیروزی نوشت: «چه پایانی! جمینای ۲.۵ پرو فقط بازی پوکمون بلو را تکمیل کرد!»

برای روشن شدن موضوع، پخش زنده «جمینای پوکمون بازی می‌کند» (Gemini Plays Pokemon) توسط فردی با نام «جوئل ز» (Joel Z) ایجاد شده است که به گفته خودش «یک مهندس نرم‌افزار ۳۰ ساله و نامرتبط با گوگل» است. با این حال، مدیران گوگل از این تلاش حمایت کرده‌اند.

به عنوان مثال، لوگان کیلپاتریک (Logan Kilpatrick)، سرپرست محصول استودیوی هوش مصنوعی گوگل، ماه گذشته پستی منتشر کرد مبنی بر اینکه جمینای «پیشرفت زیادی در تکمیل پوکمون داشته» و «پنجمین نشان خود را کسب کرده است (بهترین مدل بعدی تا کنون فقط ۳ نشان دارد، هرچند با یک رابط عامل (agent harness) متفاوت)»، که منجر به شوخی پیچای شد که گفت: «ما در حال کار بر روی API، هوش مصنوعی پوکمون مصنوعی (Artificial Pokemon Intelligence) هستیم.»

چرا پوکمون؟ در ماه فوریه، شرکت آنتروپیک (Anthropic) پیشرفت‌هایی را که مدل‌های هوش مصنوعی کلاد (Claude) آن در «پوکمون رد» (Pokemon Red) داشته‌اند، برجسته کرد و نوشت که «تفکر گسترده و آموزش عامل» کلاد «تقویت بزرگی» در کارهای «غیرمنتظره‌تر»، مانند انجام یک بازی کلاسیک، به آن می‌دهد. («پوکمون رد» و «بلو» نسخه‌های متفاوتی از یک عنوان گیم‌بوی (GameBoy) هستند که اولین بار در سال ۱۹۹۶ منتشر شدند و به مجموعه طولانی‌مدت پوکمون مرتبط هستند). حتی یک کانال توییچ (Twitch) به نام «کلاد پوکمون بازی می‌کند» (Claude Plays Pokemon) وجود دارد که جوئل ز از آن به عنوان الهام‌بخش یاد کرده است.

با وجود پیشرفت‌هایش، به نظر نمی‌رسد کلاد هنوز «پوکمون رد» را شکست داده باشد. آیا این بدان معناست که جمینای به طور عینی در این بازی بهتر است؟ در صفحه توییچ خود، جوئل ز از بینندگان درخواست کرد: «لطفاً این را یک معیار برای میزان خوب بازی کردن پوکمون توسط یک مدل زبان بزرگ (LLM) در نظر نگیرید. نمی‌توانید مقایسه‌های مستقیمی انجام دهید – جمینای و کلاد ابزارهای متفاوت و اطلاعات متفاوتی دریافت می‌کنند.»

و هر دو مدل هوش مصنوعی برای بازی کردن نیاز به کمک دارند – اینجاست که رابط‌های عامل (agent harness) ذکر شده وارد می‌شوند، که اسکرین‌شات‌های بازی را با اطلاعات اضافی روی هم قرار می‌دهند و به مدل اجازه می‌دهند تصمیم بگیرد چگونه پاسخ دهد (که ممکن است شامل فراخوانی عوامل تخصصی شود)، و سپس دکمه مربوط به دستور هوش مصنوعی را فشار می‌دهد.

جوئل ز اذعان کرد که «مداخلات توسعه‌دهنده» دیگری نیز برای کمک به جمینای در تکمیل بازی وجود داشته است، اما اصرار داشت که این تقلب نیست.

او می‌گوید: «مداخلات من توانایی‌های تصمیم‌گیری و استدلال کلی جمینای را بهبود می‌بخشند. من نکات خاصی نمی‌دهم – هیچ راهنما یا دستورالعمل مستقیمی برای چالش‌های خاص مانند کوه مون (Mt. Moon) وجود ندارد. تنها چیزی که حتی نزدیک به آن است، این است که به جمینای اطلاع دهیم که برای به دست آوردن کلید آسانسور (Lift Key) باید دو بار با یک سرباز راکت (Rocket Grunt) صحبت کند، که این یک باگ بود که بعداً در پوکمون یلو (Pokemon Yellow) رفع شد.»

او همچنین گفت: «پخش زنده جمینای پوکمون بازی می‌کند هنوز فعالانه در حال توسعه است و چارچوب آن به تکامل خود ادامه می‌دهد.»

منبع: تک‌کرانچ

هوش مصنوعی آنتروپیک بازی گوگل ال ال ام