
Image Credits:Jakub Porzycki/NurPhoto / Getty Images
اوپنایآی مدل هوش مصنوعی عامل «اپراتور» خود را ارتقا میدهد
اوپنایآی در حال بهروزرسانی مدل هوش مصنوعی قدرتبخش عامل «اپراتور» است که امکان گشتوگذار مستقل در وب و استفاده از نرمافزارها در ماشین مجازی ابری را فراهم میکند.
۱۴۰۴/۰۳/۰۲
اوپنایآی اعلام کرده است که مدل هوش مصنوعی عامل «اپراتور» خود را از نسخهای سفارشیشده از GPT-4o به مدلی مبتنی بر o3 ارتقا میدهد؛ این تغییر با تمرکز بر قابلیتهای پیشرفتهتر استدلال و تنظیمات ایمنی جدید صورت میگیرد.
اوپنایآی (OpenAI) در حال بهروزرسانی مدل هوش مصنوعی است که قدرتبخش «اپراتور» (Operator)، عامل هوش مصنوعی آن، است. این عامل میتواند بهطور مستقل در وب گشتوگذار کرده و از نرمافزارهای خاصی در یک «ماشین مجازی» (virtual machine) میزبانیشده ابری برای برآورده کردن درخواستهای کاربران استفاده کند.
بهزودی، اپراتور از مدلی مبتنی بر o3 استفاده خواهد کرد که یکی از جدیدترین مدلهای سری «استدلالی» (reasoning) o اوپنایآی است. پیش از این، اپراتور به نسخهای سفارشیشده از «جیپیتی-۴او» (GPT-4o) متکی بود.
بر اساس بسیاری از «معیارهای سنجش» (benchmarks)، o3 یک مدل بسیار پیشرفتهتر است، بهویژه در وظایف مربوط به ریاضیات و استدلال.
اوپنایآی در پستی وبلاگی نوشت: «ما مدل مبتنی بر GPT-4o موجود برای اپراتور را با نسخهای مبتنی بر o3 اوپنایآی جایگزین میکنیم.» و افزود: «نسخه «ایپیآی» (API) [اپراتور] همچنان بر پایه 4o خواهد ماند.»
اپراتور یکی از چندین ابزار «عاملمحور» (agentic tools) است که در ماههای اخیر توسط شرکتهای هوش مصنوعی منتشر شدهاند. شرکتها در حال رقابت برای ساخت عاملهای بسیار پیچیدهای هستند که بتوانند وظایف را بهطور قابل اعتماد و کموبیش بدون نظارت انجام دهند.
گوگل از طریق API جمینای (Gemini) خود یک عامل «استفاده از کامپیوتر» (computer use) ارائه میدهد که بهطور مشابه میتواند در وب گشتوگذار کرده و اقداماتی را به نمایندگی از کاربران انجام دهد؛ همچنین یک سرویس بیشتر متمرکز بر مصرفکننده به نام مارینر (Mariner) دارد. مدلهای آنتروپیک (Anthropic) نیز قادر به انجام وظایف کامپیوتری، از جمله باز کردن فایلها و پیمایش صفحات وب هستند.
به گفته اوپنایآی، مدل جدید اپراتور، با نام o3 اپراتور (o3 Operator)، «با دادههای ایمنی اضافی برای استفاده از کامپیوتر، دقیق تنظیم شده است»، از جمله مجموعهدادههایی که برای «آموزش مرزهای تصمیمگیری [اوپنایآی] در مورد تاییدها و رد کردنها به مدل» طراحی شدهاند.
اوپنایآی گزارشی فنی منتشر کرده است که عملکرد o3 اپراتور را در ارزیابیهای ایمنی خاص نشان میدهد. بر اساس گزارش فنی، در مقایسه با مدل GPT-4o اپراتور، o3 اپراتور کمتر احتمال دارد از انجام فعالیتهای «غیرقانونی» و جستجوی دادههای شخصی حساس خودداری کند و کمتر در برابر شکلی از حملات هوش مصنوعی معروف به «تزریق پرامپت» (prompt injection) آسیبپذیر است.
اوپنایآی در پست وبلاگ خود نوشت: «o3 اپراتور از همان رویکرد چندلایه به ایمنی که برای نسخه 4o اپراتور استفاده کردیم، بهره میبرد.» و افزود: «اگرچه o3 اپراتور قابلیتهای کدنویسی o3 را به ارث میبرد، اما دسترسی بومی به محیط کدنویسی یا «ترمینال» (terminal) ندارد.»
منبع: تککرانچ