OpenAI ChatGPT website displayed on a laptop screen is seen in this illustration photo taken in Krakow, Poland on September 9, 2024. (Photo by Jakub Porzycki/NurPhoto via Getty Images)
هوش مصنوعی

اوپن‌ای‌آی مدل هوش مصنوعی عامل «اپراتور» خود را ارتقا می‌دهد

اوپن‌ای‌آی در حال به‌روزرسانی مدل هوش مصنوعی قدرت‌بخش عامل «اپراتور» است که امکان گشت‌وگذار مستقل در وب و استفاده از نرم‌افزارها در ماشین مجازی ابری را فراهم می‌کند.

۱۴۰۴/۰۳/۰۲

اوپن‌ای‌آی اعلام کرده است که مدل هوش مصنوعی عامل «اپراتور» خود را از نسخه‌ای سفارشی‌شده از GPT-4o به مدلی مبتنی بر o3 ارتقا می‌دهد؛ این تغییر با تمرکز بر قابلیت‌های پیشرفته‌تر استدلال و تنظیمات ایمنی جدید صورت می‌گیرد.

اوپن‌ای‌آی (OpenAI) در حال به‌روزرسانی مدل هوش مصنوعی است که قدرت‌بخش «اپراتور» (Operator)، عامل هوش مصنوعی آن، است. این عامل می‌تواند به‌طور مستقل در وب گشت‌وگذار کرده و از نرم‌افزارهای خاصی در یک «ماشین مجازی» (virtual machine) میزبانی‌شده ابری برای برآورده کردن درخواست‌های کاربران استفاده کند.

به‌زودی، اپراتور از مدلی مبتنی بر o3 استفاده خواهد کرد که یکی از جدیدترین مدل‌های سری «استدلالی» (reasoning) o اوپن‌ای‌آی است. پیش از این، اپراتور به نسخه‌ای سفارشی‌شده از «جی‌پی‌تی-۴او» (GPT-4o) متکی بود.

بر اساس بسیاری از «معیارهای سنجش» (benchmarks)، o3 یک مدل بسیار پیشرفته‌تر است، به‌ویژه در وظایف مربوط به ریاضیات و استدلال.

اوپن‌ای‌آی در پستی وبلاگی نوشت: «ما مدل مبتنی بر GPT-4o موجود برای اپراتور را با نسخه‌ای مبتنی بر o3 اوپن‌ای‌آی جایگزین می‌کنیم.» و افزود: «نسخه «ای‌پی‌آی» (API) [اپراتور] همچنان بر پایه 4o خواهد ماند.»

اپراتور یکی از چندین ابزار «عامل‌محور» (agentic tools) است که در ماه‌های اخیر توسط شرکت‌های هوش مصنوعی منتشر شده‌اند. شرکت‌ها در حال رقابت برای ساخت عامل‌های بسیار پیچیده‌ای هستند که بتوانند وظایف را به‌طور قابل اعتماد و کم‌وبیش بدون نظارت انجام دهند.

گوگل از طریق API جمینای (Gemini) خود یک عامل «استفاده از کامپیوتر» (computer use) ارائه می‌دهد که به‌طور مشابه می‌تواند در وب گشت‌وگذار کرده و اقداماتی را به نمایندگی از کاربران انجام دهد؛ همچنین یک سرویس بیشتر متمرکز بر مصرف‌کننده به نام مارینر (Mariner) دارد. مدل‌های آنتروپیک (Anthropic) نیز قادر به انجام وظایف کامپیوتری، از جمله باز کردن فایل‌ها و پیمایش صفحات وب هستند.

به گفته اوپن‌ای‌آی، مدل جدید اپراتور، با نام o3 اپراتور (o3 Operator)، «با داده‌های ایمنی اضافی برای استفاده از کامپیوتر، دقیق تنظیم شده است»، از جمله مجموعه‌داده‌هایی که برای «آموزش مرزهای تصمیم‌گیری [اوپن‌ای‌آی] در مورد تاییدها و رد کردن‌ها به مدل» طراحی شده‌اند.

اوپن‌ای‌آی گزارشی فنی منتشر کرده است که عملکرد o3 اپراتور را در ارزیابی‌های ایمنی خاص نشان می‌دهد. بر اساس گزارش فنی، در مقایسه با مدل GPT-4o اپراتور، o3 اپراتور کمتر احتمال دارد از انجام فعالیت‌های «غیرقانونی» و جستجوی داده‌های شخصی حساس خودداری کند و کمتر در برابر شکلی از حملات هوش مصنوعی معروف به «تزریق پرامپت» (prompt injection) آسیب‌پذیر است.

اوپن‌ای‌آی در پست وبلاگ خود نوشت: «o3 اپراتور از همان رویکرد چندلایه به ایمنی که برای نسخه 4o اپراتور استفاده کردیم، بهره می‌برد.» و افزود: «اگرچه o3 اپراتور قابلیت‌های کدنویسی o3 را به ارث می‌برد، اما دسترسی بومی به محیط کدنویسی یا «ترمینال» (terminal) ندارد.»

منبع: تک‌کرانچ

به مطالعه ادامه دهید