
Image Credits:Kim Jae-Hwan/SOPA Images/LightRocket / Getty Images
OpenAI مدل هوش مصنوعی o3-pro را عرضه کرد؛ ادعای توانمندترین مدل تاکنون
اوپنایآی مدل هوش مصنوعی جدید o3-pro را عرضه کرده که ادعا میشود توانمندترین مدل این شرکت تا به امروز است.
۱۴۰۴/۰۳/۲۰
اوپنایآی مدل هوش مصنوعی o3-pro، نسخه بهبودیافته مدل استدلالی o3 را عرضه کرد. این مدل که ادعا میشود توانمندترین مدل شرکت است، برای کاربران مختلفی از سهشنبه در دسترس قرار گرفته و در بنچماردهایی مانند AIME 2024 و GPQA Diamond عملکرد خوبی از خود نشان داده است. با این حال، محدودیتهایی مانند عدم پشتیبانی از تولید تصویر و کندتر بودن در برخی موارد را نیز دارد.
اوپنایآی (OpenAI) مدل هوش مصنوعی (AI) جدیدی به نام o3-pro را عرضه کرده است که این شرکت ادعا میکند توانمندترین مدل آنها تاکنون است.
مدل o3-pro نسخهای از o3، مدل استدلالی (reasoning model) اوپنایآی است که این استارتاپ اوایل سال جاری عرضه کرد. برخلاف مدلهای هوش مصنوعی مرسوم، مدلهای استدلالی مسائل را گام به گام حل میکنند و این امر به آنها امکان میدهد در حوزههایی مانند فیزیک، ریاضی و برنامهنویسی قابل اعتمادتر عمل کنند.
اوپنایآی اعلام کرده که o3-pro از روز سهشنبه برای کاربران ChatGPT Pro و Team در دسترس قرار گرفته و جایگزین مدل o1-pro شده است. کاربران Enterprise و Edu نیز هفته آینده به این مدل دسترسی پیدا خواهند کرد. همچنین o3-pro از بعدازظهر امروز در API توسعهدهندگان اوپنایآی نیز فعال شده است.
قیمت o3-pro در API برای هر میلیون توکن ورودی (input tokens) ۲۰ دلار و برای هر میلیون توکن خروجی (output tokens) ۸۰ دلار تعیین شده است. توکنهای ورودی، توکنهایی هستند که به مدل داده میشوند، در حالی که توکنهای خروجی، توکنهایی هستند که مدل بر اساس توکنهای ورودی تولید میکند. یک میلیون توکن ورودی معادل حدود ۷۵۰ هزار کلمه است که کمی طولانیتر از رمان «جنگ و صلح» است.
اوپنایآی در گزارش تغییرات خود مینویسد: «در ارزیابیهای تخصصی، بازبینان به طور پیوسته o3-pro را در تمام دستههای آزمایششده، به ویژه در حوزههای کلیدی مانند علم، آموزش، برنامهنویسی، کسبوکار و کمک به نگارش، به o3 ترجیح دادهاند.» این شرکت اضافه کرد: «بازبینان همچنین o3-pro را به طور پیوسته برای وضوح، جامعیت، پیروی از دستورالعملها و دقت بالاتر ارزیابی کردند.»
به گفته اوپنایآی، o3-pro به ابزارهایی دسترسی دارد که به آن امکان میدهد وب را جستجو کند، فایلها را تجزیه و تحلیل نماید، درباره ورودیهای بصری استدلال کند، از پایتون استفاده کند، پاسخهای خود را با بهرهگیری از حافظه شخصیسازی نماید و موارد دیگر. طبق گفته اوپنایآی، یک نقطه ضعف این مدل این است که زمان لازم برای تکمیل پاسخهای آن معمولاً طولانیتر از o1-pro است.
o3-pro محدودیتهای دیگری نیز دارد. چتهای موقت با این مدل در ChatGPT فعلاً غیرفعال شدهاند تا اوپنایآی یک «مسئله فنی» را حل کند. o3-pro نمیتواند تصویر تولید کند و Canvas، ویژگی فضای کاری مبتنی بر هوش مصنوعی اوپنایآی، توسط o3-pro پشتیبانی نمیشود.
از سوی دیگر، بر اساس آزمایشهای داخلی اوپنایآی، o3-pro در بنچمارکهای (benchmarks) محبوب هوش مصنوعی امتیازات چشمگیری کسب کرده است. در آزمون AIME 2024 که مهارتهای ریاضی مدل را ارزیابی میکند، o3-pro بهتر از مدل برتر گوگل، Gemini 2.5 Pro، عمل کرده است. o3-pro همچنین مدل تازه عرضهشده Claude 4 Opus از شرکت Anthropic را در GPQA Diamond، آزمونی برای دانش علمی در سطح دکترا، شکست داده است.
منبع: تککرانچ