SEOUL, SOUTH KOREA - 2025/02/04: Open AI Chief Executive Officer Sam Altman speaks during the Kakao media day in Seoul. South Korean tech giant Kakao Corp. on February 4 announced partnership with OpenAI to use ChatGPT on its new artificial intelligence (AI) service joining a global alliance led by the U.S. AI company amid intensifying competition in the global AI market. (Photo by Kim Jae-Hwan/SOPA Images/LightRocket via Getty Images)
هوش مصنوعی

OpenAI مدل هوش مصنوعی o3-pro را عرضه کرد؛ ادعای توانمندترین مدل تاکنون

اوپن‌ای‌آی مدل هوش مصنوعی جدید o3-pro را عرضه کرده که ادعا می‌شود توانمندترین مدل این شرکت تا به امروز است.

۱۴۰۴/۰۳/۲۰

اوپن‌ای‌آی مدل هوش مصنوعی o3-pro، نسخه بهبودیافته مدل استدلالی o3 را عرضه کرد. این مدل که ادعا می‌شود توانمندترین مدل شرکت است، برای کاربران مختلفی از سه‌شنبه در دسترس قرار گرفته و در بنچماردهایی مانند AIME 2024 و GPQA Diamond عملکرد خوبی از خود نشان داده است. با این حال، محدودیت‌هایی مانند عدم پشتیبانی از تولید تصویر و کندتر بودن در برخی موارد را نیز دارد.

اوپن‌ای‌آی (OpenAI) مدل هوش مصنوعی (AI) جدیدی به نام o3-pro را عرضه کرده است که این شرکت ادعا می‌کند توانمندترین مدل آن‌ها تاکنون است.

مدل o3-pro نسخه‌ای از o3، مدل استدلالی (reasoning model) اوپن‌ای‌آی است که این استارتاپ اوایل سال جاری عرضه کرد. برخلاف مدل‌های هوش مصنوعی مرسوم، مدل‌های استدلالی مسائل را گام به گام حل می‌کنند و این امر به آن‌ها امکان می‌دهد در حوزه‌هایی مانند فیزیک، ریاضی و برنامه‌نویسی قابل اعتمادتر عمل کنند.

اوپن‌ای‌آی اعلام کرده که o3-pro از روز سه‌شنبه برای کاربران ChatGPT Pro و Team در دسترس قرار گرفته و جایگزین مدل o1-pro شده است. کاربران Enterprise و Edu نیز هفته آینده به این مدل دسترسی پیدا خواهند کرد. همچنین o3-pro از بعدازظهر امروز در API توسعه‌دهندگان اوپن‌ای‌آی نیز فعال شده است.

قیمت o3-pro در API برای هر میلیون توکن ورودی (input tokens) ۲۰ دلار و برای هر میلیون توکن خروجی (output tokens) ۸۰ دلار تعیین شده است. توکن‌های ورودی، توکن‌هایی هستند که به مدل داده می‌شوند، در حالی که توکن‌های خروجی، توکن‌هایی هستند که مدل بر اساس توکن‌های ورودی تولید می‌کند. یک میلیون توکن ورودی معادل حدود ۷۵۰ هزار کلمه است که کمی طولانی‌تر از رمان «جنگ و صلح» است.

اوپن‌ای‌آی در گزارش تغییرات خود می‌نویسد: «در ارزیابی‌های تخصصی، بازبینان به طور پیوسته o3-pro را در تمام دسته‌های آزمایش‌شده، به ویژه در حوزه‌های کلیدی مانند علم، آموزش، برنامه‌نویسی، کسب‌وکار و کمک به نگارش، به o3 ترجیح داده‌اند.» این شرکت اضافه کرد: «بازبینان همچنین o3-pro را به طور پیوسته برای وضوح، جامعیت، پیروی از دستورالعمل‌ها و دقت بالاتر ارزیابی کردند.»

به گفته اوپن‌ای‌آی، o3-pro به ابزارهایی دسترسی دارد که به آن امکان می‌دهد وب را جستجو کند، فایل‌ها را تجزیه و تحلیل نماید، درباره ورودی‌های بصری استدلال کند، از پایتون استفاده کند، پاسخ‌های خود را با بهره‌گیری از حافظه شخصی‌سازی نماید و موارد دیگر. طبق گفته اوپن‌ای‌آی، یک نقطه ضعف این مدل این است که زمان لازم برای تکمیل پاسخ‌های آن معمولاً طولانی‌تر از o1-pro است.

o3-pro محدودیت‌های دیگری نیز دارد. چت‌های موقت با این مدل در ChatGPT فعلاً غیرفعال شده‌اند تا اوپن‌ای‌آی یک «مسئله فنی» را حل کند. o3-pro نمی‌تواند تصویر تولید کند و Canvas، ویژگی فضای کاری مبتنی بر هوش مصنوعی اوپن‌ای‌آی، توسط o3-pro پشتیبانی نمی‌شود.

از سوی دیگر، بر اساس آزمایش‌های داخلی اوپن‌ای‌آی، o3-pro در بنچمارک‌های (benchmarks) محبوب هوش مصنوعی امتیازات چشمگیری کسب کرده است. در آزمون AIME 2024 که مهارت‌های ریاضی مدل را ارزیابی می‌کند، o3-pro بهتر از مدل برتر گوگل، Gemini 2.5 Pro، عمل کرده است. o3-pro همچنین مدل تازه عرضه‌شده Claude 4 Opus از شرکت Anthropic را در GPQA Diamond، آزمونی برای دانش علمی در سطح دکترا، شکست داده است.

منبع: تک‌کرانچ

به مطالعه ادامه دهید