
Image Credits:Jakub Porzycki/NurPhoto / Getty Images
مایکروسافت از مدلهای هوش مصنوعی جدید Phi 4 رونمایی کرد: رقابت با سیستمهای بسیار بزرگتر
مایکروسافت مدلهای هوش مصنوعی جدیدی از خانواده Phi 4 را معرفی کرده است که توانمندترین آنها در برخی معیارها با مدلهای بزرگتر مانند OpenAI o3-mini و DeepSeek R1 رقابت میکند.
۱۴۰۴/۰۲/۱۱
مایکروسافت از سه مدل جدید هوش مصنوعی استدلالی Phi 4 رونمایی کرد که با وجود اندازه کوچکتر نسبت به مدلهای قبلی، عملکرد رقابتی با سیستمهای بسیار بزرگتر از خود نشان میدهند و برای کاربردهای مختلفی از جمله آموزش و کدنویسی طراحی شدهاند.
مایکروسافت روز چهارشنبه از چندین مدل جدید و «باز» هوش مصنوعی رونمایی کرد که توانمندترین آنها در دستکم یک معیار با مدل o3-mini شرکت OpenAI رقابت میکند.
تمامی مدلهای جدید که تحت مجوز باز (permissively licensed) منتشر شدهاند، شامل Phi 4 mini reasoning، Phi 4 reasoning و Phi 4 reasoning plus، مدلهای «استدلالی» (reasoning) هستند. این بدان معناست که آنها میتوانند زمان بیشتری را صرف بررسی صحت راهحلهای مسائل پیچیده کنند. این مدلها خانواده «مدلهای کوچک» Phi مایکروسافت را گسترش میدهند؛ خانوادهای که شرکت یک سال پیش برای ارائه مبنایی برای توسعهدهندگان هوش مصنوعی که در لبه (edge) برنامهسازی میکنند، معرفی کرد.
مدل Phi 4 mini reasoning بر روی حدود ۱ میلیون مسئله ریاضی مصنوعی آموزش دیده است که توسط مدل استدلالی R1 شرکت نوپای هوش مصنوعی چینی DeepSeek تولید شدهاند. مایکروسافت اعلام کرده است که Phi 4 mini reasoning با حدود ۳.۸ میلیارد پارامتر (parameter)، برای کاربردهای آموزشی مانند «تدریس خصوصی تعبیهشده» بر روی دستگاههای سبکوزن طراحی شده است.
پارامترها به طور تقریبی با مهارتهای حل مسئله یک مدل مطابقت دارند و مدلهایی با پارامترهای بیشتر معمولاً عملکرد بهتری نسبت به مدلهایی با پارامترهای کمتر دارند.
مدل Phi 4 reasoning با ۱۴ میلیارد پارامتر، با استفاده از دادههای «با کیفیت بالا» از وب و همچنین «نمونههای گلچین شده» از مدل o3-mini شرکت OpenAI آموزش دیده است. به گفته مایکروسافت، این مدل برای کاربردهای ریاضی، علمی و کدنویسی بهترین گزینه است.
در مورد Phi 4 reasoning plus، این مدل نسخه تطبیقیافته مدل قبلاً منتشر شده Phi-4 مایکروسافت است که به یک مدل استدلالی تبدیل شده تا دقت بهتری در وظایف خاصی داشته باشد. مایکروسافت ادعا میکند که Phi 4 reasoning plus به سطح عملکرد R1 نزدیک میشود، مدلی با پارامترهای بهطور قابل توجهی بیشتر (۶۷۱ میلیارد). معیارهای داخلی شرکت همچنین نشان میدهد که Phi 4 reasoning plus در آزمون مهارت ریاضی OmniMath، با o3-mini رقابت میکند.
مدلهای Phi 4 mini reasoning، Phi 4 reasoning و Phi 4 reasoning plus بر روی پلتفرم توسعه هوش مصنوعی Hugging Face به همراه گزارشهای فنی دقیق در دسترس هستند.
مایکروسافت در یک پست وبلاگی نوشت: «با استفاده از تقطیر (distillation)، یادگیری تقویتی (reinforcement learning) و دادههای با کیفیت بالا، این مدلهای جدید اندازه و عملکرد را متعادل میکنند.» این شرکت افزود: «آنها به اندازهای کوچک هستند که برای محیطهای با تأخیر کم مناسب باشند، در عین حال قابلیتهای استدلالی قوی را حفظ میکنند که با مدلهای بسیار بزرگتر رقابت میکند. این ترکیب به دستگاههایی با منابع محدود نیز اجازه میدهد تا وظایف استدلالی پیچیده را به طور کارآمد انجام دهند.»
منبع: تککرانچ