Image Credits:Jakub Porzycki/NurPhoto / Getty Images

مایکروسافت از مدل‌های هوش مصنوعی جدید Phi 4 رونمایی کرد: رقابت با سیستم‌های بسیار بزرگتر

مایکروسافت مدل‌های هوش مصنوعی جدیدی از خانواده Phi 4 را معرفی کرده است که توانمندترین آن‌ها در برخی معیارها با مدل‌های بزرگتر مانند OpenAI o3-mini و DeepSeek R1 رقابت می‌کند.

۱۴۰۴/۰۲/۱۱

مایکروسافت از سه مدل جدید هوش مصنوعی استدلالی Phi 4 رونمایی کرد که با وجود اندازه کوچکتر نسبت به مدل‌های قبلی، عملکرد رقابتی با سیستم‌های بسیار بزرگتر از خود نشان می‌دهند و برای کاربردهای مختلفی از جمله آموزش و کدنویسی طراحی شده‌اند.

مایکروسافت روز چهارشنبه از چندین مدل جدید و «باز» هوش مصنوعی رونمایی کرد که توانمندترین آن‌ها در دست‌کم یک معیار با مدل o3-mini شرکت OpenAI رقابت می‌کند.

تمامی مدل‌های جدید که تحت مجوز باز (permissively licensed) منتشر شده‌اند، شامل Phi 4 mini reasoning، Phi 4 reasoning و Phi 4 reasoning plus، مدل‌های «استدلالی» (reasoning) هستند. این بدان معناست که آن‌ها می‌توانند زمان بیشتری را صرف بررسی صحت راه‌حل‌های مسائل پیچیده کنند. این مدل‌ها خانواده «مدل‌های کوچک» Phi مایکروسافت را گسترش می‌دهند؛ خانواده‌ای که شرکت یک سال پیش برای ارائه مبنایی برای توسعه‌دهندگان هوش مصنوعی که در لبه (edge) برنامه‌سازی می‌کنند، معرفی کرد.

مدل Phi 4 mini reasoning بر روی حدود ۱ میلیون مسئله ریاضی مصنوعی آموزش دیده است که توسط مدل استدلالی R1 شرکت نوپای هوش مصنوعی چینی DeepSeek تولید شده‌اند. مایکروسافت اعلام کرده است که Phi 4 mini reasoning با حدود ۳.۸ میلیارد پارامتر (parameter)، برای کاربردهای آموزشی مانند «تدریس خصوصی تعبیه‌شده» بر روی دستگاه‌های سبک‌وزن طراحی شده است.

پارامترها به طور تقریبی با مهارت‌های حل مسئله یک مدل مطابقت دارند و مدل‌هایی با پارامترهای بیشتر معمولاً عملکرد بهتری نسبت به مدل‌هایی با پارامترهای کمتر دارند.

مدل Phi 4 reasoning با ۱۴ میلیارد پارامتر، با استفاده از داده‌های «با کیفیت بالا» از وب و همچنین «نمونه‌های گلچین شده» از مدل o3-mini شرکت OpenAI آموزش دیده است. به گفته مایکروسافت، این مدل برای کاربردهای ریاضی، علمی و کدنویسی بهترین گزینه است.

در مورد Phi 4 reasoning plus، این مدل نسخه تطبیق‌یافته مدل قبلاً منتشر شده Phi-4 مایکروسافت است که به یک مدل استدلالی تبدیل شده تا دقت بهتری در وظایف خاصی داشته باشد. مایکروسافت ادعا می‌کند که Phi 4 reasoning plus به سطح عملکرد R1 نزدیک می‌شود، مدلی با پارامترهای به‌طور قابل توجهی بیشتر (۶۷۱ میلیارد). معیارهای داخلی شرکت همچنین نشان می‌دهد که Phi 4 reasoning plus در آزمون مهارت ریاضی OmniMath، با o3-mini رقابت می‌کند.

مدل‌های Phi 4 mini reasoning، Phi 4 reasoning و Phi 4 reasoning plus بر روی پلتفرم توسعه هوش مصنوعی Hugging Face به همراه گزارش‌های فنی دقیق در دسترس هستند.

مایکروسافت در یک پست وبلاگی نوشت: «با استفاده از تقطیر (distillation)، یادگیری تقویتی (reinforcement learning) و داده‌های با کیفیت بالا، این مدل‌های جدید اندازه و عملکرد را متعادل می‌کنند.» این شرکت افزود: «آن‌ها به اندازه‌ای کوچک هستند که برای محیط‌های با تأخیر کم مناسب باشند، در عین حال قابلیت‌های استدلالی قوی را حفظ می‌کنند که با مدل‌های بسیار بزرگتر رقابت می‌کند. این ترکیب به دستگاه‌هایی با منابع محدود نیز اجازه می‌دهد تا وظایف استدلالی پیچیده را به طور کارآمد انجام دهند.»

منبع: تک‌کرانچ

هوش مصنوعی دیپ سیک ال ال ام مایکروسافت اوپن ای آی