
Image Credits:piranka / Getty Images
مدل هوش مصنوعی کوچک جدید Ai2 از رقبای گوگل و متا پیشی میگیرد
موسسه تحقیقاتی Ai2 مدل هوش مصنوعی کوچک Olmo 2 1B را منتشر کرد که به ادعای این موسسه در معیارهای عملکردی از مدلهای با اندازه مشابه گوگل، متا و علیبابا بهتر عمل میکند.
۱۴۰۴/۰۲/۱۱
مدل هوش مصنوعی کوچک Olmo 2 1B که توسط موسسه تحقیقاتی Ai2 منتشر شده، طبق ادعاها در تستها از مدلهای مشابه گوگل و متا عملکرد بهتری دارد و به دلیل نیاز کمتر به سختافزار قدرتمند، دسترسپذیرتر است.
موسسه تحقیقاتی هوش مصنوعی غیرانتفاعی Ai2 روز پنجشنبه از مدل جدید هوش مصنوعی کوچک خود به نام Olmo 2 1B رونمایی کرد. این مدل ۱ میلیارد پارامتری (parameter)، به ادعای Ai2، در چندین معیار عملکرد (benchmark) از مدلهای با اندازه مشابه متعلق به گوگل، متا و علیبابا پیشی میگیرد. پارامترها، که گاهی وزن نامیده میشوند، اجزای داخلی یک مدل هستند که رفتار آن را هدایت میکنند.
Olmo 2 1B تحت مجوز آزاد آپاچی ۲.۰ (Apache 2.0 license) در پلتفرم توسعه هوش مصنوعی هاگینگ فیس (Hugging Face) در دسترس است. برخلاف بیشتر مدلها، Olmo 2 1B را میتوان از ابتدا بازتولید کرد؛ Ai2 کد و مجموعهدادههای (dataset) استفاده شده برای توسعه آن (Olmo-mix-1124، Dolmino-mix-1124) را ارائه کرده است.
مدلهای کوچک شاید به اندازه همتایان غولپیکر خود توانمند نباشند، اما نکته مهم این است که برای اجرا به سختافزار قدرتمند نیاز ندارند. این ویژگی آنها را برای توسعهدهندگان و علاقهمندانی که با محدودیتهای دستگاههای سطح پایین و مصرفکننده مواجه هستند، بسیار دسترسپذیرتر میکند. در چند روز اخیر موجی از معرفی مدلهای کوچک اتفاق افتاده است، از خانواده مدلهای استدلال Phi 4 مایکروسافت گرفته تا Qwen’s 2.5 Omni 3B. بیشتر این مدلها – و Olmo 2 1B – میتوانند به راحتی روی یک لپتاپ مدرن یا حتی یک دستگاه همراه اجرا شوند.
Ai2 میگوید Olmo 2 1B روی مجموعه دادهای شامل ۴ تریلیون توکن (token) از منابع عمومی، تولید شده توسط هوش مصنوعی، و ساخته شده دستی آموزش دیده است. توکنها بخشهای خام دادهای هستند که مدلها دریافت و تولید میکنند – ۱ میلیون توکن معادل تقریباً ۷۵۰ هزار کلمه است.
در معیار عملکردی که استدلال حسابی را میسنجد، GSM8K، Olmo 2 1B امتیاز بهتری نسبت به Gemma 3 1B گوگل، Llama 3.2 1B متا و Qwen 2.5 1.5B علیبابا کسب میکند. Olmo 2 1B همچنین در TruthfulQA، آزمونی برای ارزیابی دقت واقعی، از عملکرد این سه مدل پیشی میگیرد.
با این حال، Ai2 هشدار میدهد که Olmo 2 1B خطراتی به همراه دارد. این سازمان میگوید، مانند همه مدلهای هوش مصنوعی، این مدل میتواند "خروجیهای مشکلساز" شامل محتوای مضر و "حساس"، و همچنین اظهارات نادرست واقعی تولید کند. به همین دلایل، Ai2 استفاده از Olmo 2 1B را در محیطهای تجاری توصیه نمیکند.
منبع: تککرانچ