Lumen Orbit is building data centers in space.
هوش مصنوعی

مدل هوش مصنوعی کوچک جدید Ai2 از رقبای گوگل و متا پیشی می‌گیرد

موسسه تحقیقاتی Ai2 مدل هوش مصنوعی کوچک Olmo 2 1B را منتشر کرد که به ادعای این موسسه در معیارهای عملکردی از مدل‌های با اندازه مشابه گوگل، متا و علی‌بابا بهتر عمل می‌کند.

۱۴۰۴/۰۲/۱۱

مدل هوش مصنوعی کوچک Olmo 2 1B که توسط موسسه تحقیقاتی Ai2 منتشر شده، طبق ادعاها در تست‌ها از مدل‌های مشابه گوگل و متا عملکرد بهتری دارد و به دلیل نیاز کمتر به سخت‌افزار قدرتمند، دسترس‌پذیرتر است.

موسسه تحقیقاتی هوش مصنوعی غیرانتفاعی Ai2 روز پنجشنبه از مدل جدید هوش مصنوعی کوچک خود به نام Olmo 2 1B رونمایی کرد. این مدل ۱ میلیارد پارامتری (parameter)، به ادعای Ai2، در چندین معیار عملکرد (benchmark) از مدل‌های با اندازه مشابه متعلق به گوگل، متا و علی‌بابا پیشی می‌گیرد. پارامترها، که گاهی وزن نامیده می‌شوند، اجزای داخلی یک مدل هستند که رفتار آن را هدایت می‌کنند.

Olmo 2 1B تحت مجوز آزاد آپاچی ۲.۰ (Apache 2.0 license) در پلتفرم توسعه هوش مصنوعی هاگینگ فیس (Hugging Face) در دسترس است. برخلاف بیشتر مدل‌ها، Olmo 2 1B را می‌توان از ابتدا بازتولید کرد؛ Ai2 کد و مجموعه‌داده‌های (dataset) استفاده شده برای توسعه آن (Olmo-mix-1124، Dolmino-mix-1124) را ارائه کرده است.

مدل‌های کوچک شاید به اندازه همتایان غول‌پیکر خود توانمند نباشند، اما نکته مهم این است که برای اجرا به سخت‌افزار قدرتمند نیاز ندارند. این ویژگی آن‌ها را برای توسعه‌دهندگان و علاقه‌مندانی که با محدودیت‌های دستگاه‌های سطح پایین و مصرف‌کننده مواجه هستند، بسیار دسترس‌پذیرتر می‌کند. در چند روز اخیر موجی از معرفی مدل‌های کوچک اتفاق افتاده است، از خانواده مدل‌های استدلال Phi 4 مایکروسافت گرفته تا Qwen’s 2.5 Omni 3B. بیشتر این مدل‌ها – و Olmo 2 1B – می‌توانند به راحتی روی یک لپ‌تاپ مدرن یا حتی یک دستگاه همراه اجرا شوند.

Ai2 می‌گوید Olmo 2 1B روی مجموعه داده‌ای شامل ۴ تریلیون توکن (token) از منابع عمومی، تولید شده توسط هوش مصنوعی، و ساخته شده دستی آموزش دیده است. توکن‌ها بخش‌های خام داده‌ای هستند که مدل‌ها دریافت و تولید می‌کنند – ۱ میلیون توکن معادل تقریباً ۷۵۰ هزار کلمه است.

در معیار عملکردی که استدلال حسابی را می‌سنجد، GSM8K، Olmo 2 1B امتیاز بهتری نسبت به Gemma 3 1B گوگل، Llama 3.2 1B متا و Qwen 2.5 1.5B علی‌بابا کسب می‌کند. Olmo 2 1B همچنین در TruthfulQA، آزمونی برای ارزیابی دقت واقعی، از عملکرد این سه مدل پیشی می‌گیرد.

با این حال، Ai2 هشدار می‌دهد که Olmo 2 1B خطراتی به همراه دارد. این سازمان می‌گوید، مانند همه مدل‌های هوش مصنوعی، این مدل می‌تواند "خروجی‌های مشکل‌ساز" شامل محتوای مضر و "حساس"، و همچنین اظهارات نادرست واقعی تولید کند. به همین دلایل، Ai2 استفاده از Olmo 2 1B را در محیط‌های تجاری توصیه نمی‌کند.

منبع: تک‌کرانچ

به مطالعه ادامه دهید