Abstract image of big data wave and information vertical line dots on a dark background.
هوش مصنوعی

علی‌بابا از مدل‌های هوش مصنوعی «هیبریدی» Qwen 3 رونمایی کرد

شرکت فناوری چینی علی‌بابا مدل‌های هوش مصنوعی جدید Qwen 3 را منتشر کرد و ادعا می‌کند که این مدل‌ها با گوگل و OpenAI رقابت می‌کنند و در برخی معیارها از آنها پیشی می‌گیرند. این مدل‌ها به صورت «باز» و هیبریدی در دسترس هستند و بر روی داده‌های عظیمی آموزش دیده‌اند.

۱۴۰۴/۰۲/۰۸

شرکت علی‌بابا مدل‌های هوش مصنوعی Qwen 3 را با قابلیت‌های بهبود یافته و عملکرد رقابتی نسبت به مدل‌های گوگل و OpenAI معرفی کرد. این مدل‌ها با مجوز باز و به صورت هیبریدی عرضه می‌شوند و از 119 زبان پشتیبانی می‌کنند.

شرکت فناوری چینی علی‌بابا روز دوشنبه خانواده‌ای از مدل‌های هوش مصنوعی به نام Qwen 3 را منتشر کرد. این شرکت ادعا می‌کند که این مدل‌ها با بهترین مدل‌های موجود از گوگل و OpenAI مطابقت دارند و در برخی موارد از آنها بهتر عمل می‌کنند.

بیشتر این مدل‌ها تحت مجوز «باز» (open license) در پلتفرم‌های Hugging Face و GitHub برای دانلود در دسترس هستند یا به زودی خواهند بود. آنها در اندازه‌های مختلف از 0.6 میلیارد پارامتر (Parameters) تا 235 میلیارد پارامتر متغیر هستند. پارامترها تقریباً با توانایی‌های حل مسئله یک مدل مطابقت دارند و مدل‌هایی با پارامتر بیشتر معمولاً عملکرد بهتری نسبت به مدل‌هایی با پارامتر کمتر دارند.

ظهور سری مدل‌هایی با منشاء چین مانند Qwen فشار بر آزمایشگاه‌های آمریکایی مانند OpenAI را برای ارائه فناوری‌های هوش مصنوعی توانمندتر افزایش داده است. آنها همچنین باعث شده‌اند که سیاست‌گذاران محدودیت‌هایی را با هدف محدود کردن توانایی شرکت‌های هوش مصنوعی چینی برای دستیابی به تراشه‌های لازم برای آموزش مدل‌ها اعمال کنند.

به گفته علی‌بابا، مدل‌های Qwen 3 به این معنا «هیبریدی» (hybrid) هستند که می‌توانند برای حل مسائل پیچیده زمان بگذارند و «استدلال» (reason) کنند یا به درخواست‌های ساده‌تر به سرعت پاسخ دهند. استدلال مدل‌ها را قادر می‌سازد تا به طور مؤثری خود را از نظر صحت اطلاعات بررسی کنند، مشابه مدل‌هایی مانند o3 شرکت OpenAI، اما با هزینه تأخیر (latency) بالاتر.

تیم Qwen در پستی وبلاگی نوشت: «ما حالت‌های تفکر و غیرتفکر را به‌طور یکپارچه ادغام کرده‌ایم و به کاربران این امکان را می‌دهیم که «بودجه تفکر» (thinking budget) را کنترل کنند.» «این طراحی به کاربران امکان می‌دهد تا بودجه‌های خاص وظیفه را با سهولت بیشتری پیکربندی کنند.»

علی‌بابا می‌گوید مدل‌های Qwen 3 از 119 زبان پشتیبانی می‌کنند و بر روی مجموعه داده‌ای تقریباً 36 تریلیون توکن (Tokens) آموزش دیده‌اند. توکن‌ها بیت‌های خام داده‌ای هستند که یک مدل پردازش می‌کند؛ 1 میلیون توکن معادل حدود 750,000 کلمه است. علی‌بابا می‌گوید Qwen 3 بر روی ترکیبی از کتاب‌های درسی، «جفت‌های سوال و جواب» (question-answer pairs)، قطعه کدها، داده‌های تولید شده توسط هوش مصنوعی، و موارد دیگر آموزش دیده است.

علی‌بابا می‌گوید این بهبودها، همراه با موارد دیگر، عملکرد Qwen 3 را نسبت به نسل قبلی خود، Qwen 2، به طور قابل توجهی افزایش داده است. در Codeforces، یک پلتفرم برای مسابقات برنامه‌نویسی، بزرگترین مدل Qwen 3 با نام Qwen-3-235B-A22B، کمی از o3-mini شرکت OpenAI و Gemini 2.5 Pro شرکت گوگل بهتر عمل می‌کند. Qwen-3-235B-A22B همچنین در آخرین نسخه AIME، یک معیار چالش برانگیز ریاضی، و BFCL، تستی برای ارزیابی توانایی مدل در «استدلال» در مورد مسائل، از o3-mini پیشی می‌گیرد.

اما Qwen-3-235B-A22B برای عموم در دسترس نیست — حداقل هنوز.

بزرگترین مدل عمومی Qwen 3 با نام Qwen3-32B، همچنان با تعدادی از مدل‌های هوش مصنوعی اختصاصی و باز، از جمله R1 آزمایشگاه هوش مصنوعی چینی DeepSeek، رقابت می‌کند. Qwen3-32B در چندین تست، از جمله معیار دقت LiveBench، از مدل o1 شرکت OpenAI برتری دارد.

علی‌بابا می‌گوید Qwen 3 در قابلیت‌های «فراخوانی ابزار» (tool-calling) و همچنین دنبال کردن دستورالعمل‌ها و کپی کردن فرمت‌های داده‌ای خاص «عالی عمل می‌کند». علاوه بر مدل‌های قابل دانلود، Qwen 3 از طریق ارائه‌دهندگان ابری مانند Fireworks AI و Hyperbolic نیز در دسترس است.

توحین سریواستاوا، هم‌بنیان‌گذار و مدیرعامل شرکت Baseten (ارائه‌دهنده خدمات ابری هوش مصنوعی)، اظهار داشت که Qwen 3 نقطه دیگری در روند مدل‌های باز است که با سیستم‌های بسته منبع مانند OpenAI همگام می‌شوند.

او در بیانیه‌ای به TechCrunch گفت: «ایالات متحده در حال دوچندان کردن محدودیت‌های فروش تراشه به چین و خرید از چین است، اما مدل‌هایی مانند Qwen 3 که پیشرفته (state-of-the-art) و باز هستند... بدون شک به صورت داخلی استفاده خواهند شد.» او افزود: «این واقعیت را بازتاب می‌دهد که کسب‌وکارها هم ابزارهای خود را می‌سازند و هم از طریق شرکت‌های مدل بسته مانند Anthropic و OpenAI به صورت آماده خرید می‌کنند.»

منبع: تک‌کرانچ

به مطالعه ادامه دهید