
Image Credits:Yuichiro Chino / Getty ImagesAlibaba’s internal benchmark results for Qwen 3.Image Credits:Alibaba
علیبابا از مدلهای هوش مصنوعی «هیبریدی» Qwen 3 رونمایی کرد
شرکت فناوری چینی علیبابا مدلهای هوش مصنوعی جدید Qwen 3 را منتشر کرد و ادعا میکند که این مدلها با گوگل و OpenAI رقابت میکنند و در برخی معیارها از آنها پیشی میگیرند. این مدلها به صورت «باز» و هیبریدی در دسترس هستند و بر روی دادههای عظیمی آموزش دیدهاند.
۱۴۰۴/۰۲/۰۸
شرکت علیبابا مدلهای هوش مصنوعی Qwen 3 را با قابلیتهای بهبود یافته و عملکرد رقابتی نسبت به مدلهای گوگل و OpenAI معرفی کرد. این مدلها با مجوز باز و به صورت هیبریدی عرضه میشوند و از 119 زبان پشتیبانی میکنند.
شرکت فناوری چینی علیبابا روز دوشنبه خانوادهای از مدلهای هوش مصنوعی به نام Qwen 3 را منتشر کرد. این شرکت ادعا میکند که این مدلها با بهترین مدلهای موجود از گوگل و OpenAI مطابقت دارند و در برخی موارد از آنها بهتر عمل میکنند.
بیشتر این مدلها تحت مجوز «باز» (open license) در پلتفرمهای Hugging Face و GitHub برای دانلود در دسترس هستند یا به زودی خواهند بود. آنها در اندازههای مختلف از 0.6 میلیارد پارامتر (Parameters) تا 235 میلیارد پارامتر متغیر هستند. پارامترها تقریباً با تواناییهای حل مسئله یک مدل مطابقت دارند و مدلهایی با پارامتر بیشتر معمولاً عملکرد بهتری نسبت به مدلهایی با پارامتر کمتر دارند.
ظهور سری مدلهایی با منشاء چین مانند Qwen فشار بر آزمایشگاههای آمریکایی مانند OpenAI را برای ارائه فناوریهای هوش مصنوعی توانمندتر افزایش داده است. آنها همچنین باعث شدهاند که سیاستگذاران محدودیتهایی را با هدف محدود کردن توانایی شرکتهای هوش مصنوعی چینی برای دستیابی به تراشههای لازم برای آموزش مدلها اعمال کنند.
به گفته علیبابا، مدلهای Qwen 3 به این معنا «هیبریدی» (hybrid) هستند که میتوانند برای حل مسائل پیچیده زمان بگذارند و «استدلال» (reason) کنند یا به درخواستهای سادهتر به سرعت پاسخ دهند. استدلال مدلها را قادر میسازد تا به طور مؤثری خود را از نظر صحت اطلاعات بررسی کنند، مشابه مدلهایی مانند o3 شرکت OpenAI، اما با هزینه تأخیر (latency) بالاتر.
تیم Qwen در پستی وبلاگی نوشت: «ما حالتهای تفکر و غیرتفکر را بهطور یکپارچه ادغام کردهایم و به کاربران این امکان را میدهیم که «بودجه تفکر» (thinking budget) را کنترل کنند.» «این طراحی به کاربران امکان میدهد تا بودجههای خاص وظیفه را با سهولت بیشتری پیکربندی کنند.»
علیبابا میگوید مدلهای Qwen 3 از 119 زبان پشتیبانی میکنند و بر روی مجموعه دادهای تقریباً 36 تریلیون توکن (Tokens) آموزش دیدهاند. توکنها بیتهای خام دادهای هستند که یک مدل پردازش میکند؛ 1 میلیون توکن معادل حدود 750,000 کلمه است. علیبابا میگوید Qwen 3 بر روی ترکیبی از کتابهای درسی، «جفتهای سوال و جواب» (question-answer pairs)، قطعه کدها، دادههای تولید شده توسط هوش مصنوعی، و موارد دیگر آموزش دیده است.
علیبابا میگوید این بهبودها، همراه با موارد دیگر، عملکرد Qwen 3 را نسبت به نسل قبلی خود، Qwen 2، به طور قابل توجهی افزایش داده است. در Codeforces، یک پلتفرم برای مسابقات برنامهنویسی، بزرگترین مدل Qwen 3 با نام Qwen-3-235B-A22B، کمی از o3-mini شرکت OpenAI و Gemini 2.5 Pro شرکت گوگل بهتر عمل میکند. Qwen-3-235B-A22B همچنین در آخرین نسخه AIME، یک معیار چالش برانگیز ریاضی، و BFCL، تستی برای ارزیابی توانایی مدل در «استدلال» در مورد مسائل، از o3-mini پیشی میگیرد.
اما Qwen-3-235B-A22B برای عموم در دسترس نیست — حداقل هنوز.
بزرگترین مدل عمومی Qwen 3 با نام Qwen3-32B، همچنان با تعدادی از مدلهای هوش مصنوعی اختصاصی و باز، از جمله R1 آزمایشگاه هوش مصنوعی چینی DeepSeek، رقابت میکند. Qwen3-32B در چندین تست، از جمله معیار دقت LiveBench، از مدل o1 شرکت OpenAI برتری دارد.
علیبابا میگوید Qwen 3 در قابلیتهای «فراخوانی ابزار» (tool-calling) و همچنین دنبال کردن دستورالعملها و کپی کردن فرمتهای دادهای خاص «عالی عمل میکند». علاوه بر مدلهای قابل دانلود، Qwen 3 از طریق ارائهدهندگان ابری مانند Fireworks AI و Hyperbolic نیز در دسترس است.
توحین سریواستاوا، همبنیانگذار و مدیرعامل شرکت Baseten (ارائهدهنده خدمات ابری هوش مصنوعی)، اظهار داشت که Qwen 3 نقطه دیگری در روند مدلهای باز است که با سیستمهای بسته منبع مانند OpenAI همگام میشوند.
او در بیانیهای به TechCrunch گفت: «ایالات متحده در حال دوچندان کردن محدودیتهای فروش تراشه به چین و خرید از چین است، اما مدلهایی مانند Qwen 3 که پیشرفته (state-of-the-art) و باز هستند... بدون شک به صورت داخلی استفاده خواهند شد.» او افزود: «این واقعیت را بازتاب میدهد که کسبوکارها هم ابزارهای خود را میسازند و هم از طریق شرکتهای مدل بسته مانند Anthropic و OpenAI به صورت آماده خرید میکنند.»
منبع: تککرانچ