
Image Credits:Rafael Henrique/SOPA Images/LightRocket / Getty Images
میسترال مدل هوش مصنوعی Devstral را برای برنامهنویسی معرفی کرد
استارتاپ هوش مصنوعی میسترال مدل جدید Devstral را که بر برنامهنویسی تمرکز دارد معرفی کرد. این شرکت ادعا میکند که این مدل در برخی معیارها رقابتی است.
۱۴۰۴/۰۲/۳۱
میسترال مدل هوش مصنوعی Devstral را برای برنامهنویسی معرفی کرده است. این مدل تحت مجوز Apache 2.0 منتشر شده و قابل استفاده تجاری است و میسترال ادعا میکند در برخی معیارها از مدلهای دیگر بهتر عمل میکند.
استارتاپ هوش مصنوعی میسترال روز چهارشنبه از معرفی مدل جدید هوش مصنوعی خود با تمرکز بر کدنویسی به نام Devstral خبر داد.
Devstral که میسترال میگوید با مشارکت شرکت هوش مصنوعی All Hands AI توسعه یافته است، تحت مجوز Apache 2.0 به صورت باز در دسترس قرار دارد، به این معنی که میتوان از آن بدون محدودیت برای مقاصد تجاری استفاده کرد. میسترال ادعا میکند که Devstral در SWE-Bench Verified، معیاری برای سنجش مهارتهای کدنویسی، عملکرد بهتری نسبت به مدلهای باز دیگر مانند Gemma 3 27B گوگل و DeepSeek V3 آزمایشگاه هوش مصنوعی چینی دارد.
میسترال در پست وبلاگی که در اختیار تککرانچ قرار داده است، مینویسد: «Devstral در استفاده از ابزارها برای اکتشاف پایگاههای کد، ویرایش چندین فایل و تقویت عاملهای مهندسی نرمافزار (software engineering agents) بسیار عالی عمل میکند. این مدل بر روی چارچوبهای عامل کد (code agent scaffolds) مانند OpenHands یا SWE-Agent که واسط بین مدل و موارد آزمایشی را تعریف میکنند، اجرا میشود.» میسترال اشاره کرده است که Devstral به اندازه کافی سبک است که بتواند روی یک پردازنده گرافیکی Nvidia RTX 4090 یا یک مک با رم ۳۲ گیگابایت اجرا شود، که آن را گزینهای ایدهآل برای استقرار محلی و استفاده روی دستگاه میسازد.
معرفی Devstral همزمان با افزایش محبوبیت دستیارهای کدنویسی هوش مصنوعی و مدلهای پشتیبان آنها صورت میگیرد. تنها ماه گذشته، JetBrains، شرکتی که ابزارهای محبوب توسعه اپلیکیشن را ارائه میدهد، اولین مدل هوش مصنوعی «باز» خود را برای کدنویسی منتشر کرد. در ماههای اخیر، شرکتهای هوش مصنوعی از جمله گوگل، Windsurf و OpenAI نیز مدلهایی، هم به صورت باز و هم اختصاصی، معرفی کردهاند که برای وظایف برنامهنویسی بهینهسازی شدهاند.
مدلهای هوش مصنوعی هنوز برای کدنویسی نرمافزار با کیفیت با چالش مواجهاند؛ هوش مصنوعی تولیدکننده کد به دلیل ضعف در زمینههایی مانند توانایی درک منطق برنامهنویسی، تمایل به معرفی آسیبپذیریهای امنیتی و اشکالات دارد. با این حال، وعده آنها مبنی بر افزایش بهرهوری کدنویسی، شرکتها و توسعهدهندگان را به پذیرش سریع آنها سوق داده است. یک نظرسنجی اخیر نشان داد که ۷۶ درصد از توسعهدهندگان در سال گذشته از ابزارهای هوش مصنوعی در فرآیندهای توسعه خود استفاده کردهاند یا قصد استفاده داشتهاند.
میسترال پیش از این نیز با Codestral، یک مدل مولد برای کد، وارد حوزه برنامهنویسی کمکی شده بود. اما Codestral تحت مجوزی منتشر نشد که به توسعهدهندگان اجازه استفاده از مدل برای کاربردهای تجاری را بدهد؛ مجوز آن صراحتاً «هرگونه استفاده داخلی توسط کارمندان در زمینه فعالیتهای تجاری یک شرکت» را ممنوع میکرد.
Devstral که میسترال آن را «پیشنمایش تحقیقاتی (research preview)» مینامد، از پلتفرمهای توسعه هوش مصنوعی از جمله هگینگ فیس (Hugging Face) قابل دانلود است و همچنین از طریق رابط برنامهنویسی کاربردی میسترال (API) قابل دسترسی است. قیمتگذاری آن برای هر میلیون توکن ورودی (tokens) ۰.۱ دلار و برای هر میلیون توکن خروجی ۰.۳ دلار تعیین شده است. (توکنها بخشهای خام دادهای هستند که مدلهای هوش مصنوعی با آنها کار میکنند. یک میلیون توکن تقریباً معادل ۷۵۰ هزار کلمه است.)
میسترال میگوید که «به شدت در حال کار بر روی ساخت یک مدل عامل کدنویسی بزرگتر است که در هفتههای آینده در دسترس قرار خواهد گرفت.» Devstral یک مدل کوچک نیست، اما با ۲۴ میلیارد پارامتر (Parameters) در سمت مدلهای کوچکتر قرار میگیرد. (پارامترها تقریباً با مهارتهای حل مسئله یک مدل مطابقت دارند و مدلهایی با پارامتر بیشتر عموماً عملکرد بهتری نسبت به مدلهای با پارامتر کمتر دارند.)
میسترال که در سال ۲۰۲۳ تأسیس شد، یک آزمایشگاه مدل مرزی (frontier model lab) است که هدف آن ساخت مجموعهای از خدمات مبتنی بر هوش مصنوعی از جمله پلتفرم چتبات Le Chat و اپلیکیشنهای موبایل است. این شرکت توسط سرمایهگذاران خطرپذیر (VCs) از جمله General Catalyst پشتیبانی میشود و تا به امروز بیش از ۱.۱ میلیارد یورو (تقریباً ۱.۲۴ میلیارد دلار) جذب سرمایه کرده است. مشتریان میسترال شامل BNP Paribas، AXA و Mirakl هستند.
Devstral سومین محصول معرفی شده میسترال در ماه جاری است. چند هفته پیش، میسترال مدل Mistral Medium 3 را که یک مدل عمومی کارآمد است، معرفی کرد. تقریباً همزمان، این شرکت Le Chat Enterprise را عرضه کرد که یک سرویس چتبات شرکتی است و ابزارهایی مانند سازنده عامل هوش مصنوعی و ادغام مدلهای میسترال با سرویسهای شخص ثالث مانند جیمیل، گوگل درایو و شیرپوینت را ارائه میدهد.
منبع: تککرانچ