
Image Credits:Peresmeh / Getty Images
JetBrains مدل هوش مصنوعی متنباز کدنویسی Mellum را منتشر کرد
JetBrains مدل هوش مصنوعی Mellum را که یک مدل 'متنباز' برای کدنویسی است، منتشر کرده و آن را در پلتفرم Hugging Face در دسترس قرار داده است.
۱۴۰۴/۰۲/۱۰
JetBrains مدل هوش مصنوعی Mellum را برای کدنویسی منتشر کرد. این مدل ۴ میلیارد پارامتری که برای تکمیل کد طراحی شده، به صورت 'متنباز' در Hugging Face در دسترس قرار گرفته است. Mellum بر روی دادههای عمومی مانند کدهای GitHub آموزش دیده و نیازمند تنظیم دقیق برای استفاده در محیط تولید است. چالشهای امنیتی مرتبط با کدهای تولید شده توسط هوش مصنوعی نیز مورد توجه قرار گرفته است.
شرکت JetBrains، که در پشت مجموعهای از ابزارهای محبوب توسعه اپلیکیشن قرار دارد، اولین مدل هوش مصنوعی (AI) "متنباز" خود را برای کدنویسی منتشر کرده است.
در روز چهارشنبه، JetBrains مدل Mellum، یک مدل تولید کد که شرکت سال گذشته برای مجموعههای مختلف ابزارهای توسعه نرمافزار خود منتشر کرده بود، به صورت عمومی در پلتفرم توسعهدهندگان هوش مصنوعی Hugging Face در دسترس قرار داد. Mellum، که بر روی بیش از ۴ تریلیون توکن (Tokens) آموزش دیده است، دارای ۴ میلیارد پارامتر (Parameters) است و به طور خاص برای تکمیل کد (Code Completion) (به عنوان مثال تکمیل قطعات کد بر اساس زمینه اطراف آن) طراحی شده است.
پارامترها تقریباً با مهارتهای حل مسئله یک مدل مطابقت دارند، در حالی که توکنها بیتهای خام دادهای هستند که یک مدل پردازش میکند. یک میلیون توکن معادل حدود ۳۰,۰۰۰ خط کد است.
JetBrains در یک گزارش فنی توضیح میدهد: «Mellum که برای ادغام در ابزارهای توسعه حرفهای (مانند پیشنهادهای هوشمند کد در محیطهای توسعه یکپارچه یا Integrated Developer Environments)، دستیارهای کدنویسی مجهز به هوش مصنوعی و تحقیقات در زمینه درک و تولید کد طراحی شده است، برای کاربردهای آموزشی و آزمایشهای تنظیم دقیق (Fine-tuning) نیز بسیار مناسب است.»
JetBrains میگوید که Mellum، که تحت مجوز Apache 2.0 است، را بر روی مجموعهای از دادهها از جمله کدهای دارای مجوز مجاز از GitHub و مقالات ویکیپدیا به زبان انگلیسی آموزش داده است. آموزش حدود ۲۰ روز بر روی یک کلاستر شامل ۲۵۶ پردازنده گرافیکی Nvidia GPUs مدل H200 طول کشید.
راه اندازی Mellum کمی کار میبرد. مدل پایه نمیتواند بلافاصله استفاده شود؛ ابتدا باید تنظیم دقیق (Fine-tuned) شود. در حالی که JetBrains چند مدل Mellum را که برای زبان Python تنظیم دقیق شدهاند ارائه کرده است، شرکت هشدار میدهد که این مدلها فقط برای "تخمین قابلیتهای بالقوه" هستند — نه برای استقرار در محیط تولید.
کد تولید شده توسط هوش مصنوعی بدون شک در حال تغییر نحوه ساخت نرمافزار است، اما چالشهای امنیتی جدیدی نیز به همراه دارد. بر اساس نظرسنجی اواخر سال ۲۰۲۳ توسط پلتفرم امنیتی توسعهدهندگان Synk، بیش از ۵۰٪ سازمانها گاهی اوقات یا اغلب با مشکلات امنیتی در کدهای تولید شده توسط هوش مصنوعی مواجه میشوند.
در واقع، JetBrains اشاره میکند که Mellum ممکن است "سوگیریهای موجود در پایگاههای کد عمومی را منعکس کند" (به عنوان مثال تولید کدی شبیه به سبک مخازن متنباز)، و اینکه پیشنهادهای کد آن لزوماً "ایمن یا فاقد آسیبپذیری" نخواهد بود.
JetBrains در یک پست وبلاگی نوشت: "این تنها آغاز است. ما به دنبال جامعیت نیستیم — ما در حال ساخت تمرکز هستیم. اگر Mellum حتی یک آزمایش، مشارکت یا همکاری معنادار را جرقه بزند، آن را یک برد خواهیم دانست."
منبع: تککرانچ