Big data with encrypted computer code. Safe your data. Cyber internet security and privacy concept.

Image Credits:Peresmeh / Getty Images

JetBrains مدل هوش مصنوعی متن‌باز کدنویسی Mellum را منتشر کرد

JetBrains مدل هوش مصنوعی Mellum را که یک مدل 'متن‌باز' برای کدنویسی است، منتشر کرده و آن را در پلتفرم Hugging Face در دسترس قرار داده است.

۱۴۰۴/۰۲/۱۰

JetBrains مدل هوش مصنوعی Mellum را برای کدنویسی منتشر کرد. این مدل ۴ میلیارد پارامتری که برای تکمیل کد طراحی شده، به صورت 'متن‌باز' در Hugging Face در دسترس قرار گرفته است. Mellum بر روی داده‌های عمومی مانند کدهای GitHub آموزش دیده و نیازمند تنظیم دقیق برای استفاده در محیط تولید است. چالش‌های امنیتی مرتبط با کدهای تولید شده توسط هوش مصنوعی نیز مورد توجه قرار گرفته است.

شرکت JetBrains، که در پشت مجموعه‌ای از ابزارهای محبوب توسعه اپلیکیشن قرار دارد، اولین مدل هوش مصنوعی (AI) "متن‌باز" خود را برای کدنویسی منتشر کرده است.

در روز چهارشنبه، JetBrains مدل Mellum، یک مدل تولید کد که شرکت سال گذشته برای مجموعه‌های مختلف ابزارهای توسعه نرم‌افزار خود منتشر کرده بود، به صورت عمومی در پلتفرم توسعه‌دهندگان هوش مصنوعی Hugging Face در دسترس قرار داد. Mellum، که بر روی بیش از ۴ تریلیون توکن (Tokens) آموزش دیده است، دارای ۴ میلیارد پارامتر (Parameters) است و به طور خاص برای تکمیل کد (Code Completion) (به عنوان مثال تکمیل قطعات کد بر اساس زمینه اطراف آن) طراحی شده است.

پارامترها تقریباً با مهارت‌های حل مسئله یک مدل مطابقت دارند، در حالی که توکن‌ها بیت‌های خام داده‌ای هستند که یک مدل پردازش می‌کند. یک میلیون توکن معادل حدود ۳۰,۰۰۰ خط کد است.

JetBrains در یک گزارش فنی توضیح می‌دهد: «Mellum که برای ادغام در ابزارهای توسعه حرفه‌ای (مانند پیشنهادهای هوشمند کد در محیط‌های توسعه یکپارچه یا Integrated Developer Environments)، دستیارهای کدنویسی مجهز به هوش مصنوعی و تحقیقات در زمینه درک و تولید کد طراحی شده است، برای کاربردهای آموزشی و آزمایش‌های تنظیم دقیق (Fine-tuning) نیز بسیار مناسب است.»

JetBrains می‌گوید که Mellum، که تحت مجوز Apache 2.0 است، را بر روی مجموعه‌ای از داده‌ها از جمله کدهای دارای مجوز مجاز از GitHub و مقالات ویکی‌پدیا به زبان انگلیسی آموزش داده است. آموزش حدود ۲۰ روز بر روی یک کلاستر شامل ۲۵۶ پردازنده گرافیکی Nvidia GPUs مدل H200 طول کشید.

راه اندازی Mellum کمی کار می‌برد. مدل پایه نمی‌تواند بلافاصله استفاده شود؛ ابتدا باید تنظیم دقیق (Fine-tuned) شود. در حالی که JetBrains چند مدل Mellum را که برای زبان Python تنظیم دقیق شده‌اند ارائه کرده است، شرکت هشدار می‌دهد که این مدل‌ها فقط برای "تخمین قابلیت‌های بالقوه" هستند — نه برای استقرار در محیط تولید.

کد تولید شده توسط هوش مصنوعی بدون شک در حال تغییر نحوه ساخت نرم‌افزار است، اما چالش‌های امنیتی جدیدی نیز به همراه دارد. بر اساس نظرسنجی اواخر سال ۲۰۲۳ توسط پلتفرم امنیتی توسعه‌دهندگان Synk، بیش از ۵۰٪ سازمان‌ها گاهی اوقات یا اغلب با مشکلات امنیتی در کدهای تولید شده توسط هوش مصنوعی مواجه می‌شوند.

در واقع، JetBrains اشاره می‌کند که Mellum ممکن است "سوگیری‌های موجود در پایگاه‌های کد عمومی را منعکس کند" (به عنوان مثال تولید کدی شبیه به سبک مخازن متن‌باز)، و اینکه پیشنهادهای کد آن لزوماً "ایمن یا فاقد آسیب‌پذیری" نخواهد بود.

JetBrains در یک پست وبلاگی نوشت: "این تنها آغاز است. ما به دنبال جامعیت نیستیم — ما در حال ساخت تمرکز هستیم. اگر Mellum حتی یک آزمایش، مشارکت یا همکاری معنادار را جرقه بزند، آن را یک برد خواهیم دانست."

منبع: تک‌کرانچ

هوش مصنوعی هوش مصنوعی مولد ال ال ام