Image Credits: Bryce Durbin / TechCrunch
هوش مصنوعی

معرفی مدل‌های هوش مصنوعی جدید بلک فارست لبز: قابلیت ویرایش تصویر در کنار تولید

استارتاپ هوش مصنوعی بلک فارست لبز، مجموعه‌ای جدید از مدل‌های تولید تصویر را معرفی کرده است که برخی از آن‌ها قابلیت خلق و ویرایش تصویر را به صورت همزمان دارند.

۱۴۰۴/۰۳/۰۸

بلک فارست لبز، استارتاپ هوش مصنوعی سازنده مدل‌هایی که پیش‌تر در ربات چت گروک ایلان ماسک استفاده می‌شدند، مجموعه جدید مدل‌های تولید تصویر فلاکس ۱ کانتکست را معرفی کرد. این مدل‌ها علاوه بر تولید سریع و دقیق تصاویر، قابلیت ویرایش و اصلاح آن‌ها را نیز دارا هستند و در رقابت با مدل‌هایی چون ایماجن ۴ گوگل و مدل جدید اوپن‌ای‌آی عرضه شده‌اند.

شرکت استارتاپی هوش مصنوعی بلک فارست لبز (Black Forest Labs) که مدل‌های آن پیش‌تر قابلیت‌های تولید تصویر ربات چت گروک (Grok) ایلان ماسک را پشتیبانی می‌کردند، روز پنجشنبه مجموعه جدیدی از مدل‌های تولید تصویر را معرفی کرد که برخی از آن‌ها علاوه بر خلق تصویر، قادر به ویرایش آن نیز هستند.

به گفته بلک فارست لبز در پستی وبلاگی، تواناترین مدل در خانواده جدید به نام فلاکس ۱ کانتکست (Flux.1 Kontext) می‌تواند با دریافت متن و به صورت اختیاری یک تصویر مرجع، تصاویر جدیدی را تولید کند.

این شرکت در پست خود می‌نویسد: «مدل‌های فلاکس ۱ کانتکست با دنبال کردن قوی دستورات متنی (prompt following)، رندرینگ واقع‌گرایانه و تایپوگرافی رقابتی، نتایج پیشرفته‌ای (state-of-the-art) در تولید تصویر ارائه می‌دهند – همه این‌ها با سرعت پردازش (inference speeds) تا ۸ برابر سریع‌تر از مدل‌های پیشرو کنونی.»

معرفی فلاکس ۱ کانتکست در حالی صورت می‌گیرد که رقابت برای ساخت مولدهای تصویر (image generators) قدرتمندتر شدت گرفته است. گوگل اوایل ماه جاری در کنفرانس توسعه‌دهندگان خود (I/O) از جدیدترین مدل تولید تصویر خود، ایماجن ۴ (Imagen 4)، رونمایی کرد. اوایل سال جاری نیز اوپن‌ای‌آی (OpenAI) مدل تولید تصویر به شدت بهبود یافته‌ای را به چت‌جی‌پی‌تی (ChatGPT) آورد که به سرعت به دلیل توانایی‌اش در خلق آثار هنری به سبک فیلم‌های استودیو جیبلی (Studio Ghibli) وایرال شد.

خانواده مدل‌های فلاکس ۱ کانتکست شامل دو مدل فلاکس ۱ کانتکست [پرو] (Flux.1 Kontex [pro]) و فلاکس ۱ کانتکست [مکس] (Flux.1 Kontex [max]) است. مدل اول به کاربران اجازه می‌دهد تصویری را تولید و سپس در چندین مرحله آن را ویرایش و اصلاح کنند، در حالی که شخصیت‌ها و سبک تصاویر حفظ می‌شود. مدل فلاکس ۱ کانتکست [مکس] بر سرعت، پایداری و پایبندی به دستورات متنی تمرکز دارد.

بر خلاف برخی مدل‌های پیشین بلک فارست لبز، مدل‌های فلاکس ۱ کانتکست [پرو] و [مکس] قابل دانلود برای استفاده آفلاین نیستند. با این حال، بلک فارست لبز یک مدل «باز» کانتکست به نام فلاکس ۱ کانتکست [دو] (Flux.1 Kontext [dev]) را در بتای خصوصی برای تحقیقات و تست‌های ایمنی ارائه می‌دهد.

بلک فارست لبز همچنین یک محیط آزمایشی مدل (model playground) را راه‌اندازی کرده که به کاربران امکان می‌دهد مدل‌های آن را بدون نیاز به ثبت نام در سرویس شخص ثالثی امتحان کنند.

این شرکت که در آلمان مستقر است، طبق گزارش‌ها اواخر سال گذشته در حال مذاکره برای جذب سرمایه ۱۰۰ میلیون دلاری با ارزش‌گذاری یک میلیارد دلاری بوده است. بسیاری از بنیان‌گذاران این شرکت از استابیلیتی ای‌آی (Stability AI)، خالق مدل بدنام تولید تصویر استیبل دیفیوژن (Stable Diffusion)، هستند. سرمایه‌گذاران بلک فارست لبز شامل آندرسن هوروویتز (Andreessen Horowitz)، بنیان‌گذار آکیولس (Oculus) برندن آیریب (Brendan Iribe) و گری تن (Garry Tan) از وای کامبینیتور (Y Combinator) می‌شوند.

در ماه‌های پس از خروج از حالت پنهان‌کاری (stealth)، بلک فارست لبز تعدادی مدل تولید تصویر جدید و سرویس‌های متمرکز بر شرکت‌ها از جمله یک رابط برنامه‌نویسی کاربردی (API) را منتشر کرده است.

منبع: تک‌کرانچ

به مطالعه ادامه دهید