
Image Credits:Bryce Durbin / TechCrunchAn AI-generated photo from Freepik’s F Lite model.Image Credits:Freepik
معرفی مدلهای هوش مصنوعی جدید بلک فارست لبز: قابلیت ویرایش تصویر در کنار تولید
استارتاپ هوش مصنوعی بلک فارست لبز، مجموعهای جدید از مدلهای تولید تصویر را معرفی کرده است که برخی از آنها قابلیت خلق و ویرایش تصویر را به صورت همزمان دارند.
۱۴۰۴/۰۳/۰۸
بلک فارست لبز، استارتاپ هوش مصنوعی سازنده مدلهایی که پیشتر در ربات چت گروک ایلان ماسک استفاده میشدند، مجموعه جدید مدلهای تولید تصویر فلاکس ۱ کانتکست را معرفی کرد. این مدلها علاوه بر تولید سریع و دقیق تصاویر، قابلیت ویرایش و اصلاح آنها را نیز دارا هستند و در رقابت با مدلهایی چون ایماجن ۴ گوگل و مدل جدید اوپنایآی عرضه شدهاند.
شرکت استارتاپی هوش مصنوعی بلک فارست لبز (Black Forest Labs) که مدلهای آن پیشتر قابلیتهای تولید تصویر ربات چت گروک (Grok) ایلان ماسک را پشتیبانی میکردند، روز پنجشنبه مجموعه جدیدی از مدلهای تولید تصویر را معرفی کرد که برخی از آنها علاوه بر خلق تصویر، قادر به ویرایش آن نیز هستند.
به گفته بلک فارست لبز در پستی وبلاگی، تواناترین مدل در خانواده جدید به نام فلاکس ۱ کانتکست (Flux.1 Kontext) میتواند با دریافت متن و به صورت اختیاری یک تصویر مرجع، تصاویر جدیدی را تولید کند.
این شرکت در پست خود مینویسد: «مدلهای فلاکس ۱ کانتکست با دنبال کردن قوی دستورات متنی (prompt following)، رندرینگ واقعگرایانه و تایپوگرافی رقابتی، نتایج پیشرفتهای (state-of-the-art) در تولید تصویر ارائه میدهند – همه اینها با سرعت پردازش (inference speeds) تا ۸ برابر سریعتر از مدلهای پیشرو کنونی.»
معرفی فلاکس ۱ کانتکست در حالی صورت میگیرد که رقابت برای ساخت مولدهای تصویر (image generators) قدرتمندتر شدت گرفته است. گوگل اوایل ماه جاری در کنفرانس توسعهدهندگان خود (I/O) از جدیدترین مدل تولید تصویر خود، ایماجن ۴ (Imagen 4)، رونمایی کرد. اوایل سال جاری نیز اوپنایآی (OpenAI) مدل تولید تصویر به شدت بهبود یافتهای را به چتجیپیتی (ChatGPT) آورد که به سرعت به دلیل تواناییاش در خلق آثار هنری به سبک فیلمهای استودیو جیبلی (Studio Ghibli) وایرال شد.
خانواده مدلهای فلاکس ۱ کانتکست شامل دو مدل فلاکس ۱ کانتکست [پرو] (Flux.1 Kontex [pro]) و فلاکس ۱ کانتکست [مکس] (Flux.1 Kontex [max]) است. مدل اول به کاربران اجازه میدهد تصویری را تولید و سپس در چندین مرحله آن را ویرایش و اصلاح کنند، در حالی که شخصیتها و سبک تصاویر حفظ میشود. مدل فلاکس ۱ کانتکست [مکس] بر سرعت، پایداری و پایبندی به دستورات متنی تمرکز دارد.
بر خلاف برخی مدلهای پیشین بلک فارست لبز، مدلهای فلاکس ۱ کانتکست [پرو] و [مکس] قابل دانلود برای استفاده آفلاین نیستند. با این حال، بلک فارست لبز یک مدل «باز» کانتکست به نام فلاکس ۱ کانتکست [دو] (Flux.1 Kontext [dev]) را در بتای خصوصی برای تحقیقات و تستهای ایمنی ارائه میدهد.
بلک فارست لبز همچنین یک محیط آزمایشی مدل (model playground) را راهاندازی کرده که به کاربران امکان میدهد مدلهای آن را بدون نیاز به ثبت نام در سرویس شخص ثالثی امتحان کنند.
این شرکت که در آلمان مستقر است، طبق گزارشها اواخر سال گذشته در حال مذاکره برای جذب سرمایه ۱۰۰ میلیون دلاری با ارزشگذاری یک میلیارد دلاری بوده است. بسیاری از بنیانگذاران این شرکت از استابیلیتی ایآی (Stability AI)، خالق مدل بدنام تولید تصویر استیبل دیفیوژن (Stable Diffusion)، هستند. سرمایهگذاران بلک فارست لبز شامل آندرسن هوروویتز (Andreessen Horowitz)، بنیانگذار آکیولس (Oculus) برندن آیریب (Brendan Iribe) و گری تن (Garry Tan) از وای کامبینیتور (Y Combinator) میشوند.
در ماههای پس از خروج از حالت پنهانکاری (stealth)، بلک فارست لبز تعدادی مدل تولید تصویر جدید و سرویسهای متمرکز بر شرکتها از جمله یک رابط برنامهنویسی کاربردی (API) را منتشر کرده است.
منبع: تککرانچ