The Google Gemini generative AI logo on a smartphone arranged in Riga, Latvia, on Friday, Aug. 16, 2024. The public release of advanced generative AI tools such as Google's Gemini, Meta AI, and OpenAI's ChatGPT over the past two years has heightened fears that millions of workers could be displaced. Photographer: Andrey Rudakov/Bloomberg via Getty Images
هوش مصنوعی

قابلیت ویرایش بومی تصاویر به چت‌بات جمینای گوگل اضافه شد

اپلیکیشن چت‌بات جمینای گوگل اکنون به شما امکان می‌دهد هم تصاویر تولید شده توسط هوش مصنوعی و هم تصاویری را که از تلفن یا رایانه خود بارگذاری می‌کنید، ویرایش کنید.

۱۴۰۴/۰۲/۱۰

گوگل قابلیت ویرایش بومی تصاویر را به چت‌بات جمینای خود اضافه کرده است که به کاربران امکان می‌دهد تصاویر تولیدی با هوش مصنوعی و تصاویر آپلود شده را ویرایش کنند.

گوگل روز چهارشنبه در پستی وبلاگی اعلام کرد که اپلیکیشن چت‌بات جمینای (Gemini) این شرکت اکنون به شما امکان می‌دهد هم تصاویر تولید شده توسط هوش مصنوعی و هم تصاویری را که از تلفن یا رایانه خود بارگذاری می‌کنید، ویرایش کنید.

قابلیت «ویرایش بومی تصاویر» (native image editing) در جمینای از امروز به تدریج شروع به عرضه خواهد کرد و در هفته‌های آینده برای افراد بیشتری در بیش از ۴۵ زبان و بیشتر کشورها گسترش می‌یابد.

این عرضه به دنبال مدل ویرایش تصویر مبتنی بر هوش مصنوعی است که گوگل در ماه مارس در پلتفرم «ای‌آی استودیو» (AI Studio) خود آزمایش کرد، مدلی که به دلیل قابلیت بحث‌برانگیزش در حذف واتر مارک از هر تصویری، وایرال شد. مشابه ابزار ویرایش تصویر که اخیراً در چت‌جی‌پی‌تی (ChatGPT) ارتقا یافته است، ویرایشگر بومی جدید جمینای از نظر تئوری می‌تواند نتایج بهتری نسبت به تولیدکنندگان مستقل تصاویر با هوش مصنوعی ارائه دهد.

جمینای اکنون یک «جریان ویرایش چندمرحله‌ای» (multi-step editing flow) ارائه می‌دهد که طبق توصیف گوگل، پاسخ‌های «غنی‌تر و متناسب‌تر با متن» را به هر فرمان (prompt) با ادغام متن و تصویر ارائه می‌دهد. شما می‌توانید پس‌زمینه تصاویر را تغییر دهید، اشیاء را جایگزین کنید، عناصر اضافه کنید و موارد دیگر را در جریان پلتفرم جمینای انجام دهید.

گوگل در پستی وبلاگی توضیح می‌دهد: «برای مثال، می‌توانید یک عکس شخصی بارگذاری کرده و از جمینای بخواهید تصویری از خودتان با رنگ موهای متفاوت تولید کند.» «یا می‌توانید از جمینای بخواهید اولین پیش‌نویس یک داستان قبل از خواب درباره اژدها را ایجاد کند و تصاویری را برای همراهی با داستان ارائه دهد.»

اگر این قابلیت شبیه به خطر «دیپ‌فیک» (deepfake) به نظر می‌رسد، این نگرانی منطقی است. طبق گفته گوگل، برای کاهش ترس‌ها، تصاویری که با قابلیت «تولید بومی تصاویر» (native image generation) جمینای ایجاد یا ویرایش می‌شوند، شامل یک «واترمارک نامرئی» (invisible watermark) خواهند بود. این شرکت همچنین در حال «آزمایش» با «واترمارک‌های قابل مشاهده» (visible watermarks) بر روی تمام تصاویر تولید شده توسط جمینای است.

منبع: تک‌کرانچ

به مطالعه ادامه دهید