Google Gemini in Android Auto
تکنولوژی

گوگل جمینی را به اندروید اتو می‌آورد

گوگل اعلام کرد که هوش مصنوعی مولد جمینی را به زودی به تمام خودروهای دارای اندروید اتو اضافه خواهد کرد تا تجربه رانندگی را بهبود بخشد.

۱۴۰۴/۰۲/۲۳

گوگل در نمایشگاه اندروید از افزودن هوش مصنوعی جمینی به اندروید اتو در ماه‌های آینده خبر داد. این قابلیت به عنوان یک دستیار صوتی قدرتمندتر با زبان طبیعی عمل کرده و امکاناتی مانند یافتن مکان‌ها یا مکالمات با "جمینی لایو" را فراهم می‌کند. هدف گوگل افزایش کارایی و لذت رانندگی است.

گوگل اعلام کرده است که جمینی (Gemini)، هوش مصنوعی مولد (generative AI) خود را در چند ماه آینده به تمام خودروهایی که از اندروید اتو (Android Auto) پشتیبانی می‌کنند، خواهد آورد. این خبر در نمایشگاه اندروید (Android Show) شرکت، پیش از کنفرانس توسعه‌دهندگان I/O 2025 گوگل، اعلام شد.

این شرکت در پستی وبلاگی بیان کرده است که افزودن قابلیت‌های جمینی به اندروید اتو و سپس در اواخر سال جاری به خودروهایی که سیستم‌عامل داخلی گوگل (Google Built-In) را اجرا می‌کنند، رانندگی را "کارآمدتر و لذت‌بخش‌تر" خواهد کرد.

پاتریک بردی (Patrick Brady)، معاون اندروید برای خودروها، در یک نشست مجازی با خبرنگاران پیش از کنفرانس گفت: "ما فکر می‌کنیم این واقعاً یکی از بزرگترین تحولات در تجربه درون خودرو خواهد بود که برای مدت بسیار طولانی شاهد آن نبوده‌ایم."

جمینی به دو روش اصلی در تجربه اندروید اتو ظاهر خواهد شد.

جمینی به عنوان یک دستیار صوتی هوشمند بسیار قدرتمندتر عمل خواهد کرد. رانندگان (یا سرنشینان – بردی گفت که تشخیص صدای صاحب گوشی که اندروید اتو را اجرا می‌کند انجام نمی‌شود) می‌توانند از جمینی بخواهند پیامک ارسال کند، موسیقی پخش کند و اساساً تمام کارهایی را که گوگل اسیستنت قبلاً انجام می‌داد، انجام دهد. تفاوت در این است که کاربران به لطف قابلیت‌های زبان طبیعی (natural language) جمینی نیازی به دستورات "رباتیک" نخواهند داشت.

جمینی همچنین می‌تواند چیزهایی مانند اینکه آیا یک مخاطب خاص ترجیح می‌دهد پیامک را به زبان خاصی دریافت کند را "به خاطر بسپارد" و آن ترجمه را برای کاربر انجام دهد. و گوگل ادعا می‌کند که جمینی قادر به انجام یکی از رایج‌ترین نمایش‌های فناوری در خودرو خواهد بود: پیدا کردن رستوران‌های خوب در مسیر برنامه‌ریزی شده. بردی گفت که جمینی قادر خواهد بود اطلاعات و نظرات فهرست‌های گوگل را برای پاسخ به درخواست‌های خاص‌تر (مانند "مکان‌های تاکو با گزینه‌های گیاهی") جستجو کند.

روش اصلی دیگر که جمینی در آن ظاهر خواهد شد، چیزی است که گوگل آن را "جمینی لایو" (Gemini Live) می‌نامد؛ گزینه‌ای که در آن هوش مصنوعی دیجیتال اساساً همیشه در حال گوش دادن و آماده برای شروع مکالمات کامل درباره… هر چیزی است. بردی گفت که این مکالمات می‌تواند درباره همه چیز از ایده‌های سفر برای تعطیلات بهاره گرفته تا طوفان فکری برای دستور پخت‌هایی که یک کودک ۱۰ ساله دوست دارد، یا "تاریخ روم" باشد.

اگرچه همه این‌ها ممکن است کمی حواس‌پرت‌کننده به نظر برسد، بردی گفت گوگل معتقد است اینطور نخواهد بود. او ادعا کرد که قابلیت‌های زبان طبیعی باعث می‌شود راحت‌تر بتوان از اندروید اتو خواست کارهای خاصی را با دردسر کمتر انجام دهد و بنابراین جمینی "بار شناختی" (cognitive load) را "کاهش خواهد داد".

این ادعایی جسورانه در زمانی است که مردم خواستار فاصله گرفتن شرکت‌های خودروسازی از نمایشگرهای لمسی و بازگشت دکمه‌ها و ولوم‌های فیزیکی هستند – درخواستی که بسیاری از این شرکت‌ها شروع به برآورده کردن آن کرده‌اند.

مسائل زیادی هنوز در حال بررسی هستند. در حال حاضر، جمینی برای کار در اندروید اتو و خودروهای با گوگل بیلداین، از پردازش ابری (cloud processing) گوگل استفاده خواهد کرد. اما بردی گفت گوگل با خودروسازان در حال کار است "تا قدرت پردازش بیشتری را در سیستم‌ها تعبیه کنند تا [جمینی] بتواند در لبه (at the edge) اجرا شود"، که نه تنها به عملکرد بلکه به قابلیت اطمینان کمک می‌کند – عاملی چالش‌برانگیز در یک وسیله نقلیه در حال حرکت که ممکن است هر چند دقیقه یک بار به برج‌های سلولی جدید متصل شود.

خودروهای مدرن نیز حجم زیادی از داده‌ها را از حسگرهای داخلی و در برخی مدل‌ها حتی دوربین‌های داخلی و خارجی تولید می‌کنند. بردی گفت گوگل "چیزی برای اعلام ندارد" در مورد اینکه آیا جمینی می‌تواند از این داده‌های چندوجهی (multi-modal data) استفاده کند یا خیر، و افزود که "ما در این باره زیاد صحبت کرده‌ایم".

او گفت: "ما قطعاً فکر می‌کنیم با افزایش تعداد دوربین‌ها در خودروها، موارد استفاده واقعاً بسیار جالبی در آینده وجود خواهد داشت."

جمینی در اندروید اتو و گوگل بیلداین برای تمام کشورهایی که در حال حاضر به مدل هوش مصنوعی مولد این شرکت دسترسی دارند، عرضه خواهد شد و بیش از 40 زبان را پشتیبانی خواهد کرد.

منبع: تک‌کرانچ

به مطالعه ادامه دهید