31 January 2025, Bavaria, Munich: The Google logo and lettering can be seen on the facade of the company's Munich headquarters on January 31, 2025 in Munich (Bavaria). The company's development center is located in Arnulfpark. More than 2,500 employees work for the US company at various locations in Germany. The parent company of Google LLC is Alphabet Inc. Photo: Matthias Balk/dpa (Photo by Matthias Balk/picture alliance via Getty Images)
گوگل

گوگل ویژگی‌های جدید هوش مصنوعی و دسترسی‌پذیری را در اندروید و کروم عرضه می‌کند

گوگل ویژگی‌های جدید هوش مصنوعی و دسترسی‌پذیری از جمله بهبود TalkBack برای پرسش در مورد تصاویر و صفحه نمایش، به‌روزرسانی Expressive Captions و پشتیبانی بهتر از PDF در کروم را عرضه می‌کند.

۱۴۰۴/۰۲/۲۵

گوگل ویژگی‌های جدید هوش مصنوعی و دسترسی‌پذیری را برای اندروید و کروم عرضه کرده است. این به‌روزرسانی‌ها شامل بهبود TalkBack برای پرسش در مورد محتوای تصاویر و صفحه نمایش با کمک هوش مصنوعی Gemini، به‌روزرسانی ویژگی زیرنویس زنده Expressive Captions و امکان دسترسی صفحه خوان به فایل‌های PDF اسکن شده در کروم از طریق تشخیص کاراکتر نوری (OCR) است.

گوگل روز پنجشنبه اعلام کرد که در حال عرضه ویژگی‌های جدید هوش مصنوعی و دسترسی‌پذیری برای سیستم عامل اندروید و مرورگر کروم است. یکی از مهم‌ترین این ویژگی‌ها، اضافه شدن قابلیت پرسش در مورد محتوای تصاویر و صفحه نمایش به TalkBack، ابزار صفحه خوان اندروید، از طریق هوش مصنوعی Gemini است.

گوگل سال گذشته قابلیت‌های Gemini را به TalkBack اضافه کرده بود تا افراد نابینا یا کم‌بینا حتی در صورت عدم وجود متن جایگزین (Alt text)، به توضیحات خودکار تصاویر دسترسی داشته باشند. اکنون کاربران می‌توانند در مورد تصاویر خود سوالاتی بپرسند و پاسخ دریافت کنند. به عنوان مثال، اگر دوستی عکسی از گیتار جدیدش بفرستد، می‌توان توضیحی در مورد آن دریافت کرد و در مورد برند و رنگ آن سوال پرسید. علاوه بر این، اکنون امکان دریافت توضیحات و پرسش در مورد کل صفحه نمایش گوشی نیز فراهم شده است. بنابراین، هنگام خرید در یک اپلیکیشن، می‌توانید در مورد جنس یک کالا یا موجود بودن تخفیف سوال کنید.

گوگل همچنین اعلام کرد که در حال به‌روزرسانی Expressive Captions، ویژگی زیرنویس زنده اندروید است که از هوش مصنوعی برای ضبط گفته‌ها و نحوه بیان آن‌ها استفاده می‌کند. گوگل آگاه است که یکی از راه‌های ابراز احساسات افراد، کشیدن صداها در کلمات است، به همین دلیل ویژگی جدیدی برای نمایش مدت زمان کشیدگی صداها در Expressive Captions توسعه داده است. اکنون می‌توانید متوجه شوید که گزارشگر ورزشی می‌گوید "عالیییی" یا کسی به سادگی نمی‌گوید "نه"، بلکه می‌گوید "نهههههه". همچنین برچسب‌های جدیدی برای صداها مانند سوت زدن یا صاف کردن گلو اضافه خواهد شد.

این به‌روزرسانی به زبان انگلیسی در ایالات متحده، بریتانیا، کانادا و استرالیا برای دستگاه‌هایی که اندروید ۱۵ و بالاتر را اجرا می‌کنند، عرضه می‌شود.

گوگل دسترسی به فایل‌های PDF را نیز در مرورگر کروم آسان‌تر کرده است. تا پیش از این، امکان استفاده از صفحه خوان برای تعامل با فایل‌های PDF اسکن شده در مرورگر کروم دسکتاپ وجود نداشت. اکنون، کروم به طور خودکار این نوع فایل‌های PDF را شناسایی می‌کند و امکان هایلایت، کپی و جستجوی متن مانند هر صفحه دیگری را فراهم کرده و به صفحه خوان اجازه می‌دهد آن‌ها را بخواند. گوگل می‌گوید این امکان به لطف معرفی قابلیت تشخیص کاراکتر نوری (Optical Character Recognition یا OCR) میسر شده است.

علاوه بر این، ویژگی Page Zoom در کروم اندروید اکنون به شما امکان می‌دهد اندازه متنی را که می‌بینید، بدون تأثیر بر طرح‌بندی صفحه وب، بزرگ کنید. می‌توانید میزان بزرگنمایی را سفارشی کرده و انتخاب کنید که این تنظیمات برای تمام صفحات یا فقط صفحات خاصی اعمال شود. می‌توانید از طریق منوی سه نقطه در گوشه بالا سمت راست کروم به این ویژگی دسترسی پیدا کنید.

منبع: تک‌کرانچ

به مطالعه ادامه دهید