Apple
هوش مصنوعی

اپل از «هوش اپل» رونمایی کرد: جزئیات مدل جدید هوش مصنوعی و ادغام با سیری و ChatGPT

هوش اپل برای بهره‌گیری از قابلیت‌های برجسته هوش مصنوعی مولد، مانند تولید متن و تصویر، جهت بهبود ویژگی‌های موجود در برنامه‌های اپل طراحی شده است.

۱۴۰۴/۰۳/۲۰

اپل مدل و خدمات هوش مصنوعی جدید خود با نام «هوش اپل» را معرفی کرد که با ادغام عمیق در iOS، iPadOS و macOS، ویژگی‌هایی مانند ابزارهای نوشتاری، تولید تصویر و بهبود سیری را ارائه می‌دهد. این قابلیت رایگان است و با ChatGPT نیز ادغام می‌شود. انتشار موج اول آن در اکتبر ۲۰۲۴ آغاز شده است.

شرکت اپل (Apple) به تازگی از مدل و خدمات هوش مصنوعی جدید خود با نام «هوش اپل» (Apple Intelligence) رونمایی کرده است. این قابلیت که به اختصار آن را نیز AI می‌نامند، در اکتبر ۲۰۲۴ در اکوسیستم اپل ظاهر شد و قرار است بخشی دائمی از آن باشد، چرا که اپل در رقابت با شرکت‌هایی نظیر گوگل، اوپن‌ای‌آی (OpenAI) و انتروپیک (Anthropic) به دنبال توسعه بهترین ابزارهای هوش مصنوعی است.

مدیران بازاریابی اپل در کوپرتینو، هوش اپل را «هوش مصنوعی برای بقیه ما» توصیف کرده‌اند. این پلتفرم طراحی شده تا از قابلیت‌های برجسته هوش مصنوعی مولد (Generative AI)، مانند تولید متن و تصویر، برای بهبود ویژگی‌های موجود در برنامه‌ها استفاده کند. هوش اپل نیز مانند پلتفرم‌های دیگر از جمله ChatGPT و Google Gemini، بر روی مدل‌های اطلاعاتی بزرگ آموزش داده شده است. این سیستم‌ها از یادگیری عمیق برای ایجاد ارتباط بین انواع مختلف داده مانند متن، تصویر، ویدئو یا موسیقی بهره می‌برند.

قابلیت‌های متنی که توسط مدل زبان بزرگ (Large Language Model - LLM) تقویت می‌شوند، در قالب «ابزارهای نوشتاری» (Writing Tools) ارائه می‌شوند. این ویژگی در برنامه‌های مختلف اپل از جمله Mail، Messages، Pages و Notifications در دسترس است و می‌تواند برای خلاصه‌سازی متون طولانی، غلط‌گیری املایی و حتی نوشتن پیام‌ها بر اساس محتوا و لحن مورد نظر کاربر استفاده شود.

قابلیت تولید تصویر نیز به شکلی مشابه ادغام شده است، هرچند شاید کمی با سهولت کمتری. کاربران می‌توانند از هوش اپل بخواهند تا ایموجی‌های سفارشی (Genmojis) با سبک طراحی اپل را تولید کند. برنامه Image Playground نیز یک برنامه مستقل تولید تصویر است که از دستورات متنی برای ایجاد محتوای بصری استفاده می‌کند و می‌توان از آن در Messages، Keynote یا شبکه‌های اجتماعی استفاده کرد.

هوش اپل همچنین باعث بهبود چشمگیر سیری (Siri) شده است. این دستیار هوشمند که در ابتدا پیشرو بود، طی سال‌های اخیر مورد کم‌توجهی قرار گرفته بود. سیری اکنون به شکلی عمیق‌تر در سیستم عامل‌های اپل ادغام شده است؛ برای مثال، به جای آیکون آشنا، کاربران هنگام فعال بودن سیری، نور درخشانی را در اطراف لبه صفحه آیفون خود مشاهده خواهند کرد.

مهم‌تر اینکه، سیری جدید قابلیت کار کردن در بین برنامه‌ها را دارد. این به این معنی است که مثلاً می‌توانید از سیری بخواهید یک عکس را ویرایش کرده و سپس مستقیماً آن را در یک پیام متنی قرار دهد. این تجربه‌ای روان است که دستیار قبلاً فاقد آن بود. آگاهی از محتوای روی صفحه (Onscreen awareness) به سیری امکان می‌دهد تا از متنی که کاربر در حال حاضر با آن کار می‌کند برای ارائه پاسخ مناسب استفاده کند.

قبل از رویداد WWDC 2025، بسیاری انتظار داشتند که اپل نسخه قدرتمندتری از سیری را معرفی کند، اما باید کمی بیشتر منتظر بمانیم. کرگ فدریگی، معاون ارشد مهندسی نرم‌افزار اپل، در WWDC 2025 گفت: «همانطور که قبلاً به اشتراک گذاشتیم، به کار خود برای ارائه ویژگی‌هایی ادامه می‌دهیم که سیری را شخصی‌تر کنند. این کار برای رسیدن به استانداردهای کیفیت بالای ما به زمان بیشتری نیاز داشت و مشتاقانه منتظر به اشتراک گذاشتن اطلاعات بیشتر در این زمینه در سال آینده هستیم.» بر اساس گزارش بلومبرگ، نسخه در حال توسعه این سیری جدید که قرار است زمینه شخصی کاربر مانند روابط و روال‌های ارتباطی او را درک کند، به دلیل وجود خطا بیش از حد، برای عرضه آماده نیست و به همین دلیل به تعویق افتاده است.

در WWDC 2025، اپل همچنین از ویژگی هوش مصنوعی جدیدی به نام Visual Intelligence رونمایی کرد که به کاربر در جستجوی تصویری برای چیزهایی که هنگام وب‌گردی می‌بیند کمک می‌کند. اپل همچنین از قابلیت Live Translation (ترجمه زنده) پرده برداشت که می‌تواند مکالمات را به صورت آنی در برنامه‌های Messages، FaceTime و Phone ترجمه کند.

انتظار می‌رود Visual Intelligence و Live Translation اواخر سال ۲۰۲۵، هنگام عرضه عمومی iOS 26، در دسترس قرار گیرند.

پس از ماه‌ها گمانه‌زنی، هوش اپل در WWDC 2024 در مرکز توجه قرار گرفت. این پلتفرم در پی موجی از اخبار مرتبط با هوش مصنوعی مولد از شرکت‌هایی مانند گوگل و اوپن‌ای‌آی معرفی شد و نگرانی‌هایی را ایجاد کرده بود که این غول فناوری که معمولاً در سکوت کار می‌کند، از قافله جدیدترین تب فناوری عقب مانده است.

برخلاف این گمانه‌زنی‌ها، اپل تیمی داشت که بر روی رویکردی کار می‌کرد که مشخص شد بسیار «اپلی» به هوش مصنوعی است. اگرچه نمایش‌های جذابی وجود داشت، اما هوش اپل در نهایت رویکردی بسیار عمل‌گرایانه به این حوزه محسوب می‌شود. هوش اپل یک ویژگی مستقل نیست، بلکه در عوض، هدف آن ادغام شدن در قابلیت‌های موجود است. در حالی که این یک اقدام برندینگ در معنای واقعی است، فناوری مبتنی بر مدل زبان بزرگ (LLM) در پس‌زمینه عمل خواهد کرد. از دیدگاه مصرف‌کننده، این فناوری بیشتر در قالب ویژگی‌های جدید برای برنامه‌های موجود ارائه خواهد شد.

جزئیات بیشتری طی رویداد آیفون ۱۶ اپل در سپتامبر ۲۰۲۴ منتشر شد. طی این رویداد، اپل از تعدادی ویژگی مبتنی بر هوش مصنوعی که قرار است به دستگاه‌هایش اضافه شوند، صحبت کرد؛ از ترجمه بر روی اپل واچ سری ۱۰ گرفته تا جستجوی تصویری در آیفون‌ها و مجموعه‌ای از بهبودها در قابلیت‌های سیری. موج اول هوش اپل در پایان اکتبر، به عنوان بخشی از به‌روزرسانی‌های iOS 18.1، iPadOS 18.1 و macOS Sequoia 15.1 عرضه شد.

این ویژگی‌ها ابتدا به زبان انگلیسی (آمریکا) منتشر شدند. اپل بعداً محلی‌سازی برای زبان انگلیسی در استرالیا، کانادا، نیوزیلند، آفریقای جنوبی و بریتانیا را نیز اضافه کرد. پشتیبانی از زبان‌های چینی، انگلیسی (هند)، انگلیسی (سنگاپور)، فرانسوی، آلمانی، ایتالیایی، ژاپنی، کره‌ای، پرتغالی، اسپانیایی و ویتنامی در سال ۲۰۲۵ ارائه خواهد شد.

اولین موج هوش اپل در اکتبر ۲۰۲۴ از طریق به‌روزرسانی‌های iOS 18.1، iPadOS 18.1 و macOS Sequoia 15.1 عرضه شد. این به‌روزرسانی‌ها شامل ابزارهای نوشتاری یکپارچه، پاکسازی تصویر، خلاصه‌سازی مقالات و قابلیت تایپ برای تجربه بازطراحی شده سیری بود. موج دوم ویژگی‌ها به عنوان بخشی از iOS 18.2، iPadOS 18.2 و macOS Sequoia 15.2 در دسترس قرار گرفت. این فهرست شامل Genmoji، Image Playground، Visual Intelligence، Image Wand و ادغام ChatGPT است.

این قابلیت‌ها به صورت رایگان قابل استفاده هستند، به شرطی که یکی از سخت‌افزارهای مورد نیاز را داشته باشید.

قابل توجه است که تنها نسخه‌های پرو آیفون ۱۵ به دلیل محدودیت‌های چیپست مدل استاندارد، به این قابلیت دسترسی پیدا می‌کنند. با این حال، احتمالاً تمام مدل‌های آیفون ۱۶ هنگام عرضه قادر به اجرای هوش اپل خواهند بود.

هنگامی که از GPT یا Gemini سؤالی می‌پرسید، درخواست شما برای تولید پاسخ به سرورهای خارجی ارسال می‌شود که نیاز به اتصال اینترنت دارد. اما اپل رویکردی مبتنی بر مدل کوچک و سفارشی برای آموزش اتخاذ کرده است.

بزرگ‌ترین مزیت این رویکرد این است که بسیاری از این وظایف بسیار کمتر نیازمند منابع هستند و می‌توانند روی دستگاه اجرا شوند. این به این دلیل است که به جای تکیه بر رویکردهای کلی پلتفرم‌هایی مانند GPT و Gemini، اپل مجموعه‌داده‌هایی را به صورت داخلی برای وظایف خاصی مانند مثلاً نوشتن یک ایمیل گردآوری کرده است.

با این حال، این رویکرد برای همه چیز صادق نیست. درخواست‌های پیچیده‌تر از قابلیت جدید «محاسبات ابری خصوصی» (Private Cloud Compute) استفاده خواهند کرد. این شرکت اکنون سرورهای از راه دور را با پردازنده‌های Apple Silicon اداره می‌کند و ادعا می‌کند که این امکان حفظ سطح حریم خصوصی مشابه دستگاه‌های مصرف‌کننده را فراهم می‌کند. اینکه یک عمل به صورت محلی روی دستگاه یا از طریق ابر انجام می‌شود برای کاربر نامرئی خواهد بود، مگر اینکه دستگاه آفلاین باشد که در این صورت درخواست‌های از راه دور با خطا مواجه خواهند شد.

پیش از عرضه هوش اپل، شایعات زیادی درباره همکاری قریب‌الوقوع اپل با اوپن‌ای‌آی منتشر شد. در نهایت مشخص شد که این توافق کمتر درباره تقویت خود هوش اپل و بیشتر درباره ارائه یک پلتفرم جایگزین برای کارهایی است که هوش اپل برای آن‌ها طراحی نشده است. این اذعان ضمنی است که ساخت یک سیستم مبتنی بر مدل کوچک محدودیت‌هایی دارد.

هوش اپل رایگان است. همچنین دسترسی به ChatGPT از طریق آن رایگان است. با این حال، کسانی که حساب پولی در ChatGPT دارند، به ویژگی‌های پریمیوم دسترسی خواهند داشت که برای کاربران رایگان در دسترس نیست، از جمله پرس‌وجوهای نامحدود.

ادغام ChatGPT که برای اولین بار در iOS 18.2، iPadOS 18.2 و macOS Sequoia 15.2 معرفی شد، دو نقش اصلی دارد: تکمیل پایگاه دانش سیری و افزودن به گزینه‌های موجود در ابزارهای نوشتاری (Writing Tools).

با فعال بودن این سرویس، برخی سؤالات باعث می‌شوند سیری جدید از کاربر بخواهد تا اجازه دسترسی آن به ChatGPT را تأیید کند. سوالاتی درباره دستور پخت غذا یا برنامه‌ریزی سفر نمونه‌هایی هستند که ممکن است این گزینه را ظاهر کنند. کاربران همچنین می‌توانند مستقیماً از سیری بخواهند که «از ChatGPT بپرسد».

«Compose» (نوشتن) دیگر ویژگی اصلی ChatGPT است که از طریق هوش اپل در دسترس است. کاربران می‌توانند در هر برنامه‌ای که از ویژگی جدید ابزارهای نوشتاری پشتیبانی می‌کند، به آن دسترسی پیدا کنند. Compose قابلیت نوشتن محتوا بر اساس یک دستور متنی (prompt) را اضافه می‌کند. این ویژگی به ابزارهای نوشتاری موجود مانند Style (سبک نوشتار) و Summary (خلاصه) می‌پیوندد.

ما به طور قطعی می‌دانیم که اپل قصد دارد با سرویس‌های هوش مصنوعی مولد بیشتری شریک شود. این شرکت تقریباً اعلام کرده که Google Gemini نفر بعدی در این فهرست است.

در WWDC 2025، اپل چیزی را به نام چارچوب «مدل‌های بنیادی» (Foundation Models) معرفی کرد که به توسعه‌دهندگان اجازه می‌دهد حتی در حالت آفلاین از مدل‌های هوش مصنوعی آن استفاده کنند.

این امر امکان بیشتری را برای توسعه‌دهندگان فراهم می‌کند تا ویژگی‌های هوش مصنوعی را در برنامه‌های شخص ثالث خود بسازند که از سیستم‌های موجود اپل بهره می‌برند. فدریگی در WWDC گفت: «برای مثال، اگر برای امتحان آماده می‌شوید، برنامه‌ای مانند Kahoot می‌تواند از یادداشت‌های شما یک آزمون شخصی‌سازی شده بسازد تا مطالعه را جذاب‌تر کند. و چون این کار با استفاده از مدل‌های روی دستگاه انجام می‌شود، بدون هزینه API ابری خواهد بود. ما از اینکه توسعه‌دهندگان چگونه می‌توانند بر پایه هوش اپل، تجربیات جدیدی ارائه دهند که هوشمند، در حالت آفلاین در دسترس و محافظ حریم خصوصی شما هستند، بسیار هیجان‌زده‌ایم.»

منبع: تک‌کرانچ

به مطالعه ادامه دهید