This photo illustration shows the DeepSeek app on a mobile phone in Beijing on January 27, 2025. Chinese firm DeepSeek's artificial intelligence chatbot has soared to the top of the Apple Store's download charts, stunning industry insiders and analysts with its ability to match its US competitors. (Photo by GREG BAKER / AFP) (Photo by GREG BAKER/AFP via Getty Images)

Image Credits:GREG BAKER/AFP / Getty Images

DeepSeek: خیزش هوش مصنوعی چینی و واکنش‌های بین‌المللی

DeepSeek، آزمایشگاه هوش مصنوعی چینی، با برنامه چت‌بات خود به شهرت جهانی دست یافته است. این مقاله به بررسی خیزش این شرکت، مدل‌های آن و واکنش‌های بین‌المللی و دولتی می‌پردازد.

۱۴۰۴/۰۲/۱۹

برنامه چت‌بات DeepSeek، محصول آزمایشگاه هوش مصنوعی چینی، در صدر جدول برنامه‌های فروشگاهی اپل و گوگل قرار گرفته و توجهات را به خود جلب کرده است. این شرکت که مدل‌های کارآمد و ارزان‌قیمتی توسعه داده، با چالش‌های رگولاتوری در چین (سانسور محتوا) و محدودیت‌ها و ممنوعیت‌ها در آمریکا و کشورهای دیگر به دلیل نگرانی‌های امنیتی و کنترلی روبرو است.

DeepSeek، آزمایشگاه هوش مصنوعی چینی، این هفته پس از اینکه برنامه چت‌بات آن به صدر جدول برنامه‌های فروشگاهی اپل (Apple App Store) و گوگل پلی (Google Play) رسید، توجهات عمومی را به خود جلب کرد.

مدل‌های هوش مصنوعی DeepSeek، که با استفاده از تکنیک‌های محاسباتی کارآمد آموزش دیده‌اند، تحلیلگران وال استریت و متخصصان فناوری را به این پرسش واداشته‌اند که آیا ایالات متحده می‌تواند برتری خود را در رقابت هوش مصنوعی حفظ کند و آیا تقاضا برای تراشه‌های هوش مصنوعی پایدار خواهد ماند.

DeepSeek از کجا آمده و چگونه به سرعت به شهرت بین‌المللی دست یافت؟ این شرکت توسط High-Flyer Capital Management، یک صندوق سرمایه‌گذاری کمی چینی که از هوش مصنوعی برای تصمیم‌گیری‌های معاملاتی خود استفاده می‌کند، پشتیبانی می‌شود.

لیانگ ونفنگ، از علاقه‌مندان به هوش مصنوعی، High-Flyer را در سال ۲۰۱۵ هم‌بنیان‌گذاری کرد. ونفنگ، که گزارش شده در زمان دانشجویی در دانشگاه ژجیانگ به معامله‌گری مشغول بود، High-Flyer Capital Management را در سال ۲۰۱۹ به عنوان یک صندوق سرمایه‌گذاری با تمرکز بر توسعه و به‌کارگیری الگوریتم‌های هوش مصنوعی راه‌اندازی کرد.

در سال ۲۰۲۳، High-Flyer، DeepSeek را به عنوان آزمایشگاهی که مستقل از کسب‌وکار مالی خود به تحقیق در زمینه ابزارهای هوش مصنوعی اختصاص داشت، آغاز کرد. با سرمایه‌گذاری High-Flyer، این آزمایشگاه به شرکت مستقلی با نام DeepSeek تبدیل شد.

DeepSeek از همان روز اول، خوشه‌های مرکز داده خود را برای آموزش مدل‌ها ساخت. اما مانند دیگر شرکت‌های هوش مصنوعی در چین، DeepSeek تحت تاثیر ممنوعیت‌های صادرات سخت‌افزار توسط ایالات متحده قرار گرفته است. برای آموزش یکی از مدل‌های اخیر خود، شرکت مجبور شد از تراشه‌های انویدیا H800 (Nvidia H800) استفاده کند که نسخه‌ای کمتر قدرتمند از تراشه H100 است که در دسترس شرکت‌های آمریکایی قرار دارد.

گفته می‌شود تیم فنی DeepSeek جوان است. گزارش‌ها حاکی از آن است که این شرکت به شدت از محققان دکترا در زمینه هوش مصنوعی از دانشگاه‌های برتر چین جذب نیرو می‌کند. DeepSeek همچنین طبق گزارش نیویورک تایمز، افرادی را بدون سابقه علوم کامپیوتر استخدام می‌کند تا به فناوری آن کمک کنند موضوعات گسترده‌تری را بهتر درک کند.

DeepSeek اولین مجموعه مدل‌های خود، DeepSeek Coder، مدل زبان بزرگ DeepSeek (DeepSeek LLM) و DeepSeek Chat را در نوامبر ۲۰۲۳ رونمایی کرد. اما صنعت هوش مصنوعی تا بهار گذشته، زمانی که استارتاپ خانواده مدل‌های نسل بعدی DeepSeek-V2 خود را منتشر کرد، متوجه آن نشد.

DeepSeek-V2، یک سیستم عمومی برای تجزیه و تحلیل متن و تصویر، در معیارهای مختلف هوش مصنوعی عملکرد خوبی داشت و اجرای آن بسیار ارزان‌تر از مدل‌های قابل مقایسه در آن زمان بود. این امر رقبا داخلی DeepSeek، از جمله بایت‌دنس (ByteDance) و علی‌بابا (Alibaba) را مجبور کرد قیمت استفاده از برخی مدل‌های خود را کاهش داده و برخی دیگر را کاملاً رایگان کنند.

DeepSeek-V3 که در دسامبر ۲۰۲۴ عرضه شد، تنها به شهرت DeepSeek افزود.

طبق آزمایش‌های معیار داخلی DeepSeek، مدل DeepSeek V3 هم از مدل‌های قابل دانلود و در دسترس عموم مانند لاما (Llama) شرکت متا (Meta) و هم از مدل‌های «بسته» که تنها از طریق رابط برنامه‌نویسی کاربردی (API) قابل دسترسی هستند، مانند GPT-4o شرکت اوپن‌ای‌آی (OpenAI)، بهتر عمل می‌کند.

به همین اندازه چشمگیر، مدل استدلال (reasoning) R1 DeepSeek است. این مدل که در ژانویه عرضه شد، DeepSeek ادعا می‌کند R1 در معیارهای کلیدی عملکردی هم‌سطح مدل o1 شرکت اوپن‌ای‌آی دارد.

مدل R1 به عنوان یک مدل استدلال، به طور موثر خود را از نظر صحت اطلاعات بررسی می‌کند، که به آن کمک می‌کند از برخی مشکلاتی که معمولاً مدل‌ها را گرفتار می‌کنند، جلوگیری کند. مدل‌های استدلال کمی بیشتر طول می‌کشد — معمولاً ثانیه‌ها تا دقایق بیشتر — تا به راه‌حل برسند در مقایسه با یک مدل معمولی غیر استدلالی. مزیت آن این است که در حوزه‌هایی مانند فیزیک، علوم و ریاضیات قابل اعتمادتر هستند.

با این حال، مدل‌های R1، DeepSeek V3 و سایر مدل‌های DeepSeek، نقطه ضعفی نیز دارند. از آنجایی که هوش مصنوعی توسعه‌یافته در چین هستند، تحت نظارت رگولاتور اینترنت چین قرار می‌گیرند تا اطمینان حاصل شود که پاسخ‌های آن‌ها «ارزش‌های اصلی سوسیالیستی را در خود جای داده‌اند». به عنوان مثال، در برنامه چت‌بات DeepSeek، R1 به پرسش‌هایی درباره میدان تیان‌آن‌من یا استقلال تایوان پاسخ نخواهد داد.

در مارس، DeepSeek از ۱۶.۵ میلیون بازدید فراتر رفت. دیوید کار، سردبیر Similarweb، به TechCrunch گفت: «در ماه مارس، DeepSeek با وجود کاهش ۲۵ درصدی ترافیک نسبت به فوریه، بر اساس بازدید روزانه، در جایگاه دوم قرار دارد.» این رقم هنوز در مقایسه با ChatGPT که در مارس از ۵۰۰ میلیون کاربر فعال هفتگی فراتر رفت، ناچیز است.

اگر DeepSeek مدل کسب‌وکاری دارد، دقیقاً مشخص نیست این مدل چیست. این شرکت محصولات و خدمات خود را بسیار پایین‌تر از ارزش بازار قیمت‌گذاری می‌کند و برخی را رایگان ارائه می‌دهد. همچنین با وجود علاقه زیاد سرمایه‌گذاران خطرپذیر، سرمایه‌گذاری دریافت نمی‌کند.

آنطور که DeepSeek می‌گوید، پیشرفت‌ها در زمینه کارایی به آن اجازه داده است تا رقابت‌پذیری شدید در هزینه‌ها را حفظ کند. با این حال، برخی کارشناسان ارقام ارائه شده توسط شرکت را زیر سوال می‌برند.

هرچه که باشد، توسعه‌دهندگان از مدل‌های DeepSeek استقبال کرده‌اند؛ مدل‌هایی که هرچند به معنای رایج متن‌باز (open source) نیستند، اما تحت مجوزهای آزادانه‌ای در دسترس هستند که امکان استفاده تجاری را فراهم می‌کنند. به گفته کلم دلانگ، مدیر عامل Hugging Face، یکی از پلتفرم‌هایی که مدل‌های DeepSeek را میزبانی می‌کند، توسعه‌دهندگان در Hugging Face بیش از ۵۰۰ مدل «مشتق شده» از R1 ایجاد کرده‌اند که در مجموع ۲.۵ میلیون بار دانلود شده‌اند.

موفقیت DeepSeek در برابر رقبای بزرگتر و جاافتاده‌تر به عنوان «برهم زدن نظم هوش مصنوعی» و «بیش از حد تبلیغ شده» توصیف شده است. موفقیت این شرکت دست‌کم بخشی از دلایل کاهش ۱۸ درصدی قیمت سهام انویدیا در ژانویه و واکنش عمومی سم آلتمن، مدیر عامل اوپن‌ای‌آی، بود. به گزارش رویترز، در مارس، دفاتر وزارت بازرگانی ایالات متحده به کارکنان خود گفتند که DeepSeek در دستگاه‌های دولتی آن‌ها ممنوع خواهد شد.

مایکروسافت اعلام کرد که DeepSeek در سرویس Azure AI Foundry آن در دسترس است؛ پلتفرم مایکروسافت که خدمات هوش مصنوعی برای شرکت‌ها را تحت یک عنوان واحد جمع‌آوری می‌کند. زمانی که در تماس درآمد سه ماهه اول متا، از مارک زاکربرگ، مدیر عامل متا، درباره تاثیر DeepSeek بر هزینه‌های هوش مصنوعی متا پرسیده شد، او گفت که هزینه کردن در زیرساخت هوش مصنوعی همچنان یک «مزیت استراتژیک» برای متا خواهد بود. در مارس، اوپن‌ای‌آی، DeepSeek را «تحت یارانه دولتی» و «تحت کنترل دولتی» خواند و توصیه کرد که دولت ایالات متحده ممنوعیت مدل‌های DeepSeek را بررسی کند.

در تماس درآمد سه ماهه چهارم انویدیا، جنسن هوانگ، مدیر عامل این شرکت، بر «نوآوری عالی» DeepSeek تاکید کرد و گفت که این مدل و سایر مدل‌های «استدلال» برای انویدیا عالی هستند زیرا به محاسبات بسیار بیشتری نیاز دارند.

در عین حال، برخی شرکت‌ها و همچنین کل کشورها و دولت‌ها، از جمله کره جنوبی، DeepSeek را ممنوع می‌کنند. ایالت نیویورک نیز استفاده از DeepSeek در دستگاه‌های دولتی را ممنوع کرد.

در ماه می، برد اسمیت، معاون رئیس و رئیس مایکروسافت، در یک جلسه سنا گفت که کارکنان مایکروسافت به دلیل نگرانی‌های امنیتی داده و تبلیغاتی مجاز به استفاده از DeepSeek نیستند.

در مورد آینده DeepSeek، مشخص نیست چه در پیش دارد. مدل‌های بهبود یافته قطعی هستند. اما به نظر می‌رسد دولت ایالات متحده نسبت به آنچه نفوذ خارجی مضر می‌پندارد، محتاط‌تر می‌شود. در مارس، وال استریت ژورنال گزارش داد که ایالات متحده به احتمال زیاد DeepSeek را در دستگاه‌های دولتی ممنوع خواهد کرد.

منبع: تک‌کرانچ

هوش مصنوعی اپل ال ال ام مایکروسافت اوپن ای آی