
Image Credits:GREG BAKER/AFP / Getty Images
DeepSeek: خیزش هوش مصنوعی چینی و واکنشهای بینالمللی
DeepSeek، آزمایشگاه هوش مصنوعی چینی، با برنامه چتبات خود به شهرت جهانی دست یافته است. این مقاله به بررسی خیزش این شرکت، مدلهای آن و واکنشهای بینالمللی و دولتی میپردازد.
۱۴۰۴/۰۲/۱۹
برنامه چتبات DeepSeek، محصول آزمایشگاه هوش مصنوعی چینی، در صدر جدول برنامههای فروشگاهی اپل و گوگل قرار گرفته و توجهات را به خود جلب کرده است. این شرکت که مدلهای کارآمد و ارزانقیمتی توسعه داده، با چالشهای رگولاتوری در چین (سانسور محتوا) و محدودیتها و ممنوعیتها در آمریکا و کشورهای دیگر به دلیل نگرانیهای امنیتی و کنترلی روبرو است.
DeepSeek، آزمایشگاه هوش مصنوعی چینی، این هفته پس از اینکه برنامه چتبات آن به صدر جدول برنامههای فروشگاهی اپل (Apple App Store) و گوگل پلی (Google Play) رسید، توجهات عمومی را به خود جلب کرد.
مدلهای هوش مصنوعی DeepSeek، که با استفاده از تکنیکهای محاسباتی کارآمد آموزش دیدهاند، تحلیلگران وال استریت و متخصصان فناوری را به این پرسش واداشتهاند که آیا ایالات متحده میتواند برتری خود را در رقابت هوش مصنوعی حفظ کند و آیا تقاضا برای تراشههای هوش مصنوعی پایدار خواهد ماند.
DeepSeek از کجا آمده و چگونه به سرعت به شهرت بینالمللی دست یافت؟ این شرکت توسط High-Flyer Capital Management، یک صندوق سرمایهگذاری کمی چینی که از هوش مصنوعی برای تصمیمگیریهای معاملاتی خود استفاده میکند، پشتیبانی میشود.
لیانگ ونفنگ، از علاقهمندان به هوش مصنوعی، High-Flyer را در سال ۲۰۱۵ همبنیانگذاری کرد. ونفنگ، که گزارش شده در زمان دانشجویی در دانشگاه ژجیانگ به معاملهگری مشغول بود، High-Flyer Capital Management را در سال ۲۰۱۹ به عنوان یک صندوق سرمایهگذاری با تمرکز بر توسعه و بهکارگیری الگوریتمهای هوش مصنوعی راهاندازی کرد.
در سال ۲۰۲۳، High-Flyer، DeepSeek را به عنوان آزمایشگاهی که مستقل از کسبوکار مالی خود به تحقیق در زمینه ابزارهای هوش مصنوعی اختصاص داشت، آغاز کرد. با سرمایهگذاری High-Flyer، این آزمایشگاه به شرکت مستقلی با نام DeepSeek تبدیل شد.
DeepSeek از همان روز اول، خوشههای مرکز داده خود را برای آموزش مدلها ساخت. اما مانند دیگر شرکتهای هوش مصنوعی در چین، DeepSeek تحت تاثیر ممنوعیتهای صادرات سختافزار توسط ایالات متحده قرار گرفته است. برای آموزش یکی از مدلهای اخیر خود، شرکت مجبور شد از تراشههای انویدیا H800 (Nvidia H800) استفاده کند که نسخهای کمتر قدرتمند از تراشه H100 است که در دسترس شرکتهای آمریکایی قرار دارد.
گفته میشود تیم فنی DeepSeek جوان است. گزارشها حاکی از آن است که این شرکت به شدت از محققان دکترا در زمینه هوش مصنوعی از دانشگاههای برتر چین جذب نیرو میکند. DeepSeek همچنین طبق گزارش نیویورک تایمز، افرادی را بدون سابقه علوم کامپیوتر استخدام میکند تا به فناوری آن کمک کنند موضوعات گستردهتری را بهتر درک کند.
DeepSeek اولین مجموعه مدلهای خود، DeepSeek Coder، مدل زبان بزرگ DeepSeek (DeepSeek LLM) و DeepSeek Chat را در نوامبر ۲۰۲۳ رونمایی کرد. اما صنعت هوش مصنوعی تا بهار گذشته، زمانی که استارتاپ خانواده مدلهای نسل بعدی DeepSeek-V2 خود را منتشر کرد، متوجه آن نشد.
DeepSeek-V2، یک سیستم عمومی برای تجزیه و تحلیل متن و تصویر، در معیارهای مختلف هوش مصنوعی عملکرد خوبی داشت و اجرای آن بسیار ارزانتر از مدلهای قابل مقایسه در آن زمان بود. این امر رقبا داخلی DeepSeek، از جمله بایتدنس (ByteDance) و علیبابا (Alibaba) را مجبور کرد قیمت استفاده از برخی مدلهای خود را کاهش داده و برخی دیگر را کاملاً رایگان کنند.
DeepSeek-V3 که در دسامبر ۲۰۲۴ عرضه شد، تنها به شهرت DeepSeek افزود.
طبق آزمایشهای معیار داخلی DeepSeek، مدل DeepSeek V3 هم از مدلهای قابل دانلود و در دسترس عموم مانند لاما (Llama) شرکت متا (Meta) و هم از مدلهای «بسته» که تنها از طریق رابط برنامهنویسی کاربردی (API) قابل دسترسی هستند، مانند GPT-4o شرکت اوپنایآی (OpenAI)، بهتر عمل میکند.
به همین اندازه چشمگیر، مدل استدلال (reasoning) R1 DeepSeek است. این مدل که در ژانویه عرضه شد، DeepSeek ادعا میکند R1 در معیارهای کلیدی عملکردی همسطح مدل o1 شرکت اوپنایآی دارد.
مدل R1 به عنوان یک مدل استدلال، به طور موثر خود را از نظر صحت اطلاعات بررسی میکند، که به آن کمک میکند از برخی مشکلاتی که معمولاً مدلها را گرفتار میکنند، جلوگیری کند. مدلهای استدلال کمی بیشتر طول میکشد — معمولاً ثانیهها تا دقایق بیشتر — تا به راهحل برسند در مقایسه با یک مدل معمولی غیر استدلالی. مزیت آن این است که در حوزههایی مانند فیزیک، علوم و ریاضیات قابل اعتمادتر هستند.
با این حال، مدلهای R1، DeepSeek V3 و سایر مدلهای DeepSeek، نقطه ضعفی نیز دارند. از آنجایی که هوش مصنوعی توسعهیافته در چین هستند، تحت نظارت رگولاتور اینترنت چین قرار میگیرند تا اطمینان حاصل شود که پاسخهای آنها «ارزشهای اصلی سوسیالیستی را در خود جای دادهاند». به عنوان مثال، در برنامه چتبات DeepSeek، R1 به پرسشهایی درباره میدان تیانآنمن یا استقلال تایوان پاسخ نخواهد داد.
در مارس، DeepSeek از ۱۶.۵ میلیون بازدید فراتر رفت. دیوید کار، سردبیر Similarweb، به TechCrunch گفت: «در ماه مارس، DeepSeek با وجود کاهش ۲۵ درصدی ترافیک نسبت به فوریه، بر اساس بازدید روزانه، در جایگاه دوم قرار دارد.» این رقم هنوز در مقایسه با ChatGPT که در مارس از ۵۰۰ میلیون کاربر فعال هفتگی فراتر رفت، ناچیز است.
اگر DeepSeek مدل کسبوکاری دارد، دقیقاً مشخص نیست این مدل چیست. این شرکت محصولات و خدمات خود را بسیار پایینتر از ارزش بازار قیمتگذاری میکند و برخی را رایگان ارائه میدهد. همچنین با وجود علاقه زیاد سرمایهگذاران خطرپذیر، سرمایهگذاری دریافت نمیکند.
آنطور که DeepSeek میگوید، پیشرفتها در زمینه کارایی به آن اجازه داده است تا رقابتپذیری شدید در هزینهها را حفظ کند. با این حال، برخی کارشناسان ارقام ارائه شده توسط شرکت را زیر سوال میبرند.
هرچه که باشد، توسعهدهندگان از مدلهای DeepSeek استقبال کردهاند؛ مدلهایی که هرچند به معنای رایج متنباز (open source) نیستند، اما تحت مجوزهای آزادانهای در دسترس هستند که امکان استفاده تجاری را فراهم میکنند. به گفته کلم دلانگ، مدیر عامل Hugging Face، یکی از پلتفرمهایی که مدلهای DeepSeek را میزبانی میکند، توسعهدهندگان در Hugging Face بیش از ۵۰۰ مدل «مشتق شده» از R1 ایجاد کردهاند که در مجموع ۲.۵ میلیون بار دانلود شدهاند.
موفقیت DeepSeek در برابر رقبای بزرگتر و جاافتادهتر به عنوان «برهم زدن نظم هوش مصنوعی» و «بیش از حد تبلیغ شده» توصیف شده است. موفقیت این شرکت دستکم بخشی از دلایل کاهش ۱۸ درصدی قیمت سهام انویدیا در ژانویه و واکنش عمومی سم آلتمن، مدیر عامل اوپنایآی، بود. به گزارش رویترز، در مارس، دفاتر وزارت بازرگانی ایالات متحده به کارکنان خود گفتند که DeepSeek در دستگاههای دولتی آنها ممنوع خواهد شد.
مایکروسافت اعلام کرد که DeepSeek در سرویس Azure AI Foundry آن در دسترس است؛ پلتفرم مایکروسافت که خدمات هوش مصنوعی برای شرکتها را تحت یک عنوان واحد جمعآوری میکند. زمانی که در تماس درآمد سه ماهه اول متا، از مارک زاکربرگ، مدیر عامل متا، درباره تاثیر DeepSeek بر هزینههای هوش مصنوعی متا پرسیده شد، او گفت که هزینه کردن در زیرساخت هوش مصنوعی همچنان یک «مزیت استراتژیک» برای متا خواهد بود. در مارس، اوپنایآی، DeepSeek را «تحت یارانه دولتی» و «تحت کنترل دولتی» خواند و توصیه کرد که دولت ایالات متحده ممنوعیت مدلهای DeepSeek را بررسی کند.
در تماس درآمد سه ماهه چهارم انویدیا، جنسن هوانگ، مدیر عامل این شرکت، بر «نوآوری عالی» DeepSeek تاکید کرد و گفت که این مدل و سایر مدلهای «استدلال» برای انویدیا عالی هستند زیرا به محاسبات بسیار بیشتری نیاز دارند.
در عین حال، برخی شرکتها و همچنین کل کشورها و دولتها، از جمله کره جنوبی، DeepSeek را ممنوع میکنند. ایالت نیویورک نیز استفاده از DeepSeek در دستگاههای دولتی را ممنوع کرد.
در ماه می، برد اسمیت، معاون رئیس و رئیس مایکروسافت، در یک جلسه سنا گفت که کارکنان مایکروسافت به دلیل نگرانیهای امنیتی داده و تبلیغاتی مجاز به استفاده از DeepSeek نیستند.
در مورد آینده DeepSeek، مشخص نیست چه در پیش دارد. مدلهای بهبود یافته قطعی هستند. اما به نظر میرسد دولت ایالات متحده نسبت به آنچه نفوذ خارجی مضر میپندارد، محتاطتر میشود. در مارس، وال استریت ژورنال گزارش داد که ایالات متحده به احتمال زیاد DeepSeek را در دستگاههای دولتی ممنوع خواهد کرد.
منبع: تککرانچ