Anthropic Claude 3.5 logo
هوش مصنوعی

آنتروپیک مدل‌های جدید هوش مصنوعی Claude 4 را با قابلیت استدلال چندمرحله‌ای معرفی کرد

آنتروپیک در نخستین کنفرانس توسعه‌دهندگان خود، دو مدل جدید هوش مصنوعی معرفی کرد که به گفته استارتاپ، جزو بهترین‌ها در صنعت بر اساس معیارهای پرکاربرد هستند.

۱۴۰۴/۰۳/۰۱

آنتروپیک در نخستین کنفرانس توسعه‌دهندگان خود، مدل‌های جدید هوش مصنوعی Claude Opus 4 و Claude Sonnet 4 را معرفی کرد. این مدل‌ها که بخشی از خانواده Claude 4 هستند، قابلیت تجزیه و تحلیل داده‌های بزرگ، اجرای وظایف پیچیده و تمرکز بر برنامه‌نویسی دارند. Opus 4 برای کاربران پولی و Sonnet 4 برای همه در دسترس است و قیمت‌گذاری آنها بر اساس توکن اعلام شده است. آنتروپیک همچنین ابزار Claude Code را با قابلیت ادغام با محیط‌های توسعه بهبود بخشیده است. این معرفی در راستای هدف آنتروپیک برای رشد درآمد و رقابت با شرکت‌هایی مانند OpenAI و گوگل صورت می‌گیرد.

شرکت آنتروپیک (Anthropic) در نخستین کنفرانس توسعه‌دهندگان خود که پنج‌شنبه برگزار شد، دو مدل جدید هوش مصنوعی را معرفی کرد که به گفته این استارتاپ، بر اساس معیارهای پرکاربرد، جزو بهترین‌ها در صنعت هستند.

بر اساس اعلام شرکت، مدل‌های Claude Opus 4 و Claude Sonnet 4 که بخشی از خانواده مدل‌های جدید Claude 4 آنتروپیک هستند، قادر به تجزیه و تحلیل مجموعه داده‌های بزرگ، اجرای وظایف با افق زمانی طولانی و انجام اقدامات پیچیده هستند. آنتروپیک می‌گوید هر دو مدل برای عملکرد خوب در وظایف برنامه‌نویسی تنظیم شده‌اند و آنها را برای نوشتن و ویرایش کد مناسب می‌سازند.

هم کاربران پولی و هم کاربران برنامه‌های رایگان چت‌بات شرکت به Sonnet 4 دسترسی خواهند داشت، اما تنها کاربران پولی به Opus 4 دسترسی پیدا می‌کنند. برای API آنتروپیک، که از طریق پلتفرم Bedrock آمازون و Vertex AI گوگل در دسترس است، قیمت Opus 4 برای هر میلیون توکن (ورودی/خروجی) ۱۵ دلار/۷۵ دلار و Sonnet 4 برای هر میلیون توکن (ورودی/خروجی) ۳ دلار/۱۵ دلار خواهد بود.

توکن‌ها (Tokens) بیت‌های خام داده هستند که مدل‌های هوش مصنوعی با آنها کار می‌کنند. یک میلیون توکن معادل حدود ۷۵۰,۰۰۰ کلمه است.

معرفی مدل‌های Claude 4 آنتروپیک در حالی صورت می‌گیرد که این شرکت به دنبال رشد قابل توجه درآمد است. گزارش‌ها حاکی از آن است که این مجموعه که توسط محققان سابق OpenAI تأسیس شده، هدف دارد در سال ۲۰۲۷ به ۱۲ میلیارد دلار درآمد دست یابد که نسبت به پیش‌بینی ۲.۲ میلیارد دلار برای امسال، افزایشی قابل توجه است. آنتروپیک اخیراً یک تسهیلات اعتباری ۲.۵ میلیارد دلاری را بسته و میلیاردها دلار از آمازون و دیگر سرمایه‌گذاران جذب کرده است تا با هزینه‌های فزاینده مرتبط با توسعه مدل‌های پیشرفته (frontier models) مقابله کند.

رقبا، حفظ موقعیت پیشتاز در مسابقه هوش مصنوعی را آسان نکرده‌اند. در حالی که آنتروپیک مدل پرچمدار جدیدی با نام Claude Sonnet 3.7 را اوایل سال جاری در کنار ابزار کدنویسی عامل‌محور به نام Claude Code معرفی کرد، رقبایی از جمله OpenAI و گوگل برای پیشی گرفتن از این شرکت با مدل‌های قدرتمند و ابزارهای توسعه خودشان مسابقه داده‌اند.

آنتروپیک با Claude 4 جدی عمل می‌کند.

آنتروپیک می‌گوید مدل تواناتر از دو مدل معرفی شده امروز، Opus 4، می‌تواند «تلاش متمرکز» را در چندین مرحله از یک فرآیند کاری حفظ کند. در همین حال، به گفته شرکت، Sonnet 4 که به عنوان «جایگزینی ساده» برای Sonnet 3.7 طراحی شده است، در کدنویسی و ریاضیات نسبت به مدل‌های قبلی آنتروپیک بهبود یافته و دستورالعمل‌ها را با دقت بیشتری دنبال می‌کند.

خانواده Claude 4 نیز کمتر از Sonnet 3.7 درگیر «پاداش‌محوری متقلبانه» (reward hacking) می‌شود، که آنتروپیک این ادعا را مطرح کرده است. پاداش‌محوری متقلبانه، که به آن بازی با مشخصات (specification gaming) نیز گفته می‌شود، رفتاری است که در آن مدل‌ها برای تکمیل وظایف، از میانبرها و حفره‌ها استفاده می‌کنند.

برای روشن شدن، این بهبودها منجر به تولید بهترین مدل‌های جهان در تمام معیارها نشده است. به عنوان مثال، در حالی که Opus 4 در معیار SWE-bench Verified که برای ارزیابی توانایی‌های کدنویسی مدل طراحی شده است، مدل‌های Gemini 2.5 Pro گوگل و o3 و GPT-4.1 OpenAI را شکست می‌دهد، اما نمی‌تواند در ارزیابی چندوجهی MMMU یا GPQA Diamond، مجموعه‌ای از سوالات در سطح دکترا مربوط به زیست‌شناسی، فیزیک و شیمی، از o3 پیشی بگیرد.

با این حال، آنتروپیک Opus 4 را تحت اقدامات حفاظتی سخت‌گیرانه‌تری، از جمله آشکارسازهای محتوای مضر و دفاع سایبری تقویت‌شده منتشر می‌کند. شرکت ادعا می‌کند آزمایش‌های داخلی آنها نشان داده است که Opus 4 ممکن است توانایی فردی با پیش‌زمینه STEM را برای دستیابی، تولید یا استقرار تسلیحات شیمیایی، بیولوژیکی یا هسته‌ای «به طور قابل توجهی افزایش دهد»، که به مشخصات مدل «ASL-3» آنتروپیک می‌رسد.

آنتروپیک می‌گوید هم Opus 4 و هم Sonnet 4 مدل‌های «ترکیبی» (hybrid) هستند – قادر به پاسخ‌های تقریباً فوری و تفکر طولانی برای استدلال عمیق‌تر (تا حدی که هوش مصنوعی می‌تواند «استدلال» و «فکر» کند به نحوی که انسان‌ها این مفاهیم را درک می‌کنند). با روشن شدن حالت استدلال، مدل‌ها می‌توانند زمان بیشتری را برای بررسی راه‌حل‌های ممکن برای یک مسئله مشخص قبل از پاسخ صرف کنند.

آنتروپیک می‌گوید همانطور که مدل‌ها استدلال می‌کنند، خلاصه‌ای «کاربرپسند» از فرآیند فکری خود را نمایش خواهند داد. بخشی از دلیل عدم نمایش کامل آن، به گفته شرکت، حفاظت از «مزایای رقابتی» آنتروپیک است.

Opus 4 و Sonnet 4 می‌توانند از چندین ابزار مانند موتورهای جستجو به صورت موازی استفاده کنند و بین استدلال و ابزارها برای بهبود کیفیت پاسخ‌هایشان جابجا شوند. آنها همچنین می‌توانند واقعیت‌ها را استخراج کرده و در «حافظه» ذخیره کنند تا وظایف را با قابلیت اطمینان بیشتری انجام دهند، که به مرور زمان چیزی را که آنتروپیک «دانش ضمنی» (tacit knowledge) توصیف می‌کند، می‌سازند.

برای دوستانه‌تر کردن مدل‌ها برای برنامه‌نویسان، آنتروپیک در حال ارائه ارتقاهایی برای Claude Code مذکور است. Claude Code، که به توسعه‌دهندگان اجازه می‌دهد وظایف خاصی را مستقیماً از طریق ترمینال روی مدل‌های آنتروپیک اجرا کنند، اکنون با محیط‌های توسعه یکپارچه (IDEs) ادغام می‌شود و یک کیت توسعه نرم‌افزار (SDK) ارائه می‌دهد که به توسعه‌دهندگان اجازه می‌دهد آن را با برنامه‌های شخص ثالث متصل کنند.

کیت توسعه نرم‌افزار Claude Code، که اوایل این هفته معرفی شد، امکان اجرای Claude Code را به عنوان یک زیرفرآیند بر روی سیستم‌عامل‌های پشتیبانی‌شده فراهم می‌کند و راهی برای ساخت دستیاران و ابزارهای کدنویسی مبتنی بر هوش مصنوعی که از قابلیت‌های مدل‌های Claude بهره می‌برند، ارائه می‌دهد.

آنتروپیک افزونه‌ها و اتصال‌دهنده‌های Claude Code را برای VS Code مایکروسافت، JetBrains و GitHub منتشر کرده است. اتصال‌دهنده GitHub به توسعه‌دهندگان اجازه می‌دهد تا Claude Code را برای پاسخ به بازخورد بازبینان، و همچنین برای تلاش برای رفع خطاها در کد – یا اصلاح آن به نحو دیگر – برچسب‌گذاری کنند.

مدل‌های هوش مصنوعی هنوز در کدنویسی نرم‌افزار با کیفیت مشکل دارند. هوش مصنوعی تولیدکننده کد به دلیل ضعف‌ها در زمینه‌هایی مانند توانایی درک منطق برنامه‌نویسی، تمایل به ایجاد آسیب‌پذیری‌های امنیتی و خطا دارد. با این حال، وعده آنها برای افزایش بهره‌وری کدنویسی، شرکت‌ها – و توسعه‌دهندگان – را به پذیرش سریع آنها سوق می‌دهد.

آنتروپیک، با آگاهی کامل از این موضوع، وعده به‌روزرسانی‌های مکرر مدل را می‌دهد.

این استارتاپ در پیش‌نویس پست خود نوشت: «ما... در حال انتقال به به‌روزرسانی‌های مکرر مدل هستیم و جریانی پیوسته از بهبودهایی ارائه می‌دهیم که قابلیت‌های پیشگامانه را سریع‌تر به مشتریان می‌رساند. این رویکرد شما را در لبه نوآوری نگه می‌دارد زیرا ما به طور مداوم مدل‌های خود را پالایش و بهبود می‌بخشیم.»

منبع: تک‌کرانچ

به مطالعه ادامه دهید