
Image Credits:Anthropic
آنتروپیک مدلهای جدید هوش مصنوعی Claude 4 را با قابلیت استدلال چندمرحلهای معرفی کرد
آنتروپیک در نخستین کنفرانس توسعهدهندگان خود، دو مدل جدید هوش مصنوعی معرفی کرد که به گفته استارتاپ، جزو بهترینها در صنعت بر اساس معیارهای پرکاربرد هستند.
۱۴۰۴/۰۳/۰۱
آنتروپیک در نخستین کنفرانس توسعهدهندگان خود، مدلهای جدید هوش مصنوعی Claude Opus 4 و Claude Sonnet 4 را معرفی کرد. این مدلها که بخشی از خانواده Claude 4 هستند، قابلیت تجزیه و تحلیل دادههای بزرگ، اجرای وظایف پیچیده و تمرکز بر برنامهنویسی دارند. Opus 4 برای کاربران پولی و Sonnet 4 برای همه در دسترس است و قیمتگذاری آنها بر اساس توکن اعلام شده است. آنتروپیک همچنین ابزار Claude Code را با قابلیت ادغام با محیطهای توسعه بهبود بخشیده است. این معرفی در راستای هدف آنتروپیک برای رشد درآمد و رقابت با شرکتهایی مانند OpenAI و گوگل صورت میگیرد.
شرکت آنتروپیک (Anthropic) در نخستین کنفرانس توسعهدهندگان خود که پنجشنبه برگزار شد، دو مدل جدید هوش مصنوعی را معرفی کرد که به گفته این استارتاپ، بر اساس معیارهای پرکاربرد، جزو بهترینها در صنعت هستند.
بر اساس اعلام شرکت، مدلهای Claude Opus 4 و Claude Sonnet 4 که بخشی از خانواده مدلهای جدید Claude 4 آنتروپیک هستند، قادر به تجزیه و تحلیل مجموعه دادههای بزرگ، اجرای وظایف با افق زمانی طولانی و انجام اقدامات پیچیده هستند. آنتروپیک میگوید هر دو مدل برای عملکرد خوب در وظایف برنامهنویسی تنظیم شدهاند و آنها را برای نوشتن و ویرایش کد مناسب میسازند.
هم کاربران پولی و هم کاربران برنامههای رایگان چتبات شرکت به Sonnet 4 دسترسی خواهند داشت، اما تنها کاربران پولی به Opus 4 دسترسی پیدا میکنند. برای API آنتروپیک، که از طریق پلتفرم Bedrock آمازون و Vertex AI گوگل در دسترس است، قیمت Opus 4 برای هر میلیون توکن (ورودی/خروجی) ۱۵ دلار/۷۵ دلار و Sonnet 4 برای هر میلیون توکن (ورودی/خروجی) ۳ دلار/۱۵ دلار خواهد بود.
توکنها (Tokens) بیتهای خام داده هستند که مدلهای هوش مصنوعی با آنها کار میکنند. یک میلیون توکن معادل حدود ۷۵۰,۰۰۰ کلمه است.
معرفی مدلهای Claude 4 آنتروپیک در حالی صورت میگیرد که این شرکت به دنبال رشد قابل توجه درآمد است. گزارشها حاکی از آن است که این مجموعه که توسط محققان سابق OpenAI تأسیس شده، هدف دارد در سال ۲۰۲۷ به ۱۲ میلیارد دلار درآمد دست یابد که نسبت به پیشبینی ۲.۲ میلیارد دلار برای امسال، افزایشی قابل توجه است. آنتروپیک اخیراً یک تسهیلات اعتباری ۲.۵ میلیارد دلاری را بسته و میلیاردها دلار از آمازون و دیگر سرمایهگذاران جذب کرده است تا با هزینههای فزاینده مرتبط با توسعه مدلهای پیشرفته (frontier models) مقابله کند.
رقبا، حفظ موقعیت پیشتاز در مسابقه هوش مصنوعی را آسان نکردهاند. در حالی که آنتروپیک مدل پرچمدار جدیدی با نام Claude Sonnet 3.7 را اوایل سال جاری در کنار ابزار کدنویسی عاملمحور به نام Claude Code معرفی کرد، رقبایی از جمله OpenAI و گوگل برای پیشی گرفتن از این شرکت با مدلهای قدرتمند و ابزارهای توسعه خودشان مسابقه دادهاند.
آنتروپیک با Claude 4 جدی عمل میکند.
آنتروپیک میگوید مدل تواناتر از دو مدل معرفی شده امروز، Opus 4، میتواند «تلاش متمرکز» را در چندین مرحله از یک فرآیند کاری حفظ کند. در همین حال، به گفته شرکت، Sonnet 4 که به عنوان «جایگزینی ساده» برای Sonnet 3.7 طراحی شده است، در کدنویسی و ریاضیات نسبت به مدلهای قبلی آنتروپیک بهبود یافته و دستورالعملها را با دقت بیشتری دنبال میکند.
خانواده Claude 4 نیز کمتر از Sonnet 3.7 درگیر «پاداشمحوری متقلبانه» (reward hacking) میشود، که آنتروپیک این ادعا را مطرح کرده است. پاداشمحوری متقلبانه، که به آن بازی با مشخصات (specification gaming) نیز گفته میشود، رفتاری است که در آن مدلها برای تکمیل وظایف، از میانبرها و حفرهها استفاده میکنند.
برای روشن شدن، این بهبودها منجر به تولید بهترین مدلهای جهان در تمام معیارها نشده است. به عنوان مثال، در حالی که Opus 4 در معیار SWE-bench Verified که برای ارزیابی تواناییهای کدنویسی مدل طراحی شده است، مدلهای Gemini 2.5 Pro گوگل و o3 و GPT-4.1 OpenAI را شکست میدهد، اما نمیتواند در ارزیابی چندوجهی MMMU یا GPQA Diamond، مجموعهای از سوالات در سطح دکترا مربوط به زیستشناسی، فیزیک و شیمی، از o3 پیشی بگیرد.
با این حال، آنتروپیک Opus 4 را تحت اقدامات حفاظتی سختگیرانهتری، از جمله آشکارسازهای محتوای مضر و دفاع سایبری تقویتشده منتشر میکند. شرکت ادعا میکند آزمایشهای داخلی آنها نشان داده است که Opus 4 ممکن است توانایی فردی با پیشزمینه STEM را برای دستیابی، تولید یا استقرار تسلیحات شیمیایی، بیولوژیکی یا هستهای «به طور قابل توجهی افزایش دهد»، که به مشخصات مدل «ASL-3» آنتروپیک میرسد.
آنتروپیک میگوید هم Opus 4 و هم Sonnet 4 مدلهای «ترکیبی» (hybrid) هستند – قادر به پاسخهای تقریباً فوری و تفکر طولانی برای استدلال عمیقتر (تا حدی که هوش مصنوعی میتواند «استدلال» و «فکر» کند به نحوی که انسانها این مفاهیم را درک میکنند). با روشن شدن حالت استدلال، مدلها میتوانند زمان بیشتری را برای بررسی راهحلهای ممکن برای یک مسئله مشخص قبل از پاسخ صرف کنند.
آنتروپیک میگوید همانطور که مدلها استدلال میکنند، خلاصهای «کاربرپسند» از فرآیند فکری خود را نمایش خواهند داد. بخشی از دلیل عدم نمایش کامل آن، به گفته شرکت، حفاظت از «مزایای رقابتی» آنتروپیک است.
Opus 4 و Sonnet 4 میتوانند از چندین ابزار مانند موتورهای جستجو به صورت موازی استفاده کنند و بین استدلال و ابزارها برای بهبود کیفیت پاسخهایشان جابجا شوند. آنها همچنین میتوانند واقعیتها را استخراج کرده و در «حافظه» ذخیره کنند تا وظایف را با قابلیت اطمینان بیشتری انجام دهند، که به مرور زمان چیزی را که آنتروپیک «دانش ضمنی» (tacit knowledge) توصیف میکند، میسازند.
برای دوستانهتر کردن مدلها برای برنامهنویسان، آنتروپیک در حال ارائه ارتقاهایی برای Claude Code مذکور است. Claude Code، که به توسعهدهندگان اجازه میدهد وظایف خاصی را مستقیماً از طریق ترمینال روی مدلهای آنتروپیک اجرا کنند، اکنون با محیطهای توسعه یکپارچه (IDEs) ادغام میشود و یک کیت توسعه نرمافزار (SDK) ارائه میدهد که به توسعهدهندگان اجازه میدهد آن را با برنامههای شخص ثالث متصل کنند.
کیت توسعه نرمافزار Claude Code، که اوایل این هفته معرفی شد، امکان اجرای Claude Code را به عنوان یک زیرفرآیند بر روی سیستمعاملهای پشتیبانیشده فراهم میکند و راهی برای ساخت دستیاران و ابزارهای کدنویسی مبتنی بر هوش مصنوعی که از قابلیتهای مدلهای Claude بهره میبرند، ارائه میدهد.
آنتروپیک افزونهها و اتصالدهندههای Claude Code را برای VS Code مایکروسافت، JetBrains و GitHub منتشر کرده است. اتصالدهنده GitHub به توسعهدهندگان اجازه میدهد تا Claude Code را برای پاسخ به بازخورد بازبینان، و همچنین برای تلاش برای رفع خطاها در کد – یا اصلاح آن به نحو دیگر – برچسبگذاری کنند.
مدلهای هوش مصنوعی هنوز در کدنویسی نرمافزار با کیفیت مشکل دارند. هوش مصنوعی تولیدکننده کد به دلیل ضعفها در زمینههایی مانند توانایی درک منطق برنامهنویسی، تمایل به ایجاد آسیبپذیریهای امنیتی و خطا دارد. با این حال، وعده آنها برای افزایش بهرهوری کدنویسی، شرکتها – و توسعهدهندگان – را به پذیرش سریع آنها سوق میدهد.
آنتروپیک، با آگاهی کامل از این موضوع، وعده بهروزرسانیهای مکرر مدل را میدهد.
این استارتاپ در پیشنویس پست خود نوشت: «ما... در حال انتقال به بهروزرسانیهای مکرر مدل هستیم و جریانی پیوسته از بهبودهایی ارائه میدهیم که قابلیتهای پیشگامانه را سریعتر به مشتریان میرساند. این رویکرد شما را در لبه نوآوری نگه میدارد زیرا ما به طور مداوم مدلهای خود را پالایش و بهبود میبخشیم.»
منبع: تککرانچ