IT и стартапы

Anthropic выпустила Claude Sonnet 5: агентный ИИ по цене среднего класса

Новая модель приближается по возможностям к флагманскому Opus 4.8, но стоит значительно дешевле — и становится дефолтной для всех пользователей.

Редактор:Казакевич Алексей

4 июл. 20265 мин

Anthropic выпустила Claude Sonnet 5: агентный ИИ по цене среднего класса

Содержание

Цены и позиционирование на рынке
Бенчмарки и реальные сценарии использования
Безопасность в агентном контексте
Агентность как новый стандарт

Anthropic выпустила Claude Sonnet 5 — обновлённую версию своей среднеценовой модели с акцентом на агентную работу. Модель умеет самостоятельно планировать задачи, использовать браузер и терминал, а также запускаться в автономном режиме — без постоянного участия человека. По заявлению компании, ещё несколько месяцев назад такой уровень автономии был доступен только в более крупных и дорогих моделях.

С сегодняшнего дня Sonnet 5 становится моделью по умолчанию для бесплатных и Pro-подписок Claude и доступна во всех тарифных планах.

Цены и позиционирование на рынке

До 31 августа 2026 года Sonnet 5 будет стоить $2 за миллион входных токенов и $10 за миллион выходных. После этой даты цены вырастут до $3 и $15 соответственно. Это делает модель дешевле флагманского Opus 4.8, а также дешевле OpenAI GPT-5.5 и Google Gemini 3.1 Pro. Единственный более доступный конкурент в сопоставимом классе — Gemini 3.5 Flash от Google.

Для разработчиков и компаний, которые строят агентные пайплайны, разница в стоимости токенов при больших объёмах запросов превращается в существенную статью расходов. Белорусские IT-команды, работающие с LLM-инфраструктурой через API, — в том числе резиденты ПВТ — получают более доступный инструмент для production-сценариев, где раньше приходилось выбирать между качеством и бюджетом.

Антропик позиционирует Sonnet 5 как компромисс между производительностью и ценой: «Между Sonnet 5 и Opus 4.8 пользователи могут регулировать уровень усилий модели, находя нужный баланс стоимости и качества».

Бенчмарки и реальные сценарии использования

По внутренним тестам Anthropic, Sonnet 5 значительно превосходит своего предшественника Sonnet 4.6 (выпущен в феврале 2026 года) по ключевым агентным метрикам: рассуждению, использованию инструментов, написанию кода и работе со знаниями.

На бенчмарке агентного кодирования Sonnet 5 набирает 63,2% — против 58,1% у Sonnet 4.6 и 69,2% у Opus 4.8. На бенчмарке работы со знаниями новая модель и вовсе незначительно опережает Opus 4.8, хотя флагман традиционно считается лидером в задачах глубокого анализа и тонких суждений.

Практические результаты подтверждают цифры. Старший инженер Zapier Дэниел Шепард описал конкретный кейс:

««Мы поставили Claude Sonnet 5 двухчастную задачу — обновить уровни аккаунтов в Salesforce и отправить анонс запуска корпоративным контактам. Модель выполнила её от начала до конца. Раньше процесс останавливался на полпути. Для повседневной автоматизации — это очевидный выбор.»»

Тестировщики также отмечают, что Sonnet 5 самостоятельно проверяет собственные результаты без явного запроса и доводит до конца сложные задачи, на которых предыдущие версии останавливались.

Безопасность в агентном контексте

Одна из ключевых проблем агентных систем — безопасность при автономной работе. Модель, которая сама принимает решения и выполняет действия, должна надёжно отказывать в опасных запросах и противостоять атакам через инъекции в промпт.

По данным Anthropic, Sonnet 5 демонстрирует более низкий уровень «нежелательного поведения» по сравнению с Sonnet 4.6: реже соглашается на злоупотребления, лучше распознаёт попытки манипуляции через prompt injection, меньше галлюцинирует и реже проявляет угодливость (sycophancy). Сооснователь Lovable Фабиан Хедин отметил, что модель «отказывает в небезопасных запросах чётко и последовательно».

Вместе с тем Anthropic честно указывает на ограничения: по уровню защиты от манипуляций Sonnet 5 уступает Opus 4.8 и экспериментальной Claude Mythos Preview. Кроме того, модель значительно слабее флагманских Opus-моделей в выполнении опасных задач в области кибербезопасности — что в данном случае является намеренным ограничением, а не недостатком.

Агентность как новый стандарт

Выход Sonnet 5 — часть более широкой тенденции. Буквально на прошлой неделе OpenAI запустила в превью GPT-5.6 Sol — также позиционируемую как наиболее агентную модель компании, способную распределять работу между субагентами для длительных автономных задач. В мае Google представила Gemini 3.5 Flash, описав её как переход от разговорного чат-бота к агентному инструменту, который планирует, строит и итерирует с минимальным участием человека.

Конкуренция смещается: агентные возможности перестают быть дифференциатором и становятся базовым ожиданием на каждом ценовом уровне. Теперь ключевые вопросы — насколько дёшево и насколько надёжно модель справляется с автономной работой без надзора оператора.

Для белорусских разработчиков и продуктовых команд, которые уже интегрируют LLM в свои продукты или только оценивают переход на агентные архитектуры, Sonnet 5 предлагает практически флагманское качество по цене среднего класса — по крайней мере до конца августа.

— По материалам TechCrunch: оригинальная статья. Перевод и адаптация — редакция Digital Business.

Теги:#Искусственный интеллект #anthropic #llm #agents #tech

Поделиться VK

Редакция

3 июл. 20265 мин