Ptolemy Ptolemy

claude-sonnet-4-5

chat
Провайдер: Anthropic
Контекст: 200000 tokens
Цена входа
240 ₽
за 1M токенов
Цена выхода
1200 ₽
за 1M токенов

Claude Sonnet 4.5 — флагманская модель Anthropic 2025 года

Claude Sonnet 4.5 — флагманская модель Anthropic 2025 года, ориентированная на реальную работу: разработку ПО, агентную автоматизацию и сложные офисные процессы. По данным Anthropic, Sonnet 4.5 стала «лучшей в мире моделью для кодинга», существенно прибавила в рассуждениях и математике, а также уверенно использует компьютер: самостоятельно переходит по сайтам, заполняет таблицы и выполняет многошаговые задания. Релиз сопровождался апгрейдами экосистемы — от Claude Code с чекпоинтами до обновлённого расширения для Chrome и SDK для построения агентов. При этом модель позиционируется как «drop‑in» замена более ранним версиям по той же цене и доступна всем пользователям Anthropic. (anthropic.com)

Ключевые преимущества Claude Sonnet 4.5

  • Лидерство в кодинге и инженерии: модель демонстрирует топовые результаты на отраслевых бенчмарках и рассчитана на длительные автономные сессии разработки. По сообщениям СМИ, Anthropic называет Sonnet 4.5 «лучшей в мире моделью для кодинга». (cnbc.com)
  • Продвинутая «computer use»: Sonnet 4.5 уверенно управляет компьютером и браузером, что подтверждено ростом на OSWorld — 61,4% против 42,2% у предыдущей версии. Это означает более надёжное выполнение реальных задач в интерфейсе ПК: навигация, ввод данных, работа с веб‑формами. (anthropic.com)
  • Длительная автономная работа: модель способна поддерживать фокус более 30 часов на сложных многошаговых задачах — заметный скачок для практических сценариев «долгой конструкции» кода и документооборота. (anthropic.com)
  • Экосистема для разработчиков и команд: обновлённый Claude Code с чекпоинтами (сохранение и мгновенный откат), свежий терминал и нативное расширение для VS Code; инструменты памяти и контекстного редактирования в API для более длинных и устойчивых агентных цепочек; расширение Claude для Chrome для «компьютерного использования» прямо в браузере. (anthropic.com)
  • Новые функции в приложениях: поддержка исполнения кода и создания файлов (таблицы, слайды, документы) прямо из чата, а также Agent SDK для конструирования собственных агентов. (macrumors.com)
  • Доступность и миграция: Sonnet 4.5 рекомендована как модель «по умолчанию» практически для всех кейсов; при желании пользователи могут временно оставаться на Opus или прошлых версиях Sonnet. По словам Anthropic, 4.5 умнее Opus 4.1 «почти по всем параметрам», оставаясь при этом компактнее. (cnbc.com)
  • Улучшенная безопасность и устойчивость: компания заявляет о снижении «концерн‑паттернов» вроде симуляции согласия, обмана и стремления к полномочиям; повышена стойкость к prompt‑injection. Отмечается усиление автоматических классификаторов безопасности (ASL‑уровень и редтиминг). (cnbc.com)

Подтверждённые метрики и бенчмарки

  • OSWorld (навыки использования компьютера): Sonnet 4.5 — 61,4% (рост по сравнению с Sonnet 4 — 42,2% четыре месяца назад). Это демонстрирует качественный прогресс в «computer use». (anthropic.com)
  • SWE‑bench Verified (решение реальных задач в кодовой базе): Sonnet 4.5 отмечена как лидер; независимые обзоры сообщают о заметном росте точности и устойчивости на длинных сессиях. (cnbc.com)

Что нового в продуктах Anthropic вокруг Sonnet 4.5

  • Claude Code: чекпоинты для безопасного отката, переработанный терминал, нативный плагин для VS Code. Практически это упрощает длинные рефакторинги, эксперименты и откат до рабочей версии. (anthropic.com)
  • Claude API: контекстное редактирование и «память» для стабильных многошаговых цепочек; агентам проще держать состояние и продолжать работу после перерывов. (anthropic.com)
  • Приложения и интеграции: расширение Claude для Chrome с поддержкой нового «computer use», исполнение кода и генерация файлов прямо из чатов на платных тарифах, а также Agent SDK для кастомных агентов. (macrumors.com)
  • Политика доступа и цена: Anthropic рекомендует всем перейти на Sonnet 4.5 как на «drop‑in» замену прежних моделей без удорожания относительно Sonnet 4. (anthropic.com)

Сферы применения и готовые сценарии

1) Разработка ПО и DevEx

  • Автономная реализация задач из бэклога: модель открывает issue, пишет коммиты, запускает тесты, формирует MR/PR‑описание; выдерживает многочасовые серии до финального ревью инженера. (cnbc.com)
  • Рефакторинг и миграции: поэтапное переписывание модулей с сохранением совместимости, регрессионные тесты и автогенерация документации.
  • Починка багов по трассам: ввод логов/stack trace → локализация причины → патч → тесты → отчёт о влиянии.

Примеры промптов:
- «Проанализируй этот стек Python, предложи фикс и напиши тесты pytest. Не ухудшай производительность на критическом пути.»
- «Сделай план миграции с Jest на Vitest в монорепозитории и распиши риски по пакетам.»

2) Агентные сценарии и офисная автоматизация

  • Многошаговая работа в браузере: сбор данных с нескольких сайтов, заполнение Google Sheets, сверка с CRM и рассылка итогов в Slack/почту. Рост на OSWorld отражает практическую надёжность такого «компьютерного пользования». (anthropic.com)
  • Подготовка отчётности: создание сводных презентаций, таблиц и документов прямо в чате с последующей правкой в редакторе. (macrumors.com)

Примеры промптов:
- «Зайди на сайты поставщиков, собери цены на позиции из файла, сведи в новую вкладку Sheets и выдели аномалии в отдельной колонке.»
- «Создай черновик презентации по квартальным метрикам: 10 слайдов, графики и список рисков.»

3) Аналитика и финансы

  • Многочасовые модели оценки риска, разбор структурных продуктов, скрининг портфелей; модель лучше удерживает контекст и план выполнения. СМИ отмечают повышенную пригодность Sonnet 4.5 для реальных бизнес‑нужд. (cnbc.com)

Примеры промптов:
- «Разбери кредитный портфель по сегментам, построй PD/LGD‑оценки и предложи стресс‑сценарии с допущениями.»

4) Кибербезопасность

  • «Красное» моделирование сценариев атак для усиления защиты и тренировки SOC‑процессов; модель показывает прогресс в устойчивости и снижении рискованных паттернов поведения. (cnbc.com)

Примеры промптов:
- «Сгенерируй сценарии цепочек атак на EDR/IdP/облако, отметь TTP по MITRE ATT&CK и меры снижения.»

5) Юридическая и экспертная работа

  • Консолидация массивов документов, сводные записки, черновики аналитики. Отраслевые эксперты отмечают улучшение доменных рассуждений по сравнению с прежними моделями. (Используйте внутренние регламенты и обязательное human‑review.) (anthropic.com)

6) Дизайн и продукт

  • Быстрые прототипы интерфейсов, логика интерактивов, генерация UI‑вариантов для проверки гипотез; партнёры указывают на улучшение качества длинного контекста и «инженерного интеллекта». (anthropic.com)

Практические советы по внедрению

  • Начните с Claude Code и чекпоинтов: стойко ведите ветвление экспериментов, откатывайтесь при регрессах. (anthropic.com)
  • Комбинируйте «планирующий» Sonnet 4.5 и «исполнительные» подагенты: например, оркестрируйте Haiku 4.5 для параллельных подзадач, когда важны скорость и стоимость. (anthropic.com)
  • Включайте защитные рамки: валидация действий, sandbox для «computer use», проверка источников и финальное human‑approval для решений с юридическими/финансовыми последствиями. (cnbc.com)

Чем Claude Sonnet 4.5 отличается от предыдущих версий

  • Лучше «понимает» компьютер и устойчивее держит курс на длинных задачах (30+ часов против 7 часов у Opus 4). (cnbc.com)
  • Значимый рост на OSWorld и SWE‑bench Verified, что отражает реальную практичность и способность чинить баги в живых кодовых базах. (anthropic.com)
  • Экосистема инструментов: чекпоинты в Claude Code, контекстное редактирование и память в API, SDK для агентов, расширение для Chrome. (anthropic.com)
  • Рекомендована как замена Sonnet 4 «по той же цене», доступна широкой аудитории. (anthropic.com)

Вопросы и ответы (FAQ)

  • Подойдёт ли Sonnet 4.5 для моей команды разработчиков?
    Да. Anthropic позиционирует модель как лучший выбор для кодинга и сложных агентных сценариев; улучшены длительность автономной работы и устойчивость. (cnbc.com)
  • Можно ли использовать Sonnet 4.5 в качестве «браузерного» агента?
    Да, модель демонстрирует высокий уровень на OSWorld и поддерживает управление компьютером/браузером; доступны расширение для Chrome и интеграции через API/Agent SDK. (anthropic.com)
  • Насколько безопасна модель?
    Anthropic сообщает о заметном снижении рискованных паттернов поведения и усилении защиты от prompt‑injection; также развиты автоматические классификаторы и процедуры редтиминга. (cnbc.com)
  • В чём экономический смысл апгрейда?
    Sonnet 4.5 рекомендуется как «drop‑in» замена без повышения цены относительно Sonnet 4, при этом даёт ощутимые выигрыши в качестве и продуктивности. (anthropic.com)

Источники

  • Официальный анонс Anthropic (нововведения, OSWorld 61,4%, чекпоинты, рекомендации по миграции). (anthropic.com)
  • CNBC: запуск и акценты для бизнеса, устойчивость на 30‑часовых задачах, безопасность, позиционирование как дефолт. (cnbc.com)
  • InfoQ: сводка по SWE‑bench Verified и рост показателей, детали по безопасности (ASL/редтиминг). (infoq.com)
  • MacRumors: новые возможности приложений (исполнение кода, создание файлов), чекпоинты в Claude Code, Agent SDK. (macrumors.com)
  • TechRadar: обзор запуска и практических улучшений для пользователей. (techradar.com)

Готовы использовать claude-sonnet-4-5?

Начните с получения API ключа

Получить API ключ