Anthropic выпустила Claude Fable 5 и Mythos 5: прорыв в автономном ИИ

Содержание страницы

Два лица одной модели
Mythos 5 и кибербезопасность: палка о двух концах
Fable 5 как ИИ-агент: автономная работа «вдолгую»
Цифры и бенчмарки: как Fable 5 выглядит на фоне конкурентов
Еще немного о практическом применении Fable 5
Ценовая политика: мощь стала доступнее
Кто уже попробовал: отзывы пользователей
Чего модель не сделает — и почему это важно
Итог

Та-дам! 9 июня 2026 года компания Anthropic выкатила в открытый доступ Claude Fable 5 — самую мощную модель искусственного интеллекта за всю историю компании. Одновременно была запущена его «старшая» версия, Claude Mythos 5, но с жесткими ограничениями: она доступна только спецслужбам и компаниям, работающим с критической инфраструктурой. Об обеих моделях подробно рассказано в статье на сайте компании.

Анонс Anthropic: автономный ИИ Claude Fable 5 для всех и Mythos 5 для спецслужб.

Это не рядовое обновление. Предыдущую версию этого ИИ — Claude Mythos Preview — Anthropic выпустила ещё в апреле, но буквально сразу заблокировала широкий доступ к ней. Причина была названа открыто: модель оказалась настолько мощной в области кибербезопасности, что могла бы помочь злоумышленникам взламывать системы — и это всерьёз испугало самих разработчиков. Два месяца ушло на создание защитных механизмов, достаточно надёжных для публичного релиза.

Два лица одной модели

Fable 5 и Mythos 5 — по сути одна и та же нейросеть с одними и теми же возможностями. Разница в том, что Fable 5 снабжен системой фильтров, которая перехватывает потенциально опасные запросы. Когда такой запрос обнаруживается, ответ вместо Fable 5 дает предыдущая модель — Claude Opus 4.8. Пользователь видит уведомление о переключении.

По данным Anthropic, это происходит менее чем в 5% случаев — то есть при обычной работе большинство людей с такой «сменой лошадей» вообще не столкнется.

Схема архитектуры ИИ: Probe активаций, LLM-классификатор, Claude Fable 5 и Opus 4.8.

Mythos 5, в отличие от Fable 5, работает без этих ограничений. Но массовому пользователю он недоступен — только проверенным организациям через специальную программу Project Glasswing совместно с правительством США.

Mythos 5 и кибербезопасность: палка о двух концах

Именно Mythos 5 показал лучшие в мире результаты в области кибербезопасности — и именно поэтому компания отказалась выпускать в свободный доступ. На первый взгляд странно: разве мощный инструмент защиты не должен быть открыт для всех?

График эффективности Claude Fable и Mythos 5 в тестах Offensive cyber evaluations.

Источник: Anthropic

Парадокс в том, что кибербезопасность — область с двойным применением. Те же навыки, которые делают модель полезной для защитников, могут превратить ее в орудие злоумышленников. Mythos 5 умеет самостоятельно находить уязвимости в программном обеспечении, выстраивать цепочки атак и автоматически восстанавливаться после неудач — то есть делать именно то, что раньше требовало команды опытных хакеров, дорогостоящих инструментов и недель работы. Теперь это занимает часы и стоит буквально копейки.

Пример: во время внутреннего тестирования Mythos Preview самостоятельно обнаружил и связал в цепочку 271 уязвимость нулевого дня в браузере Firefox. Это реальные ранее неизвестные бреши, которые можно использовать для взлома.

Именно этот результат напугал инженеров Anthropic и заставил руководство сразу заблокировать широкий доступ к модели.

Иными словами, Mythos 5 не просто «знает про хакинг» — он умеет его выполнять автономно и в промышленных масштабах. Специалисту по киберзащите он позволит за день найти и закрыть уязвимости, которые иначе оставались бы незамеченными годами. Но в руках злоумышленника это означает возможность атаковать инфраструктуру с беспрецедентной скоростью и эффективностью. Один и тот же инструмент — противоположные последствия.

Fable 5 как ИИ-агент: автономная работа «вдолгую»

График зависимости точности от стоимости FrontierCode: Claude Fable 5, Opus 4.8 и GPT-5.5.

Источник: Anthropic

Главное, что отличает Fable 5 от всего, что было раньше — способность работать автономно над сложными задачами часами и неделями, не теряя контекст. Предыдущие модели хорошо справлялись с короткими запросами, но «плыли» на длинных многоэтапных заданиях. Fable 5 не просто удерживает фокус — он делает промежуточные заметки по ходу работы и сам проверяет свои результаты перед тем, как объявить задачу выполненной.

Наглядный пример — тест с компанией Stripe. Команде программистов потребовалось бы больше двух месяцев, чтобы вручную обновить кодовую базу из 50 миллионов строк кода. Fable 5 справился за один день.
Другой показательный кейс — игра Pokémon FireRed. Предыдущие версии Claude могли пройти её только с набором вспомогательных инструментов — картами, подсказками, дополнительными данными. Fable 5 прошел игру полностью, опираясь только на обычные скриншоты экрана — так же, как это делал бы живой человек. https://www.youtube.com/watch?v=Ty_50J84fMY

Источник: Anthropic

Цифры и бенчмарки: как Fable 5 выглядит на фоне конкурентов

Сравнение Claude Fable 5, Opus 4.8, GPT-5.5 и Gemini 3.1 Pro на SWE-Bench Pro и других тестах.

Модель лидирует почти по всем стандартным тестам. Вот ключевые цифры:

На тесте по программированию (SWE-Bench Pro, реальные задачи из GitHub) Fable 5 решил 80% задач. Для сравнения:

Opus 4.8 (предыдущая лучшая модель Anthropic) — 69%,
GPT-5.5 от OpenAI — 59%,
Gemini 3.1 Pro от Google — 54%.

На более сложном тесте качества кода (FrontierCode Diamond) разрыв еще выразительнее:

Fable 5 — 29%,
Opus 4.8 — 13%,
GPT-5.5 — всего 6%.

Прикладные тесты тоже показывают интересные результаты.

Бизнес. В аналитике модель впервые преодолела отметку 90% на тесте Hex Analytics, который проверяет способность разбираться в длинных и сложных бизнес-задачах.
Финансы. На тесте для старших финансовых аналитиков (Hebbia Finance Benchmark) Fable 5 показал лучший результат среди всех протестированных моделей. Компания IMC, специализирующаяся на торговле, сообщила, что Fable 5 безупречно справился с их внутренними тестами по анализу данных — включая фактические запросы, поиск первопричин и расчет ожидаемой стоимости.
Наука. Исследователи-физики отмечают, что модель достигла за 36 часов тех результатов, на которые у GPT-5.5 ушло четыре дня.

Закономерность очевидная: чем длиннее и сложнее задача, тем больше преимущество Fable 5.

Еще немного о практическом применении Fable 5

Компания показала несколько впечатляющих примеров того, что Fable 5 делает самостоятельно:

Генерация и симуляция. Модель построила симуляцию Солнечной системы — рассчитала движение планет по законам физики с нуля и использовала ее для предсказания солнечных затмений. В другом тесте она самостоятельно построила автоматизированную фабрику в симуляторе Factorio. В третьем — написала код для анимации жидкости в такт музыке, и сгенерировала саму музыку. https://www.youtube.com/watch?v=5f5JYLZHdhw
Источник: Anthropic
Разработка лекарств. В области медицинских исследований Mythos 5 позволил ускорить разработку лекарств примерно в десять раз. В одном из экспериментов модель без участия человека выбирала участки связывания белков, запускала инструменты анализа и исправляла ошибки — как это делал бы ученый. Из 14 исследованных белков 9 дали перспективных кандидатов для разработки лекарств, которые сейчас изучаются.
Генетические исследования. В геномике Mythos 5 провел полноценное самостоятельное исследование: больше недели автономной работы, данные по миллионам клеток 138 видов животных, созданная с нуля модель, которая превзошла результаты, опубликованные в журнале Science — при этом в 100 раз меньшего размера. Anthropic обещает опубликовать эти результаты.

Ценовая политика: мощь стала доступнее

Сравнение стоимости входных и выходных токенов Mythos Preview, Claude Fable 5 и Opus 4.8.

Fable 5 и Mythos 5 стоят $10 за миллион входящих слов (токенов) и $50 за миллион исходящих — это меньше половины цены предыдущего Mythos Preview. Подписчики платных планов Claude (Pro, Max, Team, Enterprise) могут использовать модель бесплатно с 9 по 22 июня 2026 года.

Для понимания масштаба: стоимость выросла примерно вдвое по сравнению с Opus 4.8. Но если Fable 5 за один проход делает то, на что у Opus 4.8 уходит пять попыток, итоговые расходы оказываются ниже. Именно так рассуждают компании, которые уже перешли на новую модель.

Кто уже попробовал: отзывы пользователей

Несколько компаний получили ранний доступ и поделились впечатлениями:

Cursor (редактор кода с ИИ): «Лучшая модель на нашем внутреннем тесте. Открывает задачи, которые раньше были недостижимы».
GitHub: «Значительный шаг вперед в автономности — модель берется за сложные долгосрочные задачи с уровнем надежности, которого мы раньше не видели».
Replit: «Лучшие результаты из всех протестированных нами моделей Claude».
Harvey (юридический ИИ): «В слепых сравнениях наши юристы оценивали правки Fable 5 как сопоставимые с нашей текущей моделью или лучше — каждый раз».
Hex (аналитика): «Первая модель, которая преодолела 90% на нашем основном тесте — это скачок на 10 пунктов по сравнению с Opus».

Чего модель не сделает — и почему это важно

Отдельного внимания заслуживает то, как именно Anthropic ограничивает возможности Fable 5.

Традиционный подход, используемый большинством разработчиков — прописать механику отказа модели выполнять опасные запросы. Anthropic выбрала другой путь: предварительная фильтрация.

Система фильтров работает поверх модели в режиме реального времени и перехватывает нежелательные запросы до того, как Fable 5 на них ответит.

Фильтры настроены намеренно строго, что приводит к косякам: иногда они срабатывают на вполне безобидные технические вопросы в области кибербезопасности или биологии. Anthropic открыто это признаёт эту недоработку и обещает снижать количество таких ложных срабатываний по мере обновлений.

Итог

Fable 5 — первый случай в истории Anthropic, когда компания открывает массовому пользователю возможности, ранее требовавшие специального допуска. Модель умеет работать самостоятельно часами и неделями, справляется с задачами, которые раньше требовали команды специалистов, и делает это дешевле, чем предыдущее поколение. Параллельно компания строит инфраструктуру безопасности, которая позволяет выпускать всё более мощные системы без того, чтобы они стали инструментом для злоумышленников.

Следим за развитием событий. На данный момент анонсированы дальнейшее улучшение фильтров, расширение доступа к Mythos 5 и новые модели, которые Anthropic обещает в ближайшие месяцы.