Dinkin Logo
DINKIN
Claude Mythos 1 Детальный Анализ: Кризис стоимости ИИ-агентов
Назад к новостям
25 мая 2026Редакция Dinkin

Claude Mythos 1 Детальный Анализ: Кризис стоимости ИИ-агентов

Технологические гиганты слишком поверили в магию ИИ — и теперь расплачиваются за это. Попытка резко поднять продуктивность сотрудников обернулась многомиллионными убытками, заставив Microsoft, Meta и Amazon экстренно переписывать внутренние правила. Главная финансовая дыра — агентный ИИ. Точнее, разработчики, которые бесконтрольно используют Claude Code. Наш Claude Mythos 1 Детальный Анализ показывает абсурдную картину: содержать одного виртуального помощника теперь дороже, чем нанять живого инженера. Финансовые директора в панике режут бюджеты и внедряют жесткие лимиты. В таких условиях инструменты вроде помощника Finguru превращаются из удобной опции в единственный способ не обанкротиться на облачных счетах.

Первые тревожные сигналы подал The Verge: Microsoft принудительно отключает сотрудников от удобного Claude Code, перегоняя их на собственный Copilot CLI. Fortune подтверждает — это массовый тренд. Дело не в жадности провайдеров и не в базовых тарифах. Проблема зашита в самой архитектуре автономных систем: агентный ИИ сжигает в тысячи раз больше токенов, чем обычный чат-бот. Создатель проекта OpenClaw Питер Штайнбергер показал масштаб бедствия на цифрах. За один месяц его команда спустила на токены 1,3 миллиона долларов. На бумаге ИИ обещал ускорить релизы. На практике — пробил брешь в корпоративной кассе.

Коротко
  • Технологические гиганты слишком поверили в магию ИИ — и теперь расплачиваются за это.
  • Первые тревожные сигналы подал The Verge: Microsoft принудительно отключает сотрудников от удобного Claude Code…
  • Анатомия гиперпотребления: почему агенты сжигают бюджеты.

Анатомия гиперпотребления: почему агенты сжигают бюджеты

Обычный запрос к нейросети стоит копейки. Вы задали вопрос, получили ответ — сделка закрыта. Автономный агент работает иначе. Получив задачу, он не просто пишет готовый код. Он начинает думать вслух. Генерирует промежуточные шаги, проверяет гипотезы, ошибается, запускает циклы самокоррекции и снова дергает API. И каждый раз он заново перечитывает весь контекст.

Вы просите написать функцию, а агент тратит тысячи токенов на внутренние монологи. Чем сложнее путь к решению, тем страшнее итоговый счет. Разработчикам, которые привыкли к безлимиту, придется заново учиться писать точные промпты. Навык строгой постановки задач — тот самый, который тренируют через образовательный сервис Eduhelper — снова становится вопросом профессионального выживания.

Математика убытков: Стандартный запрос к LLM — это около 1 000 токенов. Агентная система для той же задачи генерирует сотни промежуточных шагов. Итог: до 1 000 000 токенов за одну сессию. Это как оставить открытым кран с водой, где каждая капля стоит как золото.

При этом реальный прирост продуктивности вызывает вопросы. Часто сотрудники просто имитируют бурную деятельность, скармливая агентам задачи, которые быстрее сделать руками. Сложные проблемы все равно требуют человеческого контроля. В итоге компания платит дважды: миллионные счета за токены и зарплату программисту, который сидит и перепроверяет сгенерированный результат.

Парадокс Джевонса в эпоху нейросетей

Эта ситуация — классический парадокс Джевонса. Суть проста: как только ресурс становится эффективнее и дешевле, его начинают потреблять в астрономических масштабах. Стоимость обучения моделей падает. Провайдеры снижают цены на токены. Казалось бы, корпоративные расходы должны пойти вниз.

На деле дешевизна спровоцировала бум неконтролируемых запросов. Когда-то эффективные паровые машины вызвали дефицит угля. Экономичные самолеты уронили цены на билеты и удвоили спрос на перелеты (по прогнозам IATA, он удвоится к 2050 году). В IT происходит то же самое. Доступный ИИ привел к тому, что сотрудники начали тратить гигантские вычислительные мощности на банальную рутину.

Эту практику уже прозвали «токенмаксингом». Представьте, что всем в офисе раздали корпоративные кредитки без лимита. Руководство ждало точечного применения инструмента, а получило массовое делегирование всего подряд. Чтобы «сбросить лишний вес» с бюджетов, нужен строгий аудит. Точно так же, как виртуальный тренер Fitcoach помогает выстроить дисциплину в спорте, компаниям нужна дисциплина в API-запросах.

Реакция корпораций: принудительный отказ от сторонних сервисов

Осознав масштаб утечки денег, бигтех перешел к жестким мерам. Microsoft силой переводит команды с Claude Code на свой Copilot CLI. Причина банальна: сторонние сервисы стали слишком дорогими. Риск для бюджета превысил пользу от удобства.

Переход на внутренний Copilot похож на отказ от ресторанов ради домашней еды в целях экономии. Да, внутренние инструменты часто уступают внешним флагманам. Да, запрет любимого Claude Code вызовет бунт среди разработчиков. Но финансовые директора непреклонны: эпоха ИИ-безлимита на рабочих местах официально закрыта.

Теперь инженерам придется привыкать к локальным утилитам с жесткими лимитами. Вместо свободных бесед с агентом — сухие стандартизированные команды в терминале.

# Пример перехода на внутренний инструментарий
# Вместо запуска автономного агента Claude Code:
$ claude-code --autonomous-mode --task "Refactor authentication module"

# Разработчиков Microsoft обязывают использовать:
$ copilot-cli review --local-context --max-tokens=5000 ./auth

Это бьет по свободе действий, зато гарантирует предсказуемость счетов. Эффективность ИИ теперь измеряется не только качеством кода, но и потраченными на него ресурсами. Если посмотреть на тренды развития ИИ на 2026 год, вывод очевиден: рынок сместил фокус с красивой автономности на жесткую экономическую эффективность.

Иллюстрация к разделу

Индустрия на распутье: между автоматизацией и бюджетом

Кризис грянул в самый неподходящий момент — когда бизнес бросился автоматизировать сложные процессы. По данным IMARC Group, рынок аутсорсинга бизнес-процессов в 2025 году достиг 38,6 млрд долларов. Компании тащат данные в облако (там уже около 60% корпоративной информации) и внедряют предиктивную аналитику. Стартапы вроде TraPilot.ai строят платформы на тезисе Sequoia Capital «Услуги: Новое программное обеспечение». Идея красивая: ИИ должен продавать не инструменты, а готовую работу.

Но амбиции стартапов разбились о суровую бухгалтерию. Одно дело — использовать CreatorAI для текстов с понятной ценой за символ. И совсем другое — дать инженерам агента, который может часами блуждать по коду в поисках ошибки, сжигая доллары каждую секунду. Любые инвестиции в ИИ теперь требуют жесткого обоснования возврата средств (ROI).

Дисциплинарные меры: Необоснованный токенмаксинг скоро станет поводом для штрафов и увольнений. Руководителям придется балансировать между скоростью работы агента и шокирующим счетом от провайдера API в конце месяца.

Повсеместное урезание бюджетов рискует затормозить развитие автономных систем. Если гиганты не научатся сокращать количество шагов алгоритма, ограничения просто убьют конкурентоспособность. Наш анализ состояния рынка ИИ не оставляет иллюзий: выживут продукты, которые решают задачи элегантной логикой, а не брутфорсом вычислительных мощностей.

Но экономия на токенах таит свои риски. Жесткие лимиты неизбежно ударят по качеству кода. Текущие метрики слишком зациклены на моментальных тратах и игнорируют долгосрочную пользу. Разработчикам придется искать золотую середину: использовать промпты для глубокого ревью кода там, где цена ошибки высока, и писать руками там, где агент потратит слишком много ресурсов на элементарную задачу.

Иллюстрация к разделу

Анатомия провала: Как контекстное окно превращается в ловушку

Чтобы понять, куда утекают бюджеты, нужно заглянуть под капот современных LLM. Корень зла — в природе взаимодействия с API через контекстное окно. У нейросетей нет памяти в человеческом понимании. Каждый раз, когда Claude Code делает новый шаг, он вынужден отправлять на сервер всю историю переписки, весь проанализированный код и все системные промпты.

Представьте, что вы наняли ассистента с тяжелой формой амнезии. Чтобы он исправил опечатку, вам каждый раз приходится зачитывать ему вслух весь документ с первой страницы, напоминать его обязанности и пересказывать прошлые диалоги. Именно так работают ИИ-агенты.

Если базовая кодовая база весит 50 000 токенов, первый шаг обойдется ровно в эту сумму. Допустил синтаксическую ошибку? Запускается цикл исправления. Второй шаг отправит уже 52 000 токенов. Десятый — 70 000. Пустяковая задача по переименованию переменной превращается в снежный ком, который сносит месячный лимит разработчика за пару часов. На практике инженеры просто смотрят на индикатор загрузки, пока компания сжигает по пять долларов в минуту.

Технологический костыль: Провайдеры пытаются смягчить удар с помощью Prompt Caching (кэширования промптов). Это позволяет не оплачивать статичную часть контекста каждый раз. Но архитектура большинства корпоративных инструментов под кэширование еще не адаптирована. Компании продолжают платить полную цену за каждый чих нейросети.

Угроза безопасности: Когда агент получает ключи от сервера

Финансовые потери — лишь верхушка айсберга. Настоящая паника началась, когда безопасники (CISO) осознали уровень доступа автономных агентов. В отличие от обычного чат-бота, системы вроде Claude Code или Devin имеют прямой доступ к терминалу. Они сами выполняют команды, читают локальные файлы и качают зависимости из сети.

Что делает ИИ, если не находит нужную библиотеку? Он не идет к сеньору за разрешением. Он просто пишет npm install [название_библиотеки] или pip install [пакет]. Хакеры уже поняли эту фишку: они создают вредоносные пакеты с названиями, которые нейросети часто «галлюцинируют». Агент, пытаясь решить задачу, своими руками скачивает троян в корпоративный контур.

Реакция бизнеса предсказуема: отделы безопасности парализуют разработку. Инженерам запрещают использовать агентов в средах с реальными данными. Их загоняют в изолированные «песочницы» без интернета. Но без доступа к сети и свежей документации агент становится бесполезным. Замкнутый круг: безопасный ИИ ничего не умеет, а полезный — слишком опасен и дорог.

Иллюстрация к разделу

AI FinOps: Рождение новой корпоративной бюрократии

Там, где есть неконтролируемые расходы, мгновенно вырастает бюрократия. Кризис породил новую ИТ-дисциплину — AI FinOps. Если раньше бизнес отслеживал счета за серверы Amazon или Google, то теперь приходится микроменеджерить каждый API-ключ.

Компании массово ставят промежуточные шлюзы (AI Gateways) между разработчиком и серверами OpenAI или Anthropic. Прежде чем запрос уйдет к нейросети, шлюз оценивает его стоимость. Пытаетесь скормить агенту лог-файл на три миллиона строк ради одной ошибки? Система просто заблокирует действие.

# Как выглядит работа через корпоративный AI Gateway
$ agent-run --task "Analyze memory leak" ./src

[AI Gateway Blocked]: Request estimated at 125,000 tokens ($1.87).
Your daily allowance remaining: 40,000 tokens.
Action required: Please manually filter the context or use a cheaper model (e.g., Llama-3-8B).

Для рядового программиста эпоха свободы закончилась. Больше нельзя «скинуть всё на нейросеть и пойти пить кофе». Приходится вручную чистить код от мусора, дробить задачи на микро-этапы и выпрашивать у руководства дополнительные токены перед релизом. Утилиты вроде AI Cost Tracker становятся на рабочих компьютерах такой же обязательной нормой, как антивирусы.

Иллюстрация к разделу

Иллюзия локальной независимости: Спасет ли нас Open Source?

Решение кажется очевидным: отказаться от облачных API и развернуть бесплатные Open Source модели (Llama, Mistral, Qwen) прямо на компьютерах сотрудников. Платишь только за электричество, а токены становятся бесконечными. Звучит отлично, пока в дело не вступает физика.

Чтобы запустить локальную модель, сопоставимую с Claude 3.5 Sonnet, нужен колоссальный объем видеопамяти. Стандартный рабочий ноутбук с 16 или 32 ГБ оперативки просто захлебнется при попытке открыть контекстное окно для агентной работы.

Перевод сотни программистов на локальный ИИ означает закупку рабочих станций (вроде Mac Studio) по 5 000–10 000 долларов за штуку. Либо придется строить собственный кластер на дефицитных видеокартах NVIDIA H100. Капитальные затраты (CapEx) улетают в космос. Финансовые директора понимают: железо стоит дороже API, а устаревает за пару лет.

К тому же локальные модели пока слишком нестабильны для сложного агентного поведения. Они зацикливаются и сбиваются с пути. Итог комичен: компания тратит миллионы на серверы, а разработчики тайком покупают подписки на облачные сервисы за свои деньги, чтобы успевать закрывать спринты.

Новая рутина: От творцов к бесконечным ревьюерам

Фокус сместился с написания кода на управление агентами, и это ломает психологию профессии. Программисты исторически не любят читать чужой код — это тяжелый когнитивный труд. Агенты же генерируют код со скоростью пулемета. Внешне он выглядит идеально: чистый, с комментариями.

Но ИИ слишком самоуверен. Он может использовать устаревшую функцию, проигнорировать пограничный случай (edge case) или сломать архитектурный паттерн. В индустрии прижился термин «AI Slop» (ИИ-помои) — красивый, но структурно гнилой код, который нейросети тоннами вливают в репозитории.

Роль Senior-разработчика деградирует. Из творцов и архитекторов они превращаются в корректоров, которые часами вычитывают машинный текст в поисках тонких уязвимостей. Найти ошибку в ИИ-коде часто сложнее, чем написать его с нуля руками.

Эффект выгорания: HR-отделы фиксируют всплеск выгорания среди тимлидов. Причина — лавина Pull Requests, сгенерированных джуниорами через агентов. Машины пишут код быстрее, чем люди физически способны его проверять.

Чтобы не утонуть в этом потоке, компании внедряют ИИ для проверки ИИ. Наступает абсурд: один агент пишет код за 5 долларов, другой проверяет его за 3 доллара. Человек превращается в финального кликера, который просто одобряет слияние веток, уже не до конца понимая, как работает продукт. Эта потеря экспертизы — скрытый налог на ИИ. Он больно ударит по бизнесу через 3-5 лет, когда эти системы потребуют масштабного рефакторинга.

Иллюстрация к разделу

Малые специализированные модели (SLM) как выход из кризиса

Поняв, что заливать проблему вычислительной мощностью бесполезно, индустрия разворачивается к малым языковым моделям (SLM). Тезис прост: вам не нужен гениальный ИИ со знаниями квантовой физики, чтобы отформатировать таблицу.

Вместо одного гигантского агента, который жрет миллионы токенов, архитекторы выбирают роевой интеллект. Создаются узкоспециализированные микро-агенты. Один ищет SQL-инъекции. Второй пишет unit-тесты. Третий правит CSS.

Эти микро-модели весят мало, работают мгновенно и стоят доли цента. Они не философствуют. Если агент не знает ответа, он не галлюцинирует, а сразу выдает ошибку и передает задачу старшей модели.

На практике это требует перестройки всего конвейера. Руководителям придется осваивать маршрутизацию задач. Как современные Agile-методологии учат распределять работу между людьми, так и разработчикам предстоит дирижировать зоопарком нейросетей: тяжелые задачи отдавать дорогим моделям (Claude 3.5 Opus), а рутину — дешевым (Haiku или GPT-4o-mini).

Иллюстрация к разделу

Скрытая цена: Энергетический кризис дата-центров

За абстрактными токенами скрывается суровая физика. Агентный ИИ — самый энергоемкий софт в истории. Обычный поиск в Google требует 0.3 ватт-часа. Запрос к LLM — почти 3 ватт-часа. А сессия агента с десятками циклов самокоррекции сжирает столько же энергии, сколько нужно для зарядки смартфона.

Когда миллионы программистов запускают рефакторинг, дата-центры начинают плавиться. AWS, Microsoft Azure и Google Cloud столкнулись с жесткой нехваткой электричества. В США и Европе новые ЦОДы не строят не из-за дефицита чипов, а потому что локальные электросети не тянут такие мегаватты.

Как это ударит по IT-бюджетам? Провайдеры переложат стоимость инфраструктуры на клиентов. Цена токена может взлететь из-за «экологических сборов» или тарифов на пиковое потребление. Компании, подсевшие на ИИ-безлимит, окажутся в заложниках у энергетиков. Оптимизация кода и снижение вычислительной сложности снова в цене — прямо как на заре эры ПК.

Что делать прямо сейчас: Стратегия выживания для команд

Финансовый кризис ИИ-агентов — не повод отказываться от автоматизации. Это сигнал: этап слепого восторга прошел, наступила эра прагматики. Чтобы не разорить компанию и не попасть под сокращение, техническим командам пора внедрять жесткие правила:

  1. Ограничение глубины рекурсии (Max Steps). Никаких бесконечных циклов. Ставьте жесткий лимит: 3-5 попыток на самоисправление. Если ИИ не справился за 5 шагов, он не справится и за 50. Дешевле позвать человека.
  2. Изоляция контекста. Хватит скармливать агентам весь репозиторий. Используйте скрипты, чтобы отдавать только нужные файлы. Каждый лишний файл в контексте — это налог на лень, который вы платите при каждом вызове API.
  3. Переход на гибридные IDE. Забудьте про полностью автономных агентов. Выбирайте концепцию "Human-in-the-loop" (человек в цикле). В Cursor или Windsurf агент предлагает изменения, но следующий шаг требует вашего клика. Это медленнее, зато спасает бюджет.
  4. Аудит системных промптов. Витиеватые инструкции стоят денег. Перепишите корпоративные промпты: уберите вежливость, лишние объяснения и дубли. Лаконичность — сестра экономии.

Технологический ландшафт меняется стремительно. Лидерами станут те, кто научится балансировать между скоростью нейросетей и стоимостью вычислений. Остальные останутся с красивыми презентациями о цифровой трансформации и пустыми счетами, которые опустошили слишком усердные алгоритмы.

Иллюстрация к разделу

Расширенный FAQ: Погружение в детали

Почему нельзя просто запретить ИИ исправлять собственные ошибки?

Можно. Многие так и делают, переводя агентов в режим "One-shot" (одна попытка). Но это убивает саму суть технологии. Без права на ошибку ИИ становится обычным автодополнением кода. Бизнес поверил маркетологам, обещавшим «цифровых сотрудников», и теперь болезненно сталкивается с реальностью.

Насколько эффективен переход на малые модели (SLM) в деньгах?

Экономия колоссальная. Разница в цене между флагманом и SLM достигает 50-100 раз. Если отдать 70% простых задач (тесты, документация) малым моделям, можно срезать счета за API на сотни тысяч долларов в месяц, почти не потеряв в качестве.

Что такое Prompt Caching и почему это не панацея?

Кэширование позволяет серверу (например, Anthropic) ненадолго запомнить вашу кодовую базу. Следующий запрос к этому тексту идет со скидкой до 90%. Но кэш живет недолго (около 5 минут бездействия), и любое изменение в начале текста его сбрасывает. В динамичной разработке выжать из этого максимум крайне сложно.

Заменит ли ИИ-код ревьюеров в будущем?

Пока тренд обратный. Из-за феномена «AI Slop» спрос на сеньоров, способных проводить глубокий аудит, только растет. ИИ хорош в синтаксисе, но катастрофически плох в бизнес-логике и долгосрочном планировании архитектуры. Человеческая экспертиза становится премиальным товаром.

Как скоро мы увидим локальные модели, способные заменить облачных агентов?

Аналитики ждут прорыва в сжатии моделей и архитектуре чипов к 2026-2027 годам. Появление мощных нейропроцессоров (NPU) в каждом ноутбуке изменит правила игры. Но до тех пор индустрия зажата в тисках дорогих облачных API и жестких лимитов.

Иллюстрация к разделу

Дополненный Глоссарий

Термин Определение
Контекстное окно (Context Window) Объем информации, который нейросеть способна удержать в памяти при обработке запроса. Главный драйвер расходов при работе с агентами.
AI FinOps Набор практик и инструментов для мониторинга, контроля и жесткой оптимизации затрат компании на ИИ и API-вызовы.
AI Slop (ИИ-помои) Синтаксически правильный, но архитектурно слабый или логически ошибочный код, который нейросети массово генерируют и вливают в проекты.
SLM (Small Language Models) Компактные нейросети для узких задач. Отличаются высокой скоростью работы и копеечной стоимостью эксплуатации по сравнению с флагманами.
AI Gateway (ИИ-шлюз) Программная прослойка между сотрудниками и внешними провайдерами ИИ. Нужна для блокировки слишком дорогих запросов и маршрутизации.
Human-in-the-loop (HITL) Подход, при котором ИИ выполняет черновую работу, но критические решения или переход к следующему шагу обязательно требуют клика человека.
Важно: Перед внедрением идеи из статьи проверьте риски, стоимость поддержки и измеримый KPI результата.
Инсайт: Лучший эффект дает пошаговый запуск: пилот → метрики → масштабирование, а не одномоментная замена всех процессов.

FAQ

Оправдывает ли автономность Claude Code такие астрономические счета за токены?

На данный момент — нет. Анализ показывает, что реальный прирост продуктивности минимален. Агент генерирует сотни промежуточных шагов там, где нужен один прямой ответ. Экономически это часто бессмысленнее, чем наем живого специалиста.

Почему технологические гиганты не предвидели эффект парадокса Джевонса при внедрении ИИ?

Компании смотрели только на снижение базовой стоимости обучения моделей и цены за 1000 токенов. Они верили, что дешевая технология снизит общие затраты. Но они забыли про человеческую психологию: получив мощный инструмент, сотрудники начали делегировать ему абсолютно всё. Итог — взрывной рост суммарного потребления.

Сможет ли Copilot CLI полноценно заменить сотрудникам привычный функционал Claude Code?

Нет. Внутренние инструменты вроде Copilot CLI часто уступают передовым сторонним решениям в гибкости и качестве. Переход продиктован исключительно финансами, а не техническим превосходством. Это неизбежно вызовет недовольство инженеров, привыкших к свободе и мощи Claude.

Не убьет ли жесткая экономия токенов саму идею делегирования задач ИИ?

Не убьет, но сильно трансформирует. Рынок смещает фокус с полной автономности на экономическую эффективность. Сотрудникам придется заново учиться писать точные промпты и жестко ограничивать шаги агента. Делегирование останется, но перестанет быть безлимитным.

Кто должен оплачивать миллионные счета за ошибки в настройке автономных агентов?

Пока убытки несут корпорации, что и спровоцировало панику среди финансовых директоров. В будущем «токенмаксинг» станет поводом для дисциплинарных взысканий, а ответственность за настройку лимитов полностью ляжет на плечи тимлидов.

Глоссарий

Термин Определение
Агентный ИИ Тип нейросети, способный самостоятельно планировать шаги, рассуждать и выполнять цепочку действий для достижения цели, а не просто отвечать на одиночный запрос.
Парадокс Джевонса Экономический феномен: технологический прогресс делает ресурс более эффективным и дешевым, что приводит к взрывному росту его потребления, а не к экономии.
Токенмаксинг Неформальный термин. Означает максимальное, бесконтрольное и часто избыточное использование ИИ-токенов сотрудниками для решения банальных рабочих задач.
Copilot CLI Внутренний инструмент командной строки от Microsoft. Навязывается персоналу в качестве более дешевой альтернативы внешним автономным агентам.
Claude Code Продвинутый ИИ-инструмент для автономной работы с кодом. Стал причиной многомиллионных убытков в корпорациях из-за колоссального потребления токенов.
Поделиться статьей: