Коротко
Кейноут Anthropic Code with Claude: Ами Фора, Дайен, Анджела+Кейтлин и Кэт+Борис показали, что моделей новых не анонсируют, но продукт вокруг Claude переписан под «экспоненту». Доступ удваивают: лимиты Claude Code для Pro/Max/Team/Enterprise x2, лимиты API Opus подняты, компьют расширяют через партнёрство со SpaceX (Colossus One). На Claude Platform для managed agents выкатили мультиагент-оркестрацию, outcomes (rubric+grader+итерации) и dreaming (агент сам пишет уроки в память). В Claude Code добавили desktop-приложение как control plane для локальных и удалённых сессий, routines (higher-order prompts по cron/webhook/API), CI autofix и code review/security review. Главный тезис всех четырёх выступлений — модели растут по экспоненте, бизнес внедряет линейно, и закрывать этот разрыв должны разработчики через автоматизацию и архитектуру под «следующую версию Claude».
Главный тезис
Возможности моделей улучшаются экспоненциально, но организации внедряют их линейно — выигрывают команды, которые проектируют под следующую версию Claude, а не под текущую, делают апгрейд дешёвым через автоматические эвалы и не боятся амбициозных прототипов.
Ключевые идеи
- 7:27 — Объём API на Claude platform за год вырос ~17x, средний разработчик в Claude Code проводит 20 часов в неделю.
- 9:40 — Удваивают 5-часовые лимиты Claude Code для Pro, Max, Team и seat-based Enterprise; лимиты API для Opus подняты значительно.
- 9:57 — Anthropic берёт всю ёмкость дата-центра SpaceX Colossus One и направляет её в индивидуальных разработчиков и малые команды.
- 4:13 — Stripe конвертировал 50k строк Scala в Java за 4 дня вместо плановых 10 инженер-недель.
- 4:56 — Binti с Claude API убрал 20 дней из процесса лицензирования приёмной семьи.
- 6:25 — Mythos нашёл 27-летнюю уязвимость в OpenBSD, которую упустили все фуззеры, статанализаторы и ревьюеры.
- 16:54 — Task horizon как метрика прогресса: год назад — минуты, сейчас — часы, завтра — proactive, always-on агенты.
- 18:34 — Проектируйте архитектуру под следующую версию Claude, не под текущую — это «business opportunity».
- 22:17 — Advisor strategy: маленькая модель (Haiku/Sonnet) исполняет, Opus советует через tools array в Messages API — Eve Legal получил frontier-качество в 5x дешевле.
- 23:46 — Claude Managed Agents — гарнес + production-инфра, командам дают «10x faster» от прототипа до прода, memory встроена и остаётся вашей.
- 8:17 — Мультиагентная оркестрация: главный агент координирует субагентов с независимыми контекстами, результаты мерджатся.
- 25:13 — Outcomes: markdown-rubric + отдельный grader-агент, который итерирует до выполнения критериев (с max iterations).
- 25:27 — Dreaming: агент анализирует прошлые сессии, выявляет упущенные навыки и пишет playbook в память — авто-hill-climbing.
- 15:12 — Claude Code Desktop как control plane для локальных и remote-сессий с превью, сайдбаром агентов и визуальными индикаторами.
- 43:56 — Routines = higher-order prompts: по cron, webhook или API дёргают Claude Code локально или в облаке.
- 44:51 — CI autofix чинит флейки, ревью-комменты и merge-конфликты — в кодбазе Claude Code не ретраит, а каждый раз чинит root cause.
- 35:33 — Внутри Anthropic Claude Code дал +200% PR на инженера без падения качества.
Почему это важно
Anthropic явно сигналит, что гонка переехала с уровня модели на уровень продуктовой обвязки: agent harness, memory, мультиагентность, async-исполнение, верификация. Это удар по двум фронтам — по OpenAI/Google на уровне «у нас лучший developer surface» и по стартапам-обвязкам (Cursor, Cognition, Replit-агенты, code review SaaS) — Anthropic сама встраивает code review, security review, autofix, routines прямо в Claude Code. Сделка со SpaceX про Colossus One — это ответ на компьют-голод и публичное заявление, что Anthropic диверсифицируется от Amazon/Google compute. Выигрывают enterprises типа Shopify, MercadoLibre, Stripe, Notion, у которых уже отлажен flow «модель вышла → перекатили». Проигрывают команды, которые держат сложный собственный scaffolding — он становится тормозом, а не усилителем.
Идеи
- Anthropic не выпустила новую модель — весь кейноут построен вокруг продукта и инфраструктуры, что само по себе мета-сообщение.
- Сделка с SpaceX на «весь Colossus One» — Anthropic берёт компьют у конкурента Маска по compute (xAI), потому что Colossus уже отстроен.
- Лимиты подняли только для Opus в API, а в Claude Code — для подписочных тарифов; на Sonnet/Haiku в API ничего не упомянуто.
- Mythos — это, по сути, новая линейка после Opus/Sonnet/Haiku, упомянутая мимоходом как «модель, которая прочитала OpenBSD».
- 27-летний баг в OpenBSD — это политическое оружие против тезиса «AI не может найти то, что не нашли люди».
- Sonnet 3.5 New переименовали обратно в Sonnet 3.6 — Дайен это публично проговорила, признав путаницу в неймингах.
- Sonnet 3.7 была «overeager» — признание, что модель пушила решения, и эту черту пришлось дозированно экспонировать через thinking dials.
- Cloud Design + Cloud Code — у Anthropic есть отдельный продукт для дизайна (Anthropic Labs).
- Advisor strategy не требует нового SDK — реализуется через стандартный tools array, то есть Anthropic монетизирует Opus как «совесть» дешёвых моделей.
- Memory у managed agents явно объявлена «портируемой» — антипривязка к вендору как маркетинговый ход.
- Dreaming выполняется как отдельная кнопка в developer console — не auto, а ручной триггер (пока).
- Grader-агент в outcomes — это, по сути, RL-подобный цикл, упакованный в API.
- В Claude Code Desktop теперь видны и локальные, и remote сессии — единая точка управления, конкурент Cursor Composer и Devin UI.
- Routines = «cron для Claude Code» — закрывает нишу Sweep/Mentat и часть use cases для самопрограммируемых ботов.
- Borris явно сказал «большая часть моего кода пишется routines, а не мной» — продакт-овнер Claude Code публично отказывается от роли промптера.
- MercadoLibre — 23k инженеров, все на Claude Code, цель «90% автономного кода и agent-driven PR loop к Q3».
- Shopify внедрил Claude Code не только инженерам, но и в дизайн, продукт и data science.
- AcmePay-демо включало проверку UI в браузере Клодом — встроенный browser-verification как часть task definition «готово».
- CI autofix в Claude Code чинит root cause, а не ретраит — это поведенческий стандарт для остальных команд.
- Дайен призывает «иметь более сложные эвалы, чем сегодняшние возможности модели» — намёк, что внутренние эвалы у Anthropic ушли далеко вперёд от публичных.
- Anthropic называет себя «mountaineers, climbing alongside you» — позиционирование «партнёр, а не вендор» через прямой текст.
- Анджела/Кейтлин сделали fictional-стартап Lumara про посадку дронов на Луну — отсылка к SpaceX-партнёрству.
- Outcomes-рубрика — markdown, а не JSON-schema, что снижает порог входа для нетехнических ролей.
- В Claude Code IDE позиционируется как «middle ground» между CLI для power-users и desktop для визуалов.
- Phrase «touch grass and still code» — Anthropic явно метит в lifestyle-developer market через мобильные приложения.
- Code Review by Claude используется внутри всех команд Anthropic и «тысячами компаний» — социальное доказательство как фича.
- Дайен говорит «scaffolding теперь усиливает интеллект модели, а раньше держал её на плаву» — фазовый переход в роли инфраструктуры.
Инсайты
- Конкуренция в LLM смещается с модели на agentic-обвязку: продуктовая дифференциация сильнее, чем benchmark-дифференциация, и Anthropic явно ставит на это.
- Compute теперь геополитическая фигура: партнёрство со SpaceX — не про деньги, а про то, что доступ к электричеству и дата-центрам становится дефицитным ресурсом, и кто его контролирует, контролирует темп.
- Архитектура «execute-cheap, advise-expensive» превращает Opus в premium tier, который продают как «совесть» для всех остальных моделей — структурно похоже на ECR/refinement в человеческой иерархии.
- Self-improving агенты через дамп уроков в память — это первый коммерческий шаг к continual learning без файнтюна; обходит юридические и стоимостные риски настоящего RL в проде.
- Async-кодинг как новый дефолт: синхронная сессия — это лишь подмножество работы; верификация (тесты, браузер, ревью) становится критерием, отделяющим «можно отпустить» от «надо сидеть рядом».
- Routines = функтор над промптами: тот же сдвиг, что произошёл с unit-функциями → higher-order функциями в FP, происходит сейчас с промптами.
- Memory как продукт, а не фича: переносимость памяти — это новая ось lock-in/anti-lock-in, и Anthropic явно выбирает сторону «не привязываем».
- Грейдер как отдельный агент — паттерн отделения политики от валидации; в архитектуре агентов закрепляется разделение «исполнитель / судья», аналогичное actor-critic.
- Дешёвые эвалы и автоматизированный апгрейд — структурное преимущество, не разовая работа; команды без эвал-инфраструктуры структурно отстают на каждой новой модели.
- Сложный scaffolding теперь — техдолг: чем больше клея написано вокруг старой модели, тем труднее снять выгоду с новой; победители выкидывают код, а не пишут.
- Управленцы возвращаются в код через агентов — иерархическая стоимость «написать самому» падает, и senior staff/менеджмент перестаёт быть оторванным от кодбазы.
- Verification — не QA-этап, а определение «готово»: когда задача требует доказательства в браузере или CI, агент перестаёт нуждаться в human-in-the-loop.
- Мультиагент работает не из-за масштаба, а из-за изоляции контекстов: ключ — независимые threads + merge, что снижает context pollution.
Цитаты
«I think pure software is uninvestable» — этой цитаты в транскрипте нет; вместо неё привожу реальные:
«I feel like Claude has given me superpowers» — 3:58 «Чувствую, будто Claude дал мне суперспособности»
«we are doubling Cloud Code's five-hour rate limits» — 9:40 «Мы удваиваем пятичасовые лимиты Claude Code»
«We're partnering with SpaceX to use all the capacity of their Colossus One data center» — 9:57 «Мы заключаем партнёрство со SpaceX, чтобы забрать всю ёмкость их дата-центра Colossus One»
«Mythos read the entire OpenBSD source tree and found a 27-year-old vulnerability» — 6:33 «Mythos прочитал всё дерево исходников OpenBSD и нашёл 27-летнюю уязвимость»
«model capabilities are improving on an exponential, most organizations are still adopting AI on a linear path» — 7:03 «Возможности моделей растут экспоненциально, а большинство организаций внедряют AI линейно»
«You need to design for the next version of Claude, not just the current one» — 18:34 «Проектируйте под следующую версию Claude, а не только под текущую»
«model upgrades are a business opportunity» — 19:24 «Апгрейды модели — это бизнес-возможность»
«agentic coding is far more impactful than code autocomplete» — 12:43 «Агентный кодинг гораздо влиятельнее, чем автодополнение»
«frontier model quality at five times lower cost» — 23:09 «Качество фронтирной модели при в пять раз меньшей стоимости»
«Claude is actually able to self-learn» — 25:27 «Claude действительно умеет самообучаться»
«touch grass, and still code» — 36:53 «потрогать траву и при этом писать код»
«The default is now I will have quad prompt quad code» — 45:46 «Дефолт теперь — Claude промптит Claude Code»
«Routines are a higher order prompt» — 43:56 «Routines — это higher-order промпт»
«we share screenshots back and forth of the cool things that people are building with Claude» — 40:59 «Мы пересылаем друг другу скриншоты прикольных штук, которые делают с Claude»
«200% increase in the number of PRs per engineer, while keeping the same code quality bar» — 35:33 «Рост числа PR на инженера на 200% при сохранении планки качества кода»
«The capability is already here. The gap left is how fast we put it to work» — 46:29 «Возможность уже здесь. Остался только разрыв в том, как быстро мы её внедрим»
Факты
- Объём API на Claude platform вырос ~17x за год.
- Средний разработчик использует Claude Code ~20 часов в неделю.
- За последние 12 месяцев Anthropic выпустила 8 фронтирных моделей.
- Дайен пришла в Anthropic в 2023, участвовала в 18 версиях Claude (Haiku, Sonnet, Opus, Mythos).
- Stripe — перевод 50 000 строк Scala в Java за 4 дня вместо 10 инженер-недель (Scott Tom McVicker, dev infra).
- Binti (Felicia Krakuru, CEO) сократила лицензирование приёмной семьи на 20 дней благодаря Claude API.
- Rakuten на Opus 4.7 решает в 3x больше production engineering задач.
- Intuit наблюдает, как Opus 4.7 ловит собственные логические ошибки на этапе планирования и бэктрекит.
- AMP перевёл весь Smart Mode на Opus 4.7 и упростил scaffolding.
- Eve Legal на advisor strategy получил frontier-качество при 5x меньшей стоимости.
- Notion построил async-агенты на Claude Managed Agents для длинных задач внутри своего продукта.
- Shopify: Claude Code раскатан wall-to-wall, включая дизайн/продукт/data science (Andrew McNamara, Director of Applied AI).
- MercadoLibre: 23 000 инженеров на Claude Code, 500 000+ PR с человеческим оверсайтом, 9 000+ модернизированных приложений, цель Oscar Munoz/Mullen — 90% автономного кода и agent-driven PR loop к Q3.
- В Anthropic Claude Code дал +200% PR на инженера без падения качества.
- Спикеры: Ami Vora (CPO Anthropic), Diane (Research PM), Angela + Caitlin (Platform), Kat + Boris Cherny (Head of Claude Code).
- Партнёрство со SpaceX на ёмкость дата-центра Colossus One объявлено как новое.
Источники
- Mythos — внутренняя модель/агент Anthropic, нашедший 27-летнюю уязвимость в OpenBSD.
- Cloud Design by Anthropic Labs — продукт для визуального дизайна, запущен после Opus 4.7.
- Cloud Agent SDK — основа Claude Code IDE и Desktop.
- Cloud Code on Desktop / IDE / CLI / iOS / Android — линейка surfaces.
- Claude Managed Agents — managed harness + инфра.
- Routines, Outcomes, Dreaming, CI autofix, Code Review, Security Review — фичи платформы и Claude Code.
- Компании-кейсы: Stripe, Binti, Rakuten, Intuit, AMP, Eve Legal, Notion, Canva, Lagora, Shopify, MercadoLibre.
- Партнёр по компьюту: SpaceX (Colossus One).
Рекомендации
- Поддерживайте более жёсткие эвалы, чем умеет текущая модель — чтобы заметить момент, когда «магия» начала работать.
- Стройте амбициозные прототипы, даже если они сегодня не работают — они станут продуктом на следующей версии.
- Делайте апгрейд модели дешёвым: автоматизированные эвалы, простой scaffolding, отсутствие лишнего клея.
- Используйте advisor strategy для freemium и high-volume сценариев.
- Включайте memory в managed agents и помните, что её можно унести.
- Переходите на async-режим с verification внутри задачи и routines поверх Claude Code.
Итог
Anthropic не показала новую модель — она показала, что выигрывает не та команда, у которой лучший Claude, а та, чья архитектура готова встретить следующий Claude как апгрейд, а не как переписывание.