Коротко
Это запись кейноута Anthropic «Code with Claude» в Лондоне: серия выступлений (Boris, Lisa, Angela и Caitlin, Kat и Boris/Forrest) о том, что разрыв между возможностями моделей и их реальным использованием растёт, потому что модели улучшаются экспоненциально, а организации внедряют ИИ линейно. Anthropic выпустила восемь фронтир-моделей за 12 месяцев; новейшие Opus 4.7 и Mythos Preview способны «владеть результатом end-to-end» и применять суждение в задачах с высокой неопределённостью, а Mythos недавно нашёл 27-летнюю уязвимость в OpenBSD. Главный практический совет разработчикам — строить под следующую версию Claude, а не под текущую: упрощать «строительные леса» (scaffolding), делать всё более жёсткие evals и относиться к апгрейдам моделей как к бизнес-возможности. Анонсированы конкретные продукты: advisor strategy, Cloud Managed Agents с self-hosted sandboxes и MCP tunnels, а в Cloud Code — Agents View, desktop-приложение, CI autofix и routines («Claude промптит Claude»). Сквозной нарратив — возвращение «магии калькулятора»: дистанция между «у меня есть идея» и «оно работает» снова схлопывается.
Главный тезис
Возможности моделей растут по экспоненте, но бизнесы внедряют ИИ линейно — и закрытие этого разрыва, превращение capability в реально используемый продукт, целиком лежит на разработчиках, которые должны строить уже под завтрашнюю модель.
Ключевые идеи
- 4:19 — дистанция между «есть идея» и «оно работает» годами росла (компиляторы, конфиги, пакетные менеджеры), а теперь снова схлопывается: описываешь проблему — программа появляется.
- 4:31 — это «ощущение калькулятора», только теперь калькулятор пишет распределённую систему; ту же радость создания людей переживают в невиданном масштабе.
- 5:18 — Spotify через фоновый агент на Claude мёржит свыше 1000 PR в месяц и режет время миграций на 90%+, читая описание миграции на простом английском.
- 6:16 — Binti через Claude API сократила лицензирование приёмной семьи на 20 дней — это не метрика эффективности, а ребёнок, попавший в семью быстрее.
- 8:04 — Mythos прочитал весь исходник OpenBSD и нашёл 27-летнюю уязвимость, пережившую всех ревьюеров, фаззеры и статический анализ за три десятилетия.
- 8:45 — модели идут по экспоненте, организации внедряют ИИ линейно, и растёт разрыв между тем, что ИИ может, и что он реально делает для людей.
- 9:14 — год к году объём API на платформе Claude вырос почти в 17 раз, а средний разработчик в Cloud Code тратит свыше 20 часов в неделю.
- 14:02 — ценность сценариев растёт экспоненциально с интеллектом: инкрементальный интеллект создаёт новые рынки и увеличивает пирог, а не делит старый.
- 18:59 — по мере поумнения модели scaffolding (циклы, инструкции, тулы) из помощи превращается в тормоз; умной модели лучше дать обобщённые примитивы — файловую систему и песочницу.
- 18:42 — нужно строить под эмерджентные возможности, проектировать под следующую версию Claude, а не под текущую — побеждают те, чья архитектура готова поглотить следующий скачок.
- 19:55 — команды, выжимающие максимум, относятся к апгрейдам моделей как к бизнес-возможности: автоматизируют evals и тестируют модели руками.
- 22:29 — advisor strategy: дешёвая модель исполняет, а при затруднении обращается за советом к крупной — EVE Legal получили фронтир-качество в 5 раз дешевле.
- 23:45 — Cloud Managed Agents — связка агентного харнесса и production-инфраструктуры: продакшен-агент за дни, а не месяцы.
- 44:53 — сдвиг дефолта: не «я промпчу Claude Code», а «я создаю routine, которая промптит Claude Code» — routine как higher-order промпт.
- 39:23 — в MercadoLibre агенты вернули к коммитам менеджеров и VP, не писавших код годами; цель — 90% автономного кодинга к Q3.
Почему это важно
Это маркетингово-стратегический кейноут вендора: Anthropic фиксирует нарратив «экспонента vs линейность», чтобы убедить разработчиков и предприятия привязаться к её платформе именно сейчас. Выигрывают ранние адаптеры с гибкой архитектурой («developers who win»), партнёры-интеграторы (Canva, Legora, AMP, Asana) и крупные инженерные организации, перешедшие на Cloud Code wall-to-wall (Shopify, MercadoLibre с 23 000 инженеров). Проигрывают те, кто внедряет линейно и строит под текущую модель — их scaffolding устареет с очередным релизом. Упомянуты партнёры по песочницам (Daytona, Cloudflare, Vercel, Modal) и конкурентное позиционирование: Anthropic подчёркивает, что первой выпустила tool use, computer use, длинный контекст — и «дольше всех делала их надёжными». Сам внутренний показатель Anthropic (+200% PR на инженера) — аргумент-доказательство для покупателей.
Идеи
- Boris учился программировать на инженерном калькуляторе TI-83, записывая программки на TI-BASIC, чтобы подсматривать решения на контрольных по математике.
- Он научил программировать калькуляторы одноклассников, и они тоже стали получать высокие баллы — ранний пример «масштабирования» лайфхака.
- В 13 лет Boris опубликовал в интернете гайд по программированию инженерных калькуляторов.
- HTML он освоил не ради стартапа, а чтобы его лоты на eBay выглядели лучше чужих и продавались карточки Pokémon.
- Продал три голографические легендарные птицы по 99 центов — и жалеет, что не оставил их себе.
- Целое поколение училось программировать не по учебнику, а через «ковыряние» (tinkering).
- Эволюция масштаба автономности по Anthropic: пару лет назад модель «прилично писала git-commit», год назад Opus 4 строил фичу за несколько минут без участия человека, полгода назад агенты стали работать end-to-end за ночь.
- «Скачки становятся больше, а интервалы — короче» — описание ускорения, а не просто прогресса.
- Lisa с 2023 года участвовала в выпуске 17 версий Claude.
- Хронология способностей: Opus 3 — первая модель, уверенно писавшая длинный код; Sonnet 3.6 — первая, безопасно использовавшая компьютер; Sonnet 3.7 — первая «думающая» перед ответом; Opus 4 — неожиданно для самих создателей умела генерировать сложные Excel и PowerPoint.
- Метрика task horizon — сколько модель работает, прежде чем «потерять нить»: год назад минуты, сейчас часы, в будущем — непрерывно.
- Будущие агенты будут проактивными, «always on», знающими что делать без указаний, отвечающими за высокоуровневые цели.
- Сдвиг формулировок задач: не «напиши апдейт проекта», а «держи проект в графике эту неделю»; не «сделай прогноз», а «владей прогнозом и поддерживай его точным».
- Сигнал апгрейда: когда задача, которая раньше падала, начинает проходить — это знак выпустить то, что раньше выпустить было нельзя.
- Claude позиционируется как «мыслительный партнёр», готовый оспорить убеждения пользователя и возразить, когда тот неправ.
- Anthropic честно признаёт недостатки: у Claude остаются «вербальные тики», его ставят в тупик вирусные вопросы на здравый смысл, он иногда делает больше запрошенного.
- Команда Cloud Code описывает себя не как держателей готовой дорожной карты, а как «альпинистов» на не нанесённой на карту местности.
- «Multi-Clouding» — пользователи жонглируют несколькими инстансами Cloud Code одновременно; под это сделаны Desktop-приложение и Agents View в CLI.
- Desktop — единое представление локальных и облачных сессий с индикаторами: что бежит, что заблокировано, что ждёт ввода.
- VS Code расширение и desktop-приложение построены на том же Quad Agent SDK, что доступен сторонним разработчикам.
- Code review продукт разворачивает «команду агентов», обходящую все изменения и вспомогательные файлы; им пользуются тысячи компаний и каждая внутренняя команда Anthropic.
- Remote control в Cloud Code на iOS/Android — можно «пойти в парк, потрогать траву» и всё равно запустить задачу.
- В кодовой базе самого Cloud Code autofix настроен чинить корневую причину флака CI, а не просто перезапускать джобу.
- В демо Acme Pay Claude сам поймал edge-case (модалка закрывается до тоста успеха), проследил до race condition в оптимистичном апдейте, починил и проверил в браузере.
- Cloud Design от Anthropic Labs на Opus 4.7 — клиенты собирают продакшен-интерфейсы «за один присест»; у модели «есть вкус к визуальному дизайну».
- В демо Counter MCP-серверы data warehouse и feature flags спрятаны за firewall и доступны только через tunnel.anthropic.com — без выставления в публичный интернет.
- GrowthBot в демо сам обнаружил 46% drop-off в онбординг-флоу, посчитав это через защищённый запрос к data warehouse, и спросил разрешения заняться этим.
- «Dreaming» — Cloud интроспектирует собственные прошлые транскрипты, учится и самоулучшается.
Инсайты
- Усложнение программирования (тулчейн, конфиги) было исторической аномалией, а не нормой; ИИ возвращает софт к исходной «практичной магии».
- Узкое место прогресса сместилось с самих моделей на скорость организационного внедрения — технический потолок выше, чем способность людей его использовать.
- Линейное внедрение при экспоненциальном росте моделей означает не отставание, а постоянно расширяющийся разрыв — он не закроется сам.
- Чем умнее модель, тем вреднее жёсткие «леса»: помощь, спроектированная под слабую модель, ограничивает сильную — оптимальный интерфейс смещается к минимальным обобщённым примитивам.
- Конкурентное преимущество разработчика — не текущая оптимизация, а архитектурная готовность поглотить следующий скачок; оптимизация под сегодняшнюю модель — это технический долг завтра.
- Evals из инструмента контроля качества превращаются в сенсор: всё более жёсткие тесты — единственный способ заметить, что «экспонента сдвинулась под тобой».
- Интеллект не делит существующий рынок, а создаёт новые — ценность приложений растёт быстрее, чем сам интеллект.
- Разделение «исполнение / совет» по разным моделям показывает, что качество и стоимость перестали быть жёстким компромиссом — дорогая модель как консультант делает дешёвую и лучше, и дешевле.
- Дефолтный режим работы смещается с синхронного на асинхронный: проверяемость (verification) — то, что превращает «следи за агентом» в «запусти и вернись к готовому».
- Возникает рекурсивный слой автоматизации: человек больше не промптит модель, а конструирует системы, которые промптят модель — routine как higher-order prompt.
- Демократизация кодинга идёт вверх по иерархии: агенты возвращают к написанию кода менеджеров и VP, годами сидевших в ревью и роадмапах.
- Безопасность и инфраструктура становятся узким местом скорости: чем больше кода вливается, тем сильнее тормозят security-команды — отсюда сдвиг к ночному сканированию и self-hosted-инфраструктуре под контролем клиента.
- Anthropic строит нарратив раннего лидерства как защитный ров: ценность не в том, кто первым выпустил способность, а в том, кто дольше делал её надёжной.
Цитаты
«You made the thing, and it did what you wanted.» — 3:48 Ты сделал штуку, и она сделала то, что ты хотел.
«The distance between I have an idea and it runs just kept getting longer.» — 4:13 Дистанция между «у меня есть идея» и «оно работает» всё росла.
«It's the calculator feeling except the calculator can write a distributed system now.» — 4:31 Это ощущение калькулятора, только калькулятор теперь умеет писать распределённую систему.
«That's not just an efficiency metric. That's a kid connecting with a family.» — 6:24 Это не просто метрика эффективности. Это ребёнок, обретающий семью.
«The jumps keep getting bigger, and the intervals keep getting shorter.» — 8:27 Скачки становятся всё больше, а интервалы — всё короче.
«Most organizations are still adopting AI on a linear path.» — 8:45 Большинство организаций всё ещё внедряют ИИ по линейной траектории.
«As Claude gets stronger, your starting line moves forward.» — 13:38 По мере усиления Claude твоя стартовая линия сдвигается вперёд.
«In this way, incremental intelligence creates new markets and grows the pie.» — 14:02 Так инкрементальный интеллект создаёт новые рынки и увеличивает пирог.
«As models get smarter the scaffolding that used to help can hold Claude back.» — 18:59 По мере поумнения моделей строительные леса, что раньше помогали, могут тормозить Claude.
«That means designing for the next version of Claude, not the current one.» — 18:47 Это значит проектировать под следующую версию Claude, а не под текущую.
«When a task that used to fail starts passing, that's your sign to ship something that you couldn't ship before.» — 19:41 Когда падавшая задача начинает проходить — это сигнал выпустить то, что раньше было нельзя.
«It's really easy to build prototypes, but it's hard to scale in production.» — 21:43 Прототипы строить легко, а масштабировать в продакшене — трудно.
«You can now go to the park, touch grass, and still get your tasks done.» — 36:14 Теперь можно пойти в парк, потрогать траву — и всё равно сделать свои задачи.
«The default is now I'm going to have Claude prompt Claude code.» — 44:53 Теперь дефолт — это когда я заставляю Claude промптить Claude Code.
«QuadCode is putting coding back in the hands of people who spent the last decade in reviews and roadmap sessions.» — 39:30 Cloud Code возвращает кодинг в руки тех, кто десятилетие провёл в ревью и роадмап-сессиях.
«We think of ourselves more like mountaineers, just climbing alongside you in terrain that none of us has mapped before.» — 32:21 Мы скорее альпинисты, идущие рядом с вами по местности, которую никто из нас ещё не нанёс на карту.
«The capability is already here, and the remaining gap is how fast we put it to work.» — 45:44 Возможность уже здесь, и оставшийся разрыв — это насколько быстро мы пустим её в дело.
Факты
- Boris учился программировать на калькуляторе TI-83 на языке TI-BASIC; гайд опубликовал в 13 лет.
- Это первое мероприятие Code with Claude, проведённое за пределами Сан-Франциско (в Лондоне).
- Spotify: команда под руководством Nicholas Gustafsson построила фоновый агент, мёржит свыше 1000 PR в месяц в продакшен, сокращение времени миграций — более 90%.
- Binti (соосновательница и CEO Felicia Korkoru) — софт для соцработников по устройству детей в приёмные семьи; сокращение лицензирования семьи на 20 дней.
- Mythos нашёл 27-летнюю уязвимость в исходном коде OpenBSD «в прошлом месяце».
- Объём API на платформе Claude вырос год к году почти в 17 раз; средний разработчик в Cloud Code использует Claude свыше 20 часов в неделю.
- Anthropic выпустила 8 фронтир-моделей за последние 12 месяцев; Lisa присоединилась в 2023 и участвовала в выпуске 17 версий Claude.
- Opus 3 вышел «чуть более двух лет назад»; новейшие модели — Opus 4.7 и Mythos Preview.
- Rakuten: Opus 4.7 на внутреннем бенчмарке решил в 3 раза больше production-задач, чем предыдущая модель. Intuit отметил, что Opus 4.7 ловит собственные логические ошибки на этапе планирования.
- EVE Legal через advisor strategy получили фронтир-качество при в 5 раз меньшей стоимости.
- Внутри Anthropic переход на Cloud Code wall-to-wall дал +200% к числу PR на инженера.
- MercadoLibre — крупнейший e-commerce Латинской Америки, свыше 100 млн покупателей, 23 000 инженеров; отревьюено более 500 000 PR, модернизировано более 9000 приложений; Oscar Mullen целит в 90% автономного кодинга к Q3 этого года.
- Self-hosted sandboxes запускаются с поддержкой первого класса для Daytona, Cloudflare, Vercel и Modal; в демо Counter использует sandbox от Vercel.
- Год назад на первом Code with Claude в Сан-Франциско хедлайнером был Opus 4.
Источники
- Spotify, Binti, Rakuten, Intuit, AMP, EVE Legal, Asana, Shopify, MercadoLibre — компании-кейсы.
- Canva, Legora (Lagora) — партнёрские продукты на платформе Claude.
- Партнёры по песочницам: Daytona, Cloudflare, Vercel, Modal.
- Продукты Anthropic: Cloud Code (CLI, IDE-расширение для VS Code, Desktop, Agents View), Cloud Managed Agents, Cloud Platform, Cloud Design (Anthropic Labs), Cloud Security, Quad Agent SDK, routines, CI autofix, advisor strategy, MCP tunnels, self-hosted sandboxes.
- Люди: Nicholas Gustafsson (Spotify), Felicia Korkoru (Binti), Andrew McNamara (Shopify), Oscar Mullen (MercadoLibre); спикеры — Boris, Lisa, Angela, Caitlin, Kat, Forrest.
Рекомендации
- Строить и проектировать под следующую версию Claude, а не под текущую.
- Постоянно создавать всё более жёсткие evals и прототипы продуктов — как сенсор движения «экспоненты».
- Автоматизировать evals и процессы тестирования, чтобы апгрейды моделей были лёгкими; тестировать модели руками.
- Относиться к апгрейдам моделей как к бизнес-возможности, а не рутинному обновлению.
- Упрощать scaffolding, отдавая умной модели обобщённые примитивы (файловая система, песочница).
- Провести остаток дня по трекам: Research talks — для оценки моделей, Cloud Platform sessions — для строящих под пользователей, Cloud Code workshops — для ежедневного воркфлоу.
Итог
Возможность уже здесь — единственный оставшийся разрыв в том, насколько быстро разработчики пустят её в дело, строя под завтрашнюю модель, а не под сегодняшнюю.