Code with Claude London 2026: вступительный кейноут

Claude19 мая 202625 36550420 мая, 18:39

Коротко

Это запись кейноута Anthropic «Code with Claude» в Лондоне: серия выступлений (Boris, Lisa, Angela и Caitlin, Kat и Boris/Forrest) о том, что разрыв между возможностями моделей и их реальным использованием растёт, потому что модели улучшаются экспоненциально, а организации внедряют ИИ линейно. Anthropic выпустила восемь фронтир-моделей за 12 месяцев; новейшие Opus 4.7 и Mythos Preview способны «владеть результатом end-to-end» и применять суждение в задачах с высокой неопределённостью, а Mythos недавно нашёл 27-летнюю уязвимость в OpenBSD. Главный практический совет разработчикам — строить под следующую версию Claude, а не под текущую: упрощать «строительные леса» (scaffolding), делать всё более жёсткие evals и относиться к апгрейдам моделей как к бизнес-возможности. Анонсированы конкретные продукты: advisor strategy, Cloud Managed Agents с self-hosted sandboxes и MCP tunnels, а в Cloud Code — Agents View, desktop-приложение, CI autofix и routines («Claude промптит Claude»). Сквозной нарратив — возвращение «магии калькулятора»: дистанция между «у меня есть идея» и «оно работает» снова схлопывается.

Главный тезис

Возможности моделей растут по экспоненте, но бизнесы внедряют ИИ линейно — и закрытие этого разрыва, превращение capability в реально используемый продукт, целиком лежит на разработчиках, которые должны строить уже под завтрашнюю модель.

Ключевые идеи

  • 4:19дистанция между «есть идея» и «оно работает» годами росла (компиляторы, конфиги, пакетные менеджеры), а теперь снова схлопывается: описываешь проблему — программа появляется.
  • 4:31 — это «ощущение калькулятора», только теперь калькулятор пишет распределённую систему; ту же радость создания людей переживают в невиданном масштабе.
  • 5:18Spotify через фоновый агент на Claude мёржит свыше 1000 PR в месяц и режет время миграций на 90%+, читая описание миграции на простом английском.
  • 6:16Binti через Claude API сократила лицензирование приёмной семьи на 20 дней — это не метрика эффективности, а ребёнок, попавший в семью быстрее.
  • 8:04Mythos прочитал весь исходник OpenBSD и нашёл 27-летнюю уязвимость, пережившую всех ревьюеров, фаззеры и статический анализ за три десятилетия.
  • 8:45 — модели идут по экспоненте, организации внедряют ИИ линейно, и растёт разрыв между тем, что ИИ может, и что он реально делает для людей.
  • 9:14 — год к году объём API на платформе Claude вырос почти в 17 раз, а средний разработчик в Cloud Code тратит свыше 20 часов в неделю.
  • 14:02 — ценность сценариев растёт экспоненциально с интеллектом: инкрементальный интеллект создаёт новые рынки и увеличивает пирог, а не делит старый.
  • 18:59 — по мере поумнения модели scaffolding (циклы, инструкции, тулы) из помощи превращается в тормоз; умной модели лучше дать обобщённые примитивы — файловую систему и песочницу.
  • 18:42 — нужно строить под эмерджентные возможности, проектировать под следующую версию Claude, а не под текущую — побеждают те, чья архитектура готова поглотить следующий скачок.
  • 19:55 — команды, выжимающие максимум, относятся к апгрейдам моделей как к бизнес-возможности: автоматизируют evals и тестируют модели руками.
  • 22:29advisor strategy: дешёвая модель исполняет, а при затруднении обращается за советом к крупной — EVE Legal получили фронтир-качество в 5 раз дешевле.
  • 23:45Cloud Managed Agents — связка агентного харнесса и production-инфраструктуры: продакшен-агент за дни, а не месяцы.
  • 44:53 — сдвиг дефолта: не «я промпчу Claude Code», а «я создаю routine, которая промптит Claude Code» — routine как higher-order промпт.
  • 39:23 — в MercadoLibre агенты вернули к коммитам менеджеров и VP, не писавших код годами; цель — 90% автономного кодинга к Q3.

Почему это важно

Это маркетингово-стратегический кейноут вендора: Anthropic фиксирует нарратив «экспонента vs линейность», чтобы убедить разработчиков и предприятия привязаться к её платформе именно сейчас. Выигрывают ранние адаптеры с гибкой архитектурой («developers who win»), партнёры-интеграторы (Canva, Legora, AMP, Asana) и крупные инженерные организации, перешедшие на Cloud Code wall-to-wall (Shopify, MercadoLibre с 23 000 инженеров). Проигрывают те, кто внедряет линейно и строит под текущую модель — их scaffolding устареет с очередным релизом. Упомянуты партнёры по песочницам (Daytona, Cloudflare, Vercel, Modal) и конкурентное позиционирование: Anthropic подчёркивает, что первой выпустила tool use, computer use, длинный контекст — и «дольше всех делала их надёжными». Сам внутренний показатель Anthropic (+200% PR на инженера) — аргумент-доказательство для покупателей.

Идеи

  • Boris учился программировать на инженерном калькуляторе TI-83, записывая программки на TI-BASIC, чтобы подсматривать решения на контрольных по математике.
  • Он научил программировать калькуляторы одноклассников, и они тоже стали получать высокие баллы — ранний пример «масштабирования» лайфхака.
  • В 13 лет Boris опубликовал в интернете гайд по программированию инженерных калькуляторов.
  • HTML он освоил не ради стартапа, а чтобы его лоты на eBay выглядели лучше чужих и продавались карточки Pokémon.
  • Продал три голографические легендарные птицы по 99 центов — и жалеет, что не оставил их себе.
  • Целое поколение училось программировать не по учебнику, а через «ковыряние» (tinkering).
  • Эволюция масштаба автономности по Anthropic: пару лет назад модель «прилично писала git-commit», год назад Opus 4 строил фичу за несколько минут без участия человека, полгода назад агенты стали работать end-to-end за ночь.
  • «Скачки становятся больше, а интервалы — короче» — описание ускорения, а не просто прогресса.
  • Lisa с 2023 года участвовала в выпуске 17 версий Claude.
  • Хронология способностей: Opus 3 — первая модель, уверенно писавшая длинный код; Sonnet 3.6 — первая, безопасно использовавшая компьютер; Sonnet 3.7 — первая «думающая» перед ответом; Opus 4 — неожиданно для самих создателей умела генерировать сложные Excel и PowerPoint.
  • Метрика task horizon — сколько модель работает, прежде чем «потерять нить»: год назад минуты, сейчас часы, в будущем — непрерывно.
  • Будущие агенты будут проактивными, «always on», знающими что делать без указаний, отвечающими за высокоуровневые цели.
  • Сдвиг формулировок задач: не «напиши апдейт проекта», а «держи проект в графике эту неделю»; не «сделай прогноз», а «владей прогнозом и поддерживай его точным».
  • Сигнал апгрейда: когда задача, которая раньше падала, начинает проходить — это знак выпустить то, что раньше выпустить было нельзя.
  • Claude позиционируется как «мыслительный партнёр», готовый оспорить убеждения пользователя и возразить, когда тот неправ.
  • Anthropic честно признаёт недостатки: у Claude остаются «вербальные тики», его ставят в тупик вирусные вопросы на здравый смысл, он иногда делает больше запрошенного.
  • Команда Cloud Code описывает себя не как держателей готовой дорожной карты, а как «альпинистов» на не нанесённой на карту местности.
  • «Multi-Clouding» — пользователи жонглируют несколькими инстансами Cloud Code одновременно; под это сделаны Desktop-приложение и Agents View в CLI.
  • Desktop — единое представление локальных и облачных сессий с индикаторами: что бежит, что заблокировано, что ждёт ввода.
  • VS Code расширение и desktop-приложение построены на том же Quad Agent SDK, что доступен сторонним разработчикам.
  • Code review продукт разворачивает «команду агентов», обходящую все изменения и вспомогательные файлы; им пользуются тысячи компаний и каждая внутренняя команда Anthropic.
  • Remote control в Cloud Code на iOS/Android — можно «пойти в парк, потрогать траву» и всё равно запустить задачу.
  • В кодовой базе самого Cloud Code autofix настроен чинить корневую причину флака CI, а не просто перезапускать джобу.
  • В демо Acme Pay Claude сам поймал edge-case (модалка закрывается до тоста успеха), проследил до race condition в оптимистичном апдейте, починил и проверил в браузере.
  • Cloud Design от Anthropic Labs на Opus 4.7 — клиенты собирают продакшен-интерфейсы «за один присест»; у модели «есть вкус к визуальному дизайну».
  • В демо Counter MCP-серверы data warehouse и feature flags спрятаны за firewall и доступны только через tunnel.anthropic.com — без выставления в публичный интернет.
  • GrowthBot в демо сам обнаружил 46% drop-off в онбординг-флоу, посчитав это через защищённый запрос к data warehouse, и спросил разрешения заняться этим.
  • «Dreaming» — Cloud интроспектирует собственные прошлые транскрипты, учится и самоулучшается.

Инсайты

  • Усложнение программирования (тулчейн, конфиги) было исторической аномалией, а не нормой; ИИ возвращает софт к исходной «практичной магии».
  • Узкое место прогресса сместилось с самих моделей на скорость организационного внедрения — технический потолок выше, чем способность людей его использовать.
  • Линейное внедрение при экспоненциальном росте моделей означает не отставание, а постоянно расширяющийся разрыв — он не закроется сам.
  • Чем умнее модель, тем вреднее жёсткие «леса»: помощь, спроектированная под слабую модель, ограничивает сильную — оптимальный интерфейс смещается к минимальным обобщённым примитивам.
  • Конкурентное преимущество разработчика — не текущая оптимизация, а архитектурная готовность поглотить следующий скачок; оптимизация под сегодняшнюю модель — это технический долг завтра.
  • Evals из инструмента контроля качества превращаются в сенсор: всё более жёсткие тесты — единственный способ заметить, что «экспонента сдвинулась под тобой».
  • Интеллект не делит существующий рынок, а создаёт новые — ценность приложений растёт быстрее, чем сам интеллект.
  • Разделение «исполнение / совет» по разным моделям показывает, что качество и стоимость перестали быть жёстким компромиссом — дорогая модель как консультант делает дешёвую и лучше, и дешевле.
  • Дефолтный режим работы смещается с синхронного на асинхронный: проверяемость (verification) — то, что превращает «следи за агентом» в «запусти и вернись к готовому».
  • Возникает рекурсивный слой автоматизации: человек больше не промптит модель, а конструирует системы, которые промптят модель — routine как higher-order prompt.
  • Демократизация кодинга идёт вверх по иерархии: агенты возвращают к написанию кода менеджеров и VP, годами сидевших в ревью и роадмапах.
  • Безопасность и инфраструктура становятся узким местом скорости: чем больше кода вливается, тем сильнее тормозят security-команды — отсюда сдвиг к ночному сканированию и self-hosted-инфраструктуре под контролем клиента.
  • Anthropic строит нарратив раннего лидерства как защитный ров: ценность не в том, кто первым выпустил способность, а в том, кто дольше делал её надёжной.

Цитаты

«You made the thing, and it did what you wanted.» — 3:48 Ты сделал штуку, и она сделала то, что ты хотел.

«The distance between I have an idea and it runs just kept getting longer.» — 4:13 Дистанция между «у меня есть идея» и «оно работает» всё росла.

«It's the calculator feeling except the calculator can write a distributed system now.» — 4:31 Это ощущение калькулятора, только калькулятор теперь умеет писать распределённую систему.

«That's not just an efficiency metric. That's a kid connecting with a family.» — 6:24 Это не просто метрика эффективности. Это ребёнок, обретающий семью.

«The jumps keep getting bigger, and the intervals keep getting shorter.» — 8:27 Скачки становятся всё больше, а интервалы — всё короче.

«Most organizations are still adopting AI on a linear path.» — 8:45 Большинство организаций всё ещё внедряют ИИ по линейной траектории.

«As Claude gets stronger, your starting line moves forward.» — 13:38 По мере усиления Claude твоя стартовая линия сдвигается вперёд.

«In this way, incremental intelligence creates new markets and grows the pie.» — 14:02 Так инкрементальный интеллект создаёт новые рынки и увеличивает пирог.

«As models get smarter the scaffolding that used to help can hold Claude back.» — 18:59 По мере поумнения моделей строительные леса, что раньше помогали, могут тормозить Claude.

«That means designing for the next version of Claude, not the current one.» — 18:47 Это значит проектировать под следующую версию Claude, а не под текущую.

«When a task that used to fail starts passing, that's your sign to ship something that you couldn't ship before.» — 19:41 Когда падавшая задача начинает проходить — это сигнал выпустить то, что раньше было нельзя.

«It's really easy to build prototypes, but it's hard to scale in production.» — 21:43 Прототипы строить легко, а масштабировать в продакшене — трудно.

«You can now go to the park, touch grass, and still get your tasks done.» — 36:14 Теперь можно пойти в парк, потрогать траву — и всё равно сделать свои задачи.

«The default is now I'm going to have Claude prompt Claude code.» — 44:53 Теперь дефолт — это когда я заставляю Claude промптить Claude Code.

«QuadCode is putting coding back in the hands of people who spent the last decade in reviews and roadmap sessions.» — 39:30 Cloud Code возвращает кодинг в руки тех, кто десятилетие провёл в ревью и роадмап-сессиях.

«We think of ourselves more like mountaineers, just climbing alongside you in terrain that none of us has mapped before.» — 32:21 Мы скорее альпинисты, идущие рядом с вами по местности, которую никто из нас ещё не нанёс на карту.

«The capability is already here, and the remaining gap is how fast we put it to work.» — 45:44 Возможность уже здесь, и оставшийся разрыв — это насколько быстро мы пустим её в дело.

Факты

  • Boris учился программировать на калькуляторе TI-83 на языке TI-BASIC; гайд опубликовал в 13 лет.
  • Это первое мероприятие Code with Claude, проведённое за пределами Сан-Франциско (в Лондоне).
  • Spotify: команда под руководством Nicholas Gustafsson построила фоновый агент, мёржит свыше 1000 PR в месяц в продакшен, сокращение времени миграций — более 90%.
  • Binti (соосновательница и CEO Felicia Korkoru) — софт для соцработников по устройству детей в приёмные семьи; сокращение лицензирования семьи на 20 дней.
  • Mythos нашёл 27-летнюю уязвимость в исходном коде OpenBSD «в прошлом месяце».
  • Объём API на платформе Claude вырос год к году почти в 17 раз; средний разработчик в Cloud Code использует Claude свыше 20 часов в неделю.
  • Anthropic выпустила 8 фронтир-моделей за последние 12 месяцев; Lisa присоединилась в 2023 и участвовала в выпуске 17 версий Claude.
  • Opus 3 вышел «чуть более двух лет назад»; новейшие модели — Opus 4.7 и Mythos Preview.
  • Rakuten: Opus 4.7 на внутреннем бенчмарке решил в 3 раза больше production-задач, чем предыдущая модель. Intuit отметил, что Opus 4.7 ловит собственные логические ошибки на этапе планирования.
  • EVE Legal через advisor strategy получили фронтир-качество при в 5 раз меньшей стоимости.
  • Внутри Anthropic переход на Cloud Code wall-to-wall дал +200% к числу PR на инженера.
  • MercadoLibre — крупнейший e-commerce Латинской Америки, свыше 100 млн покупателей, 23 000 инженеров; отревьюено более 500 000 PR, модернизировано более 9000 приложений; Oscar Mullen целит в 90% автономного кодинга к Q3 этого года.
  • Self-hosted sandboxes запускаются с поддержкой первого класса для Daytona, Cloudflare, Vercel и Modal; в демо Counter использует sandbox от Vercel.
  • Год назад на первом Code with Claude в Сан-Франциско хедлайнером был Opus 4.

Источники

  • Spotify, Binti, Rakuten, Intuit, AMP, EVE Legal, Asana, Shopify, MercadoLibre — компании-кейсы.
  • Canva, Legora (Lagora) — партнёрские продукты на платформе Claude.
  • Партнёры по песочницам: Daytona, Cloudflare, Vercel, Modal.
  • Продукты Anthropic: Cloud Code (CLI, IDE-расширение для VS Code, Desktop, Agents View), Cloud Managed Agents, Cloud Platform, Cloud Design (Anthropic Labs), Cloud Security, Quad Agent SDK, routines, CI autofix, advisor strategy, MCP tunnels, self-hosted sandboxes.
  • Люди: Nicholas Gustafsson (Spotify), Felicia Korkoru (Binti), Andrew McNamara (Shopify), Oscar Mullen (MercadoLibre); спикеры — Boris, Lisa, Angela, Caitlin, Kat, Forrest.

Рекомендации

  • Строить и проектировать под следующую версию Claude, а не под текущую.
  • Постоянно создавать всё более жёсткие evals и прототипы продуктов — как сенсор движения «экспоненты».
  • Автоматизировать evals и процессы тестирования, чтобы апгрейды моделей были лёгкими; тестировать модели руками.
  • Относиться к апгрейдам моделей как к бизнес-возможности, а не рутинному обновлению.
  • Упрощать scaffolding, отдавая умной модели обобщённые примитивы (файловая система, песочница).
  • Провести остаток дня по трекам: Research talks — для оценки моделей, Cloud Platform sessions — для строящих под пользователей, Cloud Code workshops — для ежедневного воркфлоу.

Итог

Возможность уже здесь — единственный оставшийся разрыв в том, насколько быстро разработчики пустят её в дело, строя под завтрашнюю модель, а не под сегодняшнюю.

readmint Pro

Понравилось саммари? Сделайте такое же по своему видео

Вставьте ссылку на любое YouTube-видео — readmint расшифрует его и соберёт пересказ с главными тезисами и цитатами. Без воды и перемотки.

  • Безлимит саммари — сколько угодно видео
  • Главные тезисы и цитаты без воды
  • Приоритет в очереди обработки
  • Без рекламы и сторонних блоков
Саммари своего видео
Вставьте ссылку на YouTube, разбор будет готов за 2–3 минуты.

Безлимит по подписке readmint Pro — 499 ₽/мес