Коротко
Двое участников команды Claude Code подводят итоги первого года продукта: от внутреннего демо в Slack, на которое отреагировали два человека, до состояния, когда инженер управляет «деревом из тысяч агентов» и делает половину работы с телефона. Центральный практический приём — не исправлять агента вручную, а заставлять его записывать ошибки в CLAUDE.md или в skills, превращая каждый сбой в постоянную память. Верификацию они называют самым недопонятым элементом агентной разработки: это не юнит-тесты и линтеры, а способность агента самому запустить и проверить результат — вплоть до того, что Opus 4 сам открывал CLI Claude и тестировал собственную фичу. Plan mode и context engineering объявлены устаревшими для новых моделей (с 4.6–4.7 этап планирования не нужен, а контекст должен быть минимальным), auto-mode — более безопасным, чем ручное чтение permission-запросов. Эволюция описана как два скачка: инженер перестал писать код и стал говорить с агентом, а теперь перестаёт говорить с агентом и говорит с циклом — routine, которая сама слушает тикеты и шлёт PR.
Главный тезис
Выгода от AI приходит не тогда, когда Claude пристроен сбоку к старым процессам, а когда он поставлен в центр всего — как компьютер в 90-х; роль человека при этом сжимается до идей, вкуса и настройки верификации, а само исполнение уходит циклам агентов.
Ключевые идеи
- 0:58 — когда Claude ошибается, спикер не поправляет его в чате, а велит записать урок в CLAUDE.md или оформить как skill: только так агент может «работать бесконечно», не повторяя ошибок
- 1:26 — верификацию все понимают неправильно: юнит-тесты, линтеры и type-checking уже автоматизированы; для агентов верификация — это возможность запустить результат, и придумать как — отдельная умственная работа
- 1:49 — с Opus 4 случился переломный момент: модель сама открыла в bash CLI Claude и протестировала собственную фичу; сейчас такие циклы рутинно крутятся на iOS/Android-симуляторах и computer use для десктопа
- 2:41 — при отладке desktop-приложения агенту дают читать Slack, чтобы он сам понял, не лежит ли staging и не встречал ли кто-то баг раньше, а после дебага — обновил desktop-dev skill: опыт отладки накапливается в инструкции
- 3:46 — роли сливаются: PM пишет код, дизайнер (Megan) делает PR «я просто кнопку поправила», и то, что сначала вызывало ужас, стало нормой
- 4:29 — за инженерами подтягиваются смежники: дизайнеры прототипируют прямо в приложении вместо «найма» инженера, финансовый отдел гоняет проекции в Claude Code, у data scientists он на каждом экране
- 5:01 — фронтир сегодня — routines: инженер, запустивший voice mode, настроил цикл, который слушает каждый тикет, GitHub-issue и баг-репорт и проактивно присылает ему готовый PR с фиксом
- 5:36 — спикер сел чинить баг вечером, а его агент сообщил, что «другой Claude уже решил проблему»: у коллеги есть routine, которая находит безответные баг-репорты и в течение 5 часов мёржит фиксы с лёгкой верификацией
- 6:55 — plan mode умер: этап планирования был нужен для Opus 4–4.5, но начиная с 4.6 и точно с 4.7 модели он не требуется — спикер работает только в auto mode, запуская агента и переключаясь на следующего
- 8:06 — auto-mode безопаснее ручного одобрения: когда человек принимает 99% permission-запросов, глаза замыливаются; отдельная модель-классификатор проверяет безопасность лучше, а внимание человека остаётся на действительно важном
- 9:07 — перед выкаткой auto-mode команда собрала тысячи транскриптов агентных траекторий, посадила Red Team придумывать prompt-инъекции, построила на этом евалы и добилась, чтобы блокировались не только сегодняшние атаки, но и самые умные из вообразимых
- 10:54 — два больших скачка за полтора года: сначала «инженер взаимодействует не с исходным кодом, а с агентом», теперь — «я говорю не с агентом, а с циклом, с routine»
- 11:16 — аналогия с парадоксом продуктивности: статья HBR 90-х показывала, что выгоду от компьютеров получили не те, кто поставил машину рядом с бумажным архивом, а те, кто выбросил архив и пропустил каждый процесс через компьютер
- 12:11 — в Anthropic новички при онбординге не задают вопросов людям — они спрашивают Claude; PC-переход занял 10–15 лет, но AI-переход 12:51, потому что работа уже оцифрована, а Claude умеет пользоваться компьютером и писать код
- 15:03 — рабочий setup перевернулся: вместо шести вкладок терминала с шестью git checkout — одна вкладка, новый agent view, автоматические worktrees в desktop-приложении и примерно половина инженерии с телефона, голосом, на прогулке за кофе
- 16:20 — эволюция дисциплины: при Sonnet 3.5 инженерили промпты, при Opus 4 — контекст, с сегодняшними моделями — ни то ни другое: минимальный системный промпт, минимум инструментов, и дать модели способ самой достать контекст
Почему это важно
Это витрина стратегии Anthropic: компания демонстрирует, что сама прошла переход, который продаёт клиентам — Claude в центре каждого процесса, от кода до финансовых проекций и онбординга. Выигрывают компании, перестраивающие процессы вокруг агентов (спикеры утверждают, что таких «уже много»), и люди с продуктовым вкусом, curiosity и желанием end-to-end ownership; проигрывает специализация как таковая — границы между PM, инженером и дизайнером объявлены отмирающими. Одновременно это сигнал рынку инструментов: plan mode, prompt- и context-engineering — слои, построенные под слабости старых моделей, — отмирают с каждым поколением, и форм-фактор для управления сотнями и тысячами агентов ещё никем не найден; команда прямо говорит, что ответ придёт не сверху, а от команды и комьюнити.
Идеи
- Ошибка агента — не повод для инструкции в чате, а сырьё для персистентного артефакта (CLAUDE.md, skill); чат-коррекция испаряется, артефакт работает вечно
- Skill как аккумулятор отладочного опыта: после каждой сессии дебага агент сам дописывает собственную инструкцию по запуску окружения
- Slack для агента — сенсор состояния мира: прежде чем дебажить, проверить, не упал ли staging и не жаловался ли кто-то уже
- Рекурсивное самотестирование: Claude открывает CLI Claude внутри bash и проверяет фичу, которую сам написал
- Computer use как универсальный верификатор UI: агент кликает по новому интерфейсу, гоняет edge cases, чинит и перепроверяет
- Проактивный фикс обгоняет разработчика: баг закрыт чужой routine раньше, чем автор фичи сел его чинить вечером
- «Это всегда чужой Quad уже решил проблему» — агенты коллег становятся невидимой рабочей силой команды
- Code review, ответы на комментарии, починка CI, rebase — целый пласт инженерной рутины, которой спикер «не делал уже давно»
- Permission prompts были костылём эпохи без классификаторов и слабого alignment, а не принципом дизайна
- Делегированная проверка безопасности отдельной моделью эмпирически надёжнее уставшего человека
- Red team атакует собственный продукт до релиза, и каждая найденная атака превращается в регрессионный евал
- Ставки «это невозможно, не сработает» при работе поверх модели систематически проигрывают — auto-mode тому пример
- Накопленная инженерная интуиция требует активного выбрасывания: «строим на новой штуке — надо переучиваться»
- Бэклог исчезает как сущность: каждая понравившаяся идея сразу строится, todo-список не успевает возникнуть
- Общение с коллегами сместилось из «мне нужно от тебя» в «с тобой весело строить» — информацию даёт агент
- Инженеры ведут фичи end-to-end: от идеи через legal и маркетинг до запуска, без передачи по конвейеру
- Компьютер намеренно оставлен на рабочем столе: кодинг с дивана через remote control, коллеги сначала думали, что забыл
- Голосовой запуск агента посреди разговора: идея возникла — агент стартован с телефона, не открывая ноутбук
- Избыточный контекст — это микроменеджмент модели: она часто знает путь к результату лучше, чем подсказчик
- Harness сознательно худеет, чтобы освободить место пользовательским промптам и улучшить их соблюдение
- Форм-фактор для тысяч одновременных агентов неизвестен даже создателям — «удивлюсь, если через год инструменты будут те же»
- Демократия идей как ставка менеджмента: все говорят с пользователями, потому что прорывы придут не от лидов, а от команды и комьюнити
Инсайты
- Самоулучшение агента важнее его разовой коррекции: системы, конвертирующие ошибки в персистентную память, масштабируются неограниченно, остальные — нет
- Узкое место разработки сместилось с генерации кода на верификацию: ценность инженера теперь в том, чтобы построить агенту способ проверить себя
- Каждое поколение моделей убивает слой инструментария, построенный под слабости предыдущего — plan mode, prompt engineering и context engineering это последовательные жертвы
- Безопасность через делегирование машине надёжнее безопасности через человеческое внимание, потому что внимание деградирует при высокой доле одобрений
- Доверие к агенту напрямую конвертируется в параллелизм: второй агент возможен только тогда, когда за первым не нужно следить
- Технологический переход даёт выгоду при перестройке процесса вокруг нового ядра, а не при встраивании новинки в старый процесс — и скорость диффузии AI выше, чем у PC, потому что субстрат уже цифровой
- Специализация ролей была артефактом дороговизны исполнения; когда исполнение дёшево, роли сливаются вокруг идей, вкуса и ownership
- Опыт становится пассивом в средах со сменой парадигмы: эмпирическая проверка бьёт экспертную интуицию
- Координация через агентов вытесняет координацию через людей — человеческое общение остаётся для творчества, а не для обмена информацией
- Интерфейс к работе абстрагируется ступенями: код → агент → цикл; каждая ступень делает предыдущую невидимой деталью реализации
Фреймворки
- Два скачка взаимодействия (полтора года): 1) инженер взаимодействует не с исходным кодом, а с агентом, который пишет код; 2) инженер взаимодействует не с агентом, а с циклом/routine, которая сама управляет агентами
- Три эпохи промптинга: Sonnet 3.5 — prompt engineering; Opus 4 — context engineering; текущие модели — минимализм: минимальный системный промпт, минимум инструментов, модель сама достаёт контекст
- Урок HBR о компьютеризации: выгода приходит не от «бумажный процесс + компьютер сбоку», а от «выбросить архив, поставить компьютер в центр каждого процесса» — применяется к AI один в один
Цитаты
«ricordo di averlo pubblicato su Slack e c'erano due persone che hanno reagito» — 0:00 Помню, как запостил это в Slack — и отреагировали два человека
«Un modo molto carino per dire che non era così bravo» — 0:14 Очень милый способ сказать, что он был не так уж хорош
«Ed è come un albero di migliaia di agenti» — 0:48 И это как дерево из тысяч агентов
«ogni volta che Quad commette un errore, non gli dico di fare diversamente» — 0:51 Каждый раз, когда Claude ошибается, я не говорю ему сделать иначе
«Entro 5 ore pubblica una correzione e unisce con le facili da verificare» — 5:51 В течение 5 часов он публикует фикс и мёржит те, что легко проверить
«è sempre un quad di un'altra persona che ci sta lavorando» — 5:59 Это всегда чей-то чужой Claude уже работает над этим
«riteniamo che la modalità automatica sia più sicura rispetto alla lettura di ogni singola richiesta di autorizzazione» — 8:12 Мы считаем, что автоматический режим безопаснее, чем чтение каждого отдельного запроса на разрешение
«ho capito che in realtà mi sbaglio molto spesso perché costruire sul modello è così strano» — 10:00 Я понял, что на самом деле очень часто ошибаюсь, потому что строить поверх модели — это так странно
«forse non è il codice sorgente forse è l'agente» — 10:42 Может, это не исходный код — может, это агент
«non parlo più con un agente, parlo con un ciclo» — 10:54 Я больше не говорю с агентом — я говорю с циклом
«bisognava buttare via l'archivio» — 11:51 Нужно было выбросить архив
«Chiedono a Quad, ed è un po' strano. Questa è la prima azienda in cui lavoro in questo modo» — 12:11 Они спрашивают Claude, и это немного странно. Это первая компания, где я так работаю
«come ingegnere a me non mi sia mai divertito così tanto a fare ingegneria perché la parte noiosa non la devo fare» — 13:13 Как инженеру мне никогда не было так весело заниматься инженерией, потому что скучную часть делать не нужно
«E quindi il mio lavoro è trovare questa idea così divertente» — 13:27 И поэтому моя работа — находить идею, и это так весело
«Sono convinto che questi ruoli si stiano fondendo» — 13:38 Я убеждён, что эти роли сливаются
«sì sto programmando dal mio divano» — 15:58 Да, я программирую с дивана
«dire al modello solo ciò che deve sapere e lasciare che sia lui a capire il resto» — 16:44 Говорить модели только то, что ей нужно знать, и дать ей самой разобраться с остальным
«quando dai al modello troppo contesto è un po' come se lo stessi microgestendo» — 16:53 Когда даёшь модели слишком много контекста — это как будто ты её микроменеджишь
«non penso che queste idee verranno da noi, verranno dal team» — 17:57 Не думаю, что эти идеи придут от нас — они придут от команды
Факты
- Claude Code запущен год назад; первой презентацией был маленький ролик во внутреннем Slack, на который отреагировали два человека
- Полтора года назад единственной моделью безопасности были permission prompts с ручным «да/нет» — классификаторов не было, alignment модели был хуже
- С Opus 4 впервые наблюдалось самотестирование: модель открыла CLI Claude в bash и проверила собственную фичу
- Этап планирования был важен для Opus 4–4.5; с версии 4.6 и точно с 4.7 он, по словам спикера, больше не нужен (в SRT: «POS 4», «46», «47»)
- Циклы самотестирования сейчас работают на iOS-симуляторе, Android-симуляторе и через computer use на десктопе
- Один инженер команды запустил voice mode на все продукты и настроил routine, слушающую все тикеты, GitHub-issues и баг-репорты с автоматической подачей PR
- Routine другого инженера находит безответные баг-репорты и в течение 5 часов публикует и мёржит фиксы
- Статья Harvard Business Review 1990-х описывала, почему компании не видят роста продуктивности от компьютеров; сам переход на PC занял, по оценке спикера, 10–15 лет
- Для выкатки auto-mode команда собрала тысячи транскриптов агентных траекторий, привлекла Red Team для prompt-инъекций и построила евалы, добиваясь блокировки всех атак
- Раньше типичный setup спикера — шесть вкладок терминала с шестью git checkout одного репозитория; теперь одна вкладка с новым agent view и автоматическими worktrees
- По словам спикера, около половины своей инженерной работы он теперь делает с телефона через remote control
- Дизайнер Megan делала PR сама («просто чиню кнопку»), что сначала шокировало команду
- Команды финансов и data science в Anthropic работают в Claude Code; новые сотрудники при онбординге задают вопросы Claude, а не людям
Источники
- Harvard Business Review — статья 1990-х о парадоксе продуктивности компьютеров
- Claude Agent SDK — первый способ программного использования Claude Code, основа для routines
- CLAUDE.md и skills — механизмы персистентной памяти агента
- Opus 4, Sonnet 3.5, модели 4.6/4.7 — вехи эволюции, упомянутые спикерами
- Slack, GitHub — источники сигналов для агентов (staging-статус, тикеты, issues)
- Megan — дизайнер команды, пример слияния ролей
Рекомендации
- Не исправлять агента словами — заставлять его записывать уроки в CLAUDE.md или оформлять skill после каждой ошибки и каждой сессии отладки
- Вкладывать «умственную работу» в то, чтобы дать агенту способ самому запускать и проверять результат — это и есть верификация, а не юнит-тесты
- Давать модели минимальный системный промпт и минимум инструментов, но обязательно — способ самостоятельно достать контекст; не микроменеджить
- Ставить Claude в центр каждого процесса компании, а не сбоку от существующих, — по аналогии с уроком компьютеризации из HBR
Итог
За год Claude Code превратил инженера из автора кода в автора идей и верификационных контуров: ошибки агента пишутся в его память, проверки он запускает сам, рутину закрывают круглосуточные циклы — и выигрывает тот, кто выбросил «бумажный архив» и поставил агента в центр всех процессов.