Размышления об году с Claude Code

Claude8 июня 202643 2341 36412 мин чтения12 июня, 16:23

Коротко

Двое участников команды Claude Code подводят итоги первого года продукта: от внутреннего демо в Slack, на которое отреагировали два человека, до состояния, когда инженер управляет «деревом из тысяч агентов» и делает половину работы с телефона. Центральный практический приём — не исправлять агента вручную, а заставлять его записывать ошибки в CLAUDE.md или в skills, превращая каждый сбой в постоянную память. Верификацию они называют самым недопонятым элементом агентной разработки: это не юнит-тесты и линтеры, а способность агента самому запустить и проверить результат — вплоть до того, что Opus 4 сам открывал CLI Claude и тестировал собственную фичу. Plan mode и context engineering объявлены устаревшими для новых моделей (с 4.6–4.7 этап планирования не нужен, а контекст должен быть минимальным), auto-mode — более безопасным, чем ручное чтение permission-запросов. Эволюция описана как два скачка: инженер перестал писать код и стал говорить с агентом, а теперь перестаёт говорить с агентом и говорит с циклом — routine, которая сама слушает тикеты и шлёт PR.

Главный тезис

Выгода от AI приходит не тогда, когда Claude пристроен сбоку к старым процессам, а когда он поставлен в центр всего — как компьютер в 90-х; роль человека при этом сжимается до идей, вкуса и настройки верификации, а само исполнение уходит циклам агентов.

Ключевые идеи

  • 0:58 — когда Claude ошибается, спикер не поправляет его в чате, а велит записать урок в CLAUDE.md или оформить как skill: только так агент может «работать бесконечно», не повторяя ошибок
  • 1:26верификацию все понимают неправильно: юнит-тесты, линтеры и type-checking уже автоматизированы; для агентов верификация — это возможность запустить результат, и придумать как — отдельная умственная работа
  • 1:49 — с Opus 4 случился переломный момент: модель сама открыла в bash CLI Claude и протестировала собственную фичу; сейчас такие циклы рутинно крутятся на iOS/Android-симуляторах и computer use для десктопа
  • 2:41 — при отладке desktop-приложения агенту дают читать Slack, чтобы он сам понял, не лежит ли staging и не встречал ли кто-то баг раньше, а после дебага — обновил desktop-dev skill: опыт отладки накапливается в инструкции
  • 3:46роли сливаются: PM пишет код, дизайнер (Megan) делает PR «я просто кнопку поправила», и то, что сначала вызывало ужас, стало нормой
  • 4:29 — за инженерами подтягиваются смежники: дизайнеры прототипируют прямо в приложении вместо «найма» инженера, финансовый отдел гоняет проекции в Claude Code, у data scientists он на каждом экране
  • 5:01 — фронтир сегодня — routines: инженер, запустивший voice mode, настроил цикл, который слушает каждый тикет, GitHub-issue и баг-репорт и проактивно присылает ему готовый PR с фиксом
  • 5:36 — спикер сел чинить баг вечером, а его агент сообщил, что «другой Claude уже решил проблему»: у коллеги есть routine, которая находит безответные баг-репорты и в течение 5 часов мёржит фиксы с лёгкой верификацией
  • 6:55plan mode умер: этап планирования был нужен для Opus 4–4.5, но начиная с 4.6 и точно с 4.7 модели он не требуется — спикер работает только в auto mode, запуская агента и переключаясь на следующего
  • 8:06 — auto-mode безопаснее ручного одобрения: когда человек принимает 99% permission-запросов, глаза замыливаются; отдельная модель-классификатор проверяет безопасность лучше, а внимание человека остаётся на действительно важном
  • 9:07 — перед выкаткой auto-mode команда собрала тысячи транскриптов агентных траекторий, посадила Red Team придумывать prompt-инъекции, построила на этом евалы и добилась, чтобы блокировались не только сегодняшние атаки, но и самые умные из вообразимых
  • 10:54 — два больших скачка за полтора года: сначала «инженер взаимодействует не с исходным кодом, а с агентом», теперь — «я говорю не с агентом, а с циклом, с routine»
  • 11:16 — аналогия с парадоксом продуктивности: статья HBR 90-х показывала, что выгоду от компьютеров получили не те, кто поставил машину рядом с бумажным архивом, а те, кто выбросил архив и пропустил каждый процесс через компьютер
  • 12:11 — в Anthropic новички при онбординге не задают вопросов людям — они спрашивают Claude; PC-переход занял 10–15 лет, но AI-переход 12:51, потому что работа уже оцифрована, а Claude умеет пользоваться компьютером и писать код
  • 15:03 — рабочий setup перевернулся: вместо шести вкладок терминала с шестью git checkout — одна вкладка, новый agent view, автоматические worktrees в desktop-приложении и примерно половина инженерии с телефона, голосом, на прогулке за кофе
  • 16:20 — эволюция дисциплины: при Sonnet 3.5 инженерили промпты, при Opus 4 — контекст, с сегодняшними моделями — ни то ни другое: минимальный системный промпт, минимум инструментов, и дать модели способ самой достать контекст

Почему это важно

Это витрина стратегии Anthropic: компания демонстрирует, что сама прошла переход, который продаёт клиентам — Claude в центре каждого процесса, от кода до финансовых проекций и онбординга. Выигрывают компании, перестраивающие процессы вокруг агентов (спикеры утверждают, что таких «уже много»), и люди с продуктовым вкусом, curiosity и желанием end-to-end ownership; проигрывает специализация как таковая — границы между PM, инженером и дизайнером объявлены отмирающими. Одновременно это сигнал рынку инструментов: plan mode, prompt- и context-engineering — слои, построенные под слабости старых моделей, — отмирают с каждым поколением, и форм-фактор для управления сотнями и тысячами агентов ещё никем не найден; команда прямо говорит, что ответ придёт не сверху, а от команды и комьюнити.

Идеи

  • Ошибка агента — не повод для инструкции в чате, а сырьё для персистентного артефакта (CLAUDE.md, skill); чат-коррекция испаряется, артефакт работает вечно
  • Skill как аккумулятор отладочного опыта: после каждой сессии дебага агент сам дописывает собственную инструкцию по запуску окружения
  • Slack для агента — сенсор состояния мира: прежде чем дебажить, проверить, не упал ли staging и не жаловался ли кто-то уже
  • Рекурсивное самотестирование: Claude открывает CLI Claude внутри bash и проверяет фичу, которую сам написал
  • Computer use как универсальный верификатор UI: агент кликает по новому интерфейсу, гоняет edge cases, чинит и перепроверяет
  • Проактивный фикс обгоняет разработчика: баг закрыт чужой routine раньше, чем автор фичи сел его чинить вечером
  • «Это всегда чужой Quad уже решил проблему» — агенты коллег становятся невидимой рабочей силой команды
  • Code review, ответы на комментарии, починка CI, rebase — целый пласт инженерной рутины, которой спикер «не делал уже давно»
  • Permission prompts были костылём эпохи без классификаторов и слабого alignment, а не принципом дизайна
  • Делегированная проверка безопасности отдельной моделью эмпирически надёжнее уставшего человека
  • Red team атакует собственный продукт до релиза, и каждая найденная атака превращается в регрессионный евал
  • Ставки «это невозможно, не сработает» при работе поверх модели систематически проигрывают — auto-mode тому пример
  • Накопленная инженерная интуиция требует активного выбрасывания: «строим на новой штуке — надо переучиваться»
  • Бэклог исчезает как сущность: каждая понравившаяся идея сразу строится, todo-список не успевает возникнуть
  • Общение с коллегами сместилось из «мне нужно от тебя» в «с тобой весело строить» — информацию даёт агент
  • Инженеры ведут фичи end-to-end: от идеи через legal и маркетинг до запуска, без передачи по конвейеру
  • Компьютер намеренно оставлен на рабочем столе: кодинг с дивана через remote control, коллеги сначала думали, что забыл
  • Голосовой запуск агента посреди разговора: идея возникла — агент стартован с телефона, не открывая ноутбук
  • Избыточный контекст — это микроменеджмент модели: она часто знает путь к результату лучше, чем подсказчик
  • Harness сознательно худеет, чтобы освободить место пользовательским промптам и улучшить их соблюдение
  • Форм-фактор для тысяч одновременных агентов неизвестен даже создателям — «удивлюсь, если через год инструменты будут те же»
  • Демократия идей как ставка менеджмента: все говорят с пользователями, потому что прорывы придут не от лидов, а от команды и комьюнити

Инсайты

  • Самоулучшение агента важнее его разовой коррекции: системы, конвертирующие ошибки в персистентную память, масштабируются неограниченно, остальные — нет
  • Узкое место разработки сместилось с генерации кода на верификацию: ценность инженера теперь в том, чтобы построить агенту способ проверить себя
  • Каждое поколение моделей убивает слой инструментария, построенный под слабости предыдущего — plan mode, prompt engineering и context engineering это последовательные жертвы
  • Безопасность через делегирование машине надёжнее безопасности через человеческое внимание, потому что внимание деградирует при высокой доле одобрений
  • Доверие к агенту напрямую конвертируется в параллелизм: второй агент возможен только тогда, когда за первым не нужно следить
  • Технологический переход даёт выгоду при перестройке процесса вокруг нового ядра, а не при встраивании новинки в старый процесс — и скорость диффузии AI выше, чем у PC, потому что субстрат уже цифровой
  • Специализация ролей была артефактом дороговизны исполнения; когда исполнение дёшево, роли сливаются вокруг идей, вкуса и ownership
  • Опыт становится пассивом в средах со сменой парадигмы: эмпирическая проверка бьёт экспертную интуицию
  • Координация через агентов вытесняет координацию через людей — человеческое общение остаётся для творчества, а не для обмена информацией
  • Интерфейс к работе абстрагируется ступенями: код → агент → цикл; каждая ступень делает предыдущую невидимой деталью реализации

Фреймворки

  • Два скачка взаимодействия (полтора года): 1) инженер взаимодействует не с исходным кодом, а с агентом, который пишет код; 2) инженер взаимодействует не с агентом, а с циклом/routine, которая сама управляет агентами
  • Три эпохи промптинга: Sonnet 3.5 — prompt engineering; Opus 4 — context engineering; текущие модели — минимализм: минимальный системный промпт, минимум инструментов, модель сама достаёт контекст
  • Урок HBR о компьютеризации: выгода приходит не от «бумажный процесс + компьютер сбоку», а от «выбросить архив, поставить компьютер в центр каждого процесса» — применяется к AI один в один

Цитаты

«ricordo di averlo pubblicato su Slack e c'erano due persone che hanno reagito» — 0:00 Помню, как запостил это в Slack — и отреагировали два человека

«Un modo molto carino per dire che non era così bravo» — 0:14 Очень милый способ сказать, что он был не так уж хорош

«Ed è come un albero di migliaia di agenti» — 0:48 И это как дерево из тысяч агентов

«ogni volta che Quad commette un errore, non gli dico di fare diversamente» — 0:51 Каждый раз, когда Claude ошибается, я не говорю ему сделать иначе

«Entro 5 ore pubblica una correzione e unisce con le facili da verificare» — 5:51 В течение 5 часов он публикует фикс и мёржит те, что легко проверить

«è sempre un quad di un'altra persona che ci sta lavorando» — 5:59 Это всегда чей-то чужой Claude уже работает над этим

«riteniamo che la modalità automatica sia più sicura rispetto alla lettura di ogni singola richiesta di autorizzazione» — 8:12 Мы считаем, что автоматический режим безопаснее, чем чтение каждого отдельного запроса на разрешение

«ho capito che in realtà mi sbaglio molto spesso perché costruire sul modello è così strano» — 10:00 Я понял, что на самом деле очень часто ошибаюсь, потому что строить поверх модели — это так странно

«forse non è il codice sorgente forse è l'agente» — 10:42 Может, это не исходный код — может, это агент

«non parlo più con un agente, parlo con un ciclo» — 10:54 Я больше не говорю с агентом — я говорю с циклом

«bisognava buttare via l'archivio» — 11:51 Нужно было выбросить архив

«Chiedono a Quad, ed è un po' strano. Questa è la prima azienda in cui lavoro in questo modo» — 12:11 Они спрашивают Claude, и это немного странно. Это первая компания, где я так работаю

«come ingegnere a me non mi sia mai divertito così tanto a fare ingegneria perché la parte noiosa non la devo fare» — 13:13 Как инженеру мне никогда не было так весело заниматься инженерией, потому что скучную часть делать не нужно

«E quindi il mio lavoro è trovare questa idea così divertente» — 13:27 И поэтому моя работа — находить идею, и это так весело

«Sono convinto che questi ruoli si stiano fondendo» — 13:38 Я убеждён, что эти роли сливаются

«sì sto programmando dal mio divano» — 15:58 Да, я программирую с дивана

«dire al modello solo ciò che deve sapere e lasciare che sia lui a capire il resto» — 16:44 Говорить модели только то, что ей нужно знать, и дать ей самой разобраться с остальным

«quando dai al modello troppo contesto è un po' come se lo stessi microgestendo» — 16:53 Когда даёшь модели слишком много контекста — это как будто ты её микроменеджишь

«non penso che queste idee verranno da noi, verranno dal team» — 17:57 Не думаю, что эти идеи придут от нас — они придут от команды

Факты

  • Claude Code запущен год назад; первой презентацией был маленький ролик во внутреннем Slack, на который отреагировали два человека
  • Полтора года назад единственной моделью безопасности были permission prompts с ручным «да/нет» — классификаторов не было, alignment модели был хуже
  • С Opus 4 впервые наблюдалось самотестирование: модель открыла CLI Claude в bash и проверила собственную фичу
  • Этап планирования был важен для Opus 4–4.5; с версии 4.6 и точно с 4.7 он, по словам спикера, больше не нужен (в SRT: «POS 4», «46», «47»)
  • Циклы самотестирования сейчас работают на iOS-симуляторе, Android-симуляторе и через computer use на десктопе
  • Один инженер команды запустил voice mode на все продукты и настроил routine, слушающую все тикеты, GitHub-issues и баг-репорты с автоматической подачей PR
  • Routine другого инженера находит безответные баг-репорты и в течение 5 часов публикует и мёржит фиксы
  • Статья Harvard Business Review 1990-х описывала, почему компании не видят роста продуктивности от компьютеров; сам переход на PC занял, по оценке спикера, 10–15 лет
  • Для выкатки auto-mode команда собрала тысячи транскриптов агентных траекторий, привлекла Red Team для prompt-инъекций и построила евалы, добиваясь блокировки всех атак
  • Раньше типичный setup спикера — шесть вкладок терминала с шестью git checkout одного репозитория; теперь одна вкладка с новым agent view и автоматическими worktrees
  • По словам спикера, около половины своей инженерной работы он теперь делает с телефона через remote control
  • Дизайнер Megan делала PR сама («просто чиню кнопку»), что сначала шокировало команду
  • Команды финансов и data science в Anthropic работают в Claude Code; новые сотрудники при онбординге задают вопросы Claude, а не людям

Источники

  • Harvard Business Review — статья 1990-х о парадоксе продуктивности компьютеров
  • Claude Agent SDK — первый способ программного использования Claude Code, основа для routines
  • CLAUDE.md и skills — механизмы персистентной памяти агента
  • Opus 4, Sonnet 3.5, модели 4.6/4.7 — вехи эволюции, упомянутые спикерами
  • Slack, GitHub — источники сигналов для агентов (staging-статус, тикеты, issues)
  • Megan — дизайнер команды, пример слияния ролей

Рекомендации

  • Не исправлять агента словами — заставлять его записывать уроки в CLAUDE.md или оформлять skill после каждой ошибки и каждой сессии отладки
  • Вкладывать «умственную работу» в то, чтобы дать агенту способ самому запускать и проверять результат — это и есть верификация, а не юнит-тесты
  • Давать модели минимальный системный промпт и минимум инструментов, но обязательно — способ самостоятельно достать контекст; не микроменеджить
  • Ставить Claude в центр каждого процесса компании, а не сбоку от существующих, — по аналогии с уроком компьютеризации из HBR

Итог

За год Claude Code превратил инженера из автора кода в автора идей и верификационных контуров: ошибки агента пишутся в его память, проверки он запускает сам, рутину закрывают круглосуточные циклы — и выигрывает тот, кто выбросил «бумажный архив» и поставил агента в центр всех процессов.

readmint Pro

То, что вы только что прочитали — это саммари readmint

Оформите доступ — и получайте такой же разбор по любому своему видео. Вставляете ссылку, через 2–3 минуты готов пересказ с главными тезисами и цитатами. Без воды и без перемотки.

  • Безлимит саммари — сколько угодно видео
  • Главные тезисы и цитаты без воды
  • Приоритет в очереди обработки
  • Без рекламы и сторонних блоков
Получить такое же саммари
Доступ откроется сразу после оплаты — вставите ссылку и начнёте.

Или 4 900 ₽/год — доступ откроется сразу после оплаты.

Ещё с канала «Claude»

Все видео