Размышления об году с Claude Code

Claude8 июня 202657 0291 66812 мин чтения13 июля, 03:14

Технологии Ai Программирование Агенты Автоматизация

Коротко

Двое из команды Claude Code подводят итог первого года: от внутреннего демо в Slack, на которое отреагировали два человека, до состояния, когда инженер управляет «деревом из тысяч агентов» и половину работы делает с телефона. Центральный приём: не исправлять агента вручную, а заставлять его записывать ошибки в CLAUDE.md или в skills, превращая каждый сбой в постоянную память. Верификацию они называют самым недопонятым элементом агентной разработки: это не юнит-тесты и линтеры, а способность агента самому запустить и проверить результат, вплоть до того, что Opus 4 сам открывал CLI Claude и тестировал собственную фичу. Plan mode и context engineering объявлены устаревшими для новых моделей: с 4.6-4.7 этап планирования не нужен, а контекст должен быть минимальным. Auto-mode при этом безопаснее ручного одобрения. Эволюция описана двумя скачками: сначала инженер перестал писать код и начал говорить с агентом, теперь перестаёт говорить с агентом и говорит с циклом, с routine, которая сама слушает тикеты и шлёт PR.

Главный тезис

Выгода от AI приходит не тогда, когда Claude пристроен сбоку к старым процессам, а когда он в центре всего, как компьютер в 90-х. Роль человека сжимается до идей, вкуса и настройки верификации, а исполнение уходит циклам агентов.

Ключевые идеи

0:58 - когда Claude ошибается, спикер не поправляет его в чате, а велит записать урок в CLAUDE.md или оформить как skill: только так агент способен работать бесконечно, не повторяя ошибок
1:26 - верификацию все понимают неправильно: юнит-тесты, линтеры и type-checking уже автоматизированы, а для агентов верификация - это возможность запустить результат, и придумать как - отдельная умственная работа
1:49 - с Opus 4 случился переломный момент: модель сама открыла в bash CLI Claude и протестировала собственную фичу; сейчас такие циклы рутинно крутятся на iOS/Android-симуляторах и через computer use для десктопа
2:41 - при отладке desktop-приложения агенту дают читать Slack, чтобы он сам понял, не лежит ли staging и не встречал ли кто-то баг раньше, а после дебага обновил desktop-dev skill: опыт отладки накапливается прямо в инструкции
3:46 - роли сливаются: PM пишет код, дизайнер (Megan) делает PR «я просто кнопку поправила», и то, что сначала вызывало оторопь, стало нормой
4:29 - за инженерами подтягиваются смежники: дизайнеры прототипируют прямо в приложении вместо найма инженера, финансовый отдел гоняет проекции в Claude Code, у data scientists он на каждом экране
5:01 - фронтир сегодня - routines: инженер, запустивший voice mode, настроил цикл, который слушает каждый тикет, GitHub-issue и баг-репорт и проактивно присылает готовый PR с фиксом
5:36 - спикер сел чинить баг вечером, а его агент сообщил, что «другой Claude уже решил проблему»: у коллеги есть routine, которая находит безответные баг-репорты и за 5 часов мёржит фиксы с лёгкой верификацией
6:55 - plan mode умер: этап планирования был нужен для Opus 4-4.5, но начиная с 4.6 и точно с 4.7 модели он не требуется, спикер работает только в auto mode, запуская агента и переключаясь на следующего
8:06 - auto-mode безопаснее ручного одобрения: когда человек принимает 99% permission-запросов, глаза замыливаются, а отдельная модель-классификатор проверяет безопасность лучше, оставляя внимание человека на действительно важном
9:07 - перед выкаткой auto-mode команда собрала тысячи транскриптов агентных траекторий, посадила Red Team придумывать prompt-инъекции, построила на этом евалы и добилась, чтобы блокировались не только сегодняшние атаки, но и самые умные из вообразимых
10:54 - два больших скачка за полтора года: сначала «инженер взаимодействует не с исходным кодом, а с агентом», теперь - «я говорю не с агентом, а с циклом, с routine»
11:16 - аналогия с парадоксом продуктивности: статья HBR 90-х показывала, что выгоду от компьютеров получили не те, кто поставил машину рядом с бумажным архивом, а те, кто выбросил архив и пропустил каждый процесс через компьютер
12:11 - в Anthropic новички при онбординге не задают вопросов людям, они спрашивают Claude; PC-переход занял 10-15 лет, а AI-переход быстрее 12:51, потому что работа уже оцифрована, а Claude умеет пользоваться компьютером и писать код
15:03 - рабочий setup перевернулся: вместо шести вкладок терминала с шестью git checkout - одна вкладка, новый agent view, автоматические worktrees в desktop-приложении и примерно половина инженерии с телефона, голосом, на прогулке за кофе
16:20 - эволюция дисциплины: при Sonnet 3.5 инженерили промпты, при Opus 4 - контекст, с сегодняшними моделями - ни то ни другое: минимальный системный промпт, минимум инструментов, и способ самой достать контекст

Почему это важно

Это витрина стратегии Anthropic: компания демонстрирует, что сама прошла переход, который продаёт клиентам, Claude в центре каждого процесса, от кода до финансовых проекций и онбординга. Выигрывают компании, перестраивающие процессы вокруг агентов (спикеры утверждают, что таких уже много), и люди с продуктовым вкусом, curiosity и желанием end-to-end ownership. Проигрывает специализация как таковая: границы между PM, инженером и дизайнером объявлены отмирающими. И это сигнал рынку инструментов: plan mode, prompt- и context-engineering, слои, построенные под слабости старых моделей, отмирают с каждым поколением. Форм-фактор для управления сотнями и тысячами агентов ещё никем не найден; команда прямо говорит, что ответ придёт не сверху, а от команды и комьюнити.

Идеи

Ошибка агента - не повод для инструкции в чате, а сырьё для постоянного артефакта (CLAUDE.md, skill); чат-коррекция испаряется, артефакт работает вечно
Skill как аккумулятор отладочного опыта: после каждой сессии дебага агент сам дописывает собственную инструкцию по запуску окружения
Slack для агента - сенсор состояния мира: прежде чем дебажить, проверить, не упал ли staging и не жаловался ли кто-то уже
Рекурсивное самотестирование: Claude открывает CLI Claude внутри bash и проверяет фичу, которую сам написал
Computer use как универсальный верификатор UI: агент кликает по новому интерфейсу, гоняет edge cases, чинит и перепроверяет
Проактивный фикс обгоняет разработчика: баг закрыт чужой routine раньше, чем автор фичи сел его чинить вечером
«Это всегда чужой Quad уже решил проблему» - агенты коллег становятся невидимой рабочей силой команды
Code review, ответы на комментарии, починка CI, rebase - целый пласт инженерной рутины, которой спикер давно не занимался
Permission prompts были костылём эпохи без классификаторов и слабого alignment, а не принципом дизайна
Делегированная проверка безопасности отдельной моделью эмпирически надёжнее уставшего человека
Red team атакует собственный продукт до релиза, и каждая найденная атака превращается в регрессионный евал
Ставки «это невозможно, не сработает» при работе поверх модели систематически проигрывают, auto-mode тому пример
Накопленная инженерная интуиция требует активного выбрасывания: строим на новой штуке - надо переучиваться
Бэклог исчезает как сущность: каждая понравившаяся идея сразу строится, todo-список не успевает возникнуть
Общение с коллегами сместилось из «мне нужно от тебя» в «с тобой весело строить», информацию даёт агент
Инженеры ведут фичи end-to-end: от идеи через legal и маркетинг до запуска, без передачи по конвейеру
Компьютер намеренно оставлен на рабочем столе: кодинг с дивана через remote control, коллеги сначала думали, что забыл
Голосовой запуск агента посреди разговора: идея возникла - агент стартован с телефона, не открывая ноутбук
Избыточный контекст - это микроменеджмент модели: она часто знает путь к результату лучше, чем подсказчик
Harness сознательно худеет, чтобы освободить место пользовательским промптам и улучшить их соблюдение
Форм-фактор для тысяч одновременных агентов неизвестен даже создателям: «удивлюсь, если через год инструменты будут те же»
Демократия идей как ставка менеджмента: все говорят с пользователями, потому что прорывы придут не от лидов, а от команды и комьюнити

Инсайты

Самоулучшение агента важнее его разовой коррекции: системы, конвертирующие ошибки в постоянную память, масштабируются неограниченно, остальные нет
Узкое место разработки сместилось с генерации кода на верификацию: ценность инженера теперь в том, чтобы построить агенту способ проверить себя
Каждое поколение моделей убивает слой инструментария, построенный под слабости предыдущего: plan mode, prompt engineering и context engineering - последовательные жертвы
Безопасность через делегирование машине надёжнее безопасности через человеческое внимание, потому что внимание деградирует при высокой доле одобрений
Доверие к агенту напрямую конвертируется в параллелизм: второй агент возможен только тогда, когда за первым не нужно следить
Технологический переход даёт выгоду при перестройке процесса вокруг нового ядра, а не при встраивании новинки в старый процесс, и скорость диффузии AI выше, чем у PC, потому что субстрат уже цифровой
Специализация ролей была артефактом дороговизны исполнения; когда исполнение дёшево, роли сливаются вокруг идей, вкуса и ownership
Опыт становится пассивом в средах со сменой парадигмы: эмпирическая проверка бьёт экспертную интуицию
Координация через агентов вытесняет координацию через людей: человеческое общение остаётся для творчества, не для обмена информацией
Интерфейс к работе абстрагируется ступенями: код → агент → цикл, каждая ступень делает предыдущую невидимой деталью реализации

Фреймворки

Два скачка взаимодействия (полтора года): 1) инженер взаимодействует не с исходным кодом, а с агентом, который пишет код; 2) инженер взаимодействует не с агентом, а с циклом/routine, которая сама управляет агентами
Три эпохи промптинга: Sonnet 3.5 - prompt engineering; Opus 4 - context engineering; текущие модели - минимализм: минимальный системный промпт, минимум инструментов, модель сама достаёт контекст
Урок HBR о компьютеризации: выгода приходит не от «бумажный процесс + компьютер сбоку», а от «выбросить архив, поставить компьютер в центр каждого процесса» - применяется к AI один в один

Цитаты

«ricordo di averlo pubblicato su Slack e c'erano due persone che hanno reagito» - 0:00 Помню, как запостил это в Slack - и отреагировали два человека

«Un modo molto carino per dire che non era così bravo» - 0:14 Очень милый способ сказать, что он был не так уж хорош

«Ed è come un albero di migliaia di agenti» - 0:48 И это как дерево из тысяч агентов

«ogni volta che Quad commette un errore, non gli dico di fare diversamente» - 0:51 Каждый раз, когда Claude ошибается, я не говорю ему сделать иначе

«Entro 5 ore pubblica una correzione e unisce con le facili da verificare» - 5:51 В течение 5 часов он публикует фикс и мёржит те, что легко проверить

«è sempre un quad di un'altra persona che ci sta lavorando» - 5:59 Это всегда чей-то чужой Claude уже работает над этим

«riteniamo che la modalità automatica sia più sicura rispetto alla lettura di ogni singola richiesta di autorizzazione» - 8:12 Мы считаем, что автоматический режим безопаснее, чем чтение каждого отдельного запроса на разрешение

«ho capito che in realtà mi sbaglio molto spesso perché costruire sul modello è così strano» - 10:00 Я понял, что на самом деле очень часто ошибаюсь, потому что строить поверх модели - это так странно

«forse non è il codice sorgente forse è l'agente» - 10:42 Может, это не исходный код - может, это агент

«non parlo più con un agente, parlo con un ciclo» - 10:54 Я больше не говорю с агентом - я говорю с циклом

«bisognava buttare via l'archivio» - 11:51 Нужно было выбросить архив

«Chiedono a Quad, ed è un po' strano. Questa è la prima azienda in cui lavoro in questo modo» - 12:11 Они спрашивают Claude, и это немного странно. Это первая компания, где я так работаю

«come ingegnere a me non mi sia mai divertito così tanto a fare ingegneria perché la parte noiosa non la devo fare» - 13:13 Как инженеру мне никогда не было так весело заниматься инженерией, потому что скучную часть делать не нужно

«E quindi il mio lavoro è trovare questa idea così divertente» - 13:27 И поэтому моя работа - находить идею, и это так весело

«Sono convinto che questi ruoli si stiano fondendo» - 13:38 Я убеждён, что эти роли сливаются

«sì sto programmando dal mio divano» - 15:58 Да, я программирую с дивана

«dire al modello solo ciò che deve sapere e lasciare che sia lui a capire il resto» - 16:44 Говорить модели только то, что ей нужно знать, и дать ей самой разобраться с остальным

«quando dai al modello troppo contesto è un po' come se lo stessi microgestendo» - 16:53 Когда даёшь модели слишком много контекста - это как будто ты её микроменеджишь

«non penso che queste idee verranno da noi, verranno dal team» - 17:57 Не думаю, что эти идеи придут от нас - они придут от команды

Факты

Claude Code запущен год назад; первой презентацией был маленький ролик во внутреннем Slack, на который отреагировали два человека
Полтора года назад единственной моделью безопасности были permission prompts с ручным «да/нет»: классификаторов не было, alignment модели был хуже
С Opus 4 впервые наблюдалось самотестирование: модель открыла CLI Claude в bash и проверила собственную фичу
Этап планирования был важен для Opus 4-4.5; с версии 4.6 и точно с 4.7 он, по словам спикера, больше не нужен (в SRT: «POS 4», «46», «47»)
Циклы самотестирования сейчас работают на iOS-симуляторе, Android-симуляторе и через computer use на десктопе
Один инженер команды запустил voice mode на все продукты и настроил routine, слушающую все тикеты, GitHub-issues и баг-репорты с автоматической подачей PR
Routine другого инженера находит безответные баг-репорты и за 5 часов публикует и мёржит фиксы
Статья Harvard Business Review 1990-х описывала, почему компании не видят роста продуктивности от компьютеров; сам переход на PC занял, по оценке спикера, 10-15 лет
Для выкатки auto-mode команда собрала тысячи транскриптов агентных траекторий, привлекла Red Team для prompt-инъекций и построила евалы, добиваясь блокировки всех атак
Раньше типичный setup спикера - шесть вкладок терминала с шестью git checkout одного репозитория; теперь одна вкладка с новым agent view и автоматическими worktrees
По словам спикера, около половины своей инженерной работы он теперь делает с телефона через remote control
Дизайнер Megan делала PR сама («просто чиню кнопку»), что сначала шокировало команду
Команды финансов и data science в Anthropic работают в Claude Code; новые сотрудники при онбординге задают вопросы Claude, а не людям

Источники

Harvard Business Review - статья 1990-х о парадоксе продуктивности компьютеров
Claude Agent SDK - первый способ программного использования Claude Code, основа для routines
CLAUDE.md и skills - механизмы постоянной памяти агента
Opus 4, Sonnet 3.5, модели 4.6/4.7 - вехи эволюции, упомянутые спикерами
Slack, GitHub - источники сигналов для агентов (staging-статус, тикеты, issues)
Megan - дизайнер команды, пример слияния ролей

Рекомендации

Не исправлять агента словами - заставлять его записывать уроки в CLAUDE.md или оформлять skill после каждой ошибки и каждой сессии отладки
Вкладывать умственную работу в то, чтобы дать агенту способ самому запускать и проверять результат: это и есть верификация, не юнит-тесты
Давать модели минимальный системный промпт и минимум инструментов, но обязательно способ самостоятельно достать контекст, не микроменеджить
Ставить Claude в центр каждого процесса компании, а не сбоку от существующих, по аналогии с уроком компьютеризации из HBR

Итог

За год Claude Code превратил инженера из автора кода в автора идей и верификационных контуров: ошибки агента пишутся в его память, проверки он запускает сам, рутину закрывают круглосуточные циклы. Выигрывает тот, кто выбросил бумажный архив и поставил агента в центр всех процессов.

readmint Pro

То, что вы только что прочитали — это саммари readmint

Оформите доступ — и получайте такой же разбор по любому своему видео. Вставляете ссылку, через 2–3 минуты готов пересказ с главными тезисами и цитатами. Без воды и без перемотки.

Безлимит саммари — сколько угодно видео
Главные тезисы и цитаты без воды
Приоритет в очереди обработки
Без рекламы и сторонних блоков

Получить такое же саммари

Доступ откроется сразу после оплаты — вставите ссылку и начнёте.

Или 4 900 ₽/год — доступ откроется сразу после оплаты.

Ещё с канала «Claude»

Все видео

Создай проактивный workflow агента с Claude Code

Создай проактивный workflow агента с Claude Code

Программируй с Claude 2026: вступительный кейноут

Программируй с Claude 2026: вступительный кейноут

Будущее работы с @Claude

Будущее работы с @Claude