Как работают AI-агенты и Claude skills (Просто объяснено)

Greg Isenberg8 апреля 2026438 48511 49611 мин чтения31 мая, 15:32

Искусственный Интеллект Программирование Агенты Автоматизация

Коротко

Спикер (Ross Mike) утверждает, что современные модели (Opus 4.6, GPT 5.4) уже достаточно хороши, и узким местом стал не интеллект модели, а контекст и харнесс вокруг неё. Файлы agent.md/claude.md он считает почти бесполезными для 95% людей — они жрут токены на каждом ходе, тогда как skills работают через progressive disclosure (в контекст попадают только имя и описание). Главный рецепт: не писать скилл сразу, а сначала пройти workflow руками вместе с агентом до успешного прогона, и только потом конвертировать это в skill.md — «рекурсивно» дошлифовывая через разбор ошибок. Модели не думают, а предсказывают токены, поэтому их надо обучать как нового сотрудника, а не ждать магии. Не скейлиться ради красоты (15 сабагентов сразу), а скейлиться ради продуктивности: один агент → накопленные скиллы → сабагенты.

Главный тезис

Модели уже хороши — выигрывает не тот, у кого мощнее модель, а тот, кто даёт ей правильный минимальный контекст и кодифицирует свой уникальный workflow в скиллы, построенные на реальных успешных прогонах.

Ключевые идеи

0:50 — модели достигли плато качества: Opus 4.6 и GPT 5.4 «amazing», деление «Opus для UI, GPT для бэкенда» уже непринципиально, хотя до AGI ещё не дошли.
1:10 — при хороших моделях контекст решает всё: можно вытащить либо качество, либо slop, рулём управляет пользователь.
2:03 — agent.md/claude.md не нужны 95% людей, потому что модель и так видит кодовую базу и может проверить код сама.
3:21 — раздражающая проблема md-файлов: их содержимое добавляется в контекст на каждом ходе, тысячный файл = ~7000 токенов за каждый запуск.
3:33 — скиллы работают через progressive disclosure: в контекст грузятся только title и description, тело подтягивается лишь когда агент понял, что скилл нужен.
8:40 — худшая ошибка — сразу прыгать к написанию скилла, не пройдя workflow руками.
10:15 — модели не думают, а предсказывают токены, маппят английский на векторный граф и берут ближайшее (Париж рядом с «столица Франции»); ощущение понимания и эмоций — иллюзия от объёма данных.
11:42 — агент идеально мимикрирует, но если ему нечего копировать, он проваливается; «террибл технолоджи» — это непонимание, как работает агент.
9:23 — правильный метод: пройти workflow пошагово вместе с агентом (проверь Twitter, YouTube, Trustpilot, raised money — два провала = авто-реджект), и только после успешного прогона сказать «review what you did, create this skill».
12:50 — не скачивать чужие скиллы: это вектор атаки и у них нет контекста твоего успешного прогона; «build your own».
20:41 — методология рекурсивной достройки скилла: когда агент ошибся — спросить «why did you fail», получить ошибку (505, нет кредитов), отдать обратно, дождаться фикса и сказать «update the skill so this doesn't happen again».
19:53 — в кодинге сам код стал контекстом: не надо писать «I'm using React/Next.js/Supabase», модель видит стек; растёт ценность шаблонов (templates renaissance) как готового фундамента-контекста.
14:43 — скейлиться ради продуктивности, а не ради красоты: начать с одного агента, накопить скиллы, и только потом добавлять сабагенты, которые главный агент оркестрирует.
30:53 — модель тупеет по мере заполнения контекста: оптимум — от свежего до ~70%, ближе к 99% качество падает; экономия контекста = и деньги, и перформанс.
23:47 — есть болезненный начальный период вложения (~2 недели), о котором харнесс-компании молчат, иначе подняли бы меньше денег.

Почему это важно

Идёт сдвиг власти: знание, на которое раньше уходило «20 людей × 20 лет», теперь стоит «20 баксов в месяц», и нетехнические люди вайбкодят приложения на миллиарды. На фоне страшилок про «permanent underclass» (белые воротнички теряют работу с приходом AGI) спикер позиционирует владение агентами как страховку от попадания в этот класс. Выигрывают большие игроки — Anthropic, OpenAI (модели и харнессы Claude Code, Codex, и упоминаемый OpenClaw), которые задают темп в general-purpose и кодинге; проигрывают те, кто ждёт магии и не строит свои workflow. Ценность человека смещается в его уникальный workflow, вкус и стратегию, которые модель не знает и которые надо кодифицировать в скиллы.

Идеи

Аналогия с микрофоном: говорить модели «этот код на React» — то же, что напоминать подкастеру взять микрофон.
5% случаев, где md-файл оправдан — проприетарная инфа или методология, нужная в каждом ходе.
Скилл для создания скиллов существует («skill exception»), и спикер не пишет скиллы руками вообще.
Свой сейлз-агент в OpenClaw держит на отдельной почте, без доступа к основной — из-за attack vectors и прошлого взлома; письма пересылает вручную.
Первая наивная инструкция агенту дала эффект «legit, legit, perfect» без единого реджекта — агент не делал реального ресёрча.
Когда спрашиваешь агента «почему не посмотрел Trustpilot» — он отвечает «you're absolutely right», но сам не инициирует.
Аналогия с наймом сотрудника: дать провалиться, потом показать как надо — нужно experiential learning.
Отсылка к The Office: эпизод, где Джим не понимает, что такое «rundown» — у него нет контекста, как у нового агента.
Чужой скилл можно отдать своему AI и спросить «чему тут можно научиться», но не устанавливать.
Спикер выложил один скилл (code structure, 116 строк) на GitHub явно «чтобы собрать звёзды» и многократно просит его НЕ скачивать.
Конкретный замер токенов: его скилл целиком = 944 токена, а имя+описание = 53 токена.
Репорт-генератор тянет из ~8 источников (Notion, Dub, YouTube, Twitter Analytics), работает 10 минут безупречно — после 5 итераций рекурсивной достройки.
Прогноз: появится рынок скиллов, где продают хорошо проработанные пошаговые скиллы, потому что большинство делает их без проработанного workflow.
Метафора зубрёжки в ночь перед экзаменом = перегруженный контекст: невозможно «догнать», если весь год не учился.
Шутка про «1.8 billion» — Canadian / Monopoly money / «carny coins» vs «real Benjamins».
Признание: у спикера не хватает «уровня делюжна» («это просто сработает, релизим»), над которым он работает.
Идея «templates renaissance» — раньше на шаблонах делали деньги, и это вернётся, т.к. шаблон = готовый контекст.
Аналогия: открыть компанию сразу с 10 сотрудниками, не управляв командой никогда — обречено.
Бенчмарк (спикер за него «не на 100%»): разное качество вывода у Cursor vs Claude Code vs Codex при одной модели — доказательство роли харнесса.
Сам выпуск чуть не отменили: спикер сказал «нет банжера, нечего ревьюить, мало что выходит — большие псы рулят игрой».
Мотивационный пуант: зритель из ноябрьского выпуска вошёл в кодинг, теперь у него cake business на $150K/год и растёт.

Инсайты

Узкое место сместилось с модели на оркестрацию: когда интеллект становится коммодити, дифференциатор — это инженерия контекста и инструментов, а не выбор модели.
Контекст — расходуемый ресурс с убывающей отдачей: каждый токен в контексте имеет цену и в деньгах, и в деградации качества, поэтому архитектурный приоритет — минимализм, а не полнота.
Lazy-loading (progressive disclosure) бьёт eager-loading как принцип: грузить знание по требованию эффективнее, чем держать всё в активной памяти постоянно.
Обучение агента — это перенос tacit knowledge, а не написание документации: рабочий артефакт рождается из наблюдаемого успешного прогона, а не из абстрактного описания процесса.
Ошибка агента — это сигнал к достройке, а не баг: правильный цикл превращает каждый провал в улучшение скилла, что делает систему антихрупкой со временем.
Антропоморфизация вредит: относиться к модели как к «магической всезнающей коробке» ведёт к разочарованию; модель как «новый сотрудник» задаёт верные ожидания и правильный процесс.
Преждевременная сложность убивает продуктивность: масштабироваться надо снизу вверх по мере накопления отлаженных workflow, а не копировать чужую развесистую архитектуру.
Защищаемая ценность человека = немасштабируемое и личное: вкус, стратегия, специфический процесс — то, чего нет в обучающих данных, и именно это стоит кодифицировать.
Готовое-чужое уступает выстраданному-своему не из принципа, а механически: чужой артефакт лишён контекста твоего успешного прогона и потому хуже работает.
Удобство импорта несёт скрытую безопасность-цену: маркетплейсы скиллов — это и attack surface, и иллюзия готового решения.

Цитаты

«the models are good. The models are exceptionally good.» — 0:50 модели хороши. Модели исключительно хороши.

«you have the power to steer the models in a direction where you can get quality or you can get slop» — 1:12 у тебя есть власть направить модель туда, где ты получишь либо качество, либо помои

«95% of people don't need this» — 2:03 95% людей это не нужно

«the models actually don't think. They're predictors of tokens» — 10:15 модели на самом деле не думают. Они предсказатели токенов

«It feels like it understands. It feels like it thinks. Heck, it even feels like it has emotion.» — 10:43 Кажется, что оно понимает. Кажется, что думает. Чёрт, кажется даже, что у него есть эмоции.

«It will mimic you perfectly. You've given it nothing to mimic» — 11:42 Оно скопирует тебя идеально. Ты не дал ему ничего, что можно копировать

«we should treat models and these agents like very new employees versus like these black magic boxes that know everything» — 14:06 к моделям и агентам надо относиться как к совсем новым сотрудникам, а не как к чёрным магическим коробкам, которые знают всё

«I scaled for productivity, not for what looks cool» — 26:36 я масштабировался ради продуктивности, а не ради того, что выглядит круто

«code itself has become context now» — 19:53 сам код теперь стал контекстом

«the model will get dumb as the context window closes» — 30:53 модель тупеет по мере заполнения контекстного окна

«less is more. Rely more on the model strengths» — 31:56 меньше — это больше. Больше опирайся на сильные стороны модели

«Don't tell the model, use React. It knows to use React.» — 32:06 Не говори модели «используй React». Она и так знает, что надо использовать React.

«these are a farce. You don't need them. skills skills skills» — 32:43 это фарс. Они тебе не нужны. Скиллы, скиллы, скиллы

«knowledge that took 20 people 20 years to acquire is now like 20 bucks a month» — 17:32 знание, на которое уходило 20 людей и 20 лет, теперь стоит 20 баксов в месяц

«there needs to be this level of delusion which I don't have» — 18:03 нужен этот уровень самообмана, которого у меня нет

«it's ridiculous to call it a permanent underclass» — 17:07 нелепо называть это перманентным низшим классом

«build your own skills. Build your own. We have food at home.» — 20:35 строй свои скиллы. Строй свои. У нас еда есть дома.

«the big dogs are running the show» — 33:16 большие псы рулят игрой

Факты

Названы модели: Opus 4.6 и GPT 5.4 — обе охарактеризованы как «amazing»; до AGI ещё не дошли (по словам спикера).
Системный промпт Claude Code недавно «утёк», и спикер смог его прочитать.
Тысячестрочный claude.md оценивается примерно в 7000 токенов, расходуемых на каждом запуске.
Собственный скилл спикера = 116 строк; целиком 944 токена, а имя+описание — 53 токена (замер через OpenAI tokenizer).
Контекст-окно в начале сессии — около 20 000 токенов, лимит назван как «25, 250 000 токенов» (оговорка); при заполнении Claude Code и OpenAI Codex делают compact.
Оптимальная зона заполнения контекста — от свежего до ~70%; ближе к 99–100% качество падает.
Репорт-генератор спикера тянет данные из ~8 источников (Notion, Dub Analytics, YouTube Analytics, Twitter Analytics), работает ~10 минут, доведён за 5 итераций.
Workflow сейлз-проверки: Twitter, YouTube, Trustpilot, факт привлечения денег — если 2 из проверок не проходят, авто-реджект; результаты пишутся в Google Sheets.
У спикера сейчас 5 сабагентов: marketing, business, personal (и др.).
Период начального вложения в настройку оценён в ~2 недели (столько ушло у него на OpenClaw).
Упомянут чей-то результат: вайбкодинг приложения на $1.8 млрд (спикер подчёркивает «billion USD, не Canadian, не Monopoly»; достоверность не подтверждает — «I think», «some guy»).
Зритель ноябрьского (прошлого года) выпуска вошёл в кодинг и ведёт cake business на $150 000/год.
Упомянут бенчмарк о разнице качества Cursor vs Claude Code vs Codex — спикер оговаривается «I'm not 100% supporting it».
Целевой порог просмотров для выпусков канала — минимум 200K views.

Источники

Claude Code — кодинг-агент Anthropic (упомянут утёкший системный промпт), а также Claude Cowork.
OpenAI Codex — кодинг-агент, упоминается в сравнениях.
Cursor — упоминается в бенчмарке качества.
OpenClaw — агентский харнесс с memory-слоем, основной инструмент спикера.
Paperclip — популярный инструмент/продукт, который «взлетел»; спикер хвалит, но советует строить свою версию.
The Office — эпизод про «rundown» как иллюстрация отсутствия контекста.
OpenAI tokenizer — для подсчёта токенов.
Инструменты-источники данных: Notion, Dub Analytics, YouTube Analytics, Twitter Analytics, Trustpilot, Google Sheets.
Упомянут некий новый memory-paper (без названия) — спикер отмечает, что в пару предложений его не понять.

Рекомендации

Не используй agent.md/claude.md, если у тебя нет проприетарной инфы, нужной на каждом ходе.
Строй свои скиллы, не скачивай чужие — и из-за безопасности, и из-за отсутствия контекста успешного прогона.
Проходи workflow руками вместе с агентом до успешного прогона, и только потом конвертируй в skill.md.
При ошибке агента — спрашивай «почему провалился», отдавай ошибку обратно, после фикса проси обновить скилл (рекурсивная достройка).
Начинай с одного агента, наращивай скиллы, и лишь потом добавляй сабагенты — скейлься ради продуктивности.
Дай себе ~2 недели на болезненный начальный период, не бросай на первых провалах.
Экономь контекст — держись ниже ~70% заполнения для качества и денег.

Итог

Модель больше не дефицит — дефицит это твой кодифицированный в скиллы workflow и дисциплина минимального контекста; кто это понял, тот и не попадёт в «перманентный низший класс».

readmint Pro

То, что вы только что прочитали — это саммари readmint

Оформите доступ — и получайте такой же разбор по любому своему видео. Вставляете ссылку, через 2–3 минуты готов пересказ с главными тезисами и цитатами. Без воды и без перемотки.

Безлимит саммари — сколько угодно видео
Главные тезисы и цитаты без воды
Приоритет в очереди обработки
Без рекламы и сторонних блоков

Получить такое же саммари

Доступ откроется сразу после оплаты — вставите ссылку и начнёте.

Или 4 900 ₽/год — доступ откроется сразу после оплаты.

Ещё с канала «Greg Isenberg»

Все видео

Я получил приватный урок по Claude Cowork и Claude Code

Я получил приватный урок по Claude Cowork и Claude Code

Хватит вайбкодить. Пора добывать клиентов

Хватит вайбкодить. Пора добывать клиентов

Я посмотрел, как Дэн Коу разбирает свой AI-воркфлоу — ОФИГЕТЬ

Я посмотрел, как Дэн Коу разбирает свой AI-воркфлоу — ОФИГЕТЬ