ВТФ это AI Agent Loop? Гениально или хайп?

Greg Isenberg9 июня 202632 97898412 мин чтениясегодня, 01:24

Коротко

Гость канала Greg Isenberg (в транскрипте — Росс Майк) разбирает хайп вокруг agent loops: схем, где человек запускает агента один раз, а дальше агент сам оценивает свои результаты и продолжает работу без участия человека. Тезис Майка: лупы продвигают люди вроде Бориса и Питера, у которых нет ограничений по токенам, а для обычного разработчика на плане $20–100 это «сжигание денег» — агент строит продукт на собственных допущениях, которые почти всегда расходятся с замыслом автора. Лупы работают только там, где есть узкая задача и измеримый критерий успеха: его собственный пример — code-review-луп (Cursor → GitHub → ревью-агент с оценкой по 5-балльной шкале → автоматическая переработка кода до оценки 5/5 или пяти попыток). Луп ломается на PR длиннее 1000 строк, а для творческих задач («создай мне продукт») не работает в принципе, потому что человек не способен заранее упаковать всё своё видение в один промпт. Вердикт: сейчас (на момент съёмки) автономные лупы — преждевременный тренд, хотя через месяц всё может измениться.

Главный тезис

Agent loop — не магия и не обман, а инструмент с очень узкой зоной применимости: он осмыслен только для задач с автоматически проверяемым критерием качества (code review, шаблонный SEO-контент) и большим токен-бюджетом; для создания продукта «с нуля без человека» луп — это слот-машина, сжигающая деньги.

Ключевые идеи

  • 3:06 — классический режим работы — human-in-the-loop: агент создаёт (лендинг, auth, бэкенд по очереди), но человек смотрит каждое решение, корректирует и запускает следующий шаг.
  • 3:20Борис и Питер декларируют переход от промптов к лупам: «they are not writing the prompts, they are creating the loops» — человек присутствует лишь один раз, на старте, дальше агент сам оценивает свой результат и продолжает.
  • 4:09 — техническая основа лупа — spec.md / prd.md как to-do-список: агент идёт по задачам из markdown-файла, где якобы лежит вся нужная информация.
  • 5:43 — фундаментальная проблема: автономный разработчик-агент вынужден делать допущения по всем неуточнённым деталям, и эти допущения почти никогда не совпадают с представлением заказчика — «your plan has been implemented. But in reality, it never exists».
  • 6:45 — луп не просто ошибается, он ошибается дорого: каждая итерация самопереписывания жжёт токены.
  • 12:33 — евангелисты лупов живут в другой токен-экономике: Питер, судя по его твиту, тратит токенов на $1,3 млн в месяц — «If I had the tokens, I would have done it myself».
  • 7:59 — трендовые Ralph-лупы (Ralph Wiggum) и /goal — это одно и то же: промпт вида «не останавливайся, пока не сделаешь», просто под разными названиями в разных инструментах.
  • 8:41 — порог входа: без плана $200/мес о лупах не стоит даже думать — на планах $20/$100 это 8:56 — полное уничтожение токен-лимита.
  • 10:03 — легитимный кейс — research: Майк за полтора часа собрал лупом симулятор Among Us для AI-моделей (бенчмарк на ложь), и луп сработал именно потому, что детали реализации были ему безразличны.
  • 10:59 — для осмысленного продукта человек в процессе обязателен на 100%: AI может довести существующее, но не угадать невысказанное видение.
  • 11:32 — автономный луп без критерия качества — это слот-машина: дёргаешь ручку, жжёшь токены, надеешься на удачный результат.
  • 12:57 — рабочий пример Майка: code-review-луп — пуш фичи в GitHub, ревью-агент (Greptile/CodeRabbit) выдаёт замечания и оценку по 5-балльной шкале.
  • 14:30 — жёсткое правило: код с оценкой ниже 4/5 не попадает в production — команда «GBLOOP» в Cursor читает ревью, правит код, пушит, агент ревьюит заново.
  • 15:41 — луп имеет условие остановки: либо оценка 5/5, либо 5 попыток — и именно замкнутость и измеримость делают его рабочим.
  • 17:04 — луп ломается на PR > 1000 строк: агент не может полноценно оценить такой объём, поэтому изменения надо дробить на несколько PR.
  • 17:54 — второй валидный кейс: программный SEO — если есть формула и нужно 300 однотипных страниц, луп уместен.
  • 18:55 — луп — это беспилотник без руля: 19:01 — едешь из Майами в Чарльстон и не можешь свернуть с маршрута, даже если по пути увидел что-то важное.
  • 21:36 — финальный вердикт: сейчас полная автономия не работает; «After a month, this may be right» — но не сегодня.

Почему это важно

Видео — контрапункт к нарративу, который продвигают сотрудники Anthropic (Борис и Питер — создатели и евангелисты Claude Code): «промпты мертвы, будущее за лупами». Майк не оспаривает направление — он оспаривает применимость сегодня и для кого. Выигрывают от хайпа лаборатории (им нужны данные о self-reliant agents и им токены бесплатны) и продавцы инструментов; проигрывают инди-разработчики на планах $20–100, которые скопируют паттерн «slash goal, не останавливайся» и сожгут лимиты на код, не соответствующий их же замыслу. Упомянутые игроки экосистемы — Cursor, Claude Code, Codex, CodeRabbit (спонсор выпуска), Greptile — зарабатывают на каждой итерации лупа, что добавляет циничный слой: чем больше лупов, тем больше токенов продано.

Идеи

  • Разница между human-in-the-loop и agent loop сводится к одному параметру: сколько раз человек присутствует в цикле — на каждой итерации или только на старте.
  • Агент в лупе превращает свои собственные решения в данные для следующей итерации — «meta harness», который сам себя переписывает.
  • Невозможность лупа для продуктовой работы — не техническая, а эпистемологическая: человек физически не может выгрузить всё своё видение продукта в один документ, потому что сам узнаёт, чего хочет, только глядя на промежуточный результат.
  • Требования меняются по ходу: «сегодня одно, завтра поменяем» — а луп зафиксирован в исходном спеке и не умеет принимать обновлённый контекст.
  • Даже люди в сервисном бизнесе годами не могут вытащить из клиента, чего тот хочет, — ожидать этого от агента по одному промпту наивно.
  • Research — особый режим, где допущения агента не вредят: если тебе всё равно, как именно реализовано, луп экономит часы.
  • В кейсе Among Us Майк сознательно признаёт: «I don't care about what it created, so I don't know that information» — луп дал результат, в детали которого автор даже не заглянул.
  • Числовой score от ревью-агента превращает субъективное «код хороший?» в machine-readable критерий остановки лупа — это ключевая инженерная находка.
  • Гейт «не ниже 4/5 — в прод» работает как автоматический quality gate без участия человека.
  • Лимит в 5 попыток — страховка от бесконечного лупа, который иначе крутился бы и жёг токены до бесконечности.
  • Ограничение в 1000 строк диктует архитектуру работы: агент должен сам дробить большие изменения на несколько PR, чтобы оставаться в зоне, где ревью достоверно.
  • Луп Майка «закрытый»: вход, критерий, выход — в противоположность открытым лупам «строй стартап, пока не заработаешь $1 млн».
  • Сторонники лупов аргументируют от своей позиции: исследователям автономных агентов лупы нужны по работе, и их совет нерелевантен людям с бюджетом.
  • Ошибка тренда не в идее, а в обобщении: «у нас работает» превратилось в «это лучший способ для всех».
  • Code review — редкая задача, где итерация дешёвая, критерий формальный, а откат безопасный: идеальный полигон для автономии.
  • Спонсорский CodeRabbit сам является примером agent loop в продакшене: PR открыт → автоматическое ревью → исправление в один клик.
  • Метафора слот-машины: чем неопределённее критерий успеха, тем больше луп похож на азартную игру с токенами вместо жетонов.
  • Майк страхуется репутационно: «если компания решит уничтожить мой кредит — звоните», но врать аудитории про работоспособность тренда отказывается.
  • Прогноз с самоиронией: «через месяц это может стать правдой, и я окажусь дураком» — оценка привязана к моменту, а не к принципу.

Инсайты

  • Применимость автономии определяется не мощностью модели, а наличием дешёвой автоматической функции оценки результата: где есть score — луп работает, где оценка субъективна — нет.
  • Цена ошибки агента масштабируется итерациями: в супервизируемом режиме ошибка стоит одну правку, в лупе — N итераций токенов поверх неверного допущения.
  • Советы об инструментах нельзя отделять от экономики советчика: практика людей с безлимитными ресурсами не переносится на людей с бюджетом.
  • Спецификация — не артефакт, а процесс: требования формируются через наблюдение промежуточных результатов, поэтому любая «полная спека на входе» — иллюзия.
  • Чем безразличнее автору детали результата, тем эффективнее автономный агент — автономия растёт из равнодушия, а не из качества модели.
  • Зрелость паттерна определяется условиями остановки: луп без лимита попыток и формального критерия выхода — это не система, а ставка.
  • У автономных систем есть «окно достоверности» (здесь — 1000 строк на ревью): за его пределами оценка деградирует молча, и систему надо проектировать так, чтобы работа дробилась под окно.
  • Хайповые тренды в AI-инструментах — часто переименование одного паттерна (Ralph, /goal, loop): различать стоит механики, а не названия.
  • Один и тот же инструмент одновременно «лучшая практика» и «сжигание денег» — в зависимости от типа задачи; универсальных вердиктов про AI-паттерны не существует.
  • Интересы продавцов токенов и евангелистов токеноёмких паттернов совпадают — это стоит учитывать при оценке любого тренда «тратьте больше compute».

Фреймворки

  • Два режима работы с агентами: (1) Human-in-the-loop — человек проверяет каждое решение агента и даёт следующий промпт; (2) Agent loop — человек присутствует один раз на старте, дальше агент сам оценивает результат и итерирует.
  • Критерии применимости лупа (по Майку): узкая задача + формальный измеримый критерий успеха (score) + условие остановки (порог или лимит попыток) + объём итерации внутри окна достоверности оценщика (<1000 строк). Примеры подходящих задач: code review, шаблонный SEO-контент. Неподходящие: продукт «с нуля», всё, где требования эволюционируют.
  • Code-review-луп Майка: push в GitHub → ревью-агент даёт score X/5 → если <4/5, команда «GBLOOP» в Cursor: прочитать ревью → исправить → push → новое ревью → повторять до 5/5 или 5 попыток.

Цитаты

«they said they are not writing the prompts, they are creating the loops» — 3:20 Они сказали: мы не пишем промпты — мы создаём лупы

«creating is agent, but it is you who lead, control and allow it to happen» — 3:13 Создаёт агент, но именно ты ведёшь, контролируешь и разрешаешь этому случиться

«You may think that your plan has been implemented. But in reality, it never exists» — 5:55 Ты думаешь, что твой план реализован. Но в реальности этого никогда не происходит

«If I had the tokens, I would have done it myself» — 6:58 Будь у меня столько токенов, я бы и сам так делал

«It would be nice to hear, but it will burn the money» — 11:28 Звучит красиво, но это сжигает деньги

«I understand that the loops will create a slot machine» — 11:32 Я понимаю, что лупы превращаются в слот-машину

«He uses tokens worth $1.3 million a month» — 12:33 Он тратит токенов на 1,3 миллиона долларов в месяц

«If you are not in the $200 monthly plan, you should not think about it» — 8:41 Если ты не на плане за $200 в месяц — даже не думай об этом

«Because it will completely destroy your token use» — 8:56 Потому что это полностью уничтожит твой лимит токенов

«When we humans are trying to understand each other, how far do you think an agent will understand you?» — 9:46 Если даже мы, люди, с трудом понимаем друг друга — насколько, по-твоему, тебя поймёт агент?

«But do you know what happened? I don't care about what it created, so I don't know that information» — 10:46 И знаешь, что вышло? Мне всё равно, что оно создало, — я даже не знаю этой информации

«when you and I try to create something meaningful using AI, I am 100% sure that humans are necessary in that process» — 10:59 Когда мы пытаемся создать с помощью AI что-то осмысленное, я на 100% уверен: человек в этом процессе необходим

«Now, if you are a good at imagining, you are a genius. You won't miss any details» — 16:28 Ну а если ты гений воображения и не упускаешь ни одной детали…

«You cannot order a bad chicken sandwich by looking at a beautiful food on the way» — 19:09 Ты не можешь свернуть за сэндвичем, увидев красивую еду по дороге

«If any company plans to destroy my credit, I will call you, but I cannot lie to the people, I must be honest» — 19:31 Если какая-то компания решит уничтожить мою репутацию — звоните, но врать людям я не могу, я должен быть честным

«After a month, this may be right. Then I may be stupid, but now it is meaningful» — 21:42 Через месяц это может оказаться правдой — и тогда я окажусь дураком, но сейчас моя позиция осмысленна

Факты

  • Питер (по его твиту, на который ссылается Майк) использует токены на $1,3 млн в месяц.
  • Тарифные планы, упомянутые в контексте лупов: $20, $100 и $200/мес; лупы оправданы только на $200.
  • Code-review-гейт Майка: код с оценкой ниже 4/5 не идёт в production; цель лупа — 5/5; лимит — 5 попыток, после чего луп сдаётся.
  • Луп ревью ломается на PR свыше 1000 строк — агент не может достоверно оценить такой объём.
  • Симулятор Among Us для AI-моделей (бенчмарк на выявление лжи у моделей) был собран лупом примерно за полтора часа.
  • Инструменты в стеке Майка: Cursor (основной, не спонсировано), GitHub как source control, ревью-агенты Greptile и CodeRabbit (в SRT — «KiraPile», «Quotrabit»).
  • Спонсор выпуска — CodeRabbit: автоматическое ревью pull request'ов, фикс в один клик, новый продукт для разбора больших PR, 14 дней бесплатного триала.
  • Трендовые названия лупов: Ralph (Ralph Wiggum) и слэш-команда /goal; по словам Майка, механика у них одна.
  • Стик-фигуры для иллюстраций к выпуску обошлись примерно в $3.
  • Дата съёмки в SRT звучит как «June 1996» — очевидная ошибка распознавания; Майк подчёркивает, что вердикт «не работает» привязан к моменту записи.
  • Пример SEO-кейса: формула + 300 однотипных страниц — задача, где луп уместен.

Источники

  • Greg Isenberg — ведущий, канал
  • Росс Майк (так в транскрипте; гость выпуска) — автор разбираемой позиции
  • Борис и Питер (в SRT — «Poris and Peter») — сотрудники AI-лаборатории, популяризаторы тезиса «создавайте лупы, а не промпты»; твит Питера о $1,3 млн токенов/месяц
  • Инструменты: Cursor, Claude Code (в SRT — «clot»), Codex, GitHub, CodeRabbit, Greptile
  • Паттерны: Ralph loop / Ralph Wiggum, /goal, spec.md / prd.md
  • Among Us — игра, по мотивам которой сделан бенчмарк-симулятор для моделей

Рекомендации

  • Не запускать автономные лупы на планах $20–100 — только при бюджете уровня $200/мес и выше.
  • Использовать лупы там, где есть формальный score и условие остановки: code review (push → ревью-агент → автофикс до 5/5 или 5 попыток), шаблонный SEO-контент.
  • Держать изменения в пределах ~1000 строк на PR или заставлять агента дробить работу на несколько PR — иначе оценка ревью-агента недостоверна.
  • Для продуктовой работы оставаться в режиме human-in-the-loop: проверять решения агента на каждой итерации.
  • Лупы «вслепую» допустимы для research-задач, где детали реализации безразличны.

Итог

Agent loop работает ровно там, где успех измеряется числом, а не вкусом, — всё остальное сегодня является дорогой слот-машиной для людей с чужим токен-бюджетом.

readmint Pro

То, что вы только что прочитали — это саммари readmint

Оформите доступ — и получайте такой же разбор по любому своему видео. Вставляете ссылку, через 2–3 минуты готов пересказ с главными тезисами и цитатами. Без воды и без перемотки.

  • Безлимит саммари — сколько угодно видео
  • Главные тезисы и цитаты без воды
  • Приоритет в очереди обработки
  • Без рекламы и сторонних блоков
Получить такое же саммари
Доступ откроется сразу после оплаты — вставите ссылку и начнёте.

Или 4 900 ₽/год — доступ откроется сразу после оплаты.

Ещё с канала «Greg Isenberg»

Все видео