Коротко
Гость канала Greg Isenberg (в транскрипте — Росс Майк) разбирает хайп вокруг agent loops: схем, где человек запускает агента один раз, а дальше агент сам оценивает свои результаты и продолжает работу без участия человека. Тезис Майка: лупы продвигают люди вроде Бориса и Питера, у которых нет ограничений по токенам, а для обычного разработчика на плане $20–100 это «сжигание денег» — агент строит продукт на собственных допущениях, которые почти всегда расходятся с замыслом автора. Лупы работают только там, где есть узкая задача и измеримый критерий успеха: его собственный пример — code-review-луп (Cursor → GitHub → ревью-агент с оценкой по 5-балльной шкале → автоматическая переработка кода до оценки 5/5 или пяти попыток). Луп ломается на PR длиннее 1000 строк, а для творческих задач («создай мне продукт») не работает в принципе, потому что человек не способен заранее упаковать всё своё видение в один промпт. Вердикт: сейчас (на момент съёмки) автономные лупы — преждевременный тренд, хотя через месяц всё может измениться.
Главный тезис
Agent loop — не магия и не обман, а инструмент с очень узкой зоной применимости: он осмыслен только для задач с автоматически проверяемым критерием качества (code review, шаблонный SEO-контент) и большим токен-бюджетом; для создания продукта «с нуля без человека» луп — это слот-машина, сжигающая деньги.
Ключевые идеи
- 3:06 — классический режим работы — human-in-the-loop: агент создаёт (лендинг, auth, бэкенд по очереди), но человек смотрит каждое решение, корректирует и запускает следующий шаг.
- 3:20 — Борис и Питер декларируют переход от промптов к лупам: «they are not writing the prompts, they are creating the loops» — человек присутствует лишь один раз, на старте, дальше агент сам оценивает свой результат и продолжает.
- 4:09 — техническая основа лупа — spec.md / prd.md как to-do-список: агент идёт по задачам из markdown-файла, где якобы лежит вся нужная информация.
- 5:43 — фундаментальная проблема: автономный разработчик-агент вынужден делать допущения по всем неуточнённым деталям, и эти допущения почти никогда не совпадают с представлением заказчика — «your plan has been implemented. But in reality, it never exists».
- 6:45 — луп не просто ошибается, он ошибается дорого: каждая итерация самопереписывания жжёт токены.
- 12:33 — евангелисты лупов живут в другой токен-экономике: Питер, судя по его твиту, тратит токенов на $1,3 млн в месяц — «If I had the tokens, I would have done it myself».
- 7:59 — трендовые Ralph-лупы (Ralph Wiggum) и /goal — это одно и то же: промпт вида «не останавливайся, пока не сделаешь», просто под разными названиями в разных инструментах.
- 8:41 — порог входа: без плана $200/мес о лупах не стоит даже думать — на планах $20/$100 это 8:56 — полное уничтожение токен-лимита.
- 10:03 — легитимный кейс — research: Майк за полтора часа собрал лупом симулятор Among Us для AI-моделей (бенчмарк на ложь), и луп сработал именно потому, что детали реализации были ему безразличны.
- 10:59 — для осмысленного продукта человек в процессе обязателен на 100%: AI может довести существующее, но не угадать невысказанное видение.
- 11:32 — автономный луп без критерия качества — это слот-машина: дёргаешь ручку, жжёшь токены, надеешься на удачный результат.
- 12:57 — рабочий пример Майка: code-review-луп — пуш фичи в GitHub, ревью-агент (Greptile/CodeRabbit) выдаёт замечания и оценку по 5-балльной шкале.
- 14:30 — жёсткое правило: код с оценкой ниже 4/5 не попадает в production — команда «GBLOOP» в Cursor читает ревью, правит код, пушит, агент ревьюит заново.
- 15:41 — луп имеет условие остановки: либо оценка 5/5, либо 5 попыток — и именно замкнутость и измеримость делают его рабочим.
- 17:04 — луп ломается на PR > 1000 строк: агент не может полноценно оценить такой объём, поэтому изменения надо дробить на несколько PR.
- 17:54 — второй валидный кейс: программный SEO — если есть формула и нужно 300 однотипных страниц, луп уместен.
- 18:55 — луп — это беспилотник без руля: 19:01 — едешь из Майами в Чарльстон и не можешь свернуть с маршрута, даже если по пути увидел что-то важное.
- 21:36 — финальный вердикт: сейчас полная автономия не работает; «After a month, this may be right» — но не сегодня.
Почему это важно
Видео — контрапункт к нарративу, который продвигают сотрудники Anthropic (Борис и Питер — создатели и евангелисты Claude Code): «промпты мертвы, будущее за лупами». Майк не оспаривает направление — он оспаривает применимость сегодня и для кого. Выигрывают от хайпа лаборатории (им нужны данные о self-reliant agents и им токены бесплатны) и продавцы инструментов; проигрывают инди-разработчики на планах $20–100, которые скопируют паттерн «slash goal, не останавливайся» и сожгут лимиты на код, не соответствующий их же замыслу. Упомянутые игроки экосистемы — Cursor, Claude Code, Codex, CodeRabbit (спонсор выпуска), Greptile — зарабатывают на каждой итерации лупа, что добавляет циничный слой: чем больше лупов, тем больше токенов продано.
Идеи
- Разница между human-in-the-loop и agent loop сводится к одному параметру: сколько раз человек присутствует в цикле — на каждой итерации или только на старте.
- Агент в лупе превращает свои собственные решения в данные для следующей итерации — «meta harness», который сам себя переписывает.
- Невозможность лупа для продуктовой работы — не техническая, а эпистемологическая: человек физически не может выгрузить всё своё видение продукта в один документ, потому что сам узнаёт, чего хочет, только глядя на промежуточный результат.
- Требования меняются по ходу: «сегодня одно, завтра поменяем» — а луп зафиксирован в исходном спеке и не умеет принимать обновлённый контекст.
- Даже люди в сервисном бизнесе годами не могут вытащить из клиента, чего тот хочет, — ожидать этого от агента по одному промпту наивно.
- Research — особый режим, где допущения агента не вредят: если тебе всё равно, как именно реализовано, луп экономит часы.
- В кейсе Among Us Майк сознательно признаёт: «I don't care about what it created, so I don't know that information» — луп дал результат, в детали которого автор даже не заглянул.
- Числовой score от ревью-агента превращает субъективное «код хороший?» в machine-readable критерий остановки лупа — это ключевая инженерная находка.
- Гейт «не ниже 4/5 — в прод» работает как автоматический quality gate без участия человека.
- Лимит в 5 попыток — страховка от бесконечного лупа, который иначе крутился бы и жёг токены до бесконечности.
- Ограничение в 1000 строк диктует архитектуру работы: агент должен сам дробить большие изменения на несколько PR, чтобы оставаться в зоне, где ревью достоверно.
- Луп Майка «закрытый»: вход, критерий, выход — в противоположность открытым лупам «строй стартап, пока не заработаешь $1 млн».
- Сторонники лупов аргументируют от своей позиции: исследователям автономных агентов лупы нужны по работе, и их совет нерелевантен людям с бюджетом.
- Ошибка тренда не в идее, а в обобщении: «у нас работает» превратилось в «это лучший способ для всех».
- Code review — редкая задача, где итерация дешёвая, критерий формальный, а откат безопасный: идеальный полигон для автономии.
- Спонсорский CodeRabbit сам является примером agent loop в продакшене: PR открыт → автоматическое ревью → исправление в один клик.
- Метафора слот-машины: чем неопределённее критерий успеха, тем больше луп похож на азартную игру с токенами вместо жетонов.
- Майк страхуется репутационно: «если компания решит уничтожить мой кредит — звоните», но врать аудитории про работоспособность тренда отказывается.
- Прогноз с самоиронией: «через месяц это может стать правдой, и я окажусь дураком» — оценка привязана к моменту, а не к принципу.
Инсайты
- Применимость автономии определяется не мощностью модели, а наличием дешёвой автоматической функции оценки результата: где есть score — луп работает, где оценка субъективна — нет.
- Цена ошибки агента масштабируется итерациями: в супервизируемом режиме ошибка стоит одну правку, в лупе — N итераций токенов поверх неверного допущения.
- Советы об инструментах нельзя отделять от экономики советчика: практика людей с безлимитными ресурсами не переносится на людей с бюджетом.
- Спецификация — не артефакт, а процесс: требования формируются через наблюдение промежуточных результатов, поэтому любая «полная спека на входе» — иллюзия.
- Чем безразличнее автору детали результата, тем эффективнее автономный агент — автономия растёт из равнодушия, а не из качества модели.
- Зрелость паттерна определяется условиями остановки: луп без лимита попыток и формального критерия выхода — это не система, а ставка.
- У автономных систем есть «окно достоверности» (здесь — 1000 строк на ревью): за его пределами оценка деградирует молча, и систему надо проектировать так, чтобы работа дробилась под окно.
- Хайповые тренды в AI-инструментах — часто переименование одного паттерна (Ralph, /goal, loop): различать стоит механики, а не названия.
- Один и тот же инструмент одновременно «лучшая практика» и «сжигание денег» — в зависимости от типа задачи; универсальных вердиктов про AI-паттерны не существует.
- Интересы продавцов токенов и евангелистов токеноёмких паттернов совпадают — это стоит учитывать при оценке любого тренда «тратьте больше compute».
Фреймворки
- Два режима работы с агентами: (1) Human-in-the-loop — человек проверяет каждое решение агента и даёт следующий промпт; (2) Agent loop — человек присутствует один раз на старте, дальше агент сам оценивает результат и итерирует.
- Критерии применимости лупа (по Майку): узкая задача + формальный измеримый критерий успеха (score) + условие остановки (порог или лимит попыток) + объём итерации внутри окна достоверности оценщика (<1000 строк). Примеры подходящих задач: code review, шаблонный SEO-контент. Неподходящие: продукт «с нуля», всё, где требования эволюционируют.
- Code-review-луп Майка: push в GitHub → ревью-агент даёт score X/5 → если <4/5, команда «GBLOOP» в Cursor: прочитать ревью → исправить → push → новое ревью → повторять до 5/5 или 5 попыток.
Цитаты
«they said they are not writing the prompts, they are creating the loops» — 3:20 Они сказали: мы не пишем промпты — мы создаём лупы
«creating is agent, but it is you who lead, control and allow it to happen» — 3:13 Создаёт агент, но именно ты ведёшь, контролируешь и разрешаешь этому случиться
«You may think that your plan has been implemented. But in reality, it never exists» — 5:55 Ты думаешь, что твой план реализован. Но в реальности этого никогда не происходит
«If I had the tokens, I would have done it myself» — 6:58 Будь у меня столько токенов, я бы и сам так делал
«It would be nice to hear, but it will burn the money» — 11:28 Звучит красиво, но это сжигает деньги
«I understand that the loops will create a slot machine» — 11:32 Я понимаю, что лупы превращаются в слот-машину
«He uses tokens worth $1.3 million a month» — 12:33 Он тратит токенов на 1,3 миллиона долларов в месяц
«If you are not in the $200 monthly plan, you should not think about it» — 8:41 Если ты не на плане за $200 в месяц — даже не думай об этом
«Because it will completely destroy your token use» — 8:56 Потому что это полностью уничтожит твой лимит токенов
«When we humans are trying to understand each other, how far do you think an agent will understand you?» — 9:46 Если даже мы, люди, с трудом понимаем друг друга — насколько, по-твоему, тебя поймёт агент?
«But do you know what happened? I don't care about what it created, so I don't know that information» — 10:46 И знаешь, что вышло? Мне всё равно, что оно создало, — я даже не знаю этой информации
«when you and I try to create something meaningful using AI, I am 100% sure that humans are necessary in that process» — 10:59 Когда мы пытаемся создать с помощью AI что-то осмысленное, я на 100% уверен: человек в этом процессе необходим
«Now, if you are a good at imagining, you are a genius. You won't miss any details» — 16:28 Ну а если ты гений воображения и не упускаешь ни одной детали…
«You cannot order a bad chicken sandwich by looking at a beautiful food on the way» — 19:09 Ты не можешь свернуть за сэндвичем, увидев красивую еду по дороге
«If any company plans to destroy my credit, I will call you, but I cannot lie to the people, I must be honest» — 19:31 Если какая-то компания решит уничтожить мою репутацию — звоните, но врать людям я не могу, я должен быть честным
«After a month, this may be right. Then I may be stupid, but now it is meaningful» — 21:42 Через месяц это может оказаться правдой — и тогда я окажусь дураком, но сейчас моя позиция осмысленна
Факты
- Питер (по его твиту, на который ссылается Майк) использует токены на $1,3 млн в месяц.
- Тарифные планы, упомянутые в контексте лупов: $20, $100 и $200/мес; лупы оправданы только на $200.
- Code-review-гейт Майка: код с оценкой ниже 4/5 не идёт в production; цель лупа — 5/5; лимит — 5 попыток, после чего луп сдаётся.
- Луп ревью ломается на PR свыше 1000 строк — агент не может достоверно оценить такой объём.
- Симулятор Among Us для AI-моделей (бенчмарк на выявление лжи у моделей) был собран лупом примерно за полтора часа.
- Инструменты в стеке Майка: Cursor (основной, не спонсировано), GitHub как source control, ревью-агенты Greptile и CodeRabbit (в SRT — «KiraPile», «Quotrabit»).
- Спонсор выпуска — CodeRabbit: автоматическое ревью pull request'ов, фикс в один клик, новый продукт для разбора больших PR, 14 дней бесплатного триала.
- Трендовые названия лупов: Ralph (Ralph Wiggum) и слэш-команда /goal; по словам Майка, механика у них одна.
- Стик-фигуры для иллюстраций к выпуску обошлись примерно в $3.
- Дата съёмки в SRT звучит как «June 1996» — очевидная ошибка распознавания; Майк подчёркивает, что вердикт «не работает» привязан к моменту записи.
- Пример SEO-кейса: формула + 300 однотипных страниц — задача, где луп уместен.
Источники
- Greg Isenberg — ведущий, канал
- Росс Майк (так в транскрипте; гость выпуска) — автор разбираемой позиции
- Борис и Питер (в SRT — «Poris and Peter») — сотрудники AI-лаборатории, популяризаторы тезиса «создавайте лупы, а не промпты»; твит Питера о $1,3 млн токенов/месяц
- Инструменты: Cursor, Claude Code (в SRT — «clot»), Codex, GitHub, CodeRabbit, Greptile
- Паттерны: Ralph loop / Ralph Wiggum, /goal, spec.md / prd.md
- Among Us — игра, по мотивам которой сделан бенчмарк-симулятор для моделей
Рекомендации
- Не запускать автономные лупы на планах $20–100 — только при бюджете уровня $200/мес и выше.
- Использовать лупы там, где есть формальный score и условие остановки: code review (push → ревью-агент → автофикс до 5/5 или 5 попыток), шаблонный SEO-контент.
- Держать изменения в пределах ~1000 строк на PR или заставлять агента дробить работу на несколько PR — иначе оценка ревью-агента недостоверна.
- Для продуктовой работы оставаться в режиме human-in-the-loop: проверять решения агента на каждой итерации.
- Лупы «вслепую» допустимы для research-задач, где детали реализации безразличны.
Итог
Agent loop работает ровно там, где успех измеряется числом, а не вкусом, — всё остальное сегодня является дорогой слот-машиной для людей с чужим токен-бюджетом.