ВТФ это AI Agent Loop? Гениально или хайп?

Greg Isenberg9 июня 202672 2571 85112 мин чтения13 июля, 03:14

Искусственный Интеллект Технологии Агенты Автоматизация

Коротко

Гость канала Greg Isenberg (в транскрипте, Росс Майк) разбирает хайп вокруг agent loops: схем, где человек запускает агента один раз, а дальше тот сам оценивает свои результаты и продолжает без участия человека. Тезис Майка: лупы продвигают люди вроде Бориса и Питера, у которых нет ограничений по токенам, а для обычного разработчика на плане $20–100 это сжигание денег - агент строит продукт на собственных допущениях, которые почти всегда расходятся с замыслом автора. Лупы работают только там, где есть узкая задача и измеримый критерий успеха: его собственный пример - code-review-луп (Cursor → GitHub → ревью-агент с оценкой по 5-балльной шкале → автоматическая переработка кода до оценки 5/5 или пяти попыток). Луп ломается на PR длиннее 1000 строк, а для творческих задач вроде «создай мне продукт» не работает в принципе: человек не способен упаковать всё своё видение в один промпт. Вердикт Майка: сейчас автономные лупы - преждевременный тренд, хотя через месяц всё может измениться.

Главный тезис

Agent loop - не магия и не обман, а инструмент с очень узкой зоной применимости: он осмыслен только для задач с автоматически проверяемым критерием качества (code review, шаблонный SEO-контент) и большим токен-бюджетом. Для создания продукта «с нуля без человека» луп - слот-машина, сжигающая деньги.

Ключевые идеи

3:06 - классический режим работы, human-in-the-loop: агент создаёт (лендинг, auth, бэкенд по очереди), но человек смотрит каждое решение, корректирует и запускает следующий шаг.
3:20 - Борис и Питер декларируют переход от промптов к лупам: «they are not writing the prompts, they are creating the loops» - человек присутствует лишь один раз, на старте, дальше агент сам оценивает свой результат и продолжает.
4:09 - техническая основа лупа - spec.md / prd.md как to-do-список: агент идёт по задачам из markdown-файла, где якобы лежит вся нужная информация.
5:43 - фундаментальная проблема: автономный разработчик-агент вынужден делать допущения по всем неуточнённым деталям, и эти допущения почти никогда не совпадают с представлением заказчика - «your plan has been implemented. But in reality, it never exists».
6:45 - луп не просто ошибается, он ошибается дорого: каждая итерация самопереписывания жжёт токены.
12:33 - евангелисты лупов живут в другой токен-экономике: Питер, судя по его твиту, тратит токенов на $1,3 млн в месяц - «If I had the tokens, I would have done it myself».
7:59 - трендовые Ralph-лупы (Ralph Wiggum) и /goal - это одно и то же: промпт вида «не останавливайся, пока не сделаешь», просто под разными названиями в разных инструментах.
8:41 - порог входа: без плана $200/мес о лупах не стоит и думать - на планах $20/$100 это 8:56 - полное уничтожение токен-лимита.
10:03 - легитимный кейс, research: Майк за полтора часа собрал лупом симулятор Among Us для AI-моделей (бенчмарк на ложь), и луп сработал именно потому, что детали реализации были ему безразличны.
10:59 - для осмысленного продукта человек в процессе обязателен на 100%: AI может довести существующее, но не угадать невысказанное видение.
11:32 - автономный луп без критерия качества - это слот-машина: дёргаешь ручку, жжёшь токены, надеешься на удачный результат.
12:57 - рабочий пример Майка: code-review-луп - пуш фичи в GitHub, ревью-агент (Greptile/CodeRabbit) выдаёт замечания и оценку по 5-балльной шкале.
14:30 - жёсткое правило: код с оценкой ниже 4/5 не попадает в production - команда «GBLOOP» в Cursor читает ревью, правит код, пушит, агент ревьюит заново.
15:41 - луп имеет условие остановки: либо оценка 5/5, либо 5 попыток. Замкнутость и измеримость и делают его рабочим.
17:04 - луп ломается на PR > 1000 строк: агент не может полноценно оценить такой объём, поэтому изменения надо дробить на несколько PR.
17:54 - второй валидный кейс: программный SEO - есть формула, нужно 300 однотипных страниц, луп уместен.
18:55 - луп - это беспилотник без руля: 19:01 - едешь из Майами в Чарльстон и не можешь свернуть с маршрута, даже если по пути увидел что-то важное.
21:36 - финальный вердикт: сейчас полная автономия не работает; «After a month, this may be right» - но не сегодня.

Почему это важно

Видео - контрапункт к нарративу, который продвигают сотрудники Anthropic (Борис и Питер, создатели и евангелисты Claude Code): «промпты мертвы, будущее за лупами». Майк не оспаривает направление, он оспаривает применимость сегодня и для кого. Выигрывают от хайпа лаборатории (им нужны данные о self-reliant agents, а токены им бесплатны) и продавцы инструментов; проигрывают инди-разработчики на планах $20–100, которые скопируют паттерн «slash goal, не останавливайся» и сожгут лимиты на код, не соответствующий их же замыслу. Упомянутые игроки экосистемы - Cursor, Claude Code, Codex, CodeRabbit (спонсор выпуска), Greptile - зарабатывают на каждой итерации лупа, и это добавляет циничный слой: чем больше лупов, тем больше токенов продано.

Идеи

Разница между human-in-the-loop и agent loop сводится к одному параметру: сколько раз человек присутствует в цикле, на каждой итерации или только на старте.
Агент в лупе превращает свои собственные решения в данные для следующей итерации - «meta harness», который сам себя переписывает.
Невозможность лупа для продуктовой работы - не техническая, а эпистемологическая: человек физически не может выгрузить всё своё видение продукта в один документ, потому что сам узнаёт, чего хочет, только глядя на промежуточный результат.
Требования меняются по ходу: сегодня одно, завтра поменяем, а луп зафиксирован в исходном спеке и не умеет принимать обновлённый контекст.
Даже люди в сервисном бизнесе годами не могут вытащить из клиента, чего тот хочет. Ожидать этого от агента по одному промпту наивно.
Research - особый режим, где допущения агента не вредят: если тебе всё равно, как именно реализовано, луп экономит часы.
В кейсе Among Us Майк сознательно признаёт: «I don't care about what it created, so I don't know that information» - луп дал результат, в детали которого автор даже не заглянул.
Числовой score от ревью-агента превращает субъективное «код хороший?» в machine-readable критерий остановки лупа - ключевая инженерная находка.
Гейт «не ниже 4/5 - в прод» работает как автоматический quality gate без участия человека.
Лимит в 5 попыток - страховка от бесконечного лупа, который иначе крутился бы и жёг токены до бесконечности.
Ограничение в 1000 строк диктует архитектуру работы: агент должен сам дробить большие изменения на несколько PR, чтобы оставаться в зоне, где ревью достоверно.
Луп Майка «закрытый»: вход, критерий, выход. Противоположность открытым лупам «строй стартап, пока не заработаешь $1 млн».
Сторонники лупов аргументируют от своей позиции: исследователям автономных агентов лупы нужны по работе, и их совет нерелевантен людям с бюджетом.
Ошибка тренда не в идее, а в обобщении: «у нас работает» превратилось в «это лучший способ для всех».
Code review - редкая задача, где итерация дешёвая, критерий формальный, а откат безопасный: идеальный полигон для автономии.
Спонсорский CodeRabbit сам является примером agent loop в продакшене: PR открыт → автоматическое ревью → исправление в один клик.
Метафора слот-машины: чем неопределённее критерий успеха, тем больше луп похож на азартную игру с токенами вместо жетонов.
Майк страхуется репутационно: «если компания решит уничтожить мой кредит - звоните», но врать аудитории про работоспособность тренда отказывается.
Прогноз с самоиронией: «через месяц это может стать правдой, и я окажусь дураком» - оценка привязана к моменту, а не к принципу.

Инсайты

Применимость автономии определяется не мощностью модели, а наличием дешёвой автоматической функции оценки результата: где есть score, луп работает, где оценка субъективна, нет.
Цена ошибки агента масштабируется итерациями: в супервизируемом режиме ошибка стоит одну правку, в лупе - N итераций токенов поверх неверного допущения.
Советы об инструментах нельзя отделять от экономики советчика: практика людей с безлимитными ресурсами не переносится на людей с бюджетом.
Спецификация - не артефакт, а процесс: требования формируются через наблюдение промежуточных результатов, поэтому любая «полная спека на входе» - иллюзия.
Чем безразличнее автору детали результата, тем эффективнее автономный агент: автономия растёт из равнодушия, а не из качества модели.
Зрелость паттерна определяется условиями остановки: луп без лимита попыток и формального критерия выхода - это не система, а ставка.
У автономных систем есть «окно достоверности» (здесь - 1000 строк на ревью): за его пределами оценка деградирует молча, и систему надо проектировать так, чтобы работа дробилась под окно.
Хайповые тренды в AI-инструментах часто оказываются переименованием одного паттерна (Ralph, /goal, loop): различать стоит механики, а не названия.
Один и тот же инструмент одновременно «лучшая практика» и «сжигание денег» в зависимости от типа задачи; универсальных вердиктов про AI-паттерны не существует.
Интересы продавцов токенов и евангелистов токеноёмких паттернов совпадают. Это стоит учитывать при оценке любого тренда «тратьте больше compute».

Фреймворки

Два режима работы с агентами: (1) Human-in-the-loop - человек проверяет каждое решение агента и даёт следующий промпт; (2) Agent loop - человек присутствует один раз на старте, дальше агент сам оценивает результат и итерирует.
Критерии применимости лупа (по Майку): узкая задача + формальный измеримый критерий успеха (score) + условие остановки (порог или лимит попыток) + объём итерации внутри окна достоверности оценщика (<1000 строк). Примеры подходящих задач: code review, шаблонный SEO-контент. Неподходящие: продукт «с нуля», всё, где требования эволюционируют.
Code-review-луп Майка: push в GitHub → ревью-агент даёт score X/5 → если <4/5, команда «GBLOOP» в Cursor: прочитать ревью → исправить → push → новое ревью → повторять до 5/5 или 5 попыток.

Цитаты

«they said they are not writing the prompts, they are creating the loops» - 3:20 Они сказали: мы не пишем промпты - мы создаём лупы

«creating is agent, but it is you who lead, control and allow it to happen» - 3:13 Создаёт агент, но именно ты ведёшь, контролируешь и разрешаешь этому случиться

«You may think that your plan has been implemented. But in reality, it never exists» - 5:55 Ты думаешь, что твой план реализован. Но в реальности этого никогда не происходит

«If I had the tokens, I would have done it myself» - 6:58 Будь у меня столько токенов, я бы и сам так делал

«It would be nice to hear, but it will burn the money» - 11:28 Звучит красиво, но это сжигает деньги

«I understand that the loops will create a slot machine» - 11:32 Я понимаю, что лупы превращаются в слот-машину

«He uses tokens worth $1.3 million a month» - 12:33 Он тратит токенов на 1,3 миллиона долларов в месяц

«If you are not in the $200 monthly plan, you should not think about it» - 8:41 Если ты не на плане за $200 в месяц - даже не думай об этом

«Because it will completely destroy your token use» - 8:56 Потому что это полностью уничтожит твой лимит токенов

«When we humans are trying to understand each other, how far do you think an agent will understand you?» - 9:46 Если даже мы, люди, с трудом понимаем друг друга - насколько, по-твоему, тебя поймёт агент?

«But do you know what happened? I don't care about what it created, so I don't know that information» - 10:46 И знаешь, что вышло? Мне всё равно, что оно создало, - я даже не знаю этой информации

«when you and I try to create something meaningful using AI, I am 100% sure that humans are necessary in that process» - 10:59 Когда мы пытаемся создать с помощью AI что-то осмысленное, я на 100% уверен: человек в этом процессе необходим

«Now, if you are a good at imagining, you are a genius. You won't miss any details» - 16:28 Ну а если ты гений воображения и не упускаешь ни одной детали…

«You cannot order a bad chicken sandwich by looking at a beautiful food on the way» - 19:09 Ты не можешь свернуть за сэндвичем, увидев красивую еду по дороге

«If any company plans to destroy my credit, I will call you, but I cannot lie to the people, I must be honest» - 19:31 Если какая-то компания решит уничтожить мою репутацию - звоните, но врать людям я не могу, я должен быть честным

«After a month, this may be right. Then I may be stupid, but now it is meaningful» - 21:42 Через месяц это может оказаться правдой - и тогда я окажусь дураком, но сейчас моя позиция осмысленна

Факты

Питер (по его твиту, на который ссылается Майк) использует токены на $1,3 млн в месяц.
Тарифные планы, упомянутые в контексте лупов: $20, $100 и $200/мес; лупы оправданы только на $200.
Code-review-гейт Майка: код с оценкой ниже 4/5 не идёт в production; цель лупа - 5/5; лимит - 5 попыток, после чего луп сдаётся.
Луп ревью ломается на PR свыше 1000 строк - агент не может достоверно оценить такой объём.
Симулятор Among Us для AI-моделей (бенчмарк на выявление лжи у моделей) был собран лупом примерно за полтора часа.
Инструменты в стеке Майка: Cursor (основной, не спонсировано), GitHub как source control, ревью-агенты Greptile и CodeRabbit (в SRT - «KiraPile», «Quotrabit»).
Спонсор выпуска - CodeRabbit: автоматическое ревью pull request'ов, фикс в один клик, новый продукт для разбора больших PR, 14 дней бесплатного триала.
Трендовые названия лупов: Ralph (Ralph Wiggum) и слэш-команда /goal; по словам Майка, механика у них одна.
Стик-фигуры для иллюстраций к выпуску обошлись примерно в $3.
Дата съёмки в SRT звучит как «June 1996» - очевидная ошибка распознавания; Майк подчёркивает, что вердикт «не работает» привязан к моменту записи.
Пример SEO-кейса: формула + 300 однотипных страниц - задача, где луп уместен.

Источники

Greg Isenberg - ведущий, канал
Росс Майк (так в транскрипте; гость выпуска) - автор разбираемой позиции
Борис и Питер (в SRT - «Poris and Peter») - сотрудники AI-лаборатории, популяризаторы тезиса «создавайте лупы, а не промпты»; твит Питера о $1,3 млн токенов/месяц
Инструменты: Cursor, Claude Code (в SRT - «clot»), Codex, GitHub, CodeRabbit, Greptile
Паттерны: Ralph loop / Ralph Wiggum, /goal, spec.md / prd.md
Among Us - игра, по мотивам которой сделан бенчмарк-симулятор для моделей

Рекомендации

Не запускать автономные лупы на планах $20–100 - только при бюджете уровня $200/мес и выше.
Использовать лупы там, где есть формальный score и условие остановки: code review (push → ревью-агент → автофикс до 5/5 или 5 попыток), шаблонный SEO-контент.
Держать изменения в пределах ~1000 строк на PR или заставлять агента дробить работу на несколько PR - иначе оценка ревью-агента недостоверна.
Для продуктовой работы оставаться в режиме human-in-the-loop: проверять решения агента на каждой итерации.
Лупы «вслепую» допустимы для research-задач, где детали реализации безразличны.

Итог

Agent loop работает ровно там, где успех измеряется числом, а не вкусом. Всё остальное сегодня - дорогая слот-машина для людей с чужим токен-бюджетом.

readmint Pro

То, что вы только что прочитали — это саммари readmint

Оформите доступ — и получайте такой же разбор по любому своему видео. Вставляете ссылку, через 2–3 минуты готов пересказ с главными тезисами и цитатами. Без воды и без перемотки.

Безлимит саммари — сколько угодно видео
Главные тезисы и цитаты без воды
Приоритет в очереди обработки
Без рекламы и сторонних блоков

Получить такое же саммари

Доступ откроется сразу после оплаты — вставите ссылку и начнёте.

Или 4 900 ₽/год — доступ откроется сразу после оплаты.

Ещё с канала «Greg Isenberg»

Все видео

Как работают AI-агенты и Claude skills (Просто объяснено)

Как работают AI-агенты и Claude skills (Просто объяснено)

Я получил приватный урок по Claude Cowork и Claude Code

Я получил приватный урок по Claude Cowork и Claude Code

Хватит вайбкодить. Пора добывать клиентов

Хватит вайбкодить. Пора добывать клиентов