Коротко
Спикер из Cursor рассказывает, как компания превращает Claude-агентов в полноценных «облачных сотрудников», проходя три стадии: дать им инструменты и контекст, научить эффективно использовать сильные модели, и наконец построить «систему, которая строит систему». Ключевая аналогия — онбординг агента похож на онбординг разработчика: ему нужен компьютер, документация и среда, в которой он может видеть и действовать. Cursor запустил cloud-based агента, который при заходе в Cursor сам исследует кодовую базу, и сделал ставку на Claude 4.7 как лучшую модель для computer use. Главный операционный приём — WTF skill (work on the factory): агент в фоне сообщает о любой раздражающей или сломанной мелочи, проблемы группируются, и второй агент-менеджер их разгребает, постепенно вытесняя людей из петли. Чем сильнее агент, тем больше разработчики ему доверяют и нагружают — петля положительной обратной связи.
Главный тезис
Чтобы агенты делали большую работу автономно, к ним нужно относиться как к новым сотрудникам — давать видимость, среду, документацию и право жаловаться на инфраструктуру, а не выжимать из них задачи в текущем сетапе.
Ключевые идеи
- 0:55 — Cursor прошёл три стадии работы с агентами: дать инструменты и контекст, научить пользоваться сильными моделями, построить «систему, которая строит систему».
- 1:28 — третья стадия — это мета-уровень: вместо помощи агенту от A до D строится система, решающая всё от A до Z.
- онбординг агента сделан по аналогии с онбордингом человека в Cursor: компьютер, среда, документация.
- старый опыт setup для модели был как «закинуть её в базу данных» — тысячи строк инструкций без возможности потрогать приложение.
- 2:53 — cloud-агент при заходе в Cursor сам исследует кодовую базу, не меняя её, чтобы понять, как её запускать.
- 4:02 — улучшение dev-среды для агентов даёт петлю положительной обратной связи: запускают больше агентов → больше пользы → ещё больше запускают.
- 4:50 — главный принцип автономии: агент должен видеть всё, что видишь ты (whisper-ошибка: «lawyers» = «agents»).
- 6:00 — после программирования следующая большая область для агентов — computer use (управление пикселями, мышью, клавиатурой).
- 6:14 — метафора сложности: код — это шахматная доска (всё видно), а навигация по нему — видеоигра (видишь только маленький кусок, есть тупики и двери в одну сторону).
- 6:40 — Claude 4.7 — выбранная Cursor модель для computer use из-за способности к долгому планированию и откату.
- 7:41 — научиться сразу пушить задачи агентам, а не копить в трекере — даёт кратный рост числа активных агентов.
- 8:23 — Cursor применяет принцип «безопасность через свободу» — давать агенту больше, а не меньше прав, в разумных пределах.
- 11:46 — WTF skill (Work on The Factory): агент обязан репортить всё раздражающее и сломанное, а не «терпеть» рутину.
- 12:46 — поверх репортов работает второй агент-менеджер, который классифицирует проблемы и группирует повторяющиеся.
- 11:27 — цель системы — постепенно убирать человека из петли разбора проблем.
Почему это важно
Cursor продаёт IDE, где главный пользователь — уже не человек, а агент, и эта презентация — публичное признание того, что экономика продукта зависит не от UX для разработчика, а от DX для модели. Anthropic выигрывает дважды: Claude 4.7 позиционируется как дефолт для computer use, и сам подход «агент жалуется в фабрику» закрепляет паттерн долгих автономных сессий, где сильнее всего проявляется их преимущество в планировании. Проигрывают компании, которые продолжают думать про AI как про «автокомплит для человека» — они упрутся в стену, пока конкуренты строят инфраструктуру под рои агентов.
Идеи
- Агент в современном setup-е работает как разработчик, которому дали тысячи страниц доков и запретили запускать приложение — удивительно, что это вообще работает.
- Видимость для агента важнее прав: если он не видит результат своего действия, он не может корректировать поведение.
- Cloud-агент при первом заходе не должен ничего менять — только исследовать, как запускается проект.
- Локальная разработка прощает «оставленное состояние», cloud-агенту приходится поднимать окружение с нуля каждый раз — это узкое место.
- Чем дольше агент ждёт старта сервиса, тем меньше задач за единицу времени, и тем меньше доверия у пользователя.
- Способность агента строить самотест после изменения (как продемонстрировано в примере с marketplace) даёт разработчику артефакт для ревью до того, как читать код.
- При параллельной работе многих агентов визуальный результат становится единственным масштабируемым способом проверки.
- Решение копить проблемы в трекере vs. сразу пушить — стратегический выбор, влияющий на количество одновременно живых агентов.
- «Безопасность через свободу» — контринтуитивный принцип: больше прав даёт более полезного агента, а не более опасного.
- WTF skill превращает агента из исполнителя в сенсор для инфраструктуры — он жалуется на то, что человеку даже не пришло бы в голову зарепортить.
- Старые модели не умели жаловаться — это новое поведение, появившееся именно в Claude последнего поколения.
- Один агент репортит, второй — разгребает: разделение труда между агентами по аналогии с человеческими ролями.
- Проблемы делятся на технические (фикс возможен), пермишен-проблемы (нет доступа), и проблемы незнания (агент не понимает, что делать).
- Цель — асимптотически убрать человека из разбора, оставив только эскалацию.
- Положительная петля: сильный агент → доверие → больше задач → больше данных о слабостях → ещё более сильный агент.
- Обратная петля тоже работает: слабый агент → недоверие → меньше использования → нет данных для улучшения → деградация.
- Programmer experience уже хорошо изучен; Agent Experience (AX) — новая дисциплина, требующая не меньше внимания.
- Подход «фабрика проблем» переносим за пределы программирования — это общий паттерн для любых background-операций ИИ.
- Чессбоард vs. видеоигра — рабочая метафора для оценки того, какие задачи модели вообще под силу: где нужна общая картина, где локальная навигация.
- Когда агентов становится много, ошибки масштабируются — каждая мелкая боль умножается на число параллельных сессий.
Инсайты
- Agent Experience становится отдельной инженерной дисциплиной: как DX оптимизировал инструменты под человека, AX оптимизирует инфраструктуру под модель, и это две разные оптимизации.
- Доверие — это не настройка, а функция инвестиций: пользователи не «решают» доверять агенту, доверие появляется как побочный эффект надёжности, а надёжность — следствие вложений в среду.
- Жалоба агента — это данные более ценные, чем его результат: репорт о сломанной мелочи указывает на структурный дефект инфраструктуры, который человек проигнорирует.
- Мета-уровень всегда побеждает прямую помощь: компания, которая строит систему для решения класса задач, обгоняет ту, что решает задачи поштучно — даже если в моменте вторая выглядит продуктивнее.
- Автономия требует видимости, а не интеллекта: ограничение агента сегодня — не модель, а то, что он не видит результата своих действий.
- Параллелизм меняет требования к артефактам: при одном агенте важен код, при десяти — важен визуальный/тестовый отчёт, потому что код прочитать уже невозможно.
- Безопасность через ограничение — антипаттерн в эпоху агентов: жёсткие пермишены превращают модель в бесполезного наблюдателя; продуктивнее давать свободу и контролировать через наблюдение.
- Архитектура «агент-сенсор + агент-менеджер» воспроизводит человеческую организацию, потому что задачи координации остаются теми же независимо от того, кто их выполняет.
Фреймворки
Три стадии работы с агентами (по Cursor):
- Дать инструменты и контекст для самостоятельной работы.
- Научить эффективно использовать сильные модели и обновлять их паттерны поведения.
- Построить «систему, которая строит систему» — мета-уровень, решающий класс задач, а не отдельные задачи.
Классификация проблем агентов:
- Технические (можно зафиксить кодом).
- Пермишен-проблемы (нет доступа — нужно расширить права).
- Проблемы незнания (агент не понимает, что делать — нужно человеческое вмешательство и документация).
Метафора сложности кода:
- Код как шахматная доска — все фигуры видны разом.
- Навигация по коду как видеоигра — видишь только маленький фрагмент, есть двери в одну сторону и тупики.
Цитаты
«building the system that builds the system» — 1:28 строить систему, которая строит систему
«From the perspective of the model, thousands of lines of software instructions pass at high speed» — 2:22 С точки зрения модели, тысячи строк программных инструкций пролетают на высокой скорости
«Anyone can visit Courser, Comboard, and the cloud-based representative will start working» — 2:53 Любой может зайти в Cursor — и cloud-агент сразу начнёт работать
«give your lawyers the possibility of vision» — 4:50 дай своим агентам возможность видеть
«the lawyers must be able to see everything you see» — 4:53 агент должен видеть всё, что видишь ты
«using computers is the next important field» — 6:00 использование компьютеров — следующая важная область
«if the program was like a chessboard where you can see all the pieces on the board» — 6:14 если бы программа была как шахматная доска, где видны все фигуры
«moving between these pieces, it is like a video game where you can only see a small part» — 6:21 перемещение между ними — как видеоигра, где видишь только маленькую часть
«There are doors with one direction and there are cases of loss that you can reach» — 6:26 Есть двери в одну сторону и тупики, в которые можно зайти
«the Cloud 47 model is our model for using the computer» — 6:40 Claude 4.7 — наша модель для computer use
«start directly sending notifications» — 7:41 начни сразу пушить уведомления
«security through freedom» — 8:23 безопасность через свободу
«When cloud programs fail, it is really useful to allocate some time to know the cause of the error» — 9:05 Когда облачные программы падают, реально полезно потратить время и понять причину ошибки
«if the failure continues, it leads to accumulated failure in all directions of the company» — 9:17 если падения продолжаются, это ведёт к накопленному провалу во всех направлениях компании
«when you invest in them and make them do better, everyone wants to use them more» — 9:33 когда ты в них инвестируешь и делаешь их лучше, все хотят использовать их больше
«you have the employee experience, and you must take care of it to the same extent, if not more» — 10:29 у тебя есть Agent Experience, и заботиться о нём нужно не меньше, чем о developer experience
«WTF skill, which means working on the factory» — 11:46 WTF skill — Work on The Factory
«when there is something annoying or interrupted or annoying, you have to report it» — 11:59 когда что-то раздражает или сломано — обязан зарепортить
«The old models did not perform this role well» — 12:12 Старые модели плохо справлялись с этой ролью
«the goal is to gradually reduce human intervention» — 11:27 цель — постепенно убирать человека из петли
Факты
- Компания, о которой идёт речь — Cursor.
- Cursor использует Claude 4.7 как основную модель для computer use.
- Cursor выделяет три стадии работы с агентами: инструменты/контекст → обучение использованию моделей → построение «системы, которая строит систему».
- В Cursor есть cloud-based агент, доступный при заходе на Cursor — он сам исследует кодовую базу при первом запуске.
- При онбординге разработчика Cursor выдаёт компьютер и «огромное количество документации, возможно даже больше чем нужно».
- Cursor использует WTF skill (Work on The Factory), который раздаётся каждому cloud-агенту.
- В архитектуре Cursor работает второй агент-менеджер, который классифицирует и группирует репорты от рабочих агентов.
- Проблемы делятся на три категории: технические, пермишен-проблемы, проблемы незнания.
- Спикер утверждает, что первой областью, где «умные системы превзошли», стало программирование, а следующая — computer use.
- Пример из демо: агент построил «маркетплейс» с полем для URL и CSV-файлов и записал визуальную презентацию работы.
- Принцип «security through freedom» спикер сам признаёт контринтуитивным («may seem like...»).
Источники
- Cursor — IDE и продуктовый контекст всей презентации.
- Claude 4.7 (в SRT — «Cloud 47») — модель Anthropic, используемая Cursor для computer use.
Итог
Будущее за командами, которые относятся к агенту как к новому сотруднику — дают ему среду, видимость и право жаловаться на фабрику, — а не как к умному автокомплиту.