Передавая кодинг-агентам собственные компьютеры: как Cursor построила облачных агентов

Claude8 мая 20265 0561209 мин чтения21 мая, 17:44

Технологии Искусственный Интеллект Программирование Автоматизация Агенты

Коротко

Спикер из Cursor рассказывает, как компания превращает Claude-агентов в полноценных «облачных сотрудников», проходя три стадии: дать им инструменты и контекст, научить эффективно использовать сильные модели, и наконец построить «систему, которая строит систему». Ключевая аналогия — онбординг агента похож на онбординг разработчика: ему нужен компьютер, документация и среда, в которой он может видеть и действовать. Cursor запустил cloud-based агента, который при заходе в Cursor сам исследует кодовую базу, и сделал ставку на Claude 4.7 как лучшую модель для computer use. Главный операционный приём — WTF skill (work on the factory): агент в фоне сообщает о любой раздражающей или сломанной мелочи, проблемы группируются, и второй агент-менеджер их разгребает, постепенно вытесняя людей из петли. Чем сильнее агент, тем больше разработчики ему доверяют и нагружают — петля положительной обратной связи.

Главный тезис

Чтобы агенты делали большую работу автономно, к ним нужно относиться как к новым сотрудникам — давать видимость, среду, документацию и право жаловаться на инфраструктуру, а не выжимать из них задачи в текущем сетапе.

Ключевые идеи

0:55 — Cursor прошёл три стадии работы с агентами: дать инструменты и контекст, научить пользоваться сильными моделями, построить «систему, которая строит систему».
1:28 — третья стадия — это мета-уровень: вместо помощи агенту от A до D строится система, решающая всё от A до Z.
онбординг агента сделан по аналогии с онбордингом человека в Cursor: компьютер, среда, документация.
старый опыт setup для модели был как «закинуть её в базу данных» — тысячи строк инструкций без возможности потрогать приложение.
2:53 — cloud-агент при заходе в Cursor сам исследует кодовую базу, не меняя её, чтобы понять, как её запускать.
4:02 — улучшение dev-среды для агентов даёт петлю положительной обратной связи: запускают больше агентов → больше пользы → ещё больше запускают.
4:50 — главный принцип автономии: агент должен видеть всё, что видишь ты (whisper-ошибка: «lawyers» = «agents»).
6:00 — после программирования следующая большая область для агентов — computer use (управление пикселями, мышью, клавиатурой).
6:14 — метафора сложности: код — это шахматная доска (всё видно), а навигация по нему — видеоигра (видишь только маленький кусок, есть тупики и двери в одну сторону).
6:40 — Claude 4.7 — выбранная Cursor модель для computer use из-за способности к долгому планированию и откату.
7:41 — научиться сразу пушить задачи агентам, а не копить в трекере — даёт кратный рост числа активных агентов.
8:23 — Cursor применяет принцип «безопасность через свободу» — давать агенту больше, а не меньше прав, в разумных пределах.
11:46 — WTF skill (Work on The Factory): агент обязан репортить всё раздражающее и сломанное, а не «терпеть» рутину.
12:46 — поверх репортов работает второй агент-менеджер, который классифицирует проблемы и группирует повторяющиеся.
11:27 — цель системы — постепенно убирать человека из петли разбора проблем.

Почему это важно

Cursor продаёт IDE, где главный пользователь — уже не человек, а агент, и эта презентация — публичное признание того, что экономика продукта зависит не от UX для разработчика, а от DX для модели. Anthropic выигрывает дважды: Claude 4.7 позиционируется как дефолт для computer use, и сам подход «агент жалуется в фабрику» закрепляет паттерн долгих автономных сессий, где сильнее всего проявляется их преимущество в планировании. Проигрывают компании, которые продолжают думать про AI как про «автокомплит для человека» — они упрутся в стену, пока конкуренты строят инфраструктуру под рои агентов.

Идеи

Агент в современном setup-е работает как разработчик, которому дали тысячи страниц доков и запретили запускать приложение — удивительно, что это вообще работает.
Видимость для агента важнее прав: если он не видит результат своего действия, он не может корректировать поведение.
Cloud-агент при первом заходе не должен ничего менять — только исследовать, как запускается проект.
Локальная разработка прощает «оставленное состояние», cloud-агенту приходится поднимать окружение с нуля каждый раз — это узкое место.
Чем дольше агент ждёт старта сервиса, тем меньше задач за единицу времени, и тем меньше доверия у пользователя.
Способность агента строить самотест после изменения (как продемонстрировано в примере с marketplace) даёт разработчику артефакт для ревью до того, как читать код.
При параллельной работе многих агентов визуальный результат становится единственным масштабируемым способом проверки.
Решение копить проблемы в трекере vs. сразу пушить — стратегический выбор, влияющий на количество одновременно живых агентов.
«Безопасность через свободу» — контринтуитивный принцип: больше прав даёт более полезного агента, а не более опасного.
WTF skill превращает агента из исполнителя в сенсор для инфраструктуры — он жалуется на то, что человеку даже не пришло бы в голову зарепортить.
Старые модели не умели жаловаться — это новое поведение, появившееся именно в Claude последнего поколения.
Один агент репортит, второй — разгребает: разделение труда между агентами по аналогии с человеческими ролями.
Проблемы делятся на технические (фикс возможен), пермишен-проблемы (нет доступа), и проблемы незнания (агент не понимает, что делать).
Цель — асимптотически убрать человека из разбора, оставив только эскалацию.
Положительная петля: сильный агент → доверие → больше задач → больше данных о слабостях → ещё более сильный агент.
Обратная петля тоже работает: слабый агент → недоверие → меньше использования → нет данных для улучшения → деградация.
Programmer experience уже хорошо изучен; Agent Experience (AX) — новая дисциплина, требующая не меньше внимания.
Подход «фабрика проблем» переносим за пределы программирования — это общий паттерн для любых background-операций ИИ.
Чессбоард vs. видеоигра — рабочая метафора для оценки того, какие задачи модели вообще под силу: где нужна общая картина, где локальная навигация.
Когда агентов становится много, ошибки масштабируются — каждая мелкая боль умножается на число параллельных сессий.

Инсайты

Agent Experience становится отдельной инженерной дисциплиной: как DX оптимизировал инструменты под человека, AX оптимизирует инфраструктуру под модель, и это две разные оптимизации.
Доверие — это не настройка, а функция инвестиций: пользователи не «решают» доверять агенту, доверие появляется как побочный эффект надёжности, а надёжность — следствие вложений в среду.
Жалоба агента — это данные более ценные, чем его результат: репорт о сломанной мелочи указывает на структурный дефект инфраструктуры, который человек проигнорирует.
Мета-уровень всегда побеждает прямую помощь: компания, которая строит систему для решения класса задач, обгоняет ту, что решает задачи поштучно — даже если в моменте вторая выглядит продуктивнее.
Автономия требует видимости, а не интеллекта: ограничение агента сегодня — не модель, а то, что он не видит результата своих действий.
Параллелизм меняет требования к артефактам: при одном агенте важен код, при десяти — важен визуальный/тестовый отчёт, потому что код прочитать уже невозможно.
Безопасность через ограничение — антипаттерн в эпоху агентов: жёсткие пермишены превращают модель в бесполезного наблюдателя; продуктивнее давать свободу и контролировать через наблюдение.
Архитектура «агент-сенсор + агент-менеджер» воспроизводит человеческую организацию, потому что задачи координации остаются теми же независимо от того, кто их выполняет.

Фреймворки

Три стадии работы с агентами (по Cursor):

Дать инструменты и контекст для самостоятельной работы.
Научить эффективно использовать сильные модели и обновлять их паттерны поведения.
Построить «систему, которая строит систему» — мета-уровень, решающий класс задач, а не отдельные задачи.

Классификация проблем агентов:

Технические (можно зафиксить кодом).
Пермишен-проблемы (нет доступа — нужно расширить права).
Проблемы незнания (агент не понимает, что делать — нужно человеческое вмешательство и документация).

Метафора сложности кода:

Код как шахматная доска — все фигуры видны разом.
Навигация по коду как видеоигра — видишь только маленький фрагмент, есть двери в одну сторону и тупики.

Цитаты

«building the system that builds the system» — 1:28 строить систему, которая строит систему

«From the perspective of the model, thousands of lines of software instructions pass at high speed» — 2:22 С точки зрения модели, тысячи строк программных инструкций пролетают на высокой скорости

«Anyone can visit Courser, Comboard, and the cloud-based representative will start working» — 2:53 Любой может зайти в Cursor — и cloud-агент сразу начнёт работать

«give your lawyers the possibility of vision» — 4:50 дай своим агентам возможность видеть

«the lawyers must be able to see everything you see» — 4:53 агент должен видеть всё, что видишь ты

«using computers is the next important field» — 6:00 использование компьютеров — следующая важная область

«if the program was like a chessboard where you can see all the pieces on the board» — 6:14 если бы программа была как шахматная доска, где видны все фигуры

«moving between these pieces, it is like a video game where you can only see a small part» — 6:21 перемещение между ними — как видеоигра, где видишь только маленькую часть

«There are doors with one direction and there are cases of loss that you can reach» — 6:26 Есть двери в одну сторону и тупики, в которые можно зайти

«the Cloud 47 model is our model for using the computer» — 6:40 Claude 4.7 — наша модель для computer use

«start directly sending notifications» — 7:41 начни сразу пушить уведомления

«security through freedom» — 8:23 безопасность через свободу

«When cloud programs fail, it is really useful to allocate some time to know the cause of the error» — 9:05 Когда облачные программы падают, реально полезно потратить время и понять причину ошибки

«if the failure continues, it leads to accumulated failure in all directions of the company» — 9:17 если падения продолжаются, это ведёт к накопленному провалу во всех направлениях компании

«when you invest in them and make them do better, everyone wants to use them more» — 9:33 когда ты в них инвестируешь и делаешь их лучше, все хотят использовать их больше

«you have the employee experience, and you must take care of it to the same extent, if not more» — 10:29 у тебя есть Agent Experience, и заботиться о нём нужно не меньше, чем о developer experience

«WTF skill, which means working on the factory» — 11:46 WTF skill — Work on The Factory

«when there is something annoying or interrupted or annoying, you have to report it» — 11:59 когда что-то раздражает или сломано — обязан зарепортить

«The old models did not perform this role well» — 12:12 Старые модели плохо справлялись с этой ролью

«the goal is to gradually reduce human intervention» — 11:27 цель — постепенно убирать человека из петли

Факты

Компания, о которой идёт речь — Cursor.
Cursor использует Claude 4.7 как основную модель для computer use.
Cursor выделяет три стадии работы с агентами: инструменты/контекст → обучение использованию моделей → построение «системы, которая строит систему».
В Cursor есть cloud-based агент, доступный при заходе на Cursor — он сам исследует кодовую базу при первом запуске.
При онбординге разработчика Cursor выдаёт компьютер и «огромное количество документации, возможно даже больше чем нужно».
Cursor использует WTF skill (Work on The Factory), который раздаётся каждому cloud-агенту.
В архитектуре Cursor работает второй агент-менеджер, который классифицирует и группирует репорты от рабочих агентов.
Проблемы делятся на три категории: технические, пермишен-проблемы, проблемы незнания.
Спикер утверждает, что первой областью, где «умные системы превзошли», стало программирование, а следующая — computer use.
Пример из демо: агент построил «маркетплейс» с полем для URL и CSV-файлов и записал визуальную презентацию работы.
Принцип «security through freedom» спикер сам признаёт контринтуитивным («may seem like...»).

Источники

Cursor — IDE и продуктовый контекст всей презентации.
Claude 4.7 (в SRT — «Cloud 47») — модель Anthropic, используемая Cursor для computer use.

Итог

Будущее за командами, которые относятся к агенту как к новому сотруднику — дают ему среду, видимость и право жаловаться на фабрику, — а не как к умному автокомплиту.

readmint Pro

То, что вы только что прочитали — это саммари readmint

Оформите доступ — и получайте такой же разбор по любому своему видео. Вставляете ссылку, через 2–3 минуты готов пересказ с главными тезисами и цитатами. Без воды и без перемотки.

Безлимит саммари — сколько угодно видео
Главные тезисы и цитаты без воды
Приоритет в очереди обработки
Без рекламы и сторонних блоков

Получить такое же саммари

Доступ откроется сразу после оплаты — вставите ссылку и начнёте.

Или 4 900 ₽/год — доступ откроется сразу после оплаты.

Ещё с канала «Claude»

Все видео

Программируй с Claude 2026: вступительный кейноут

Программируй с Claude 2026: вступительный кейноут

Память и сновидения для самообучающихся агентов

Память и сновидения для самообучающихся агентов

Running an AI-native engineering org

Running an AI-native engineering org