Передавая кодинг-агентам собственные компьютеры: как Cursor построила облачных агентов

Claude8 мая 20264 88611721 мая, 17:44

Технологии Искусственный Интеллект Программирование Автоматизация Агенты

Коротко

Спикер из Cursor описывает, как компания перестраивает работу вокруг автономных ИИ-агентов: главный дефицит теперь не интеллект модели, а способность людей дать ей инструменты, контекст и достаточно амбициозные задачи. Компания прошла три стадии — оснащение агентов инструментами, обучение их эффективному использованию и финальную — «построение системы, которая строит систему». Для онбординга агентов построили облачного агента-настройщика, который сам исследует репозиторий и поднимает окружение, а также новый CLI для управления сервисами в облачных запусках. Введён ключевой навык WTF («Work on The Factory»), заставляющий каждого облачного агента сообщать о любой поломке или неудобстве в системный лог, откуда менеджеры-агенты сортируют проблемы по категориям. Конечная цель — самоулучшающаяся система, где вмешательство человека постепенно сводится к нулю, а паттерны выходят за пределы программирования.

Главный тезис

Узкое место развития ИИ — не сама модель, а человеческая инфраструктура вокруг неё; поэтому работа разработчика смещается от решения отдельных задач к построению самоулучшающейся системы, которая решает все задачи сразу.

Ключевые идеи

0:09 — модели стали настолько продвинутыми, что вызов сместился с интеллекта модели на способность людей дать ей инструменты, контекст и амбициозные цели.
0:38 — миссия Cursor — безопасно «освободить» агентов и поручать им всё более крупные задачи.
0:49 — пройдено три стадии: оснащение инструментами и контекстом, обучение эффективному использованию моделей, построение системы, которая строит систему.
1:22 — третья стадия означает не помогать агентам решать задачи «от А до Г», а построить систему, решающую всё от А до Я.
2:12 — прежний онбординг модели был похож на сброс модели в кодовую базу: тысячи строк кода мелькают, задача есть, а понимания окружения нет.
2:44 — построен облачный агент-настройщик, который исследует репозиторий, ничего не меняя, и выясняет, как его запускать.
3:35 — облачные агенты каждый раз поднимают окружение с нуля, поэтому любая мелкая проблема умножается на число запусков.
3:59 — создан новый CLI, чтобы агенты могли запускать сервисы, ждать их готовности и проверять статус вместо неэффективного «сна».
4:21 — улучшение окружений запускает положительную обратную петлю: лучше среда → больше запусков агентов → больше пользы.
4:44 — первый принцип автономии: видимость — агент должен видеть всё, что видит человек, включая чужие диалоги агентов.
6:08 — программирование как шахматы (все фигуры на виду), а использование компьютера как видеоигра (виден лишь фрагмент, есть двери в одну сторону и проигрышные состояния).
6:34 — Claude 4.7 объявлен моделью Cursor для использования компьютера: сильные навыки рефлексии, отката назад и общего интеллекта.
6:42 — агент записывает демо своей работы, что даёт разработчику быстрый способ проверки до чтения кода.
8:17 — концепция «безопасность через свободу»: отпуская облачные программы, разработчик освобождает и себя от управления ресурсами и переключения контекста.
11:40 — навык WTF («Work on The Factory») требует от каждого агента сообщать обо всём сломанном или запутанном, чтобы улучшать инструменты, а не работать рутинно.
13:32 — эти паттерны выйдут за пределы программирования: облачная разработка по сути не чисто программная задача.

Почему это важно

Это взгляд изнутри компании-лидера ИИ-кодинга на то, как меняется сама профессия разработчика: от ручного решения задач — к проектированию самоулучшающихся агентных систем. Выигрывают здесь Cursor (продаёт инфраструктуру для «освобождения агентов») и Anthropic, чья модель Claude 4.7 позиционируется как лучшая для использования компьютера — следующего после кода рубежа. Спикер сознательно строит аналогию между онбордингом ИИ-агентов и наймом людей-разработчиков, превращая управленческие практики (трекеры задач, триаж, документация, обратная связь) в архитектуру для агентов. Главная ставка — что компании, освоившие «фабрику», где агенты сами чинят и улучшают рабочие процессы, получат масштабируемое преимущество, а сами паттерны перенесутся за пределы программирования.

Идеи

Дефицит сместился: раньше не хватало ума модели, теперь не хватает людей, способных дать ей нормальные задачи и контекст.
Онбординг человека-разработчика (компьютер, настройка среды, гора документации) стал прямым шаблоном для онбординга агента.
У Cursor «возможно, слишком много» документации — её пришлось переписывать в упрощённые версии специально для агентов.
Агент-настройщик намеренно ничего не меняет в коде на этапе исследования — только разбирается, как репозиторий запускается.
Настройка окружения — это не только «что запустить», но и переменные среды и нужные разрешения; процесс интерактивный, с участием разработчика.
При локальной разработке сервисы оставляют запущенными; облачные агенты этой роскоши лишены — каждый раз с нуля.
Агенты раньше «спали» в ожидании запуска сервисов — неэффективная трата ресурсов, которую закрыли через CLI.
Агентам дали мультиинструмент для создания тестовых аккаунтов и логина в сторонние сервисы.
Видимость двусторонняя: если человек сам поменял приложение, агент должен увидеть эти изменения.
Агент должен видеть диалоги других агентов — так же, как человек просматривает чужую переписку при отладке.
Промах не в том, что модель не умеет кликать пиксели — семейство Claude это умеет; сложность в навигации по частично наблюдаемому миру.
В использовании компьютера есть «двери в одну сторону» и проигрышные состояния — нужна рефлексия и умение откатываться.
Демо-запись агента — это инструмент ревью: разработчик смотрит работающее демо вместо чтения тонн кода.
Когда нужно поручить агентам больше: либо перестать вести баги в трекере и слать их сразу в очередь алертов, либо давать крупные проекты на долгий автономный прогон.
Спикера удивило, насколько верным оказалось предположение «дай агентам мощнее — разработчики начнут делать вещи интереснее».
Облако защищает разработчика: облачные программы не лезут в его локальные переменные среды.
Накопленные сбои дают «кумулятивный отказ» по всей компании — поэтому чинить надо системно.
Доверие к агентам растёт нелинейно: вложился — стало лучше — все хотят пользоваться больше — хочется вложиться ещё.
«Опыт сотрудника» (агента) для Cursor важен не меньше, а то и больше, чем «опыт разработчика».
Менеджеры-агенты делают триаж: технические проблемы, проблемы доступа/разрешений и проблемы «незнания».
Проблемы «незнания» требуют человеческого вмешательства — подсказать правильный путь решения.
Старые модели плохо «работали на фабрику» — не жаловались; новые сами фиксируют, что сломано или запутано.
Решать проблему «с первого раза» одним агентом неэффективно — слишком много повторов; что-то случается лишь однажды.
Решение валидируют так: один агент чинит, затем набор облачных агентов проверяет фикс при изменённых условиях разработки.
К человеку фикс приходит уже с высоким уровнем доверия — проверенный на наборе оценок.
Цель — постепенно убрать человека из контура: агенты решают полностью, без ревью.
WTF-навык получает каждый облачный агент — это почти дословно те же инструкции, что и в управленческой схеме.
Спикер сравнивает эти навыки с фоновыми процессами ОС — сборкой мусора и очисткой.
Облачная разработка — не чисто программная задача: много переменных, и лишь часть из них про код.
Спикера можно найти в X по нику XBISME для разговора о «идентичных самоулучшающихся системах».

Инсайты

Прогресс ИИ упирается не в модель, а в организационную и инструментальную обвязку вокруг неё — узкое место переехало из алгоритма в инфраструктуру.
Управление агентами конвергирует к управлению людьми: трекеры, триаж, документация и онбординг переносятся почти дословно.
Зрелость автономной системы измеряется не качеством одного решения, а скоростью, с которой решение обобщается на всю организацию.
Частичная наблюдаемость среды — фундаментально более тяжёлый класс задач, чем полностью наблюдаемая: она требует не точности действий, а стратегии и обратимости.
Демонстрация (видимый артефакт) масштабируется как способ верификации лучше, чем чтение кода, когда параллельно работают десятки агентов.
Надёжность достигается не «решить с первого раза», а статистически — прогоном фикса через множество вариаций условий.
Автономия и безопасность не противоречат, а усиливают друг друга: ограничение области действия агента освобождает и человека, и систему.
Внедрение агентов имеет петлю положительной обратной связи: качество порождает доверие, доверие порождает использование, использование оправдывает инвестиции.
Локальные сбои в распределённой агентной системе не остаются локальными — они накапливаются в системный отказ, поэтому экономически выгодно чинить корень.
Способность системы жаловаться на саму себя — необходимое условие её самоулучшения; «молчаливый» исполнитель не даёт сигналов для оптимизации.
Сдвиг роли человека: от исполнителя задач — к программисту системы, которая исполняет задачи.
Паттерны, отработанные в программировании, — это прототип для любой автономной работы, потому что код лишь первая, самая удобная для ИИ область.

Фреймворки

Три стадии освобождения агентов:

Оснастить агентов инструментами и контекстом для большей автономности.
Научиться использовать более эффективные модели — обновлять их паттерны и поведение.
«Построить систему, которая строит систему» — решать всё «от А до Я», а не «от А до Г».

Принципы автономии:

Видимость — агент видит всё, что видит человек (приложение, изменения, диалоги других агентов).
Инструменты — агент может делать всё, что может человек, при разумных ограничениях безопасности.
Качество данных и инструкций — высококачественная кодовая база и чёткие инструкции для качественного результата.

Три категории проблем при триаже:

Технические — можно устранить напрямую.
Доступы/разрешения — у агента нет прав, нужно их выдать.
«Незнание» — агент не знает, что делать, нужно человеческое руководство.

Два режима выдачи агентам большей работы:

Поток мелких задач/багов — слать сразу в очередь алертов, минуя трекер.
Крупные проекты — давать автономному агенту большие блоки работы на долгий прогон.

Цитаты

«لم يعود التحدي يكمن في ذكاء النموذج نفسه» — 0:13 Вызов больше не в интеллекте самой модели

«نرى أن مهمتنا هي تحرير وكلائنا بأمان» — 0:38 Наша миссия — безопасно освободить наших агентов

«بناء النظام الذي يبني النظام» — 1:22 Построить систему, которая строит систему

«تستغل هذا الوقت لبناء نظام قادر على حل جميع المشكلات من ألف إلى يا» — 1:32 Ты тратишь это время на построение системы, способной решить все проблемы от А до Я

«تجربة الأعداد كانت أشبه بإضافة النموذج إلى قاعدة بيانات» — 2:12 Опыт онбординга был похож на добавление модели в базу данных

«يجب ان يتمكن الوكلاء من رؤية كل ما تراه انت ايضا» — 4:47 Агенты должны видеть всё, что видишь и ты

«البرمجة مثل شطرنج حيث يمكنك رؤية جميع القطع على الرقعة» — 6:08 Программирование как шахматы, где видны все фигуры на доске

«التنقل بين هذه القطع فهو أشبه بلعبة فيديو» — 6:14 Навигация между этими фигурами — это скорее видеоигра

«نموذج كلاود 47 هو نموذجنا لاستخدام الحاسوب» — 6:34 Модель Claude 4.7 — это наша модель для использования компьютера

«مفهومة الأمان من خلال الحرية والتي قد تبدو كدعاية أرويلية» — 8:17 Концепция «безопасность через свободу», которая может звучать как оруэлловская пропаганда

«لقد فجئنا جميعا بمدى متعة البرمجة بفضل هذه الطريقة» — 8:42 Мы все были удивлены, насколько программирование стало приятным благодаря этому способу

«إذا استمرت حالات الفشل فإنها تؤدي إلى فشل متراكم في جميع أنحاء الشركة» — 9:12 Если сбои продолжаются, они приводят к накопленному отказу по всей компании

«مهارة WTF التي تعني العمل على المصنع» — 11:40 Навык WTF, что означает «работа на фабрике»

«النماذج القديمة لم تكن تؤدي هذا الدور بشكل جيد» — 12:05 Старые модели плохо справлялись с этой ролью

«جعل الوكيل يحلها من أول مرة لم يكن فعالا» — 12:29 Заставлять агента решать с первого раза было неэффективно

«الهدف هو تقليل التدخل البشري تدريجياً» — 11:23 Цель — постепенно сократить человеческое вмешательство

«هذا تغيير مهم حقا في طريقة تفكيرك في عملك حيث أنت تبرمج النظام» — 9:43 Это действительно важная перемена в том, как ты думаешь о своей работе: ты программируешь систему

«خبرة تطوير الحوسبة السحابية ليست مشكلة برمجية بالمعنى الحرفي» — 13:38 Опыт облачной разработки — не программная задача в буквальном смысле

Факты

Спикер представляет компанию Cursor (كورسور) — инструмент для ИИ-ассистированной разработки.
Cursor прошёл три стадии в процессе работы с агентами.
Построен облачный агент-настройщик (وكيل إعداد سحابي), доступный любому для настройки своего репозитория.
Создан новый CLI-инструмент для управления сервисами в облачных запусках (запуск, ожидание готовности, проверка статуса).
Агентам дан мультиинструмент для создания тестовых аккаунтов и логина в сторонние сервисы.
Claude 4.7 (в SRT — «كلاود 47») назван моделью Cursor для использования компьютера; речь идёт о семействе моделей Claude.
Использование компьютера определено как ввод/вывод «сырых пикселей» с управлением мышью и клавиатурой.
Ключевой навык называется WTF — «Work on The Factory» и выдаётся каждому облачному агенту.
Проблемы при триаже делятся на три категории: технические, доступа/разрешений и «незнания».
Многие разработчики запускают облачных агентов ежедневно.
Фиксы валидируются прогоном через набор облачных агентов с изменёнными условиями разработки («набор оценок»).
Контакт спикера в X — ник XBISME; сайт компании — cursor.com (в SRT упомянут как «كيرسور.com»).
Спикер предлагает связаться с ним для разговора о «идентичных самоулучшающихся системах».

Источники

Cursor (cursor.com) — компания и продукт спикера.
Claude 4.7 / семейство моделей Claude (Anthropic) — модель для использования компьютера.
Аккаунт спикера в X под ником XBISME.

Итог

Будущее разработки — не в более умных моделях, а в людях, которые перестают решать задачи руками и начинают строить самоулучшающуюся «фабрику» агентов, чинящую и обучающую саму себя.

readmint Pro

Понравилось саммари? Сделайте такое же по своему видео

Вставьте ссылку на любое YouTube-видео — readmint расшифрует его и соберёт пересказ с главными тезисами и цитатами. Без воды и перемотки.

Безлимит саммари — сколько угодно видео
Главные тезисы и цитаты без воды
Приоритет в очереди обработки
Без рекламы и сторонних блоков

Саммари своего видео

Вставьте ссылку на YouTube, разбор будет готов за 2–3 минуты.