Коротко
Спикер из Cursor описывает, как компания перестраивает работу вокруг автономных ИИ-агентов: главный дефицит теперь не интеллект модели, а способность людей дать ей инструменты, контекст и достаточно амбициозные задачи. Компания прошла три стадии — оснащение агентов инструментами, обучение их эффективному использованию и финальную — «построение системы, которая строит систему». Для онбординга агентов построили облачного агента-настройщика, который сам исследует репозиторий и поднимает окружение, а также новый CLI для управления сервисами в облачных запусках. Введён ключевой навык WTF («Work on The Factory»), заставляющий каждого облачного агента сообщать о любой поломке или неудобстве в системный лог, откуда менеджеры-агенты сортируют проблемы по категориям. Конечная цель — самоулучшающаяся система, где вмешательство человека постепенно сводится к нулю, а паттерны выходят за пределы программирования.
Главный тезис
Узкое место развития ИИ — не сама модель, а человеческая инфраструктура вокруг неё; поэтому работа разработчика смещается от решения отдельных задач к построению самоулучшающейся системы, которая решает все задачи сразу.
Ключевые идеи
- 0:09 — модели стали настолько продвинутыми, что вызов сместился с интеллекта модели на способность людей дать ей инструменты, контекст и амбициозные цели.
- 0:38 — миссия Cursor — безопасно «освободить» агентов и поручать им всё более крупные задачи.
- 0:49 — пройдено три стадии: оснащение инструментами и контекстом, обучение эффективному использованию моделей, построение системы, которая строит систему.
- 1:22 — третья стадия означает не помогать агентам решать задачи «от А до Г», а построить систему, решающую всё от А до Я.
- 2:12 — прежний онбординг модели был похож на сброс модели в кодовую базу: тысячи строк кода мелькают, задача есть, а понимания окружения нет.
- 2:44 — построен облачный агент-настройщик, который исследует репозиторий, ничего не меняя, и выясняет, как его запускать.
- 3:35 — облачные агенты каждый раз поднимают окружение с нуля, поэтому любая мелкая проблема умножается на число запусков.
- 3:59 — создан новый CLI, чтобы агенты могли запускать сервисы, ждать их готовности и проверять статус вместо неэффективного «сна».
- 4:21 — улучшение окружений запускает положительную обратную петлю: лучше среда → больше запусков агентов → больше пользы.
- 4:44 — первый принцип автономии: видимость — агент должен видеть всё, что видит человек, включая чужие диалоги агентов.
- 6:08 — программирование как шахматы (все фигуры на виду), а использование компьютера как видеоигра (виден лишь фрагмент, есть двери в одну сторону и проигрышные состояния).
- 6:34 — Claude 4.7 объявлен моделью Cursor для использования компьютера: сильные навыки рефлексии, отката назад и общего интеллекта.
- 6:42 — агент записывает демо своей работы, что даёт разработчику быстрый способ проверки до чтения кода.
- 8:17 — концепция «безопасность через свободу»: отпуская облачные программы, разработчик освобождает и себя от управления ресурсами и переключения контекста.
- 11:40 — навык WTF («Work on The Factory») требует от каждого агента сообщать обо всём сломанном или запутанном, чтобы улучшать инструменты, а не работать рутинно.
- 13:32 — эти паттерны выйдут за пределы программирования: облачная разработка по сути не чисто программная задача.
Почему это важно
Это взгляд изнутри компании-лидера ИИ-кодинга на то, как меняется сама профессия разработчика: от ручного решения задач — к проектированию самоулучшающихся агентных систем. Выигрывают здесь Cursor (продаёт инфраструктуру для «освобождения агентов») и Anthropic, чья модель Claude 4.7 позиционируется как лучшая для использования компьютера — следующего после кода рубежа. Спикер сознательно строит аналогию между онбордингом ИИ-агентов и наймом людей-разработчиков, превращая управленческие практики (трекеры задач, триаж, документация, обратная связь) в архитектуру для агентов. Главная ставка — что компании, освоившие «фабрику», где агенты сами чинят и улучшают рабочие процессы, получат масштабируемое преимущество, а сами паттерны перенесутся за пределы программирования.
Идеи
- Дефицит сместился: раньше не хватало ума модели, теперь не хватает людей, способных дать ей нормальные задачи и контекст.
- Онбординг человека-разработчика (компьютер, настройка среды, гора документации) стал прямым шаблоном для онбординга агента.
- У Cursor «возможно, слишком много» документации — её пришлось переписывать в упрощённые версии специально для агентов.
- Агент-настройщик намеренно ничего не меняет в коде на этапе исследования — только разбирается, как репозиторий запускается.
- Настройка окружения — это не только «что запустить», но и переменные среды и нужные разрешения; процесс интерактивный, с участием разработчика.
- При локальной разработке сервисы оставляют запущенными; облачные агенты этой роскоши лишены — каждый раз с нуля.
- Агенты раньше «спали» в ожидании запуска сервисов — неэффективная трата ресурсов, которую закрыли через CLI.
- Агентам дали мультиинструмент для создания тестовых аккаунтов и логина в сторонние сервисы.
- Видимость двусторонняя: если человек сам поменял приложение, агент должен увидеть эти изменения.
- Агент должен видеть диалоги других агентов — так же, как человек просматривает чужую переписку при отладке.
- Промах не в том, что модель не умеет кликать пиксели — семейство Claude это умеет; сложность в навигации по частично наблюдаемому миру.
- В использовании компьютера есть «двери в одну сторону» и проигрышные состояния — нужна рефлексия и умение откатываться.
- Демо-запись агента — это инструмент ревью: разработчик смотрит работающее демо вместо чтения тонн кода.
- Когда нужно поручить агентам больше: либо перестать вести баги в трекере и слать их сразу в очередь алертов, либо давать крупные проекты на долгий автономный прогон.
- Спикера удивило, насколько верным оказалось предположение «дай агентам мощнее — разработчики начнут делать вещи интереснее».
- Облако защищает разработчика: облачные программы не лезут в его локальные переменные среды.
- Накопленные сбои дают «кумулятивный отказ» по всей компании — поэтому чинить надо системно.
- Доверие к агентам растёт нелинейно: вложился — стало лучше — все хотят пользоваться больше — хочется вложиться ещё.
- «Опыт сотрудника» (агента) для Cursor важен не меньше, а то и больше, чем «опыт разработчика».
- Менеджеры-агенты делают триаж: технические проблемы, проблемы доступа/разрешений и проблемы «незнания».
- Проблемы «незнания» требуют человеческого вмешательства — подсказать правильный путь решения.
- Старые модели плохо «работали на фабрику» — не жаловались; новые сами фиксируют, что сломано или запутано.
- Решать проблему «с первого раза» одним агентом неэффективно — слишком много повторов; что-то случается лишь однажды.
- Решение валидируют так: один агент чинит, затем набор облачных агентов проверяет фикс при изменённых условиях разработки.
- К человеку фикс приходит уже с высоким уровнем доверия — проверенный на наборе оценок.
- Цель — постепенно убрать человека из контура: агенты решают полностью, без ревью.
- WTF-навык получает каждый облачный агент — это почти дословно те же инструкции, что и в управленческой схеме.
- Спикер сравнивает эти навыки с фоновыми процессами ОС — сборкой мусора и очисткой.
- Облачная разработка — не чисто программная задача: много переменных, и лишь часть из них про код.
- Спикера можно найти в X по нику XBISME для разговора о «идентичных самоулучшающихся системах».
Инсайты
- Прогресс ИИ упирается не в модель, а в организационную и инструментальную обвязку вокруг неё — узкое место переехало из алгоритма в инфраструктуру.
- Управление агентами конвергирует к управлению людьми: трекеры, триаж, документация и онбординг переносятся почти дословно.
- Зрелость автономной системы измеряется не качеством одного решения, а скоростью, с которой решение обобщается на всю организацию.
- Частичная наблюдаемость среды — фундаментально более тяжёлый класс задач, чем полностью наблюдаемая: она требует не точности действий, а стратегии и обратимости.
- Демонстрация (видимый артефакт) масштабируется как способ верификации лучше, чем чтение кода, когда параллельно работают десятки агентов.
- Надёжность достигается не «решить с первого раза», а статистически — прогоном фикса через множество вариаций условий.
- Автономия и безопасность не противоречат, а усиливают друг друга: ограничение области действия агента освобождает и человека, и систему.
- Внедрение агентов имеет петлю положительной обратной связи: качество порождает доверие, доверие порождает использование, использование оправдывает инвестиции.
- Локальные сбои в распределённой агентной системе не остаются локальными — они накапливаются в системный отказ, поэтому экономически выгодно чинить корень.
- Способность системы жаловаться на саму себя — необходимое условие её самоулучшения; «молчаливый» исполнитель не даёт сигналов для оптимизации.
- Сдвиг роли человека: от исполнителя задач — к программисту системы, которая исполняет задачи.
- Паттерны, отработанные в программировании, — это прототип для любой автономной работы, потому что код лишь первая, самая удобная для ИИ область.
Фреймворки
Три стадии освобождения агентов:
- Оснастить агентов инструментами и контекстом для большей автономности.
- Научиться использовать более эффективные модели — обновлять их паттерны и поведение.
- «Построить систему, которая строит систему» — решать всё «от А до Я», а не «от А до Г».
Принципы автономии:
- Видимость — агент видит всё, что видит человек (приложение, изменения, диалоги других агентов).
- Инструменты — агент может делать всё, что может человек, при разумных ограничениях безопасности.
- Качество данных и инструкций — высококачественная кодовая база и чёткие инструкции для качественного результата.
Три категории проблем при триаже:
- Технические — можно устранить напрямую.
- Доступы/разрешения — у агента нет прав, нужно их выдать.
- «Незнание» — агент не знает, что делать, нужно человеческое руководство.
Два режима выдачи агентам большей работы:
- Поток мелких задач/багов — слать сразу в очередь алертов, минуя трекер.
- Крупные проекты — давать автономному агенту большие блоки работы на долгий прогон.
Цитаты
«لم يعود التحدي يكمن في ذكاء النموذج نفسه» — 0:13 Вызов больше не в интеллекте самой модели
«نرى أن مهمتنا هي تحرير وكلائنا بأمان» — 0:38 Наша миссия — безопасно освободить наших агентов
«بناء النظام الذي يبني النظام» — 1:22 Построить систему, которая строит систему
«تستغل هذا الوقت لبناء نظام قادر على حل جميع المشكلات من ألف إلى يا» — 1:32 Ты тратишь это время на построение системы, способной решить все проблемы от А до Я
«تجربة الأعداد كانت أشبه بإضافة النموذج إلى قاعدة بيانات» — 2:12 Опыт онбординга был похож на добавление модели в базу данных
«يجب ان يتمكن الوكلاء من رؤية كل ما تراه انت ايضا» — 4:47 Агенты должны видеть всё, что видишь и ты
«البرمجة مثل شطرنج حيث يمكنك رؤية جميع القطع على الرقعة» — 6:08 Программирование как шахматы, где видны все фигуры на доске
«التنقل بين هذه القطع فهو أشبه بلعبة فيديو» — 6:14 Навигация между этими фигурами — это скорее видеоигра
«نموذج كلاود 47 هو نموذجنا لاستخدام الحاسوب» — 6:34 Модель Claude 4.7 — это наша модель для использования компьютера
«مفهومة الأمان من خلال الحرية والتي قد تبدو كدعاية أرويلية» — 8:17 Концепция «безопасность через свободу», которая может звучать как оруэлловская пропаганда
«لقد فجئنا جميعا بمدى متعة البرمجة بفضل هذه الطريقة» — 8:42 Мы все были удивлены, насколько программирование стало приятным благодаря этому способу
«إذا استمرت حالات الفشل فإنها تؤدي إلى فشل متراكم في جميع أنحاء الشركة» — 9:12 Если сбои продолжаются, они приводят к накопленному отказу по всей компании
«مهارة WTF التي تعني العمل على المصنع» — 11:40 Навык WTF, что означает «работа на фабрике»
«النماذج القديمة لم تكن تؤدي هذا الدور بشكل جيد» — 12:05 Старые модели плохо справлялись с этой ролью
«جعل الوكيل يحلها من أول مرة لم يكن فعالا» — 12:29 Заставлять агента решать с первого раза было неэффективно
«الهدف هو تقليل التدخل البشري تدريجياً» — 11:23 Цель — постепенно сократить человеческое вмешательство
«هذا تغيير مهم حقا في طريقة تفكيرك في عملك حيث أنت تبرمج النظام» — 9:43 Это действительно важная перемена в том, как ты думаешь о своей работе: ты программируешь систему
«خبرة تطوير الحوسبة السحابية ليست مشكلة برمجية بالمعنى الحرفي» — 13:38 Опыт облачной разработки — не программная задача в буквальном смысле
Факты
- Спикер представляет компанию Cursor (كورسور) — инструмент для ИИ-ассистированной разработки.
- Cursor прошёл три стадии в процессе работы с агентами.
- Построен облачный агент-настройщик (وكيل إعداد سحابي), доступный любому для настройки своего репозитория.
- Создан новый CLI-инструмент для управления сервисами в облачных запусках (запуск, ожидание готовности, проверка статуса).
- Агентам дан мультиинструмент для создания тестовых аккаунтов и логина в сторонние сервисы.
- Claude 4.7 (в SRT — «كلاود 47») назван моделью Cursor для использования компьютера; речь идёт о семействе моделей Claude.
- Использование компьютера определено как ввод/вывод «сырых пикселей» с управлением мышью и клавиатурой.
- Ключевой навык называется WTF — «Work on The Factory» и выдаётся каждому облачному агенту.
- Проблемы при триаже делятся на три категории: технические, доступа/разрешений и «незнания».
- Многие разработчики запускают облачных агентов ежедневно.
- Фиксы валидируются прогоном через набор облачных агентов с изменёнными условиями разработки («набор оценок»).
- Контакт спикера в X — ник XBISME; сайт компании — cursor.com (в SRT упомянут как «كيرسور.com»).
- Спикер предлагает связаться с ним для разговора о «идентичных самоулучшающихся системах».
Источники
- Cursor (cursor.com) — компания и продукт спикера.
- Claude 4.7 / семейство моделей Claude (Anthropic) — модель для использования компьютера.
- Аккаунт спикера в X под ником XBISME.
Итог
Будущее разработки — не в более умных моделях, а в людях, которые перестают решать задачи руками и начинают строить самоулучшающуюся «фабрику» агентов, чинящую и обучающую саму себя.