Коротко
Питер Штейнбергер, создатель опенсорсного AI-агента OpenClaw, рассказывает, как репозиторий взлетел до 160k+ звёзд почти за ночь, потому что агент впервые работает локально на машине пользователя, а не в облаке — и поэтому может реально управлять компьютером, файлами и подключёнными устройствами. Главный «ага-момент» случился, когда прототип за час склейки кода через WhatsApp + Claude самостоятельно сконвертировал голосовое сообщение через FFmpeg + Whisper API за 9 секунд — без того, чтобы Штейнбергер это закладывал. Из этого следует, что 80% существующих приложений (MyFitnessPal, тудушки и т.п.) обречены, потому что агент сам ведёт данные пользователя в обычных markdown-файлах на диске. Будущее — рой специализированных агентов (личный, рабочий, для отношений), которые торгуются друг с другом и нанимают людей для офлайн-задач. Сам Штейнбергер строит контркультурно: Codex вместо Claude Code, копии репозитория вместо worktrees, никакого UI, никакого MCP — только CLI.
Главный тезис
Локальный агент с доступом ко всему компьютеру пользователя — это не «ещё один чат-бот», а замена операционной системы и большинства приложений: модель достаточно умна, чтобы решать неожиданные задачи комбинацией существующих инструментов, а данные принадлежат пользователю как набор обычных файлов.
Ключевые идеи
- 1:35 — главное отличие OpenClaw от конкурентов: он работает на машине пользователя, а не в облаке, поэтому может делать всё, что может сам пользователь
- 2:03 — агент управляет духовкой, Tesla, светом, Sonos, температурой кровати — ChatGPT так не может
- 3:04 — следующий шаг: боты нанимают людей для задач, где другая сторона не приняла бы бота (старая школа, очереди)
- 4:08 — пока все гнались за централизованным «божественным» интеллектом, реально работает роевой/общественный интеллект из специализированных агентов
- 9:28 — навык кодинга оказался общей способностью к креативному решению задач, переносимой на любые реальные проблемы
- 10:41 — 80% приложений исчезнут: MyFitnessPal, тудушки, всё, что просто хранит и обрабатывает данные пользователя
- 11:36 — выживут только приложения с физическими сенсорами, остальное поглотят агенты
- 14:40 — люди используют агента не только для решения задач, но и для личных проблем — отсюда важность того, чтобы данные были локальные
- 6:55 — фишка нового агента: разговор через WhatsApp голосом, без терминалов, моделей и папок
- 7:42 — первый прототип собрал за один час — клей между зависимостями (WhatsApp + Claude)
- 9:58 — модель сама выбрала не ставить локальный Whisper, потому что догадалась, что пользователь не готов ждать загрузку — это и был момент «ох..»
- 12:59 — миф о деградации моделей — это на самом деле адаптация ожиданий пользователя к новому базовому уровню
- 13:53 — лок-ин крупных AI-компаний построен на невозможности экспорта памяти/контекста — opensource ломает это, потому что данные у пользователя
- секретный файл
soul.mdс ценностями агента, вдохновлённый исследованием Anthropic о скрытых текстах в весах модели - 20:41 — Штейнбергер полностью пропустил MCP: написал утилиту MakePorter, которая конвертирует MCP в CLI — потому что боты хороши в UNIX
- 18:54 — пока все используют Claude Code, он предпочитает Codex: тот читает больше файлов перед изменением, нужно меньше промптинга
Почему это важно
Видео фиксирует поворотный момент 2026 года: agentic AI выходит из облака на личные машины, и это перераспределяет власть от моделных монополий (OpenAI, Anthropic) к экосистеме опенсорс-обёрток и пользователям. Если правда, что 80% SaaS-приложений теряют смысл (потому что агент сам ведёт данные в md-файлах), то под удар попадают MyFitnessPal, Todoist, Notion, тысячи нишевых стартапов — а выигрывают производители железа с сенсорами (Apple, Garmin, Tesla) и поставщики токенов. Anthropic это видит и встраивает «tool search» прямо в API, чтобы удержать разработчиков на MCP, но Штейнбергер показывает, что CLI + UNIX-композиция работает лучше. Контекст: автор сидел в одиночестве в маленькой стране далеко от Кремниевой долины — и собрал то, что не смогли крупные команды.
Идеи
- Прототип уровня «160k звёзд» собран за час из клея между WhatsApp и Claude Code — порог входа в революцию AI стал часом
- Случайная находка в Марракеше: модель сама придумала пайплайн «ffmpeg → OpenAI Whisper API → ответ» за 9 секунд, потому что у пользователя не было локального whisper
- Тот же агент через несколько часов работы нашёл на чужом компьютере годовые аудиозаписи, о которых владелец сам забыл, и построил из них нарратив
- Модель сознательно выбрала не качать локальный whisper, оценив нетерпеливость пользователя — meta-моделирование пользователя без явной инструкции
- «Кодинг как навык» — это не про синтаксис, а про креативное решение задач, которое переносится на любую реальность
- Пользователи будут владеть несколькими специализированными агентами: личный, рабочий, для отношений
- Бот для отношений «получает всё, что между нами» — новая категория межличностных артефактов
- Если боты ведут переговоры с ботами, рестораны старой школы получат бот-симулятор человеческого звонка
- Боты будут физически нанимать людей через сервисы вроде TaskRabbit, чтобы стоять в очередях за владельцем
- Локальная память агента = обычные markdown-файлы на диске, не зашифрованные, доступные пользователю
- Облачные AI-сервисы специально не дают экспортировать память, чтобы держать lock-in
- Anthropic зарелизил «tool search» — фактически признание, что MCP стал слишком сложным
- Voice → текст → агент → voice — основной интерфейс будущего, а не чат
- Discord-эксперимент: бот в открытом канале, заблокированный на user ID создателя, смеётся над попытками джейлбрейка
- Никто за всё время не вскрыл секретный
soul.md, хотя бот сидел в публичном Discord soul.mdродился через диалог с самим агентом про ценности взаимодействия человека и AI- Главная инвестиция в качество — тон, а не функционал: бот «нахальный, смешной, приятный в использовании»
- Сложность с именами проекта: OpenCloud → OpenClaw → агент-персона «Multi»
- 10 параллельных копий одного репозитория на main вместо git worktrees — упрощение когнитивной нагрузки, а не процесса
- Worktrees добавляют проблем с именами веток и невозможностью «откатиться»
- UI добавляет когнитивный шум — терминал даёт меньше трения
- «Адаптация к новому токену» = эффект движущейся базовой линии: модели не деградируют, ожидания растут
- Open-source модели через год догонят сегодняшний топ — но к тому моменту все будут жаловаться на новый топ
- Только сенсорные приложения выживут — потому что у них есть физический моностей в железе
- Модели тоже становятся коммодити, если приложения схлопываются
- Зависимость от чата OpenAI = зависимость от их памяти, перенести нельзя
- Agentic-фокус автора рос полтора года: от «вайб-тюнинга» (2 месяца проект) к WhatsApp-голосовому агенту
- «Болезнь» вайб-кодинга: ловил себя на том, что не отлипает от компьютера в компании друзей
- Сам OpenClaw — это проекция тела автора в его рабочий процесс, а не отдельное приложение
- В Twitter не получилось объяснить «магию» — пришлось показывать через Discord-демо живьём
Инсайты
- Магия агента не описывается, а только демонстрируется: твит не передаст ощущение, нужна интерактивная встреча с поведением — отсюда выбор открытого Discord как маркетинга
- Емержентность ≠ запрограммированность: ценность даёт не то, что разработчик встроил, а то, что модель додумывает на стыке примитивов (file → ffmpeg → API)
- Локальность = власть: пока данные пользователя в облаке, модельные компании держат рынок; локальные md-файлы переводят рынок в режим товарной конкуренции
- Архитектурная асимметрия: облачные агенты ограничены интерфейсами, локальные — ограничены только тем, что умеет хост
- Адаптация ожиданий — структурный механизм недовольства технологией: люди не замечают, как привыкают, и приписывают деградацию модели вместо собственного дрейфа
- Lock-in 2026 = память, а не модель: модель легко заменить, привязка пользователя — в накопленном контексте
- CLI > MCP: модели обучены на гигантском корпусе UNIX-команд, поэтому композиция через CLI работает надёжнее любого нового протокола
- Меньше трения важнее, чем меньше шагов: десять копий репо на main эффективнее, чем worktree, если каждый ветвь-нейминг — это микрорешение
- Личность агента — продукт: тон, дерзость, юмор удерживают пользователя сильнее, чем фичи
- Опенсорс агентов выигрывает не идеологически, а функционально: только локальный код имеет доступ к локальным данным конечного пользователя
- AI-революция переезжает на edge: ценность смещается от модели к раннеру и оркестратору на машине пользователя
- Креативное решение задач — горизонтальный навык: успех кодинговых моделей предсказывает успех в произвольных реальных задачах
Цитаты
«אני צריך מערה, שבוע של בדידות» — 0:58 Мне нужна пещера, неделя одиночества
«מכונה יכולה לעשות כל דבר שאתה יכול לעשות עם המכונה» — 1:53 Машина может всё, что ты можешь сделать с машиной
«זה יכול לשלוט בטמפרטורה של המיטה שלי. JPD לא יכול לעשות את זה» — 2:03 Он может управлять температурой моей кровати. ChatGPT так не может
«הצעד הטבעי הבא, כמו, אוקיי, אני רוצה להזמין מקום במסעדה» — 3:13 Следующий естественный шаг — окей, я хочу забронировать столик в ресторане
«הבוט שלי צריך לבצע קצת עבודה אנושית» — 3:28 Моему боту нужно выполнить немного человеческой работы
«אינטליגנציה נחילית ואינטליגנציה קהילתית» — 4:08 Роевой интеллект и общественный интеллект
«בן אדם אחד כנראה אפילו לא יוכל למצוא אוכל» — 4:32 Один человек, наверное, даже еду себе не найдёт
«כידוד הוא כמו פתרון בעיות יצירתי שממופה טוב מאוד חזרה לעולם האמיתי» — 9:28 Кодинг — это креативное решение задач, которое хорошо ложится обратно на реальный мир
«אני חושב שין מינוס 80% מהן יעלמו» — 10:41 Я думаю, минус 80% из них исчезнут
«למה אני צריך את MyFitnessPal? כאילו הסוכן שלי כבר יודע שאני מקבל החלטות גרועות» — 10:44 Зачем мне MyFitnessPal? Мой агент и так знает, что я принимаю плохие решения
«רק האפליקציות שיש להן חיישנים, אולי הן שורדות» — 11:36 Выживают, наверное, только приложения с сенсорами
«אנשים משתמשים בסוכן שלהם לא רק לפתרון בעיות, אלא גם לפתרון בעיות אישי» — 14:40 Люди используют своего агента не только для решения задач, но и для личных проблем
«פשוטו כמשמעו, לקח לי שעה לאב טיפוס ראשוני גרוע מאוד» — 7:42 Буквально, мне понадобился час на очень плохой первичный прототип
«איך לעזאזל עשית את זה» — 8:51 Как, чёрт возьми, ты это сделал
«זה היה אפילו כל כך חכם שהוא בחר לא להתקין את הוויספר המקומי» — 9:48 Он был настолько умён, что выбрал не ставить локальный Whisper
«הסתגלתם לטקן החדש ועכשיו הציפיות שלכם עלו, אבל המודל עדיין הממוצע» — 12:59 Вы адаптировались к новому токену, и ожидания выросли, а модель та же средняя
«אין שום דרך לחברה אחרת להוציא את הזיכרונות שלך» — 13:53 Нет вообще никакого способа другой компании достать твои воспоминания
«אתה הבעלים של הזיכרונות, זה סתם חבורה של קבצי הנחה על המחשב שלך» — 14:23 Ты владелец воспоминаний, это просто набор markdown-файлов на твоём компьютере
«הסוכן שלי היה צוחק עליהם» — 15:44 Мой агент над ними смеялся
«עד כואף אחד לא פיצח את הקובץ הזה» — 17:33 До сих пор никто этот файл не взломал
«אני מרגיש שכל העולם עושה קוד ענן ואני לא חושב שיכולתי לבנות את הדבר הזה עם קוד ענן» — 18:54 Мне кажется, весь мир сидит на Claude Code, а я не думаю, что смог бы построить эту штуку на Claude Code
«אני לגמרי מדלג על כל השטויות של MCP Classy» — 20:53 Я полностью пропускаю всю эту классическую MCP-возню
«אף בן אדם, מטורף לא מנסה להתקשר לאמסי פי באופן ידני» — 21:46 Ни один человек в здравом уме не пытается вручную дёргать MCP
«אתה יכול פשוט לעשות דברים» — 6:24 Ты можешь просто делать вещи
Факты
- Репозиторий OpenClaw (ранее CloudBot) взлетел до 160k+ звёзд на GitHub «почти за ночь»
- Первый прототип Штейнбергер собрал за 1 час, окончательный — за несколько часов в Марракеше на плохом интернете
- Прототип использовал WhatsApp как интерфейс, потому что текст работает везде даже на слабой сети
- Демонстрационный случай: модель за 9 секунд распознала аудио-сообщение через ffmpeg + OpenAI Whisper API без предварительной установки локального whisper
- У Штейнбергера на GitHub около 40 проектов
- До OpenClaw 2 месяца работал над «вайб-тюнингом» (vibe-tuning)
- На экране одновременно держит до 6 (иногда до 10) копий одного репозитория в режиме main
- Личность агента в OpenClaw называется Multi
- Секретный файл с ценностями называется soul.md, остальные
identity.md,sol.md— публичные шаблоны - Идея
soul.mdродилась после прочтения исследования Anthropic о скрытом тексте в весах модели про конституцию AI - Штейнбергер предпочитает Codex для кодинга, не Claude Code — Codex просматривает больше файлов перед изменением
- Утилита MakePorter конвертирует MCP-серверы в CLI, обходя «MCP Classy»
- OpenClaw не имеет нативной поддержки MCP — обходится через MakePorter
- Anthropic выпустил инструмент tool search для решения проблемы перегруженности MCP
- Discord-эксперимент: бот сидит в публичном канале, отвечает всем, но слушает только Штейнбергера по user ID
- Чужой компьютер: агент нашёл аудиозаписи годичной давности, о которых владелец сам забыл, и сделал из них нарратив
Источники
- OpenClaw (ранее CloudBot, OpenCloud) — главный проект, репозиторий на GitHub
- Meltbook — проект сообщества, где боты разговаривают друг с другом
- MakePorter — утилита Штейнбергера для конвертации MCP в CLI
- Codex — предпочитаемый ассистент кодинга
- Claude Code — основной конкурент Codex, который Штейнбергер не использует
- OpenAI Whisper API — использован агентом для распознавания речи в Марракеше
- FFmpeg — использован агентом для конвертации аудио
- WhatsApp — интерфейс для общения с агентом
- MyFitnessPal — пример приложения, обречённого на исчезновение
- Anthropic — упомянуто их исследование о скрытых текстах в весах модели (конституция AI)
- Конкретные устройства, которые умеет контролировать агент: Tesla, Sonos, освещение, духовка, температура кровати
Итог
Локальный агент превращает компьютер пользователя в живое решающее устройство — и обнуляет рынок приложений, моделей-в-облаке и протоколов вроде MCP в пользу простой связки «голос + UNIX + markdown-файлы пользователя».