Создатель OpenClaw: почему 80% приложений исчезнут

Y Combinator7 февраля 2026992 88021 400вчера, 12:59

Коротко

Питер Штейнбергер, создатель опенсорсного AI-агента OpenClaw, рассказывает, как репозиторий взлетел до 160k+ звёзд почти за ночь, потому что агент впервые работает локально на машине пользователя, а не в облаке — и поэтому может реально управлять компьютером, файлами и подключёнными устройствами. Главный «ага-момент» случился, когда прототип за час склейки кода через WhatsApp + Claude самостоятельно сконвертировал голосовое сообщение через FFmpeg + Whisper API за 9 секунд — без того, чтобы Штейнбергер это закладывал. Из этого следует, что 80% существующих приложений (MyFitnessPal, тудушки и т.п.) обречены, потому что агент сам ведёт данные пользователя в обычных markdown-файлах на диске. Будущее — рой специализированных агентов (личный, рабочий, для отношений), которые торгуются друг с другом и нанимают людей для офлайн-задач. Сам Штейнбергер строит контркультурно: Codex вместо Claude Code, копии репозитория вместо worktrees, никакого UI, никакого MCP — только CLI.

Главный тезис

Локальный агент с доступом ко всему компьютеру пользователя — это не «ещё один чат-бот», а замена операционной системы и большинства приложений: модель достаточно умна, чтобы решать неожиданные задачи комбинацией существующих инструментов, а данные принадлежат пользователю как набор обычных файлов.

Ключевые идеи

  • 1:35 — главное отличие OpenClaw от конкурентов: он работает на машине пользователя, а не в облаке, поэтому может делать всё, что может сам пользователь
  • 2:03 — агент управляет духовкой, Tesla, светом, Sonos, температурой кровати — ChatGPT так не может
  • 3:04 — следующий шаг: боты нанимают людей для задач, где другая сторона не приняла бы бота (старая школа, очереди)
  • 4:08 — пока все гнались за централизованным «божественным» интеллектом, реально работает роевой/общественный интеллект из специализированных агентов
  • 9:28 — навык кодинга оказался общей способностью к креативному решению задач, переносимой на любые реальные проблемы
  • 10:4180% приложений исчезнут: MyFitnessPal, тудушки, всё, что просто хранит и обрабатывает данные пользователя
  • 11:36 — выживут только приложения с физическими сенсорами, остальное поглотят агенты
  • 14:40 — люди используют агента не только для решения задач, но и для личных проблем — отсюда важность того, чтобы данные были локальные
  • 6:55 — фишка нового агента: разговор через WhatsApp голосом, без терминалов, моделей и папок
  • 7:42 — первый прототип собрал за один час — клей между зависимостями (WhatsApp + Claude)
  • 9:58 — модель сама выбрала не ставить локальный Whisper, потому что догадалась, что пользователь не готов ждать загрузку — это и был момент «ох..»
  • 12:59 — миф о деградации моделей — это на самом деле адаптация ожиданий пользователя к новому базовому уровню
  • 13:53 — лок-ин крупных AI-компаний построен на невозможности экспорта памяти/контекста — opensource ломает это, потому что данные у пользователя
  • секретный файл soul.md с ценностями агента, вдохновлённый исследованием Anthropic о скрытых текстах в весах модели
  • 20:41 — Штейнбергер полностью пропустил MCP: написал утилиту MakePorter, которая конвертирует MCP в CLI — потому что боты хороши в UNIX
  • 18:54 — пока все используют Claude Code, он предпочитает Codex: тот читает больше файлов перед изменением, нужно меньше промптинга

Почему это важно

Видео фиксирует поворотный момент 2026 года: agentic AI выходит из облака на личные машины, и это перераспределяет власть от моделных монополий (OpenAI, Anthropic) к экосистеме опенсорс-обёрток и пользователям. Если правда, что 80% SaaS-приложений теряют смысл (потому что агент сам ведёт данные в md-файлах), то под удар попадают MyFitnessPal, Todoist, Notion, тысячи нишевых стартапов — а выигрывают производители железа с сенсорами (Apple, Garmin, Tesla) и поставщики токенов. Anthropic это видит и встраивает «tool search» прямо в API, чтобы удержать разработчиков на MCP, но Штейнбергер показывает, что CLI + UNIX-композиция работает лучше. Контекст: автор сидел в одиночестве в маленькой стране далеко от Кремниевой долины — и собрал то, что не смогли крупные команды.

Идеи

  • Прототип уровня «160k звёзд» собран за час из клея между WhatsApp и Claude Code — порог входа в революцию AI стал часом
  • Случайная находка в Марракеше: модель сама придумала пайплайн «ffmpeg → OpenAI Whisper API → ответ» за 9 секунд, потому что у пользователя не было локального whisper
  • Тот же агент через несколько часов работы нашёл на чужом компьютере годовые аудиозаписи, о которых владелец сам забыл, и построил из них нарратив
  • Модель сознательно выбрала не качать локальный whisper, оценив нетерпеливость пользователя — meta-моделирование пользователя без явной инструкции
  • «Кодинг как навык» — это не про синтаксис, а про креативное решение задач, которое переносится на любую реальность
  • Пользователи будут владеть несколькими специализированными агентами: личный, рабочий, для отношений
  • Бот для отношений «получает всё, что между нами» — новая категория межличностных артефактов
  • Если боты ведут переговоры с ботами, рестораны старой школы получат бот-симулятор человеческого звонка
  • Боты будут физически нанимать людей через сервисы вроде TaskRabbit, чтобы стоять в очередях за владельцем
  • Локальная память агента = обычные markdown-файлы на диске, не зашифрованные, доступные пользователю
  • Облачные AI-сервисы специально не дают экспортировать память, чтобы держать lock-in
  • Anthropic зарелизил «tool search» — фактически признание, что MCP стал слишком сложным
  • Voice → текст → агент → voice — основной интерфейс будущего, а не чат
  • Discord-эксперимент: бот в открытом канале, заблокированный на user ID создателя, смеётся над попытками джейлбрейка
  • Никто за всё время не вскрыл секретный soul.md, хотя бот сидел в публичном Discord
  • soul.md родился через диалог с самим агентом про ценности взаимодействия человека и AI
  • Главная инвестиция в качество — тон, а не функционал: бот «нахальный, смешной, приятный в использовании»
  • Сложность с именами проекта: OpenCloud → OpenClaw → агент-персона «Multi»
  • 10 параллельных копий одного репозитория на main вместо git worktrees — упрощение когнитивной нагрузки, а не процесса
  • Worktrees добавляют проблем с именами веток и невозможностью «откатиться»
  • UI добавляет когнитивный шум — терминал даёт меньше трения
  • «Адаптация к новому токену» = эффект движущейся базовой линии: модели не деградируют, ожидания растут
  • Open-source модели через год догонят сегодняшний топ — но к тому моменту все будут жаловаться на новый топ
  • Только сенсорные приложения выживут — потому что у них есть физический моностей в железе
  • Модели тоже становятся коммодити, если приложения схлопываются
  • Зависимость от чата OpenAI = зависимость от их памяти, перенести нельзя
  • Agentic-фокус автора рос полтора года: от «вайб-тюнинга» (2 месяца проект) к WhatsApp-голосовому агенту
  • «Болезнь» вайб-кодинга: ловил себя на том, что не отлипает от компьютера в компании друзей
  • Сам OpenClaw — это проекция тела автора в его рабочий процесс, а не отдельное приложение
  • В Twitter не получилось объяснить «магию» — пришлось показывать через Discord-демо живьём

Инсайты

  • Магия агента не описывается, а только демонстрируется: твит не передаст ощущение, нужна интерактивная встреча с поведением — отсюда выбор открытого Discord как маркетинга
  • Емержентность ≠ запрограммированность: ценность даёт не то, что разработчик встроил, а то, что модель додумывает на стыке примитивов (file → ffmpeg → API)
  • Локальность = власть: пока данные пользователя в облаке, модельные компании держат рынок; локальные md-файлы переводят рынок в режим товарной конкуренции
  • Архитектурная асимметрия: облачные агенты ограничены интерфейсами, локальные — ограничены только тем, что умеет хост
  • Адаптация ожиданий — структурный механизм недовольства технологией: люди не замечают, как привыкают, и приписывают деградацию модели вместо собственного дрейфа
  • Lock-in 2026 = память, а не модель: модель легко заменить, привязка пользователя — в накопленном контексте
  • CLI > MCP: модели обучены на гигантском корпусе UNIX-команд, поэтому композиция через CLI работает надёжнее любого нового протокола
  • Меньше трения важнее, чем меньше шагов: десять копий репо на main эффективнее, чем worktree, если каждый ветвь-нейминг — это микрорешение
  • Личность агента — продукт: тон, дерзость, юмор удерживают пользователя сильнее, чем фичи
  • Опенсорс агентов выигрывает не идеологически, а функционально: только локальный код имеет доступ к локальным данным конечного пользователя
  • AI-революция переезжает на edge: ценность смещается от модели к раннеру и оркестратору на машине пользователя
  • Креативное решение задач — горизонтальный навык: успех кодинговых моделей предсказывает успех в произвольных реальных задачах

Цитаты

«אני צריך מערה, שבוע של בדידות» — 0:58 Мне нужна пещера, неделя одиночества

«מכונה יכולה לעשות כל דבר שאתה יכול לעשות עם המכונה» — 1:53 Машина может всё, что ты можешь сделать с машиной

«זה יכול לשלוט בטמפרטורה של המיטה שלי. JPD לא יכול לעשות את זה» — 2:03 Он может управлять температурой моей кровати. ChatGPT так не может

«הצעד הטבעי הבא, כמו, אוקיי, אני רוצה להזמין מקום במסעדה» — 3:13 Следующий естественный шаг — окей, я хочу забронировать столик в ресторане

«הבוט שלי צריך לבצע קצת עבודה אנושית» — 3:28 Моему боту нужно выполнить немного человеческой работы

«אינטליגנציה נחילית ואינטליגנציה קהילתית» — 4:08 Роевой интеллект и общественный интеллект

«בן אדם אחד כנראה אפילו לא יוכל למצוא אוכל» — 4:32 Один человек, наверное, даже еду себе не найдёт

«כידוד הוא כמו פתרון בעיות יצירתי שממופה טוב מאוד חזרה לעולם האמיתי» — 9:28 Кодинг — это креативное решение задач, которое хорошо ложится обратно на реальный мир

«אני חושב שין מינוס 80% מהן יעלמו» — 10:41 Я думаю, минус 80% из них исчезнут

«למה אני צריך את MyFitnessPal? כאילו הסוכן שלי כבר יודע שאני מקבל החלטות גרועות» — 10:44 Зачем мне MyFitnessPal? Мой агент и так знает, что я принимаю плохие решения

«רק האפליקציות שיש להן חיישנים, אולי הן שורדות» — 11:36 Выживают, наверное, только приложения с сенсорами

«אנשים משתמשים בסוכן שלהם לא רק לפתרון בעיות, אלא גם לפתרון בעיות אישי» — 14:40 Люди используют своего агента не только для решения задач, но и для личных проблем

«פשוטו כמשמעו, לקח לי שעה לאב טיפוס ראשוני גרוע מאוד» — 7:42 Буквально, мне понадобился час на очень плохой первичный прототип

«איך לעזאזל עשית את זה» — 8:51 Как, чёрт возьми, ты это сделал

«זה היה אפילו כל כך חכם שהוא בחר לא להתקין את הוויספר המקומי» — 9:48 Он был настолько умён, что выбрал не ставить локальный Whisper

«הסתגלתם לטקן החדש ועכשיו הציפיות שלכם עלו, אבל המודל עדיין הממוצע» — 12:59 Вы адаптировались к новому токену, и ожидания выросли, а модель та же средняя

«אין שום דרך לחברה אחרת להוציא את הזיכרונות שלך» — 13:53 Нет вообще никакого способа другой компании достать твои воспоминания

«אתה הבעלים של הזיכרונות, זה סתם חבורה של קבצי הנחה על המחשב שלך» — 14:23 Ты владелец воспоминаний, это просто набор markdown-файлов на твоём компьютере

«הסוכן שלי היה צוחק עליהם» — 15:44 Мой агент над ними смеялся

«עד כואף אחד לא פיצח את הקובץ הזה» — 17:33 До сих пор никто этот файл не взломал

«אני מרגיש שכל העולם עושה קוד ענן ואני לא חושב שיכולתי לבנות את הדבר הזה עם קוד ענן» — 18:54 Мне кажется, весь мир сидит на Claude Code, а я не думаю, что смог бы построить эту штуку на Claude Code

«אני לגמרי מדלג על כל השטויות של MCP Classy» — 20:53 Я полностью пропускаю всю эту классическую MCP-возню

«אף בן אדם, מטורף לא מנסה להתקשר לאמסי פי באופן ידני» — 21:46 Ни один человек в здравом уме не пытается вручную дёргать MCP

«אתה יכול פשוט לעשות דברים» — 6:24 Ты можешь просто делать вещи

Факты

  • Репозиторий OpenClaw (ранее CloudBot) взлетел до 160k+ звёзд на GitHub «почти за ночь»
  • Первый прототип Штейнбергер собрал за 1 час, окончательный — за несколько часов в Марракеше на плохом интернете
  • Прототип использовал WhatsApp как интерфейс, потому что текст работает везде даже на слабой сети
  • Демонстрационный случай: модель за 9 секунд распознала аудио-сообщение через ffmpeg + OpenAI Whisper API без предварительной установки локального whisper
  • У Штейнбергера на GitHub около 40 проектов
  • До OpenClaw 2 месяца работал над «вайб-тюнингом» (vibe-tuning)
  • На экране одновременно держит до 6 (иногда до 10) копий одного репозитория в режиме main
  • Личность агента в OpenClaw называется Multi
  • Секретный файл с ценностями называется soul.md, остальные identity.md, sol.md — публичные шаблоны
  • Идея soul.md родилась после прочтения исследования Anthropic о скрытом тексте в весах модели про конституцию AI
  • Штейнбергер предпочитает Codex для кодинга, не Claude Code — Codex просматривает больше файлов перед изменением
  • Утилита MakePorter конвертирует MCP-серверы в CLI, обходя «MCP Classy»
  • OpenClaw не имеет нативной поддержки MCP — обходится через MakePorter
  • Anthropic выпустил инструмент tool search для решения проблемы перегруженности MCP
  • Discord-эксперимент: бот сидит в публичном канале, отвечает всем, но слушает только Штейнбергера по user ID
  • Чужой компьютер: агент нашёл аудиозаписи годичной давности, о которых владелец сам забыл, и сделал из них нарратив

Источники

  • OpenClaw (ранее CloudBot, OpenCloud) — главный проект, репозиторий на GitHub
  • Meltbook — проект сообщества, где боты разговаривают друг с другом
  • MakePorter — утилита Штейнбергера для конвертации MCP в CLI
  • Codex — предпочитаемый ассистент кодинга
  • Claude Code — основной конкурент Codex, который Штейнбергер не использует
  • OpenAI Whisper API — использован агентом для распознавания речи в Марракеше
  • FFmpeg — использован агентом для конвертации аудио
  • WhatsApp — интерфейс для общения с агентом
  • MyFitnessPal — пример приложения, обречённого на исчезновение
  • Anthropic — упомянуто их исследование о скрытых текстах в весах модели (конституция AI)
  • Конкретные устройства, которые умеет контролировать агент: Tesla, Sonos, освещение, духовка, температура кровати

Итог

Локальный агент превращает компьютер пользователя в живое решающее устройство — и обнуляет рынок приложений, моделей-в-облаке и протоколов вроде MCP в пользу простой связки «голос + UNIX + markdown-файлы пользователя».

readmint Pro

Понравилось саммари? Сделайте такое же по своему видео

Вставьте ссылку на любое YouTube-видео — readmint расшифрует его и соберёт пересказ с главными тезисами и цитатами. Без воды и перемотки.

  • Безлимит саммари — сколько угодно видео
  • Главные тезисы и цитаты без воды
  • Приоритет в очереди обработки
  • Без рекламы и сторонних блоков
Саммари своего видео
Вставьте ссылку на YouTube, разбор будет готов за 2–3 минуты.

Безлимит по подписке readmint Pro — 499 ₽/мес