Hermes Agent Desktop: полная настройка + реальные примеры использования

Greg Isenberg6 июня 20269 77152811 мин чтениясегодня, 04:34

Коротко

Alex Finn (гость) показывает Greg Isenberg'у новое десктоп-приложение агента Hermes и утверждает, что оно обошло конкурента OpenClaw, повторяя путь «Apple против Android»: целенаправленные, отполированные апдейты против сырых и ненадёжных. Центральная практическая идея — управление контекстом ради экономии: отдельные сессии, профили под разные модели (Opus 4.8 для стратегии, GPT-5.5 для кода, локальный Qwen для бесплатного поиска) и отключение лишних из 150+ скиллов снижают счёт с «$1000/мес» в разы. Finn демонстрирует технику обратного промпта (агент сам генерирует точный prompt для cron-задачи), артефакты как «второй мозг» для ссылок/файлов и cron-задачи с реальным подтверждением выполнения. Кульминация — реальный кейс: локальный Qwen на NVIDIA DGX Spark каждые 20 минут сканирует Reddit и X, находит чужие проблемы под навыки Finn'а и автоматически собирает прототип микро-SaaS. Сквозной тезис: агенты надо использовать не для экспериментов, а для решения чужих проблем — это и есть способ зарабатывать.

Главный тезис

Десктоп-агент Hermes побеждает не функциями, а организацией (сессии, профили, артефакты, cron) — и если правильно управлять контекстом и подбирать модель под задачу, агент превращается в круглосуточного «сотрудника-одиночку», который находит чужие проблемы и зарабатывает на их решении.

Ключевые идеи

  • 2:08 — выход десктоп-версии Hermes — это момент, когда он, по мнению Finn'а, обогнал OpenClaw; Finn, бывший топ-юзер OpenClaw, публично сменил лагерь.
  • 4:23 — главный рычаг экономии — раздельные сессии: каждый новый разговор уходит в чистую сессию, контекст не раздувается.
  • 3:47 — ошибка большинства — вести всё в одной большой ветке: каждое сообщение тащит за собой всю историю, поэтому расходы растут в 3-4 раза (особенно на Opus с «миллионом параметров»).
  • 3:56 — жалоба «плачу $1000/мес» — следствие плохого менеджмента контекста, а не цены агента; при грамотных сессиях платишь кратно меньше.
  • 6:30профили — это отдельные агенты со своим набором скиллов, файлом soul.md (личность), памятью и историей; в десктопе переключение в один клик вместо команды в терминале.
  • 8:04 — стратегия выбора модели: Opus 4.8 для мышления и оркестрации, GPT-5.5 для кода (лучше Opus в программировании и с бо́льшими лимитами), локальный Qwen для бесплатного поиска.
  • 8:31 — локальная модель на своём железе даёт «бесплатный безлимитный интеллект» — поиск новостей и сканирование ничего не стоят.
  • 10:09 — Finn спорит с подходом Paperclip (отдельный агент на каждую роль — продакт, дизайнер, CTO): это неэффективно по затратам, цепочка «вызов за вызовом» тащит контекст каждого. Лучше думать в терминах сильных сторон модели.
  • 12:59артефакты централизуют все ссылки, изображения и файлы; кидаешь ссылку без команды — агент сам раскладывает её во «второй мозг», и потом всё ищется (напр., «Reddit» покажет все reddit-ссылки).
  • 14:57 — Hermes ощущается как «Apple-продукт в режиме OpenClaw»: удобный десктоп без обязательной командной строки для обычного пользователя.
  • 16:37 — диагноз конкуренту: апдейты OpenClaw стали сырыми и ненадёжными («обновил — и сломалось»), тогда как Hermes выкатывает таргетированные апдейты на эффективность раз в неделю.
  • 17:53 — по умолчанию у агента 150+ скиллов, каждый добавляет контекст и стоимость; новый UI позволяет отключать лишние и видеть скиллы, которые агент создаёт сам в фоне (саморазвитие).
  • 20:44 — частая боль с cron-задачами через Telegram/CLI — нет подтверждения создания; в десктопе раздел Cron показывает все запланированные задачи и даёт создавать их вручную.
  • 22:21техника обратного промпта: вместо того чтобы диктовать агенту что делать, ты вываливаешь свои интересы/цели, а агент сам выдаёт точный, детальный prompt для cron-задачи.
  • 35:19 — реальный кейс: локальный Qwen на DGX Spark каждые 20 минут сканирует Reddit и X, находит чужие проблемы под навыки Finn'а, объясняет почему он может их решить и автоматически собирает прототип микро-SaaS.

Почему это важно

Это маркетинговый разбор-демо внутри войны агентских десктоп-платформ: Hermes против OpenClaw, поданной как «Apple против Android». Finn — инфлюенсер с большой аудиторией, ранее ассоциированный с OpenClaw, его демонстративный переход = сигнал рынку (он подчёркивает, что ему «никто из них не платит», что само по себе часть позиционирования). Выигрывают вендоры моделей, чьи профили он рекомендует комбинировать (Anthropic Opus 4.8, OpenAI GPT-5.5, Qwen), и NVIDIA с DGX Spark + локальными open-source моделями (Nemotron) — на фоне дефицита и дорожающей памяти железо становится «бутылочным горлышком надолго». Целевая аудитория — соло-предприниматели, которым продают идею, что агент + локальное железо за ~$5000 окупятся через автоматический поиск и решение чужих проблем.

Идеи

  • Смена платформы подаётся как спортивный сюжет: переход с OpenClaw на Hermes сравнивается с уходом Майкла Джордана из баскетбола в бейсбол в 1994-м.
  • Контекст-менеджмент — это не техничка, а прямая экономия денег: узкая ветка = компактные сообщения = меньший счёт.
  • Профили можно складывать в папки — буквальная файловая организация «команды агентов».
  • Имена профилей у Finn'а: Default (Hirmas), Willy, Coder, GPTMS, Librarian, Oracle, Qwen — у каждого своя модель и роль.
  • «Library» как отдельный профиль-«второй мозг»: кидаешь ссылку без инструкции, просто send — он сам сортирует.
  • Разница profile vs sub-agent: профиль = отдельная личность+скиллы+память; sub-agent = копия главного агента с теми же скиллами для параллельной работы.
  • Правило выбора: нужен другой набор скиллов → новый профиль; тот же набор, но параллельно → sub-agents.
  • Кейс sub-agents: микро-SaaS с 5-6 функциями (API, форматирование твитов, шеринг) — запускаешь 5-6 копий-кодеров одновременно.
  • Кейс профилей: YouTube-видео — Qwen ищет, Opus пишет сценарий, GPT-профиль генерит миниатюру через image-генератор.
  • Окно контекста вынесено вниз интерфейса — видно заполнение, новая сессия его очищает.
  • Модели в Hermes переключаются динамически; в OpenClaw модель «жёстко закодирована» — ждёшь апдейта под новую модель.
  • Можно крутить не только модель, но и усилие: «Opus 4.8 с минимальным усилием» или Haiku для простых задач — ещё экономия.
  • Idea Browser + Hermes — «магия»: связка, которая «строит каждую идею» (Finn обещает отдельный часовой эпизод).
  • Дашборд возможностей выглядит как «хак из 90-х», но Finn принципиально игнорит дизайн: «мне важна ценность, а не стиль».
  • Агент знает о тебе всё (community, активы, бизнесы вроде Vibe Coding Academy) и сам добавляет кнопки/контекст под твои продукты.
  • Даже не понравившаяся идея от агента полезна — стимулирует креатив («а если на другом рынке / в виде приложения»).
  • Mac Studio раньше был рекомендацией №1 за unified memory, но почти везде распродан.
  • DGX Spark: 128 ГБ unified memory, plug-and-play, не нужен даже монитор для настройки.
  • NVIDIA сама вышла на рынок моделей (open-source Nemotron), разрабатывая их на Spark.
  • Дефицит памяти — структурный и надолго: даже карта памяти для Nintendo Switch стоит ~$100, «память стоит целое состояние».
  • Локальное железо ценно не только функционально, но и как обучение/тренировка.
  • Цена воспринимается неверно: $200/мес за Claude люди считают дорогим, а Netflix+Xbox Live+Amazon Prime, которые «высасывают деньги и жизненную энергию», — нет.
  • Расходы на ИИ и железо подаются как «инвестиции в себя» с ожидаемым ROI, а не как подписки-развлечения.
  • Финальный мотиватор: «ты это заслужил, купи себе Spark» — если используешь и зарабатываешь $5000, а потом в 10 раз больше, решение очевидно.

Инсайты

  • Главная стоимость в агентах — не цена токена, а дисциплина контекста: архитектура «одной ветки» делает каждый запрос дороже экспоненциально, поэтому организация интерфейса напрямую конвертируется в деньги.
  • Победа на рынке агентов смещается от «больше фич» к надёжности и кураторству апдейтов — зрелые пользователи наказывают за сломанные обновления сильнее, чем награждают за новые возможности.
  • Специализация по ролям проигрывает специализации по моделям: дробить агента на 50 «сотрудников» — это перенос человеческой оргструктуры туда, где она создаёт лишний overhead контекста; эффективнее мыслить сильными сторонами модели.
  • Лучший способ заставить LLM выдать хороший результат — переложить на неё мета-работу формулирования промпта (обратный промпт): модель знает о промптинге больше пользователя.
  • Локальный compute меняет экономику автоматизации: когда инференс бесплатен, можно гонять задачи каждые 20 минут — частота, немыслимая на платном API, открывает качественно новые сценарии (непрерывный мониторинг).
  • Ценность соло-предпринимателя в эпоху агентов — в доступе к чужим проблемам в реальном времени и низком пороге окупаемости: крошечные рынки становятся прибыльными, когда стоимость разработки стремится к нулю.
  • Железо — это бутылочное горлышко ИИ-цикла, и дефицит памяти структурно продлевает его; владение собственным compute становится стратегическим, а не нишевым выбором.
  • Восприятие цены ИИ искажено фреймом «подписки-развлечения»: рефрейминг в «инвестицию с ROI» — это и аргумент, и продающий приём одновременно.
  • Демонстративная смена платформы инфлюенсером — это рыночный сигнал, упакованный в личный нарратив; оговорка «мне не платят» работает как усилитель доверия, а не как отказ от позиционирования.

Цитаты

«I think, this is the moment, when Hermes overtook Aupin Klo, to be honest» — 2:08 Думаю, это момент, когда Hermes честно обошёл OpenClaw

«God, I pay $1,000 a month. If you manage your context and sessions well, you don't pay $1,000 a month» — 3:56 «Боже, я плачу $1000 в месяц». Если хорошо управляешь контекстом и сессиями — не платишь $1000

«Profiles are literally separate Hermes agents» — 6:30 Профили — это буквально отдельные агенты Hermes

«I think Opus 48 is the smartest model of all existing. It is also very expensive» — 8:04 Думаю, Opus 4.8 — умнейшая из существующих моделей. И очень дорогая

«Free unlimited intelligence, because it works on my desk» — 8:31 Бесплатный безлимитный интеллект, потому что он работает у меня на столе

«In fact, everything that matters is the result and the results» — 11:00 По сути, важен только результат и результаты

«It's like Michael Jordan's transition from basketball to baseball in 1994» — 15:45 Это как переход Майкла Джордана из баскетбола в бейсбол в 1994-м

«more like an Apple product for use in the open-claw mode» — 14:57 Скорее Apple-продукт для использования в режиме OpenClaw

«The Hermes team went on the Apple way, while the OpenClaw team went on the Android way» — 16:14 Команда Hermes пошла путём Apple, а команда OpenClaw — путём Android

«The answer is always the opposite. Always» — 22:21 Ответ всегда обратный. Всегда

«my favorite combination in the world, flattening thoughts in the opposite order» — 24:09 моя любимая комбинация в мире — выкладывать мысли в обратном порядке

«The founder said that the whole agency is, in fact, 4 APIs in a cloak» — 35:19 Основатель сказал, что всё агентство — это, по сути, 4 API в плаще

«that this is how you can create the greatest value for yourself in the whole world» — 42:46 именно так ты можешь создать наибольшую ценность для себя во всём мире

«compare it to the cost of netflix xbox live and amazon prime right these things just suck your money and vitality» — 41:31 сравните с ценой Netflix, Xbox Live и Amazon Prime — они просто высасывают деньги и жизненную энергию

«$200 dollars for claude 5000 for dj x spark these are investments in themselves» — 41:38 $200 за Claude, $5000 за DGX Spark — это инвестиции в себя

«how the hell to earn money from hermes» — 42:22 как, чёрт возьми, зарабатывать на Hermes

«You don't need DJI X Spark. I'll offer you an alternative in a second» — 33:23 Тебе не нужен DGX Spark. Через секунду предложу альтернативу

«the cost of memory is rapidly growing» — 39:37 стоимость памяти стремительно растёт

Факты

  • Десктоп-приложение Hermes вышло за несколько дней до записи; Finn изучал его «последние несколько дней».
  • По умолчанию агент Hermes содержит более 150 скиллов, каждый добавляет контекст и стоимость.
  • Локальное сканирование в кейсе Finn'а запускается каждые 20 минут на модели Qwen 3 (в транскрипте «Kven 37»/«Kwen 36»/«Qwen 27» — whisper-разнобой) на устройстве NVIDIA DGX Spark.
  • DGX Spark имеет 128 ГБ unified memory; работает по принципу plug-and-play, монитор для настройки не нужен.
  • Цена DGX Spark, по словам Greg'а, недавно поднята примерно до $4,800 (Finn оговаривается, что «у всех разные финансовые возможности»).
  • Стоимость Claude упоминается как $200/мес, что люди считают дорогим.
  • Профили Finn'а: Default/Hirmas (Opus 4.8), GPTMS (GPT-5.5), Qwen (локальный), Willy, Coder, Librarian, Oracle.
  • Упомянутые модели: Opus 4.8, GPT-5.5, Qwen 3, Haiku, NVIDIA Nemotron (open-source, разрабатывается на Spark).
  • Карта памяти для Nintendo Switch стоит ~$100 — Finn приводит как иллюстрацию роста цен на память.
  • Раньше топ-рекомендацией для локальных моделей был Mac Studio (за объём unified memory), но он почти распродан.
  • Кейс «утреннего брифинга» настраивается на 9 утра по восточному времени, по интересам: ИИ, фондовые инвестиции, технологии, Boston Celtics.
  • Finn в шутку упоминает, что «только что потерял ~100 000 подписчиков» (контекст — отсылка к Boston Celtics/Jason Tatum).
  • Greg Isenberg обещает добавить ссылки на Alex Finn (X/бывший Twitter, YouTube) в описание эпизода.

Источники

  • Hermes Agent (desktop) — главный продукт обзора
  • OpenClaw — конкурирующий агент (в транскрипте также «Aupin Klo»)
  • Paperclip («Скрепка») — инструмент мульти-агентов по ролям, который Finn критикует
  • Idea Browser — инструмент генерации бизнес-идей, связка с Hermes
  • NVIDIA DGX Spark — устройство для локальных моделей (в транскрипте «DJI X Spark»)
  • Mac Studio — альтернатива для локального инференса
  • Vibe Coding Academy — продукт/сообщество Alex Finn
  • Модели: Anthropic Opus 4.8 / Haiku, OpenAI GPT-5.5, Qwen 3, NVIDIA Nemotron
  • Платформы для сканирования проблем: Reddit, X (Twitter)

Рекомендации

  • Создавать отдельные профили под разные модели и пользоваться раздельными сессиями/папками для экономии.
  • Применять технику обратного промпта: сначала рассказать агенту о себе, потом попросить его сгенерировать оптимальный prompt.
  • Отключать ненужные из 150+ скиллов и держать контекст узким.
  • Завести cron-задачу, которая круглосуточно ищет чужие проблемы под твои навыки.
  • Если позволяют средства — купить DGX Spark (или Mac Studio) для бесплатного локального инференса; рассматривать это как инвестицию, а не подписку.
  • Использовать агентов для решения чужих проблем, а не для экспериментов.

Итог

Hermes Desktop выигрывает организацией, а не магией: управляй контекстом, подбирай модель под задачу — и агент станет круглосуточным сотрудником, который находит чужие проблемы и превращает их в деньги.

readmint Pro

То, что вы только что прочитали — это саммари readmint

Оформите доступ — и получайте такой же разбор по любому своему видео. Вставляете ссылку, через 2–3 минуты готов пересказ с главными тезисами и цитатами. Без воды и без перемотки.

  • Безлимит саммари — сколько угодно видео
  • Главные тезисы и цитаты без воды
  • Приоритет в очереди обработки
  • Без рекламы и сторонних блоков
Получить такое же саммари
Доступ откроется сразу после оплаты — вставите ссылку и начнёте.

Или 4 900 ₽/год — доступ откроется сразу после оплаты.

Ещё с канала «Greg Isenberg»

Все видео