Демис Хассабис: Агенты, AGI и следующий большой научный прорыв

Y Combinator29 апреля 2026238 9204 83412 мин чтения31 мая, 05:31

Коротко

Демис Хассабис оценивает сроки появления AGI примерно в 2030 год и даёт «50 на 50» вероятность того, что текущей парадигмы (масштабирование + chain-of-thought + агенты) хватит без одной-двух принципиально новых идей. Нерешёнными он называет непрерывное обучение, долгосрочное мышление и память — сейчас всё это «приклеивается на скотч» через контекстное окно, что он считает грубой силой и архитектурно неправильным. DeepMind переносит наследие AlphaGo/AlphaZero (агентность, RL, поиск Монте-Карло) в Gemini, а ключевой компетенцией называет дистилляцию: маленькие модели (Flash, Gemma, nano) дают ~95% качества Frontier за ~10% стоимости и нужны для обслуживания миллиардов пользователей и работы на устройствах/в робототехнике. Хассабис формулирует «рецепт AlphaFold» (огромное комбинаторное пространство + чёткая целевая функция + данные/симулятор), советует основателям идти в deep tech на стыке ИИ и науки и закладывать появление AGI в середину своего 10-летнего пути.

Главный тезис

Агенты и текущая парадигма — верная дорога к AGI, но для полноценного интеллекта не хватает непрерывного обучения и памяти; недостающих фундаментальных идей, скорее всего, одна-две, и мы «только в самом начале».

Ключевые идеи

  • 0:00 — нерешены три вещи: непрерывное обучение, долгосрочное мышление и аспекты памяти; они нужны для AGI.
  • 3:20 — вероятность того, что нужна одна-две большие новые идеи (а не просто масштабирование существующих методов), Хассабис оценивает как 50/50.
  • 2:35 — он не верит, что через пару лет окажется, что текущий путь был тупиком: пройдено слишком многое.
  • 3:40 — память сейчас собирается «на скотч»: всё запихивается в контекстное окно, что «грубая сила» и архитектурно неверно.
  • 4:55 — даже при бесконечном хранении остаётся нетривиальная цена поиска релевантного фрагмента памяти для конкретного решения.
  • 5:56 — миллион токенов «не так много»: это всего ~20 минут видео, для понимания жизни за месяц-два нужно куда больше.
  • 6:27 — DeepMind делал агентов с самого начала: Atari, AlphaGo, AlphaStar — системы, которые сами ставят цели и строят планы.
  • 8:12дистилляция даёт модели на ~95% уровня Frontier за ~10% стоимости; это главная сила для обслуживания миллиардов пользователей.
  • 9:47информационного предела для маленьких моделей пока не видно: 50B/400B потенциально могут стать как сегодняшние топовые.
  • 10:40 — инженеры уже делают в 5–10 раз больше работы, чем полгода назад; ссылка на Стива Йегги о «1000×» относительно гугл-инженера 2000-х.
  • 14:59 — интеллект моделей неровный: золотая медаль IMO, но элементарные арифметические ошибки при определённой постановке вопроса.
  • 12:48 — именно отсутствие непрерывного обучения мешает агентам доводить задачи до конца: они плохо адаптируются к конкретному контексту.
  • 33:51 — «рецепт AlphaFold»: огромное комбинаторное пространство + чёткая целевая функция + много данных/симулятор.
  • 22:45 — мультимодальность Gemini «недооценена»: даёт преимущество для моделей мира, Genie, Gemini Robotics и понимания физического мира.
  • 0:15 — стартуя в deep tech сегодня (10-летний путь), нужно закладывать появление AGI в середину пути и уметь это использовать.

Почему это важно

Это карта приоритетов человека, который буквально руководит созданием Gemini и определяет, куда движется Google DeepMind. Хассабис прямо очерчивает фронтир (память, непрерывное обучение, агентность) и одновременно подаёт сигнал индустрии и инвесторам: чисто софтверные «обёртки вокруг базовой модели» уязвимы перед следующим обновлением фундаментальных моделей, а защищённую ценность создают междисциплинарные deep-tech-команды на стыке ИИ и науки (материаловедение, медицина, биология). Выигрывают те, кто владеет и ML, и предметной областью; проигрывают «AI-for-science» стартапы без собственного научного ядра. Упомянуты Google (распространение Gemini во все продукты), китайские open-source-модели как конкуренты Gemma, Isomorphic Labs в фарме — каждому это нужно, чтобы застолбить место до прихода AGI.

Идеи

  • Память в мозге консолидируется во сне (REM, гиппокамп) — отсюда метафора «циклов сна» для непрерывного обучения у моделей.
  • Experience replay в DQN (2013) был прямым заимствованием из нейробиологии — переигрывание успешных траекторий.
  • Странность трансформеров: один и тот же вес используется «снова и снова» — Хассабиса это смущает как неестественное.
  • Человеческая рабочая память — около 7 элементов; у моделей миллион–десять миллионов «окон», но они пытаются хранить всё, включая ненужное и неверное.
  • Million-token контекст «достаточно велик для большинства задач», но наивная запись всех токенов видео в реальном времени мгновенно его исчерпывает.
  • AlphaGo/AlphaZero-идеи (поиск Монте-Карло, RL) сегодня переоткрываются «в более общем смысле» внутри базовых моделей с режимами мышления.
  • Дистилляция — не вынужденная мера, а стратегическое преимущище: одни и те же методы дают и Flash, и Gemma, и nano для Android/очков/роботов.
  • Локальные модели на устройстве обрабатывают приватный аудиовизуальный поток локально, делегируя облачным «фронт-моделям» лишь отдельные случаи (оркестрация).
  • Open-weights важны геополитически: нужны «западные стеки» с открытым кодом как ответ сильным китайским открытым моделям.
  • Никто не может позволить себе бесплатно держать две фронт-модели максимального размера с разными свойствами — отсюда выбор открывать именно периферийные (nano) модели.
  • Vibe-кодинг: прототип тематического парка за полчаса против 6 месяцев в 17 лет — но AAA-хита, закодированного «на вайбах», ещё нет.
  • Почему ребёнок ещё не сделал хит на 10 млн копий чисто через ИИ — значит, чего-то не хватает (процесс? инструменты? мастерство/«душа»/вкус?).
  • Возможен парадоксальный ответ: ничего не не хватает, просто мы неправильно используем уже существующие системы — нужен творец с глубоким владением инструментом.
  • Сначала придёт не автономия, а ускорение людей в «тысячу раз» — автономные хиты появятся позже.
  • Десятки агентов на ~40 часов работы пока не дают результата, оправдывающего такие вложения — но дадут (горизонт 6–12 месяцев).
  • Изобрести «Ход 37» — мало; Хассабис хочет систему, которая по короткому описанию изобретёт саму игру Го (правила за 5 минут, мастерство — за жизнь, эстетически красива).
  • Мониторинг chain-of-thought: модель иногда видит, что курс ошибочен, но, не найдя лучше, возвращается к нему — не хватает самоанализа процесса мышления.
  • Inference никогда не станет «по сути бесплатным» — парадокс Джевонса: всю доступную мощность всё равно поглотят миллионы совместно работающих агентов.
  • Группы агентов, думающих в разных направлениях, с последующим объединением — режим исследования.
  • Энергозатраты упадут почти до нуля при решении термояда/сверхпроводников/батарей (материаловедение), но физическое производство чипов останется узким местом на десятилетия.
  • Виртуальная клетка: начать с относительно самодостаточного ядра клетки, потому что можно «отрезать» кусок сложности с чёткими input/output.
  • Главная проблема виртуальной клетки — данные: нет метода визуализировать живую клетку с нанометровым разрешением, не убивая её.
  • AlphaFold-проблемы — те, где «законы физики позволяют» решение, и вопрос лишь в эффективном поиске иголки в стоге сена.
  • «Тест Эйнштейна»: обучить систему на знаниях 1901 года — выведет ли она спецтеорию относительности 1905-го (Annus Mirabilis)?
  • Ещё сложнее, чем решить задачу тысячелетия, — придумать новый набор задач тысячелетия, достойных жизни математика.
  • Долговечное и стоящее не бывает лёгким — поэтому Хассабис всегда тянулся к deep tech.
  • В 2010-м инвесторы и академия говорили «это не работает, пробовали в 90-х» — вера и убеждённость важнее консенсуса.
  • Будущее — не один гигантский мозг: Gemini как общая система, вызывающая специализированные (Alpha-подобные) как инструменты, иначе слишком много регрессий.

Инсайты

  • Контекстное окно — это паллиатив, а не решение памяти: бесконечное хранение не устраняет фундаментальную стоимость извлечения релевантного, что делает поиск, а не объём, настоящей задачей.
  • Прогресс в AI часто идёт через возврат к старым идеям на новом масштабе — «тёмные века» 2013-го содержат механизмы (replay, MCTS), переоткрываемые сегодня.
  • Биологический мозг — действующий контрпример к архитектуре трансформеров, и расхождения (сон, консолидация, переменные веса) указывают, где искать недостающие идеи.
  • Маленькие модели — не компромисс, а отдельная стратегическая ось: скорость итераций ценнее последних 5% качества для целых классов задач (кодинг, робототехника, приватность на устройстве).
  • Граница ценности в ИИ смещается от «силы модели» к владению инструментом: ограничителем становится человеческое мастерство, вкус и творческий импульс, а не способности системы.
  • Креативность как способность ставить задачи (а не решать заданные) — текущий потолок: системы интерполируют и экстраполируют, но не мыслят по аналогии и не порождают по-настоящему новые гипотезы.
  • Удешевление inference не высвобождает ресурс, а индуцирует спрос (Джевонс) — вычисления останутся дефицитом, пока есть узкие места в физическом мире.
  • Хорошая научная мишень для ИИ определяется структурой задачи (комбинаторный взрыв + измеримая цель + генерируемые данные), а не предметной областью — это переносимый критерий.
  • Защищённость бизнеса от «прилива» базовых моделей даёт привязка к миру атомов и междисциплинарность, а не к чистому софту.
  • Моделирование сложных систем требует искусства декомпозиции: найти самодостаточный модуль с чистыми границами важнее, чем моделировать всё сразу.
  • Узкое место науки всё чаще не алгоритм, а измерительный инструмент, генерирующий данные (живая клетка без разрушения) — прогресс ИИ упирается в физику наблюдения.
  • Архитектура будущего интеллекта — модульная оркестрация общих и специализированных систем, а не монолит: универсальность и специализация дополняют, а не вытесняют друг друга.

Цитаты

«Constant learning, long-term thinking, some aspects of memory, all this is not yet solved.» — 0:00 Непрерывное обучение, долгосрочное мышление, некоторые аспекты памяти — всё это ещё не решено.

«So, agents, this is the way, and I think we're just getting started.» — 0:31 Итак, агенты — это путь, и, думаю, мы только начинаем.

«I don't see a world in which we'll understand in a couple of years that it was a deaf corner.» — 2:35 Я не вижу мира, в котором через пару лет мы поймём, что это был тупик.

«I think you know that my rate is about 50-50, if that's true.» — 3:20 Думаю, вы знаете, что моя оценка — примерно 50 на 50, так это или нет.

«now we seem to be putting it together with the help of a sticky line» — 3:40 сейчас мы будто склеиваем это на скотч.

«a million tokens is not so much. It's only about 20 minutes.» — 5:56 миллион токенов — не так много. Это всего около 20 минут.

«It's a 50-year-old, grandiose challenge in biology, and they gave it to every scientist on Earth for free.» — 1:23 Это грандиозный 50-летний вызов в биологии, и они бесплатно отдали его каждому учёному на Земле.

«flash models that are 95% better than Frontier and cost about 10% cheaper» — 8:12 flash-модели на уровне 95% от Frontier при стоимости около 10%.

«You need an active system that can actively solve problems so that you can reach AGI.» — 15:43 Нужна активная система, способная активно решать задачи, чтобы достичь AGI.

«It's not enough to invent Hit 37.» — 19:00 Изобрести «Ход 37» — недостаточно.

«I want a system that can find Go, if you give it a short description» — 19:09 Я хочу систему, которая придумает Го по короткому описанию.

«sometimes it will look at the course, realize that it is a mistake, but cannot find anything better, so it returns to this course and still does it» — 14:31 иногда модель видит, что курс ошибочен, но не находит лучше — и всё равно к нему возвращается.

«I think that we will just use everything, we will use everything that is in our power» — 24:15 думаю, мы просто используем всё, всю мощность, что нам доступна.

«I think that in about 10 years we will be in the shape of a virtual cell» — 26:33 думаю, примерно через 10 лет мы получим виртуальную клетку.

«no brute force or special case algorithm will solve this problem» — 33:56 ни грубая сила, ни частный алгоритм эту задачу не решат.

«I sometimes call it my Einstein test» — 37:23 я иногда называю это своим тестом Эйнштейна.

«I would like to solve, equals NP. This is my favorite task.» — 36:47 я хотел бы решить P = NP. Это моя любимая задача.

«nothing really long-lasting and worth it is easy» — 31:48 ничто по-настоящему долговечное и стоящее не даётся легко.

«you just need to consider the appearance of the USA in the middle of its journey» — 0:15 нужно закладывать появление AGI в середину своего пути.

«It turned out that it did, but maybe not. Maybe we came 50 years earlier.» — 32:57 Оказалось, что важнейшая — но, может, и нет. Возможно, мы пришли на 50 лет раньше.

Факты

  • Демис Хассабис: в детстве — шахматный вундеркинд; в 17 лет сделал первую популярную игру-парк (Theme Park); степень по философии и когнитивной нейробиологии; опубликовал фундаментальную работу о памяти и воображении в мозге; в 2010 соосновал DeepMind.
  • В прошлом году (2024) получил Нобелевскую премию по химии за работу, связанную с AlphaFold.
  • AlphaGo обыграл чемпиона мира по Го; AlphaFold решил предсказание структуры белка — «50-летний вызов».
  • Первая программа DeepMind для Atari — DQN, ~2013, использовала experience replay из нейробиологии.
  • Личный прогноз Хассабиса по AGI — «около 2030».
  • Рабочая память человека — около 7 элементов; контекст моделей — миллион / десять миллионов «окон».
  • Миллион токенов ≈ 20 минут видео.
  • Gemma: около 40 млн загрузок за две с половиной недели (по словам спикера); упомянуты «Gemma 4».
  • Isomorphic Labs выделена из DeepMind после AlphaFold 2; «скоро большие анонсы».
  • Виртуальная клетка — горизонт ~10 лет; начинают с ядра клетки.
  • Системы DeepMind для научного поиска: CoScientist, AlphaEvolve («идёт чуть дальше базового Gemini»).
  • «Ход 37» — во второй партии AlphaGo; AlphaFold начали в день возвращения из Сеула, ~10 лет назад; Хассабис едет в Корею отмечать 10 лет AlphaGo.
  • Ссылка на Стива Йегги: ~1000× продуктивности относительно гугл-инженера ~2000-х; оценка «в 5–10 раз больше работы, чем полгода назад» (хедж: «I'm not sure I've seen the results that would justify such an input level, but I think they will»).
  • Над дистилляцией работают «мировые эксперты», среди упомянутых — Джефф (Jeff Dean) и Орал (Oriol Vinyals).
  • DeepMind основан в 2010; тогда направление считалось «нишевым, не работающим» (по словам инвесторов и академии).

Источники

  • DeepMind / Google DeepMind, Gemini, Gemma — компания и модели спикера.
  • AlphaGo, AlphaZero, AlphaStar, DQN, AlphaFold (1/2) — проекты DeepMind.
  • CoScientist, AlphaEvolve, Genie, Gemini Robotics — исследовательские системы.
  • Isomorphic Labs — фарм-компания, выделенная из DeepMind.
  • Парадокс Джевонса — экономический принцип, на который ссылается спикер.
  • Тест Эйнштейна / Annus Mirabilis (1905) — концептуальный бенчмарк научной креативности.
  • Задачи тысячелетия, P = NP, гипотеза Римана — упомянутые математические цели.
  • Стив Йегги (Steve Yegge) — источник тезиса о 1000× продуктивности.
  • Y Combinator — контекст мероприятия (интервьюер Гарри, набор в школу в Сан-Франциско 25–26 июля).

Рекомендации

  • Основателям: идти в deep tech на стыке ИИ и сложной науки (материаловедение, медицина) — такие категории защищены от «прилива» базовых моделей.
  • Иметь команду с двойной экспертизой — ML + предметная область — или собирать таких сооснователей.
  • Работать над тем, чем по-настоящему одержим, и закладывать появление AGI в середину своего 10-летнего пути, проектируя продукт под этот сценарий.
  • Привносить в созданное с помощью ИИ человеческое мастерство, душу и вкус — без этого хитов не будет.

Итог

Агенты и масштабирование ведут к AGI к ~2030 году, но последний рубеж — память и непрерывное обучение, а настоящую ценность создаст не очередная обёртка над моделью, а человеческое мастерство и deep tech на стыке ИИ с миром атомов.

readmint Pro

То, что вы только что прочитали — это саммари readmint

Оформите доступ — и получайте такой же разбор по любому своему видео. Вставляете ссылку, через 2–3 минуты готов пересказ с главными тезисами и цитатами. Без воды и без перемотки.

  • Безлимит саммари — сколько угодно видео
  • Главные тезисы и цитаты без воды
  • Приоритет в очереди обработки
  • Без рекламы и сторонних блоков
Получить такое же саммари
Доступ откроется сразу после оплаты — вставите ссылку и начнёте.

Или 4 900 ₽/год — доступ откроется сразу после оплаты.

Ещё с канала «Y Combinator»

Все видео