Коротко
Демис Хассабис оценивает сроки появления AGI примерно в 2030 год и даёт «50 на 50» вероятность того, что текущей парадигмы (масштабирование + chain-of-thought + агенты) хватит без одной-двух принципиально новых идей. Нерешёнными он называет непрерывное обучение, долгосрочное мышление и память — сейчас всё это «приклеивается на скотч» через контекстное окно, что он считает грубой силой и архитектурно неправильным. DeepMind переносит наследие AlphaGo/AlphaZero (агентность, RL, поиск Монте-Карло) в Gemini, а ключевой компетенцией называет дистилляцию: маленькие модели (Flash, Gemma, nano) дают ~95% качества Frontier за ~10% стоимости и нужны для обслуживания миллиардов пользователей и работы на устройствах/в робототехнике. Хассабис формулирует «рецепт AlphaFold» (огромное комбинаторное пространство + чёткая целевая функция + данные/симулятор), советует основателям идти в deep tech на стыке ИИ и науки и закладывать появление AGI в середину своего 10-летнего пути.
Главный тезис
Агенты и текущая парадигма — верная дорога к AGI, но для полноценного интеллекта не хватает непрерывного обучения и памяти; недостающих фундаментальных идей, скорее всего, одна-две, и мы «только в самом начале».
Ключевые идеи
- 0:00 — нерешены три вещи: непрерывное обучение, долгосрочное мышление и аспекты памяти; они нужны для AGI.
- 3:20 — вероятность того, что нужна одна-две большие новые идеи (а не просто масштабирование существующих методов), Хассабис оценивает как 50/50.
- 2:35 — он не верит, что через пару лет окажется, что текущий путь был тупиком: пройдено слишком многое.
- 3:40 — память сейчас собирается «на скотч»: всё запихивается в контекстное окно, что «грубая сила» и архитектурно неверно.
- 4:55 — даже при бесконечном хранении остаётся нетривиальная цена поиска релевантного фрагмента памяти для конкретного решения.
- 5:56 — миллион токенов «не так много»: это всего ~20 минут видео, для понимания жизни за месяц-два нужно куда больше.
- 6:27 — DeepMind делал агентов с самого начала: Atari, AlphaGo, AlphaStar — системы, которые сами ставят цели и строят планы.
- 8:12 — дистилляция даёт модели на ~95% уровня Frontier за ~10% стоимости; это главная сила для обслуживания миллиардов пользователей.
- 9:47 — информационного предела для маленьких моделей пока не видно: 50B/400B потенциально могут стать как сегодняшние топовые.
- 10:40 — инженеры уже делают в 5–10 раз больше работы, чем полгода назад; ссылка на Стива Йегги о «1000×» относительно гугл-инженера 2000-х.
- 14:59 — интеллект моделей неровный: золотая медаль IMO, но элементарные арифметические ошибки при определённой постановке вопроса.
- 12:48 — именно отсутствие непрерывного обучения мешает агентам доводить задачи до конца: они плохо адаптируются к конкретному контексту.
- 33:51 — «рецепт AlphaFold»: огромное комбинаторное пространство + чёткая целевая функция + много данных/симулятор.
- 22:45 — мультимодальность Gemini «недооценена»: даёт преимущество для моделей мира, Genie, Gemini Robotics и понимания физического мира.
- 0:15 — стартуя в deep tech сегодня (10-летний путь), нужно закладывать появление AGI в середину пути и уметь это использовать.
Почему это важно
Это карта приоритетов человека, который буквально руководит созданием Gemini и определяет, куда движется Google DeepMind. Хассабис прямо очерчивает фронтир (память, непрерывное обучение, агентность) и одновременно подаёт сигнал индустрии и инвесторам: чисто софтверные «обёртки вокруг базовой модели» уязвимы перед следующим обновлением фундаментальных моделей, а защищённую ценность создают междисциплинарные deep-tech-команды на стыке ИИ и науки (материаловедение, медицина, биология). Выигрывают те, кто владеет и ML, и предметной областью; проигрывают «AI-for-science» стартапы без собственного научного ядра. Упомянуты Google (распространение Gemini во все продукты), китайские open-source-модели как конкуренты Gemma, Isomorphic Labs в фарме — каждому это нужно, чтобы застолбить место до прихода AGI.
Идеи
- Память в мозге консолидируется во сне (REM, гиппокамп) — отсюда метафора «циклов сна» для непрерывного обучения у моделей.
- Experience replay в DQN (2013) был прямым заимствованием из нейробиологии — переигрывание успешных траекторий.
- Странность трансформеров: один и тот же вес используется «снова и снова» — Хассабиса это смущает как неестественное.
- Человеческая рабочая память — около 7 элементов; у моделей миллион–десять миллионов «окон», но они пытаются хранить всё, включая ненужное и неверное.
- Million-token контекст «достаточно велик для большинства задач», но наивная запись всех токенов видео в реальном времени мгновенно его исчерпывает.
- AlphaGo/AlphaZero-идеи (поиск Монте-Карло, RL) сегодня переоткрываются «в более общем смысле» внутри базовых моделей с режимами мышления.
- Дистилляция — не вынужденная мера, а стратегическое преимущище: одни и те же методы дают и Flash, и Gemma, и nano для Android/очков/роботов.
- Локальные модели на устройстве обрабатывают приватный аудиовизуальный поток локально, делегируя облачным «фронт-моделям» лишь отдельные случаи (оркестрация).
- Open-weights важны геополитически: нужны «западные стеки» с открытым кодом как ответ сильным китайским открытым моделям.
- Никто не может позволить себе бесплатно держать две фронт-модели максимального размера с разными свойствами — отсюда выбор открывать именно периферийные (nano) модели.
- Vibe-кодинг: прототип тематического парка за полчаса против 6 месяцев в 17 лет — но AAA-хита, закодированного «на вайбах», ещё нет.
- Почему ребёнок ещё не сделал хит на 10 млн копий чисто через ИИ — значит, чего-то не хватает (процесс? инструменты? мастерство/«душа»/вкус?).
- Возможен парадоксальный ответ: ничего не не хватает, просто мы неправильно используем уже существующие системы — нужен творец с глубоким владением инструментом.
- Сначала придёт не автономия, а ускорение людей в «тысячу раз» — автономные хиты появятся позже.
- Десятки агентов на ~40 часов работы пока не дают результата, оправдывающего такие вложения — но дадут (горизонт 6–12 месяцев).
- Изобрести «Ход 37» — мало; Хассабис хочет систему, которая по короткому описанию изобретёт саму игру Го (правила за 5 минут, мастерство — за жизнь, эстетически красива).
- Мониторинг chain-of-thought: модель иногда видит, что курс ошибочен, но, не найдя лучше, возвращается к нему — не хватает самоанализа процесса мышления.
- Inference никогда не станет «по сути бесплатным» — парадокс Джевонса: всю доступную мощность всё равно поглотят миллионы совместно работающих агентов.
- Группы агентов, думающих в разных направлениях, с последующим объединением — режим исследования.
- Энергозатраты упадут почти до нуля при решении термояда/сверхпроводников/батарей (материаловедение), но физическое производство чипов останется узким местом на десятилетия.
- Виртуальная клетка: начать с относительно самодостаточного ядра клетки, потому что можно «отрезать» кусок сложности с чёткими input/output.
- Главная проблема виртуальной клетки — данные: нет метода визуализировать живую клетку с нанометровым разрешением, не убивая её.
- AlphaFold-проблемы — те, где «законы физики позволяют» решение, и вопрос лишь в эффективном поиске иголки в стоге сена.
- «Тест Эйнштейна»: обучить систему на знаниях 1901 года — выведет ли она спецтеорию относительности 1905-го (Annus Mirabilis)?
- Ещё сложнее, чем решить задачу тысячелетия, — придумать новый набор задач тысячелетия, достойных жизни математика.
- Долговечное и стоящее не бывает лёгким — поэтому Хассабис всегда тянулся к deep tech.
- В 2010-м инвесторы и академия говорили «это не работает, пробовали в 90-х» — вера и убеждённость важнее консенсуса.
- Будущее — не один гигантский мозг: Gemini как общая система, вызывающая специализированные (Alpha-подобные) как инструменты, иначе слишком много регрессий.
Инсайты
- Контекстное окно — это паллиатив, а не решение памяти: бесконечное хранение не устраняет фундаментальную стоимость извлечения релевантного, что делает поиск, а не объём, настоящей задачей.
- Прогресс в AI часто идёт через возврат к старым идеям на новом масштабе — «тёмные века» 2013-го содержат механизмы (replay, MCTS), переоткрываемые сегодня.
- Биологический мозг — действующий контрпример к архитектуре трансформеров, и расхождения (сон, консолидация, переменные веса) указывают, где искать недостающие идеи.
- Маленькие модели — не компромисс, а отдельная стратегическая ось: скорость итераций ценнее последних 5% качества для целых классов задач (кодинг, робототехника, приватность на устройстве).
- Граница ценности в ИИ смещается от «силы модели» к владению инструментом: ограничителем становится человеческое мастерство, вкус и творческий импульс, а не способности системы.
- Креативность как способность ставить задачи (а не решать заданные) — текущий потолок: системы интерполируют и экстраполируют, но не мыслят по аналогии и не порождают по-настоящему новые гипотезы.
- Удешевление inference не высвобождает ресурс, а индуцирует спрос (Джевонс) — вычисления останутся дефицитом, пока есть узкие места в физическом мире.
- Хорошая научная мишень для ИИ определяется структурой задачи (комбинаторный взрыв + измеримая цель + генерируемые данные), а не предметной областью — это переносимый критерий.
- Защищённость бизнеса от «прилива» базовых моделей даёт привязка к миру атомов и междисциплинарность, а не к чистому софту.
- Моделирование сложных систем требует искусства декомпозиции: найти самодостаточный модуль с чистыми границами важнее, чем моделировать всё сразу.
- Узкое место науки всё чаще не алгоритм, а измерительный инструмент, генерирующий данные (живая клетка без разрушения) — прогресс ИИ упирается в физику наблюдения.
- Архитектура будущего интеллекта — модульная оркестрация общих и специализированных систем, а не монолит: универсальность и специализация дополняют, а не вытесняют друг друга.
Цитаты
«Constant learning, long-term thinking, some aspects of memory, all this is not yet solved.» — 0:00 Непрерывное обучение, долгосрочное мышление, некоторые аспекты памяти — всё это ещё не решено.
«So, agents, this is the way, and I think we're just getting started.» — 0:31 Итак, агенты — это путь, и, думаю, мы только начинаем.
«I don't see a world in which we'll understand in a couple of years that it was a deaf corner.» — 2:35 Я не вижу мира, в котором через пару лет мы поймём, что это был тупик.
«I think you know that my rate is about 50-50, if that's true.» — 3:20 Думаю, вы знаете, что моя оценка — примерно 50 на 50, так это или нет.
«now we seem to be putting it together with the help of a sticky line» — 3:40 сейчас мы будто склеиваем это на скотч.
«a million tokens is not so much. It's only about 20 minutes.» — 5:56 миллион токенов — не так много. Это всего около 20 минут.
«It's a 50-year-old, grandiose challenge in biology, and they gave it to every scientist on Earth for free.» — 1:23 Это грандиозный 50-летний вызов в биологии, и они бесплатно отдали его каждому учёному на Земле.
«flash models that are 95% better than Frontier and cost about 10% cheaper» — 8:12 flash-модели на уровне 95% от Frontier при стоимости около 10%.
«You need an active system that can actively solve problems so that you can reach AGI.» — 15:43 Нужна активная система, способная активно решать задачи, чтобы достичь AGI.
«It's not enough to invent Hit 37.» — 19:00 Изобрести «Ход 37» — недостаточно.
«I want a system that can find Go, if you give it a short description» — 19:09 Я хочу систему, которая придумает Го по короткому описанию.
«sometimes it will look at the course, realize that it is a mistake, but cannot find anything better, so it returns to this course and still does it» — 14:31 иногда модель видит, что курс ошибочен, но не находит лучше — и всё равно к нему возвращается.
«I think that we will just use everything, we will use everything that is in our power» — 24:15 думаю, мы просто используем всё, всю мощность, что нам доступна.
«I think that in about 10 years we will be in the shape of a virtual cell» — 26:33 думаю, примерно через 10 лет мы получим виртуальную клетку.
«no brute force or special case algorithm will solve this problem» — 33:56 ни грубая сила, ни частный алгоритм эту задачу не решат.
«I sometimes call it my Einstein test» — 37:23 я иногда называю это своим тестом Эйнштейна.
«I would like to solve, equals NP. This is my favorite task.» — 36:47 я хотел бы решить P = NP. Это моя любимая задача.
«nothing really long-lasting and worth it is easy» — 31:48 ничто по-настоящему долговечное и стоящее не даётся легко.
«you just need to consider the appearance of the USA in the middle of its journey» — 0:15 нужно закладывать появление AGI в середину своего пути.
«It turned out that it did, but maybe not. Maybe we came 50 years earlier.» — 32:57 Оказалось, что важнейшая — но, может, и нет. Возможно, мы пришли на 50 лет раньше.
Факты
- Демис Хассабис: в детстве — шахматный вундеркинд; в 17 лет сделал первую популярную игру-парк (Theme Park); степень по философии и когнитивной нейробиологии; опубликовал фундаментальную работу о памяти и воображении в мозге; в 2010 соосновал DeepMind.
- В прошлом году (2024) получил Нобелевскую премию по химии за работу, связанную с AlphaFold.
- AlphaGo обыграл чемпиона мира по Го; AlphaFold решил предсказание структуры белка — «50-летний вызов».
- Первая программа DeepMind для Atari — DQN, ~2013, использовала experience replay из нейробиологии.
- Личный прогноз Хассабиса по AGI — «около 2030».
- Рабочая память человека — около 7 элементов; контекст моделей — миллион / десять миллионов «окон».
- Миллион токенов ≈ 20 минут видео.
- Gemma: около 40 млн загрузок за две с половиной недели (по словам спикера); упомянуты «Gemma 4».
- Isomorphic Labs выделена из DeepMind после AlphaFold 2; «скоро большие анонсы».
- Виртуальная клетка — горизонт ~10 лет; начинают с ядра клетки.
- Системы DeepMind для научного поиска: CoScientist, AlphaEvolve («идёт чуть дальше базового Gemini»).
- «Ход 37» — во второй партии AlphaGo; AlphaFold начали в день возвращения из Сеула, ~10 лет назад; Хассабис едет в Корею отмечать 10 лет AlphaGo.
- Ссылка на Стива Йегги: ~1000× продуктивности относительно гугл-инженера ~2000-х; оценка «в 5–10 раз больше работы, чем полгода назад» (хедж: «I'm not sure I've seen the results that would justify such an input level, but I think they will»).
- Над дистилляцией работают «мировые эксперты», среди упомянутых — Джефф (Jeff Dean) и Орал (Oriol Vinyals).
- DeepMind основан в 2010; тогда направление считалось «нишевым, не работающим» (по словам инвесторов и академии).
Источники
- DeepMind / Google DeepMind, Gemini, Gemma — компания и модели спикера.
- AlphaGo, AlphaZero, AlphaStar, DQN, AlphaFold (1/2) — проекты DeepMind.
- CoScientist, AlphaEvolve, Genie, Gemini Robotics — исследовательские системы.
- Isomorphic Labs — фарм-компания, выделенная из DeepMind.
- Парадокс Джевонса — экономический принцип, на который ссылается спикер.
- Тест Эйнштейна / Annus Mirabilis (1905) — концептуальный бенчмарк научной креативности.
- Задачи тысячелетия, P = NP, гипотеза Римана — упомянутые математические цели.
- Стив Йегги (Steve Yegge) — источник тезиса о 1000× продуктивности.
- Y Combinator — контекст мероприятия (интервьюер Гарри, набор в школу в Сан-Франциско 25–26 июля).
Рекомендации
- Основателям: идти в deep tech на стыке ИИ и сложной науки (материаловедение, медицина) — такие категории защищены от «прилива» базовых моделей.
- Иметь команду с двойной экспертизой — ML + предметная область — или собирать таких сооснователей.
- Работать над тем, чем по-настоящему одержим, и закладывать появление AGI в середину своего 10-летнего пути, проектируя продукт под этот сценарий.
- Привносить в созданное с помощью ИИ человеческое мастерство, душу и вкус — без этого хитов не будет.
Итог
Агенты и масштабирование ведут к AGI к ~2030 году, но последний рубеж — память и непрерывное обучение, а настоящую ценность создаст не очередная обёртка над моделью, а человеческое мастерство и deep tech на стыке ИИ с миром атомов.