Грант Сандерсон (3Blue1Brown) – ИИ и будущее математики

Dwarkesh Patel30 июня 2026175 5264 57714 мин чтениясегодня, 04:25

Коротко

Грант Сандерсон (3Blue1Brown) объясняет Дваркешу, почему золото на IMO не стало «моментом AGI». Фронтир способностей ИИ зубчатый, и зубчатость эта фрактальна даже внутри самой математики: геометрия «решается за 19 секунд», а комбинаторика держится. Решение вроде гипотезы Римана он раскладывает на три сценария: мостик между полями, постройка новой «горы»-теории, тупой перебор через силу. Близок к тому, что LLM умеют сейчас, только первый. Центральная мысль разговора: настоящий прорыв в математике не доказательство теорем, а генерация правильных гипотез и определений. Для этого нет бенчмарка и нет RLVR-среды, потому что верификационная петля тянется сотню лет (Лагранж → Абель → Галуа → кварки). Дваркеш добавляет свою теорию: ИИ так рвётся вперёд в математике и коде из-за grindability, возможности гонять тысячи детерминированных параллельных роллаутов, которой нет у computer use и реального мира. Одной верифицируемости для этого мало. В финале оба сходятся: уцелевшая роль математика сдвигается к куратору и учителю. Социальная, реляционная функция переживёт даже сверхумные модели.

Главный тезис

Скорость прогресса ИИ в математике обманчива. Пройденные бенчмарки (IMO, отдельные гипотезы) это связывание уже известных идей «молнией между полями». А вот придумывание новых понятий и постановка правильных вопросов, качественно другой навык, не поддаётся ни бенчмаркингу, ни нынешнему обучению с проверяемой наградой: их ценность подтверждается десятилетиями.

Ключевые идеи

  • 1:36: у ИИ зубчатый фронтир способностей, и внутри математики эта зубчатость фрактальна: геометрия падает мгновенно, комбинаторика сопротивляется.
  • 2:08: в 2024 IMO модель «холодно решила» геометрию за 19 секунд брутфорс-солвером, а золото не взяла только потому, что в тот год выпало две комбинаторики.
  • 3:07: если ИИ решит Millennium-задачу, то ограничитель на пути туда, возможно, тот же, что и ограничитель для white-collar работы, а возможно и нет: зависит от природы решения.
  • 3:34: первый тип прорыва: модель эксперт во многих полях и находит «молнию»-связь между ними (как Монтгомери и Дайсон за обедом связали дзета-функцию Римана и случайные матрицы).
  • 6:34: второй тип: постройка новой «горы», целой теории (как эллиптические кривые + модулярные формы для теоремы Ферма); это навык, которого у ИИ сейчас нет.
  • 9:18: иерархия: хорошие доказывают теоремы, великие придумывают гипотезы, величайшие придумывают определения; ИИ пока живёт на нижнем этаже.
  • 11:32: то, для чего нельзя сделать бенчмарк, нельзя и обучить: между бенчмарком и тренировочной средой нет принципиальной разницы.
  • 10:31: способность генерить гипотезы измеряется не хедлайном, а сдвигом тона в разговорах с математиками между 2025 и 2026.
  • 13:24: теория Галуа: верификационная петля «полезна ли эта идея» длиной в сто лет, через криптографию и физику, при этом «человеческий верификатор» (академия) сначала её отверг.
  • 23:08: возможная награда за галуа-инстинкт: малость/сжатость понятий (колмогоровская сложность как прокси элегантности) вместо бинарного «решил или нет».
  • 32:55: разница между доказательством и объяснением: есть «нерешённые экспозиционные проблемы» (Тимоти Чоу про форсинг), где доказано, но непонятно почему.
  • 56:20: прогресс в математике и коде объясняется grindability больше, чем верифицируемостью самой по себе: детерминированные контейнеры, тысячи параллельных роллаутов, решённая проблема credit assignment.
  • 54:28: computer use верифицируем, но не гриндабелен: бот-детекторы, дорогие роллауты, живой мир меняется день ото дня, симулятор не переиграть.
  • 41:58: авторегрессия: странный способ мышления. Ты «раб контекста», а самая ценная связь по природе маловероятный следующий токен, поэтому связи между полями трудно поощрять.
  • 46:00: ключевое преимущество цифровых умов: параллелизуемость и намеренное увеличение энтропии на уровне промпта (один агент доказывает, другой опровергает, разные контексты и biases).
  • 59:48: уникальность Lean: бесконечно растущее дерево Mathlib, куда можно «залить компьют и отвернуться на 10 лет» (как AlphaZero в го), чего натуральный язык не даёт.

Почему это важно

Математика первой ушла за горизонт, поэтому она главный полигон: что происходит здесь (и что не происходит) предсказывает, как ИИ поведёт себя с остальной экономикой. Лаборатории вкачивают миллиарды ради PR-хедлайнов о поверженных гипотезах, и картина от этого кривится. Легко демонстрируемые результаты вроде решённой задачи получают всё внимание, а по-настоящему ценные вещи, правильное определение, курирование направлений, для бенчмарков невидимы и потому недофинансированы вниманием. В выигрыше те, кто понимает, куда направить «бегемота новой математики»: куратор с экономическим рычагом. Упомянуты OpenAI и DeepMind (хедлайны и переход от Lean к натуральному языку на IMO), DeepSeek (мета-верификатор для натуральных доказательств), Boeing (PDE-инсайты сэкономили миллиарды), Jane Street и Cursor как спонсоры.

Идеи

  • Дизайнеры IMO пытаются сделать задачи «нетренируемыми», но грязный секрет в том, что натренировать можно почти на всё.
  • Комбинаторика это «джокер» IMO: игривые, головоломные задачи, где выпадение двух комбинаторных вопросов решило судьбу золота.
  • «Носитель факела математики для человечества» цепляется за комбинаторику как за последний оплот креативности, но и это временно.
  • Медицинский пример связывания знаний: препарат вызывает мигрень, другой факт про то же, и вдруг один препарат лечит обе вещи, то, что человек средних способностей с таким объёмом знаний сделал бы.
  • Гипотезу нельзя вынести в хедлайн: «GPT-5.4 придумала хорошую гипотезу, честно, все считают её хорошей» просто не звучит.
  • Серия интервью с математиками снималась больше года, и в ней видно, как за «эоны» ИИ-времени (2025→2026) меняется тон.
  • Открытие абеля vs Галуа: оба под влиянием Лагранжа независимо пришли к схожим инсайтам про симметрию корней.
  • Лагранж не решил задачу: он задал правильный вопрос (искать не формулу, а доказательство невозможности), и это само по себе ценность без результата.
  • Галуа писал свой трактат в тюрьме, подростком; академия отвергла его работы как некогерентные; «функция-верификатор» дала осечку.
  • Понадобились Луивилль (через 20 лет) и Жордан (ещё через 20), чтобы вытащить и оформить идеи Галуа в современную теорию групп.
  • Гелл-Манн предсказал кварки из чисто теоретико-группового вопроса, одно из самых красивых поздних применений.
  • «Разожги человеку костёр, он согреется на ночь; подожги человека, он согреется на всю жизнь», как Грант описывает своё отношение к ИИ.
  • Возможная роль математика будущего: не объяснитель, а куратор музея искусств в почти бесконечном пространстве идей.
  • Человеческих музыкантов и математиков сохранит социальная функция «истории за ними», даже если MP3 или доказательство объективно лучше у модели.
  • ABC-гипотеза Мотидзуки (inter-universal geometry) как страшный сценарий «чужой» математики: годы восхождения на гору, которая может оказаться неверной.
  • Дэвид Бессис, «The Fall of the Theorem Economy»: доказательства теорем получают кредит, но паразитируют на определениях; ИИ ломает привычное распределение авторства.
  • Диффузионные модели для текста производят не радикально иное, значит важнее данные и среда, чем архитектура и loss-функция.
  • «Троллевая» задача IMO, на которой провалились сильные ученики и сам Терри Тао: элегантный манящий путь неверен, а верно почти «мозгонедоступно» простое решение, нужно сбежать из контекста IMO.
  • Ботокс-эксперимент: люди хуже читают эмоции после заморозки лица, потому что понимание чужой эмоции частично это её мимикрия своими мышцами.
  • У моделей нет лицевых мышц и другое устройство «мозга», поэтому слабая theory of mind не удивительна, это как инопланетянин, пытающийся эмпатировать.
  • Хорошая карточка для интервального повторения требует проекции чужого ума на три месяца вперёд, модели проваливают этот «странно случайный» навык.
  • Реальное предпочтение Дваркеша: даже живого эксперта он хотел бы иногда ставить на паузу, чтобы базовое спросить у LLM.
  • Wikipedia-аналогия: объяснения LLM как вики, каждое предложение верно, но лучшая часть это ссылки внизу; спрашивай у LLM «кого почитать».
  • Гранта «газлайтила» Claude, приписав чужое видео каналу 3Blue1Brown, но видео реальное и полезное.
  • Обучение с тремя третями экрана: лекция Строгаца + учебник по хаосу + LLM для прунинга веток.
  • A+ учитель делает «джиу-джитсу» с креативным неправильным вопросом ученика и встраивает его; LLM вместо этого убегает по своей траектории.
  • Reward-hacking в письме: модель ведётся на «D-star», дрянное эссе, дёргающее все формальные рычаги A-эссе.
  • Письмо немодульно, в отличие от кода и математики: конечный продукт и есть то, что производит модель, слопом быть нельзя.

Инсайты

  • Заявленные «глубокие причины», почему ИИ чего-то не может, регулярно оказываются просто неправильной рамкой, вскоре после этого он это делает.
  • Обучение на human feedback создаёт структурный крен к угождению: модель хвалит вопрос вместо того, чтобы переформулировать неправильную ментальную модель спрашивающего.
  • Ценность фундаментальной идеи и её немедленная полезность разъединены во времени, поэтому рыночные и обучающие сигналы систематически недооценивают её.
  • Прогресс в закрытых, детерминированных, дешёво-параллелизуемых доменах опережает всё остальное не из-за «ума», а из-за свойств среды обучения (grindability + credit assignment).
  • Преимущества ИИ не в интеллекте единичной системы, а в мета-свойствах: параллелизм, слияние знаний, спавн копий, управляемая энтропия. «Количество имеет собственное качество».
  • Нет единственно верной эвристики для науки: нужны независимые исследовательские программы со своими biases (если все LLM «Эйнштейны», квантовая механика застрянет).
  • Проверяемость и объяснимость решения ИИ зависят от типа прорыва: молния-связь человекочитаема, новая гора требует долгого «переваривания», грубая сила даёт нечитаемую простыню.
  • Способность генерить понятия и объяснять их, вероятно, один и тот же навык (Эйнштейн, Шеннон, Фейнман, ясные экспозиторы), поэтому «объяснение» не останется человеку по остаточному принципу.
  • Сжатие как интеллект: более короткое и предсказательное представление ощущается умнее, и это можно попытаться превратить в награду за элегантность.
  • Верификация в математике многоуровнева: натуральный язык + мета-верификатор уже работают (DeepSeek), Lean даёт «зелёную галочку», о которой мечтали бы все остальные науки.
  • Устойчивость профессии определяется её реляционностью, а не когнитивным превосходством: учительство переживёт AGI, потому что мотивация к интересу - это социальный феномен.
  • Автосуждение о карьере должно начинаться с вопроса «откуда идут деньги и какую ценность я добавляю», а не «где мне дадут дальше продвигаться через обруч».
  • Ускорение чистой математики в 10–100x может обнажить неудобную правду: часть её стала практически бесполезной, и грантовые обещания про «эллиптические кривые помогут криптографии» не подтвердятся.

Фреймворки

Три сценария того, как ИИ может решить крупную проблему (напр. гипотезу Римана):

  1. Молния-связь: эксперт в поле A + эксперт в поле B, провести связь между ними; человекочитаемо.
  2. Постройка горы: создать новую теорию/абстракцию, кристаллизующую предмет; требует долгого восхождения, риск «чужой» математики.
  3. Грубая сила: сверхдлинная цепочка рассуждений без новых теорий; корректно, но нечитаемо и непереваримо.

Иерархия математиков (цитата из видео Polylog): хорошие доказывают теоремы → великие придумывают гипотезы → величайшие придумывают определения.

Три причины быстрого прогресса ИИ в математике (по Дваркешу): (1) верифицируемость домена, (2) grindability: детерминированные параллельные роллауты, (3) Lean/формализация (переоценена как VR-среда, но ценна как бесконечно растущее дерево и как «зелёная галочка» корректности).

Цитаты

«there's a spiky frontier to AI, math is just right there in one of the spikes. But there's kind of a fractal nature to that spikiness» (1:36) У ИИ зубчатый фронтир, математика прямо в одном из зубцов. Но у этой зубчатости фрактальная природа

«like geometry just solves in like 19 seconds in 2024 because it's kind of a brute force solver» (2:15) Геометрия просто решается секунд за 19 в 2024, потому что это по сути брутфорс-солвер

«how good mathematicians prove theorems, great mathematicians come up with conjectures, and the greatest mathematicians come up with definitions» (9:18) Хорошие математики доказывают теоремы, великие придумывают гипотезы, а величайшие придумывают определения

«That's the premium tier mathematician» (9:35) Это математик премиум-класса

«there's really no fundamental difference between a benchmark and a training environment» (11:40) Между бенчмарком и тренировочной средой нет принципиальной разницы

«that verification loop is 100 years long» (13:24) Эта верификационная петля длиной в сто лет

«Working in the Quinty doesn't seem to be good for your health» (20:50) Работа над квинтикой, похоже, вредна для здоровья

«If you're a young genius, don't work on the Quinty» (20:54) Если ты юный гений, не берись за квинтику

«everyone knows the idea of an unsolved research problem. I want to propose the idea of an unsolved expository problem» (32:34) Все знают, что такое нерешённая исследовательская проблема. Я хочу предложить понятие нерешённой экспозиционной проблемы

«There's a difference between proof and explanation» (32:55) Есть разница между доказательством и объяснением

«auto-regression is actually like a really, really weird way to produce stuff» (41:58) Авторегрессия, правда очень странный способ что-то производить

«It's not just verifiability. It has to be grindable» (56:20) Дело не только в верифицируемости. Оно должно быть гриндабельным

«quantity has a quality all of its own» (46:54) У количества есть собственное качество

«you build a man a fire and he's warm for one night, but set a man on fire and he's warm for the rest of his life» (35:56) Разожги человеку костёр, согреется на ночь; подожги человека, согреется на всю жизнь

«It would be like this very emergent thing to have theory of mind. Whereas we can just like plug it into our own minds» (1:14:50) Для них theory of mind - эмерджентная штука. А мы просто подключаем это к собственному уму

«Know where the money is coming from. Know where you plug into that» (1:27:35) Знай, откуда идут деньги. Знай, куда ты в это встраиваешься

«maybe one of the awkward conclusions of it will be revealing like, ah, man, over the last... it's just become wholly useless» (1:33:01) Может, один из неудобных выводов будет: блин, за последнее время это стало совершенно бесполезным

«It's just like an alien trying to empathize. Like how could it have theory of mind?» (1:14:45) Это как инопланетянин, пытающийся сопереживать. Откуда у него theory of mind?

Факты

  • Дваркеш впервые интервьюировал Гранта около трёх лет назад и тогда спрашивал, не будет ли золото на IMO эквивалентно AGI.
  • В IMO четыре категории задач: геометрия, теория чисел, алгебра, комбинаторика; шесть задач на тесте.
  • В 2024 модель взяла бы золото, если бы не две комбинаторные задачи в том году; геометрию она решала брутфорсом почти мгновенно.
  • Хью Монтгомери и Фримен Дайсон в IAS заметили совпадение статистики нулей дзета-функции Римана и собственных значений случайных эрмитовых матриц (ядерная физика).
  • Абель, «юный норвежский математик», доказал невозможность общей формулы для квинтики; умер в 26 лет от туберкулёза.
  • Лагранж первым увидел, что разрешимость полиномов связана с симметриями/перестановками выражений (пример: A+B+C+D vs (A+B)(C+D)).
  • Галуа писал ключевой трактат в тюрьме, подростком; его работы академия отвергала; идеи оформили Луивилль (~через 20 лет) и Жордан (ещё позже).
  • Гелл-Манн предсказал существование кварков из теоретико-группового вопроса.
  • Полилог (Polylog), математический канал с хорошим видео про unit distance conjecture.
  • Erdős-задача под номером ~1196 была решена через объекты «primitive sets» и идею вроде марковской цепи с функцией фон Мангольдта.
  • Терри Тао провалил ту самую «троллевую» задачу IMO, как и многие сильные ученики.
  • DeepSeek выпустил DeepSeek-Math с верификатором натуральных доказательств, обучаемым мета-верификатором; DeepMind на IMO сначала работал через Lean, на следующий год, на натуральном языке.
  • Инсайты одной группы по PDE позволили Boeing больше делать в симуляции без разборки-сборки, сэкономив «миллиарды»; после этого группу стали финансировать (Грант оговаривается, что пересказывает по памяти).
  • Ботокс-эксперимент (Грант помнит смутно, «может, исследование ненастоящее»): после ботокса люди хуже распознают эмоции по лицам.
  • Карпати сделал auto-research: один Python-файл с базовым обучением LLM, агенты вносят правки, ускоряющие speedrun, правка остаётся; Эрик Дженг делал похожее с го-ботом.
  • Терри Тао упоминал проект по исчерпывающему перебору пространства возможных алгебр/аксиоматических систем.
  • Дэвид Бессис написал пост «The Fall of the Theorem Economy»; Алекс Контарович говорил, что ненулевой error rate ИИ-доказательств делает их «невыносимыми» для проверки.
  • Грант вырос в Индии до восьми лет, говорит на гуджарати (из рекламной вставки Gemini); Дваркеш ездил в Китай в 2024 и публикует эпизоды на Bilibili.
  • Jane Street известна очень высоким уровнем удержания сотрудников; полное интервью на 3b1b.co/janestreet.

Источники

  • Grant Sanderson / 3Blue1Brown: канал и готовящаяся серия «AI and math» (интервью с математиками, ещё не выпущена)
  • Polylog: видео про unit distance conjecture
  • David Bessis, «The Fall of the Theorem Economy» (блог-пост)
  • Timothy Chow: экспозиционная работа про forcing и континуум-гипотезу
  • Stephen Strogatz, «Nonlinear Dynamics and Chaos» (учебник) + его университетские лекции
  • Andy Matuschak и соавтор: отчёт об обучении LLM писать хорошие карточки для интервального повторения
  • Alex Kontorovich: комментарии об error rate ИИ-доказательств
  • Andrej Karpathy: идея auto-research (один Python-файл + агенты)
  • Eric Jang: работа над сильным го-ботом, наблюдения о поведении агентов
  • Terry Tao: проект по перебору пространства алгебр
  • Программы и понятия: Langlands program, Mathlib, Lean, AlphaGo/AlphaZero, DeepSeek-Math
  • Инструменты/спонсоры: Gemini 3.5 Live Translate, Cursor (cursor.com/dwarkesh), Jane Street (3b1b.co/janestreet)
  • Люди-примеры: Лагранж, Абель, Галуа, Гаусс, Луивилль, Жордан, Гелл-Манн, Эйнштейн, Шеннон, Фейнман, Мотидзуки (ABC-гипотеза), Монтгомери, Дайсон

Рекомендации

  • Выбирая курсы и книги, ориентируйся на того, кто учит/пишет, больше, чем на тему: прежние интересы сейчас довольно произвольны.
  • Прочитал хорошую книгу, читай другие книги этого же автора, а не другое про ту же тему.
  • Учись в связке: лекция + учебник + LLM для прунинга веток; проси LLM не объяснение, а «кого почитать», и иди к первоисточнику.
  • Прежде чем идти в профессию (математику, кодинг), сначала пойми, откуда деньги и какую ценность ты добавляешь, это уже ставит тебя впереди большинства.
  • Студентам-математикам: всерьёз рассмотреть роль математического образователя/куратора, одна из самых устойчивых пост-AGI профессий.

Итог

Пройденные бенчмарки в математике, это ИИ, находящий молнии между известными полями. Настоящий рубеж, придумывание понятий и постановка вопросов, невидим для метрик, необучаем нынешними методами и оставляет человеку роль куратора и учителя, а не доказателя.

readmint Pro

То, что вы только что прочитали — это саммари readmint

Оформите доступ — и получайте такой же разбор по любому своему видео. Вставляете ссылку, через 2–3 минуты готов пересказ с главными тезисами и цитатами. Без воды и без перемотки.

  • Безлимит саммари — сколько угодно видео
  • Главные тезисы и цитаты без воды
  • Приоритет в очереди обработки
  • Без рекламы и сторонних блоков
Получить такое же саммари
Доступ откроется сразу после оплаты — вставите ссылку и начнёте.

Или 4 900 ₽/год — доступ откроется сразу после оплаты.

Ещё с канала «Dwarkesh Patel»

Все видео