Дженсен Хуанг: NVIDIA — компания за $4 триллиона и революция ИИ | Подкаст Лекса Фридмана #494

Lex Fridman23 марта 20261 165 82424 49313 мин чтения28 мая, 00:03

Технологии Искусственный Интеллект Бизнес Лидерство Стратегия

Коротко

Дженсен Хуанг описывает переход NVIDIA от компании по производству GPU к создателю «фабрик ИИ» уровня дата-центра, где базовой единицей вычислений становится стойка, а не чип. Главная стратегия — совместное проектирование всех уровней стэка (от транзистора до питания), оправданное законом Амдала: без распределённой архитектуры рост от тысяч машин не превращается в миллионократное ускорение. Куда стала экзистенциальной ставкой 20 лет назад, когда установка её на каждый GeForce съела 50% себестоимости и уронила капитализацию с 8 до 1,5 млрд долларов — но именно установленная база сделала её непобедимой. Хуанг повторяет, что менеджмент компании — это постоянное формирование картины мира у сотрудников, партнёров и всей цепочки поставок, чтобы к моменту анонса все спрашивали «что так долго?». В конце он разводит «интеллект» как товаризируемую функциональную способность и «человечность» как несводимую к ней категорию.

Главный тезис

Компьютер перестал быть системой извлечения информации и стал системой генерации, а значит — фабрикой, производящей токены как товар; масштабирование интеллекта в конечном счёте упирается только в вычисления, и победит тот, кто умеет совместно проектировать всё — от чипа до электросети — на скорости света.

Ключевые идеи

1:20 — Закон Амдала диктует: чтобы 10 тыс. машин дали миллионократное ускорение, нужно шардировать пайплайн, данные и модели, иначе масштабирование вырождается в линейное.
5:18 — Архитектура компании должна отражать среду, в которой она существует; у Хуанга 60+ прямых подчинённых и нет тет-а-тетов — все совещания коллективные, потому что задача коллективная.
8:39 — Между узкой специализацией ускорителя и универсальностью вычислений существует фундаментальное противоречие, которое NVIDIA проходит «узкой тропой» шаг за шагом.
14:29 — Решение поставить CUDA в каждый GeForce съело валовую маржу (с 50% себестоимости), уронило капитализацию с 8 до 1,5 млрд, но именно установленная база стала рвом.
12:09 — Архитектуру определяет не элегантность (x86 уродлив, но победил RISC), а установленная база разработчиков и пользователей.
18:43 — Хуанг не делает «больших анонсов»: он постепенно меняет картину мира у совета, команды и партнёров, чтобы к моменту объявления все думали «что так долго?».
28:33 — Четыре закона масштабирования: предобучение, постобучение, тест-тайм и агентное; все они в итоге упираются в компьют.
24:02 — «Конец данных» — миф: большинство данных в человеческой коммуникации синтетические по природе, и синтетика для обучения будет только расти.
25:47 — Идея «инференс простой и дешёвый» провалилась: рассуждение, планирование и поиск вычислительно дороже, чем чтение.
32:34 — Хуанг строит железо не по слухам, а рассуждением от первых принципов: что нужно цифровому сотруднику? Файловая система, инструменты, доступ к данным — отсюда архитектура Vera Rubin.
56:53 — Принцип «скорость света»: вместо непрерывных улучшений (74 дня → 72) — проектирование от физического предела (74 → 6 дней).
48:08 — Решение энергетического кризиса не в новых станциях, а в дата-центрах с плавной деградацией, которые умеют снижать мощность в пиковые часы.
53:14 — Метод Маска: минималистичный системный подход + «срочность как заразное состояние» + физическое присутствие на площадке.
1:07:46 — Опенсорс нужен, чтобы ИИ распространился во все индустрии и страны, и потому что ИИ — не только язык (биология, химия, физика требуют отдельных моделей).
1:25:10 — Раньше компьютер был складом (хранение и извлечение), теперь — фабрикой (генерация токенов под контекст), и это меняет долю компьюта в ВВП на два порядка.
2:00:26 — Радиологов после ИИ стало больше, не меньше: цель работы ≠ задачи работы, ИИ автоматизирует задачи, но цель остаётся за человеком.
2:14:21 — Интеллект — это функциональный цикл (восприятие → понимание → рассуждение → планирование), он товаризируется; человечность — отдельная, более широкая категория.

Почему это важно

NVIDIA сейчас определяет темп технологической революции, на её отчёты опираются государственные бюджеты и стратегии целых наций. Хуанг публично формулирует не только инженерную доктрину (совместное проектирование, скорость света, установленная база), но и переопределяет сам компьютер: из склада в фабрику, из чипа в стойку, из инструмента в производственный актив. Это поднимает ставки для всей цепочки поставок (TSMC, ASML, SK Hynix, GE Vernova), для энергетического сектора (требование «плавной деградации» дата-центров), для геополитики (Китай как сильнейший инженерный конкурент через опенсорс и культуру строителей) и для рынка труда (через сегментацию токенов как айфонов и переход к «миллиарду программистов»). Выигрывают игроки, способные мыслить системно и от первых принципов; проигрывают те, кто оптимизирует приращение в 2 дня вместо пересоздания процесса с нуля.

Идеи

Хуанг физически демонстрировал чип на сцене, теперь это «скорее мило» — единица мышления изменилась с GPU на гигаваттную фабрику.
Куда успешна не из-за технологии, а потому что 43 тысячи сотрудников последовательно её развивали 20 лет — это про преданность, а не про изобретение.
В новой стойке Vera Rubin — 1,3 млн компонентов на стойку шириной 48 см, и NVIDIA должна выпускать ~200 таких подов в неделю.
Архитектура изменилась за год от Grace Blackwell (заточена под LLM) до Vera Rubin (заточена под агентов с инструментами) — потому что предыдущая была спроектирована раньше Claude Code и Codex.
Грейс Блэкуелл — это NVLink 72 вместо NVLink 8, чтобы модель на 4-10 трлн параметров помещалась в одну вычислительную область.
Memory HBM раньше использовалась только в суперкомпьютерах; Хуанг 3 года назад убедил DRAM-производителей вложиться, и теперь HBM, LPDDR5 и DDR показали рекордные годы за 45 лет.
Сборка суперкомпьютеров перенесена из дата-центра в цепочку поставок — NVL72 идёт 2-3 тонны на стойку и собирается ещё у производителя.
50 ГВт дата-центров требуют ~1 ГВт мощности в самой цепочке поставок на тестирование.
99% времени сеть работает с большим избытком мощности — заказчики требуют шесть девяток, не зная об этом.
Хуанг видит проблему энергопотребления как трёхстороннюю: пользователь → директор → переговорщики → провайдер → коммунальные службы; каждый уровень требует невозможного, не общаясь с остальными.
В Китае мэры провинций конкурируют между собой — это создаёт внутреннюю конкуренцию, через которую выживают сильнейшие игроки.
Культурная иерархия в Китае: семья → друзья → компания, поэтому инженеры свободно делятся знаниями и опенсорсят, а не прячут.
Большинство китайских лидеров — инженеры; в США и других странах — юристы, которые «блюдут порядок» вместо строительства.
Около 50% мировых исследователей ИИ — китайцы, и большинство по-прежнему живут в Китае.
В 2013 году основатель TSMC Моррис Чанг предложил Хуангу стать CEO TSMC; он отказался, потому что уже видел, чем станет NVIDIA.
За 30 лет работы с TSMC у NVIDIA с ними нет контракта — только доверие.
Установленная база CUDA настолько глубока, что разработчик пишет под неё, зная: «завтра она станет в 10 раз лучше, можно подождать полгода».
Хуанг сам ловит себя на детском мышлении «насколько это может быть сложно?» — без него великие проекты не начинаются.
В Китае люди уже учат свои Cloude искать работу, выполнять её и зарабатывать.
Хуанг гадает, что скоро появятся цифровые инфлюенсеры в духе Тамагочи, которые завирусятся на пару месяцев и исчезнут.
DLSS 5 — это не «нейрослоп поверх игры»: он работает внутри пайплайна художника, сохраняя геометрию покадрово.
NVIDIA первой запустила GPU в космос — у Хуанга мысль: «можно было сделать целое заявление, нарисовать скафандр на GPU».
Радиологов прогнозировали к исчезновению уже в 2020-х, ИИ обошёл человека по компьютерному зрению — но радиологов стало больше, потому что пациентов и нагрузки тоже стало больше.
Хуанг считает, что «айфон токенов» уже появился — это OpenClaw и агенты, самое быстрорастущее приложение в истории.
Кла́д — это «мышление вслух» как стиль управления: Хуанг показывает весь путь рассуждения, чтобы команда могла оспорить любой шаг, а не только вывод.
Преемственность Хуанг решает не плановым процессом, а непрерывной передачей всего что узнаёт — ничто не задерживается у него дольше доли секунды.
Идеальный исход — «умереть на работе мгновенно, без долгих страданий».
Хуанг полусерьёзно описывает план: отправить гуманоидного робота себя в космос заранее, потом догнать его сознанием со скоростью света через интернет-следы.
Его первая работа — чистить туалеты в Denny's, об этом он напоминает себе и команде в моменты неловкости.

Инсайты

Установленная база — это архитектурное болото, в которое инвесторы не верят, пока оно не победит; элегантность архитектуры на длинной дистанции проигрывает массовости разработчиков.
«Совместное проектирование» — не словесная формула, а антипод закона Мура: если масштабирование транзистора замедлилось, нужно вынести оптимизацию на всю вертикаль (стойка, питание, охлаждение, ПО, сеть).
Стратегические сдвиги не должны быть анонсами-сюрпризами — они результат многолетней работы по формированию консенсуса; «что так долго?» — лучшая реакция на анонс.
Скорость света как ментальная модель ломает культуру непрерывного улучшения: вместо «72 дня вместо 74» — «6 дней с нуля». Это разделяет инжиниринг и оптимизацию ритуала.
Дата-центр как продукт переходит от «всегда включён» к «всегда работает, иногда медленнее» — это требует переосмысления контрактов и SLA на каждом уровне цепочки от коммунальных служб до конечного пользователя.
ИИ-фабрика — это компьютер, прямо связанный с выручкой, поэтому экономическая логика капвложений в неё фундаментально отличается от логики склада данных.
Опенсорс в Китае — это культурное следствие иерархии «семья → друзья → компания», а не идеологический выбор; конкурировать с этим закрытыми моделями структурно сложно.
В мире, где данные кончаются, синтетические данные становятся нормой, потому что человеческая коммуникация и всегда была преимущественно синтетической.
Цель работы и задачи работы — разные сущности; автоматизация уничтожает только профессии без цели, состоящие из одних задач.
Интеллект — функциональный цикл и может быть товаризирован; человечность определяется характером, состраданием и опытом боли и не сводится к интеллекту.
Терпимость к неловкости — недооценённая сверхспособность лидера; публичные размышления вслух создают коллективное доверие к процессу, а не только к выводу.
Преемственность — это не план, а скорость передачи знаний; если ничего у тебя не задерживается, ты автоматически решаешь задачу преемственности каждый день.
«Мышление ребёнка» — экономия на пессимизме входа; зрелые проекты начинаются с недооценки сложности и удерживаются стойкостью на дистанции.
Великие компании растут не отъёмом доли, а созданием рынков, которых ещё не существует — это делает их рост непредсказуемым для финансовых моделей.

Фреймворки

Четыре закона масштабирования ИИ:

Предобучение (запоминание и обобщение из данных)
Постобучение (оттачивание через синтетические данные)
Тест-тайм / инференс (рассуждение, планирование, поиск)
Агентное масштабирование (умножение через субагентов и инструменты)

Принцип «скорости света»: Любое действие сравнивается с физическим пределом по каждому ограничению отдельно (задержка, пропускная способность, стоимость, ёмкость, мощность). Сначала ищется skydown-предел, потом оправданные компромиссы для системы в целом — не наоборот.

Безопасность агентных систем — две из трёх возможностей: Агент может (1) получать доступ к конфиденциальной информации, (2) исполнять код, (3) взаимодействовать со средой. Безопасно — любые две, но не все три одновременно.

Три причины опенсорса NVIDIA:

Понимание архитектур моделей для совместного проектирования железа.
Вовлечение всех индустрий и стран в ИИ-революцию.
Признание, что ИИ не сводится к языку (биология, химия, физика).

Цитаты

«Совместное проектирование — это задача системной инженерии.» — 56:18

«Нужно, чтобы скорость росла быстрее, чем число добавляемых машин.» — 1:24

«Цель компании — быть механизмом, машиной, системой, которая производит результат.» — 5:18

«В конечном счете важна установленная база.» — 13:16

«NVIDIA — это дом, который построил GeForce.» — 15:03

«Манифестируешь будущее, и оно настолько убедительно, что иначе просто быть не может.» — 17:39

«Инференс — это мышление. А мышление — это сложно.» — 25:51

«В конечном счете разум масштабируется только одним образом — вычислениями.» — 28:33

«Неважно, что случится дальше, чтобы языковая модель стала цифровым сотрудником.» — 32:34

«Нужно, чтобы система была настолько сложной, насколько необходимой, и настолько простой, насколько возможно.» — 1:00:34

«Каждое наше действие я сравниваю со скоростью света.» — 56:53

«Сначала надо спроектировать, исходя из первопринципов, держа в уме скорость света.» — 58:21

«Большая часть, скорее всего, будет синтетической.» — 24:02

«Технология была выдающейся, визионерской, да. Но решающим фактором было то, что компания была полностью ей предана.» — 1:15:58

«Раньше компьютеры были системой хранения, извлечения информации.» — 1:25:10

«Склады не приносят больших денег. Фабрики напрямую связаны с выручкой.» — 1:27:16

«Цель радиолога — не просто смотреть снимки, а диагностировать болезни.» — 2:00:26

«Цель их работы не поменялась.» — 2:01:22

«В будущем каждый плотник будет программистом.» — 2:02:22

«Интеллект — это слово, которому мы со временем придали чрезмерно высокий статус.» — 2:15:42

«Стоит восхвалять слово «человечность». Характер, человечность — вот что важнее.» — 2:15:49

«Я окружен людьми, которые умнее меня.» — 2:14:28

«Что такого есть в посудомойке, что позволяет ему сидеть в центре среди сверхлюдей?» — 2:15:05

«Я не верю в планирование преемственности.» — 2:18:31

«Я надеюсь, что мой идеальный исход — умереть на работе.» — 2:19:52

«Хватит ныть, поехали дальше. Вставай с кровати и вперед.» — 1:40:27

«Я проживаю опыт, случающийся раз в человечестве.» — 2:18:07

Факты

NVIDIA — крупнейшая компьютерная компания в мире на момент интервью.
В прямом подчинении у Хуанга больше 60 человек, тет-а-тетов он не проводит.
После запуска CUDA капитализация NVIDIA упала примерно с 6-8 млрд до ~1,5 млрд долларов; CUDA увеличила себестоимость GeForce примерно на 50% при марже ~35%.
На текущий момент CUDA — версии 13.2.
NVLink перешёл от NVLink 8 к NVLink 72, что позволяет размещать модели 4-10 трлн параметров в одной вычислительной области.
Стойка NVL72 содержит ~1,3 млн компонентов и ~1300 чипов (плюс 4000 чиплетов), ширина 48 см.
Платформа Vera Rubin: 7 типов чипов, 5 типов стоек, 40 стоек, 1,2 квадриллиона транзисторов, ~20 тыс. кристаллов, 1100+ GPU Rubin, 10 ПБ/с масштабируемой пропускной способности.
В цепочке поставок одной стойки участвуют ~200 поставщиков.
За последние 10 лет NVIDIA обеспечила прирост вычислений в ~1 млн раз, тогда как закон Мура дал бы ~100x.
Дата-центры на 50 ГВт требуют ~1 ГВт мощности в самой цепочке поставок на сборку и тестирование.
Энергосеть в среднем работает на ~60% мощности; пик нагрузки случается несколько дней зимой и летом.
Хуанг возглавляет NVIDIA 34 года, что делает его самым долгожителем-CEO в технологической индустрии.
В 2013 году Моррис Чанг предложил Хуангу пост CEO TSMC — Хуанг отказался.
Около 50% мировых исследователей ИИ — китайцы, большинство по-прежнему живут в Китае.
К 2019-2020 компьютерное зрение в радиологии стало сверхчеловеческим, но количество радиологов выросло.
NVIDIA Nemotron 3 Super — открытая MoE-модель примерно на 120 млрд параметров с открытыми весами, данными и методологией.
NVIDIA выпустила первый GPU в космосе.
На GTC рядом с Хуангом стояли директора практически всей IT-индустрии — несколько сотен CEO.
DLSS 5 — открытая система, позволяющая обучать собственные модели стиля и в перспективе задавать стиль промтом.

Источники

CUDA — вычислительная платформа NVIDIA, основа всей экосистемы ИИ-вычислений
CG — ранний язык NVIDIA, прообраз CUDA
OpenCL — конкурирующая архитектура, проигравшая CUDA
Mellanox — приобретение NVIDIA, упомянутое как пример «очевидного» решения
Grace Blackwell, Vera Rubin, ROC, Ampere — поколения архитектур NVIDIA
NVLink 72 — система масштабирования NVIDIA
DGX X1 — оригинальная архитектура суперкомпьютеров NVIDIA
OpenClaw, Claude Code, Codex — упомянутые ИИ-агенты и инструменты
Nemotron 3 Super — открытая MoE-модель NVIDIA, упоминается с благодарностью
DeepSeek, Minimax — китайские опенсорс-игроки
DLSS 5 — генеративная система NVIDIA для графики
OpenShell / NIMU-кло — инструменты безопасности NVIDIA для агентных систем
TSMC, ASML, SK Hynix, GE Vernova, Caterpillar — упомянутая цепочка поставок
Perplexity — компания, которую Хуанг поддерживает; упомянут CEO как «Питер»
Doom, Virtua Fighter, Cyberpunk 2077, Skyrim — игры, упомянутые в контексте графики
xAI, Colossus (Memphis) — пример инженерной скорости Илона Маска
Илья Суцкевер — упомянут с цитатой «данные кончились или предобучение завершено»
Морис Чанг — основатель TSMC, друг и наставник Хуанга
Джим Крамер — упомянут как канал, через который обычные инвесторы попадали в акции NVIDIA
Алан Кей — финальная цитата подкаста: «Лучший способ предсказать будущее — создать его»

Рекомендации

Будь то студент, инженер, фермер, фармацевт или плотник — становись экспертом в использовании ИИ; при выборе из двух кандидатов Хуанг всегда возьмёт того, кто им владеет.
Когда тревожишься — разбивай тревогу на части: отдели то, на что можешь повлиять, от того, на что не можешь, и начинай делать.
Дели нагрузку как можно раньше: рассказывай команде то, что узнал, ещё до того, как сам полностью разобрался — это и про преемственность, и про коллективное мышление.
Тестируй любое инженерное решение на соответствие физическому пределу, прежде чем переходить к улучшениям.
Учись забывать неудачи быстро, иначе они блокируют движение вперёд.

Итог

В мире, где компьютер из склада превратился в фабрику токенов, побеждает тот, кто умеет совместно проектировать всю вертикаль на скорости света и переопределять рынок раньше, чем индустрия успевает спросить «зачем».

readmint Pro

То, что вы только что прочитали — это саммари readmint

Оформите доступ — и получайте такой же разбор по любому своему видео. Вставляете ссылку, через 2–3 минуты готов пересказ с главными тезисами и цитатами. Без воды и без перемотки.

Безлимит саммари — сколько угодно видео
Главные тезисы и цитаты без воды
Приоритет в очереди обработки
Без рекламы и сторонних блоков

Получить такое же саммари

Доступ откроется сразу после оплаты — вставите ссылку и начнёте.

Или 4 900 ₽/год — доступ откроется сразу после оплаты.

Ещё с канала «Lex Fridman»

Все видео

Павел Дуров: Telegram, Свобода, Цензура, Деньги, Власть и Природа Человека | Подкаст Лекса Фридмана #482

Павел Дуров: Telegram, Свобода, Цензура, Деньги, Власть и Природа Человека | Подкаст Лекса Фридмана #482

Питер Левелс: Программирование, вирусные стартапы на базе ИИ и жизнь цифрового кочевника | Подкаст Лекса Фридмана #440

Питер Левелс: Программирование, вирусные стартапы на базе ИИ и жизнь цифрового кочевника | Подкаст Лекса Фридмана #440

Теренс Тао: самые сложные задачи в математике, физике и будущее ИИ | Подкаст Лекса Фридмана #472

Теренс Тао: самые сложные задачи в математике, физике и будущее ИИ | Подкаст Лекса Фридмана #472