Коротко
Дженсен Хуанг описывает переход NVIDIA от компании по производству GPU к создателю «фабрик ИИ» уровня дата-центра, где базовой единицей вычислений становится стойка, а не чип. Главная стратегия — совместное проектирование всех уровней стэка (от транзистора до питания), оправданное законом Амдала: без распределённой архитектуры рост от тысяч машин не превращается в миллионократное ускорение. Куда стала экзистенциальной ставкой 20 лет назад, когда установка её на каждый GeForce съела 50% себестоимости и уронила капитализацию с 8 до 1,5 млрд долларов — но именно установленная база сделала её непобедимой. Хуанг повторяет, что менеджмент компании — это постоянное формирование картины мира у сотрудников, партнёров и всей цепочки поставок, чтобы к моменту анонса все спрашивали «что так долго?». В конце он разводит «интеллект» как товаризируемую функциональную способность и «человечность» как несводимую к ней категорию.
Главный тезис
Компьютер перестал быть системой извлечения информации и стал системой генерации, а значит — фабрикой, производящей токены как товар; масштабирование интеллекта в конечном счёте упирается только в вычисления, и победит тот, кто умеет совместно проектировать всё — от чипа до электросети — на скорости света.
Ключевые идеи
- 1:20 — Закон Амдала диктует: чтобы 10 тыс. машин дали миллионократное ускорение, нужно шардировать пайплайн, данные и модели, иначе масштабирование вырождается в линейное.
- 5:18 — Архитектура компании должна отражать среду, в которой она существует; у Хуанга 60+ прямых подчинённых и нет тет-а-тетов — все совещания коллективные, потому что задача коллективная.
- 8:39 — Между узкой специализацией ускорителя и универсальностью вычислений существует фундаментальное противоречие, которое NVIDIA проходит «узкой тропой» шаг за шагом.
- 14:29 — Решение поставить CUDA в каждый GeForce съело валовую маржу (с 50% себестоимости), уронило капитализацию с 8 до 1,5 млрд, но именно установленная база стала рвом.
- 12:09 — Архитектуру определяет не элегантность (x86 уродлив, но победил RISC), а установленная база разработчиков и пользователей.
- 18:43 — Хуанг не делает «больших анонсов»: он постепенно меняет картину мира у совета, команды и партнёров, чтобы к моменту объявления все думали «что так долго?».
- 28:33 — Четыре закона масштабирования: предобучение, постобучение, тест-тайм и агентное; все они в итоге упираются в компьют.
- 24:02 — «Конец данных» — миф: большинство данных в человеческой коммуникации синтетические по природе, и синтетика для обучения будет только расти.
- 25:47 — Идея «инференс простой и дешёвый» провалилась: рассуждение, планирование и поиск вычислительно дороже, чем чтение.
- 32:34 — Хуанг строит железо не по слухам, а рассуждением от первых принципов: что нужно цифровому сотруднику? Файловая система, инструменты, доступ к данным — отсюда архитектура Vera Rubin.
- 56:53 — Принцип «скорость света»: вместо непрерывных улучшений (74 дня → 72) — проектирование от физического предела (74 → 6 дней).
- 48:08 — Решение энергетического кризиса не в новых станциях, а в дата-центрах с плавной деградацией, которые умеют снижать мощность в пиковые часы.
- 53:14 — Метод Маска: минималистичный системный подход + «срочность как заразное состояние» + физическое присутствие на площадке.
- 1:07:46 — Опенсорс нужен, чтобы ИИ распространился во все индустрии и страны, и потому что ИИ — не только язык (биология, химия, физика требуют отдельных моделей).
- 1:25:10 — Раньше компьютер был складом (хранение и извлечение), теперь — фабрикой (генерация токенов под контекст), и это меняет долю компьюта в ВВП на два порядка.
- 2:00:26 — Радиологов после ИИ стало больше, не меньше: цель работы ≠ задачи работы, ИИ автоматизирует задачи, но цель остаётся за человеком.
- 2:14:21 — Интеллект — это функциональный цикл (восприятие → понимание → рассуждение → планирование), он товаризируется; человечность — отдельная, более широкая категория.
Почему это важно
NVIDIA сейчас определяет темп технологической революции, на её отчёты опираются государственные бюджеты и стратегии целых наций. Хуанг публично формулирует не только инженерную доктрину (совместное проектирование, скорость света, установленная база), но и переопределяет сам компьютер: из склада в фабрику, из чипа в стойку, из инструмента в производственный актив. Это поднимает ставки для всей цепочки поставок (TSMC, ASML, SK Hynix, GE Vernova), для энергетического сектора (требование «плавной деградации» дата-центров), для геополитики (Китай как сильнейший инженерный конкурент через опенсорс и культуру строителей) и для рынка труда (через сегментацию токенов как айфонов и переход к «миллиарду программистов»). Выигрывают игроки, способные мыслить системно и от первых принципов; проигрывают те, кто оптимизирует приращение в 2 дня вместо пересоздания процесса с нуля.
Идеи
- Хуанг физически демонстрировал чип на сцене, теперь это «скорее мило» — единица мышления изменилась с GPU на гигаваттную фабрику.
- Куда успешна не из-за технологии, а потому что 43 тысячи сотрудников последовательно её развивали 20 лет — это про преданность, а не про изобретение.
- В новой стойке Vera Rubin — 1,3 млн компонентов на стойку шириной 48 см, и NVIDIA должна выпускать ~200 таких подов в неделю.
- Архитектура изменилась за год от Grace Blackwell (заточена под LLM) до Vera Rubin (заточена под агентов с инструментами) — потому что предыдущая была спроектирована раньше Claude Code и Codex.
- Грейс Блэкуелл — это NVLink 72 вместо NVLink 8, чтобы модель на 4-10 трлн параметров помещалась в одну вычислительную область.
- Memory HBM раньше использовалась только в суперкомпьютерах; Хуанг 3 года назад убедил DRAM-производителей вложиться, и теперь HBM, LPDDR5 и DDR показали рекордные годы за 45 лет.
- Сборка суперкомпьютеров перенесена из дата-центра в цепочку поставок — NVL72 идёт 2-3 тонны на стойку и собирается ещё у производителя.
- 50 ГВт дата-центров требуют ~1 ГВт мощности в самой цепочке поставок на тестирование.
- 99% времени сеть работает с большим избытком мощности — заказчики требуют шесть девяток, не зная об этом.
- Хуанг видит проблему энергопотребления как трёхстороннюю: пользователь → директор → переговорщики → провайдер → коммунальные службы; каждый уровень требует невозможного, не общаясь с остальными.
- В Китае мэры провинций конкурируют между собой — это создаёт внутреннюю конкуренцию, через которую выживают сильнейшие игроки.
- Культурная иерархия в Китае: семья → друзья → компания, поэтому инженеры свободно делятся знаниями и опенсорсят, а не прячут.
- Большинство китайских лидеров — инженеры; в США и других странах — юристы, которые «блюдут порядок» вместо строительства.
- Около 50% мировых исследователей ИИ — китайцы, и большинство по-прежнему живут в Китае.
- В 2013 году основатель TSMC Моррис Чанг предложил Хуангу стать CEO TSMC; он отказался, потому что уже видел, чем станет NVIDIA.
- За 30 лет работы с TSMC у NVIDIA с ними нет контракта — только доверие.
- Установленная база CUDA настолько глубока, что разработчик пишет под неё, зная: «завтра она станет в 10 раз лучше, можно подождать полгода».
- Хуанг сам ловит себя на детском мышлении «насколько это может быть сложно?» — без него великие проекты не начинаются.
- В Китае люди уже учат свои Cloude искать работу, выполнять её и зарабатывать.
- Хуанг гадает, что скоро появятся цифровые инфлюенсеры в духе Тамагочи, которые завирусятся на пару месяцев и исчезнут.
- DLSS 5 — это не «нейрослоп поверх игры»: он работает внутри пайплайна художника, сохраняя геометрию покадрово.
- NVIDIA первой запустила GPU в космос — у Хуанга мысль: «можно было сделать целое заявление, нарисовать скафандр на GPU».
- Радиологов прогнозировали к исчезновению уже в 2020-х, ИИ обошёл человека по компьютерному зрению — но радиологов стало больше, потому что пациентов и нагрузки тоже стало больше.
- Хуанг считает, что «айфон токенов» уже появился — это OpenClaw и агенты, самое быстрорастущее приложение в истории.
- Кла́д — это «мышление вслух» как стиль управления: Хуанг показывает весь путь рассуждения, чтобы команда могла оспорить любой шаг, а не только вывод.
- Преемственность Хуанг решает не плановым процессом, а непрерывной передачей всего что узнаёт — ничто не задерживается у него дольше доли секунды.
- Идеальный исход — «умереть на работе мгновенно, без долгих страданий».
- Хуанг полусерьёзно описывает план: отправить гуманоидного робота себя в космос заранее, потом догнать его сознанием со скоростью света через интернет-следы.
- Его первая работа — чистить туалеты в Denny's, об этом он напоминает себе и команде в моменты неловкости.
Инсайты
- Установленная база — это архитектурное болото, в которое инвесторы не верят, пока оно не победит; элегантность архитектуры на длинной дистанции проигрывает массовости разработчиков.
- «Совместное проектирование» — не словесная формула, а антипод закона Мура: если масштабирование транзистора замедлилось, нужно вынести оптимизацию на всю вертикаль (стойка, питание, охлаждение, ПО, сеть).
- Стратегические сдвиги не должны быть анонсами-сюрпризами — они результат многолетней работы по формированию консенсуса; «что так долго?» — лучшая реакция на анонс.
- Скорость света как ментальная модель ломает культуру непрерывного улучшения: вместо «72 дня вместо 74» — «6 дней с нуля». Это разделяет инжиниринг и оптимизацию ритуала.
- Дата-центр как продукт переходит от «всегда включён» к «всегда работает, иногда медленнее» — это требует переосмысления контрактов и SLA на каждом уровне цепочки от коммунальных служб до конечного пользователя.
- ИИ-фабрика — это компьютер, прямо связанный с выручкой, поэтому экономическая логика капвложений в неё фундаментально отличается от логики склада данных.
- Опенсорс в Китае — это культурное следствие иерархии «семья → друзья → компания», а не идеологический выбор; конкурировать с этим закрытыми моделями структурно сложно.
- В мире, где данные кончаются, синтетические данные становятся нормой, потому что человеческая коммуникация и всегда была преимущественно синтетической.
- Цель работы и задачи работы — разные сущности; автоматизация уничтожает только профессии без цели, состоящие из одних задач.
- Интеллект — функциональный цикл и может быть товаризирован; человечность определяется характером, состраданием и опытом боли и не сводится к интеллекту.
- Терпимость к неловкости — недооценённая сверхспособность лидера; публичные размышления вслух создают коллективное доверие к процессу, а не только к выводу.
- Преемственность — это не план, а скорость передачи знаний; если ничего у тебя не задерживается, ты автоматически решаешь задачу преемственности каждый день.
- «Мышление ребёнка» — экономия на пессимизме входа; зрелые проекты начинаются с недооценки сложности и удерживаются стойкостью на дистанции.
- Великие компании растут не отъёмом доли, а созданием рынков, которых ещё не существует — это делает их рост непредсказуемым для финансовых моделей.
Фреймворки
Четыре закона масштабирования ИИ:
- Предобучение (запоминание и обобщение из данных)
- Постобучение (оттачивание через синтетические данные)
- Тест-тайм / инференс (рассуждение, планирование, поиск)
- Агентное масштабирование (умножение через субагентов и инструменты)
Принцип «скорости света»: Любое действие сравнивается с физическим пределом по каждому ограничению отдельно (задержка, пропускная способность, стоимость, ёмкость, мощность). Сначала ищется skydown-предел, потом оправданные компромиссы для системы в целом — не наоборот.
Безопасность агентных систем — две из трёх возможностей: Агент может (1) получать доступ к конфиденциальной информации, (2) исполнять код, (3) взаимодействовать со средой. Безопасно — любые две, но не все три одновременно.
Три причины опенсорса NVIDIA:
- Понимание архитектур моделей для совместного проектирования железа.
- Вовлечение всех индустрий и стран в ИИ-революцию.
- Признание, что ИИ не сводится к языку (биология, химия, физика).
Цитаты
«Совместное проектирование — это задача системной инженерии.» — 56:18
«Нужно, чтобы скорость росла быстрее, чем число добавляемых машин.» — 1:24
«Цель компании — быть механизмом, машиной, системой, которая производит результат.» — 5:18
«В конечном счете важна установленная база.» — 13:16
«NVIDIA — это дом, который построил GeForce.» — 15:03
«Манифестируешь будущее, и оно настолько убедительно, что иначе просто быть не может.» — 17:39
«Инференс — это мышление. А мышление — это сложно.» — 25:51
«В конечном счете разум масштабируется только одним образом — вычислениями.» — 28:33
«Неважно, что случится дальше, чтобы языковая модель стала цифровым сотрудником.» — 32:34
«Нужно, чтобы система была настолько сложной, насколько необходимой, и настолько простой, насколько возможно.» — 1:00:34
«Каждое наше действие я сравниваю со скоростью света.» — 56:53
«Сначала надо спроектировать, исходя из первопринципов, держа в уме скорость света.» — 58:21
«Большая часть, скорее всего, будет синтетической.» — 24:02
«Технология была выдающейся, визионерской, да. Но решающим фактором было то, что компания была полностью ей предана.» — 1:15:58
«Раньше компьютеры были системой хранения, извлечения информации.» — 1:25:10
«Склады не приносят больших денег. Фабрики напрямую связаны с выручкой.» — 1:27:16
«Цель радиолога — не просто смотреть снимки, а диагностировать болезни.» — 2:00:26
«Цель их работы не поменялась.» — 2:01:22
«В будущем каждый плотник будет программистом.» — 2:02:22
«Интеллект — это слово, которому мы со временем придали чрезмерно высокий статус.» — 2:15:42
«Стоит восхвалять слово «человечность». Характер, человечность — вот что важнее.» — 2:15:49
«Я окружен людьми, которые умнее меня.» — 2:14:28
«Что такого есть в посудомойке, что позволяет ему сидеть в центре среди сверхлюдей?» — 2:15:05
«Я не верю в планирование преемственности.» — 2:18:31
«Я надеюсь, что мой идеальный исход — умереть на работе.» — 2:19:52
«Хватит ныть, поехали дальше. Вставай с кровати и вперед.» — 1:40:27
«Я проживаю опыт, случающийся раз в человечестве.» — 2:18:07
Факты
- NVIDIA — крупнейшая компьютерная компания в мире на момент интервью.
- В прямом подчинении у Хуанга больше 60 человек, тет-а-тетов он не проводит.
- После запуска CUDA капитализация NVIDIA упала примерно с 6-8 млрд до ~1,5 млрд долларов; CUDA увеличила себестоимость GeForce примерно на 50% при марже ~35%.
- На текущий момент CUDA — версии 13.2.
- NVLink перешёл от NVLink 8 к NVLink 72, что позволяет размещать модели 4-10 трлн параметров в одной вычислительной области.
- Стойка NVL72 содержит ~1,3 млн компонентов и ~1300 чипов (плюс 4000 чиплетов), ширина 48 см.
- Платформа Vera Rubin: 7 типов чипов, 5 типов стоек, 40 стоек, 1,2 квадриллиона транзисторов, ~20 тыс. кристаллов, 1100+ GPU Rubin, 10 ПБ/с масштабируемой пропускной способности.
- В цепочке поставок одной стойки участвуют ~200 поставщиков.
- За последние 10 лет NVIDIA обеспечила прирост вычислений в ~1 млн раз, тогда как закон Мура дал бы ~100x.
- Дата-центры на 50 ГВт требуют ~1 ГВт мощности в самой цепочке поставок на сборку и тестирование.
- Энергосеть в среднем работает на ~60% мощности; пик нагрузки случается несколько дней зимой и летом.
- Хуанг возглавляет NVIDIA 34 года, что делает его самым долгожителем-CEO в технологической индустрии.
- В 2013 году Моррис Чанг предложил Хуангу пост CEO TSMC — Хуанг отказался.
- Около 50% мировых исследователей ИИ — китайцы, большинство по-прежнему живут в Китае.
- К 2019-2020 компьютерное зрение в радиологии стало сверхчеловеческим, но количество радиологов выросло.
- NVIDIA Nemotron 3 Super — открытая MoE-модель примерно на 120 млрд параметров с открытыми весами, данными и методологией.
- NVIDIA выпустила первый GPU в космосе.
- На GTC рядом с Хуангом стояли директора практически всей IT-индустрии — несколько сотен CEO.
- DLSS 5 — открытая система, позволяющая обучать собственные модели стиля и в перспективе задавать стиль промтом.
Источники
- CUDA — вычислительная платформа NVIDIA, основа всей экосистемы ИИ-вычислений
- CG — ранний язык NVIDIA, прообраз CUDA
- OpenCL — конкурирующая архитектура, проигравшая CUDA
- Mellanox — приобретение NVIDIA, упомянутое как пример «очевидного» решения
- Grace Blackwell, Vera Rubin, ROC, Ampere — поколения архитектур NVIDIA
- NVLink 72 — система масштабирования NVIDIA
- DGX X1 — оригинальная архитектура суперкомпьютеров NVIDIA
- OpenClaw, Claude Code, Codex — упомянутые ИИ-агенты и инструменты
- Nemotron 3 Super — открытая MoE-модель NVIDIA, упоминается с благодарностью
- DeepSeek, Minimax — китайские опенсорс-игроки
- DLSS 5 — генеративная система NVIDIA для графики
- OpenShell / NIMU-кло — инструменты безопасности NVIDIA для агентных систем
- TSMC, ASML, SK Hynix, GE Vernova, Caterpillar — упомянутая цепочка поставок
- Perplexity — компания, которую Хуанг поддерживает; упомянут CEO как «Питер»
- Doom, Virtua Fighter, Cyberpunk 2077, Skyrim — игры, упомянутые в контексте графики
- xAI, Colossus (Memphis) — пример инженерной скорости Илона Маска
- Илья Суцкевер — упомянут с цитатой «данные кончились или предобучение завершено»
- Морис Чанг — основатель TSMC, друг и наставник Хуанга
- Джим Крамер — упомянут как канал, через который обычные инвесторы попадали в акции NVIDIA
- Алан Кей — финальная цитата подкаста: «Лучший способ предсказать будущее — создать его»
Рекомендации
- Будь то студент, инженер, фермер, фармацевт или плотник — становись экспертом в использовании ИИ; при выборе из двух кандидатов Хуанг всегда возьмёт того, кто им владеет.
- Когда тревожишься — разбивай тревогу на части: отдели то, на что можешь повлиять, от того, на что не можешь, и начинай делать.
- Дели нагрузку как можно раньше: рассказывай команде то, что узнал, ещё до того, как сам полностью разобрался — это и про преемственность, и про коллективное мышление.
- Тестируй любое инженерное решение на соответствие физическому пределу, прежде чем переходить к улучшениям.
- Учись забывать неудачи быстро, иначе они блокируют движение вперёд.
Итог
В мире, где компьютер из склада превратился в фабрику токенов, побеждает тот, кто умеет совместно проектировать всю вертикаль на скорости света и переопределять рынок раньше, чем индустрия успевает спросить «зачем».