Коротко
Дженсен Хуанг (CEO NVIDIA) выстраивает защиту тезиса, что GPU и CUDA — не коммодити: превращение «электронов в токены» требует столько инженерии и науки, что путь «далёк от завершения». Он описывает ИИ как «пятислойный пирог» (энергия → чипы → инфраструктура → модели → приложения), где США должны выиграть на каждом уровне, а не отдавать рынок ради одного слоя. Большая часть интервью — жёсткий спор с интервьюером об экспортном контроле в Китай: Хуанг настаивает, что у Китая уже избыток компьюта, энергии и 50% мировых ИИ-исследователей, поэтому запрет не сдерживает, а лишь толкает Китай к самодостаточности и лишает Америку второго по величине рынка. Он раскрывает экономику моста NVIDIA — годовой ритм релизов, лучший TCO, install base, доменные библиотеки CUDA-X — и признаёт прошлую ошибку: неспособность вовремя инвестировать в Anthropic, которую перехватили Google и AWS. Сквозная мысль — преимущество NVIDIA не в литографии (закон Мура мёртв), а в архитектуре, программируемости и алгоритмах.
Главный тезис
ИИ — это не одна модель, а пятислойный «пирог», где ценность создаётся всей вертикалью «электрон → токен»; США (и NVIDIA как его стек) должны побеждать на каждом слое и удерживать глобальный рынок, а не отступать из страха — потому что компьют, ставший дефицитом, и есть подлинный рычаг власти, а отказ от рынка лишь ускоряет конкурента.
Ключевые идеи
- 0:32 — кто-то должен превращать электроны в токены, и со временем ценность этих токенов растёт; это и есть бизнес-модель NVIDIA, а не «коммодити».
- 0:55 — сделать из «электрона в токене» полный коммодити крайне трудно: это требует навыка, инженерии, науки, инноваций, и «путешествие далеко от завершения».
- 2:29 — ИИ-индустрия это пятислойный пирог, и США должны выиграть на каждом слое, а не жертвовать одним ради другого.
- 6:06 — огромный downstream-спрос NVIDIA заставляет поставщиков (память, ODM, упаковка) инвестировать вверх по цепочке; GTC собирает всю вселенную ИИ «на 360 градусов», чтобы все увидели единую картину.
- 9:40 — узкое место масштабирования — не идеи, а сантехники, электрики, EUV-машины, энергия; это «проблема на 2-3 года», решаемая чётким сигналом спроса.
- 13:46 — прогноз 10-летней давности «не идите в радиологи» провалился: радиологов не хватает, что опровергает алармизм о конце профессий.
- 17:36 — рынок NVIDIA шире любого TPU/ASIC, потому что GPU делает не только перемножение матриц, а всё: data processing, квантовую химию, графику, ветвящиеся алгоритмы с произвольным доступом к памяти.
- 30:53 — CPU как Cadillac (всегда удобный круиз), а GPU NVIDIA как гоночный болид: на нём может ездить каждый, но выжать предел требует специализации, и NVIDIA знает свою архитектуру лучше всех.
- 25:04 — фронтир-лаборатории (OpenAI) выбирают CUDA + PyTorch, потому что гиперскейлеры со своими кернелами гонятся лишь за «последними 5%», а экосистема CUDA богаче (Triton, vLLM, SGLang, RL-фреймворки).
- 32:16 — у NVIDIA лучший TCO в мире; ни один TPU/Trainium не показал лучшую стоимость инференса (вызов на бенчмарке InferenceMax).
- 28:37 — install base (миллионы GPU во всех облаках, всех форм-факторов) делает софт переносимым везде — это «крупнейшее сокровище» NVIDIA.
- 54:19 — NVIDIA держит фиксированную цену независимо от спроса и принцип «первым пришёл — первым обслужен»; не повышает цены при дефиците, в отличие от остальной чип-индустрии — это про доверие.
- 55:13 — за 30 лет с TSMC нет юридического договора, только доверие; так же клиент может «поставить весь бизнес» на годовой роадмап NVIDIA (Rubin, Rubin Ultra).
- 40:12 — прошлая ошибка: NVIDIA не смогла инвестировать в Anthropic, потому что VC не дал бы нужных миллиардов; это сделали Google и AWS, и теперь Хуанг «не повторит ошибку» ($30B в OpenAI, $10B в Anthropic).
- 50:22 — философия: делать как можно меньше (дать экосистеме процветать), но как можно больше того, без чего рынок не возникнет (CoreWeave, cuLitho, доменные библиотеки).
- 1:27:52 — Китай — крупнейший контрибьютор open-source моделей; лучше, чтобы они работали на американском стеке, чем подталкивать мир к китайскому.
- 1:32:32 — закон Мура мёртв (~25%/год по транзисторам), прирост Blackwell в 50x против Hopper идёт от архитектуры и computer science, а не от литографии.
Почему это важно
Это интервью — публичная оборона главного бенефициара ИИ-бума от двух экзистенциальных нарративов: «софт станет коммодити, и NVIDIA вместе с ним» и «экспорт чипов в Китай — угроза нацбезопасности США». Хуанг отвечает обоим, защищая капитализацию (просевшие оценки софтверных компаний) и ~40% китайского рынка, который экспортный контроль фактически отнял. В споре столкнулись две модели мира: интервьюер видит компьют как обогащённый уран, который надо удерживать у США, чтобы выиграть гонку кибер-возможностей (Anthropic, находящая zero-days); Хуанг видит ИИ как индустрию-пирог, где победа = глобальное доминирование американского стека, а самоизоляция лишь рождает конкурента (Huawei, DeepSeek, SMIC). Ставки: кто задаёт стандарт ИИ для Глобального Юга, Индии, Ближнего Востока — Америка или Китай. Упомянуты все игроки экосистемы: TSMC, ASML, Micron, SK Hynix, Samsung, Broadcom, Google, AWS, OpenAI, Anthropic, xAI, CoreWeave, Crusoe.
Идеи
- Аналогия «вход — электрон, выход — токен» как ментальная модель всей компании NVIDIA.
- Сделать один токен ценнее другого — как сделать одну монету дороже другой; это вопрос науки, а не штамповки.
- GTC устроен как единое физическое место, где апстрим видит даунстрим и наоборот — намеренная архитектура доверия и инвестиций.
- Поставщики вкладываются в апстрим не потому что верят на слово, а потому что видят гарантированный спрос вниз по цепочке.
- «Хорошая проблема» — когда спрос экономики выше суммарного предложения всей индустрии; это лучше, чем наоборот.
- За два года NVIDIA «прогрела» TSMC, чтобы CoWoS-упаковка перестала быть спецтехнологией и масштабировалась как обычная логика.
- NVIDIA лицензирует свои патенты по силиконовой фотонике поставщикам open — намеренно создаёт открытую цепочку, а не запирает.
- Радиолог — это не «чтение снимков», а уход за пациентом; узкое понимание профессии порождает ложные прогнозы о её исчезновении.
- Если переоценить ИИ и отпугнуть людей от профессии софт-инженера — останешься вообще без софт-инженеров.
- ASIC-маржа (~65%) почти такая же высокая, как у NVIDIA (~70%); «экономия» на отказе от NVIDIA иллюзорна — всё равно платишь Broadcom.
- Оптимизация кернела силами NVIDIA даёт партнёрской модели +50-60% скорости — прямое увеличение выручки на установленном флоте Hopper/Blackwell.
- Crusoe считает KV-cache один раз на кластер для тысяч агентов — критично при длинных префиксах агентных систем (5x throughput, 10x быстрее first token против vLLM).
- NVIDIA подключает сторонние ускорители (Groq в систему garbage collection), когда меняется формат workload, а не алгоритм.
- Сегментация рынка токенов: «премиальный» быстрый токен (низкий throughput, высокий ASP) против дешёвого массового — как разные классы обслуживания.
- При выходе за пределы текущих мощностей легко вернуться на старый узел (7nm), который никто не занимает, и нарастить объём — у NVIDIA есть этот «хвост».
- Каждое поколение даёт прирост далеко за пределами масштабирования транзистора — за счёт упаковки, стекинга, системной архитектуры.
- Anthropic не выпустила «Mythos» из-за избыточных кибер-способностей: тысячи серьёзных уязвимостей в каждой ОС и браузере, баг в OpenBSD возрастом 27 лет.
- Huawei провёл рекордный год по отгрузкам чипов — «сотни тысяч», больше чем Anthropic; у них много логики и HBM, но узкое место — пропускная способность памяти.
- Между 5nm и 7nm разница ~10x — но это не определяющий фактор: важнее архитектура, сеть (Mellanox), энергия.
- Китай: «города-призраки», пустые ЦОДы, свободная энергия — могут поставить в 4-10 раз больше чипов, потому что энергия бесплатна.
- Экспортный контроль уже дал «неожиданный результат»: ускорил собственные чипы Китая и заставил их ИИ-инфраструктуру оптимизироваться под внутреннюю архитектуру.
- Энергия — нижний слой пирога: «много энергии разрушает дефицит чипов, много чипов разрушает дефицит энергии».
- В США из-за нехватки энергии NVIDIA вынуждена выжимать максимум перформанса на ватт; в Китае ватты «бесплатны и полны».
- При старте NVIDIA было 60 компаний 3D-графики; выжила одна, и её первая архитектура была «полностью неправильной» — её списывали со счетов.
- Контрфактуал: даже без ИИ NVIDIA была бы крупной — accelerated computing для биотеха, графики, data processing, квантовой химии существовал бы и так.
- «Тензоры — не единственный способ вычислять»: матричное умножение лишь часть ИИ, а ИИ — лишь часть компьюта.
Инсайты
- Коммодитизация не наступает там, где ценность создаётся всей вертикалью знаний, а не одним воспроизводимым артефактом — защита от коммодити встроена в сложность стека, а не в патент.
- Рыночная власть масштабируется не объёмом продаж, а способностью заставить поставщиков инвестировать в тебя — спрос вниз по цепочке монетизируется как капитал вверх по цепочке.
- Когда физика (закон Мура) упирается в потолок, рычаг прироста смещается в software/архитектуру; компания, контролирующая программную абстракцию, перехватывает экспоненту у компании, контролирующей литографию.
- Lock-in рождается не из контракта, а из накопленной стоимости переключения (install base, экосистема, доверие к роадмапу) — поэтому x86 живёт десятилетиями, и поэтому фиксированная цена выгоднее ценового гужевания.
- Алармизм об «исчезновении профессий» систематически ошибается, потому что сводит профессию к её автоматизируемому ядру, игнорируя неавтоматизируемую обёртку.
- Экспортный контроль над зрелым (а не дефицитным) ресурсом контрпродуктивен: он не сдерживает, а субсидирует появление автономного конкурента и стандарта.
- Стратегия «не выбирать победителей, а поддержать всех» работает как хедж против собственной неспособности предсказать выживших — что подтверждает история самой NVIDIA (1 из 60).
- Дефицитный вход (компьют) делает дорогой человеческий капитал (исследователей) продуктивным — поэтому контроль над компьютом стоит дороже контроля над любым отдельным алгоритмом.
- Открытость (open-source, лицензирование патентов, открытый стек) — не альтруизм, а механизм навязывания своего стандарта как глобальной инфраструктуры по умолчанию.
- «Проигрышная ментальность» как стратегический изъян: предположение «всё равно потеряем рынок» само становится самосбывающимся отказом конкурировать.
- В системах с непрозрачным нижним уровнем доверие к платформе важнее производительности — разработчик выбирает стек, где «вина всегда твоя, а не компьютера».
- Дифференциация цены токена по латентности/качеству превращает компьют из однородного коммодити в сегментированный рынок с разными классами обслуживания.
Цитаты
«someone has to change electrons in token» — 0:32 кто-то должен превращать электроны в токены
«It's difficult to make a complete commodity out of an electron in a token» — 0:55 Трудно сделать из электрона в токене полный коммодити
«AI is a five-layer cake if you want» — 2:29 ИИ — это пятислойный пирог, если угодно
«we can be limited by the number of plumber» — 9:40 нас может ограничивать число сантехников
«don't become a radiologist» — 13:35 не становитесь радиологом
«The world will not have any other radiologist, but we have a lack of radiologists» — 13:49 Мира без радиологов не будет — наоборот, нам их не хватает
«NVIDIA's GPUs are like FN Racer's accelerator» — 31:10 GPU NVIDIA — как акселератор гоночного болида
«Nvidia's computing stack shows the best TCO in the world» — 32:16 Вычислительный стек NVIDIA показывает лучший TCO в мире
«You decide your price. And then people decide whether to buy it or not» — 54:19 Ты назначаешь свою цену, а люди решают, покупать или нет
«there is no legal agreement between TSMC» — 55:13 между нами и TSMC нет юридического договора
«No Foundry in history can say that» — 56:24 Ни одна фабрика в истории не может такого сказать
«I don't think you are talking to a person who is a loser» — 1:20:25 По-моему, ты говоришь не с тем, кто проигрывает
«that losing attitude, that losing mentality, doesn't mean anything to me» — 1:21:22 это пораженческое отношение, эта менталка лузера для меня ничего не значит
«We are not a car» — 1:20:37 Мы не автомобиль
«We are not Samriddhi Uranium. This is a chip» — 1:23:20 Мы не обогащаем уран. Это чип
«China is the biggest contributor to open model in the world» — 1:27:52 Китай — крупнейший в мире контрибьютор открытых моделей
«It was never going to be successful. We thought about it very well. But we reached a wrong conclusion» — 48:07 Это никогда не должно было сработать. Мы всё хорошо обдумали — но пришли к неверному выводу
«no VC would ever invest Rs. 5 million in an AI lab in the hope that it would become anthropic» — 40:12 ни один венчур не вложил бы [миллиарды] в ИИ-лабораторию в надежде, что она станет Anthropic
«We did it as soon as possible. If I could, I would have done it even earlier» — 42:02 Мы сделали это как можно раньше. Мог бы — сделал бы ещё раньше
«We should do as much work as possible. As little as possible» — 46:27 Нам стоит делать как можно больше. И как можно меньше
«Moore's law is over» — 1:32:32 Закон Мура мёртв
«tensors are not the only way you calculate» — 1:43:00 тензоры — не единственный способ вычислять
«Even if AI wasn't present today, NVIDIA would have been a big thing» — 1:40:36 Даже если бы ИИ сегодня не было, NVIDIA всё равно была бы крупной
Факты
- NVIDIA инвестировала, по словам Хуанга, ~$30 млрд в OpenAI и ~$10 млрд в Anthropic.
- Маржа NVIDIA названа на уровне ~70%, маржа ASIC-производителей — ~65%.
- Blackwell заявлен как до 50x энергоэффективнее Hopper (изначально Хуанг говорил 35x, аналитик Dylan Patel назвал это «sandbagging» и насчитал 50x).
- Закон Мура, по оценке Хуанга, даёт сейчас ~25% прироста в год; лучший computer science добавляет до 10x.
- Anthropic объявила сделку на несколько гигаватт с Broadcom и Google по TPU; две из трёх ведущих моделей мира (Claude, Gemini) тренируются на TPU.
- Huawei провёл рекордный по объёму год, отгрузив, по словам Хуанга, «сотни тысяч» чипов — больше, чем у Anthropic (точные цифры он подаёт как оценку).
- Разрыв между 5nm и 7nm Хуанг оценивает примерно в 10x; Китай «застрял» на 7nm из-за отсутствия EUV (контроль ASML).
- Около 50% мировых ИИ-разработчиков находятся в Китае; Китай назван вторым по величине рынком компьюта в мире.
- Компьюта в США, по утверждению Хуанга, в 100 раз больше, чем где-либо ещё в мире (его собственная оценка, не факт).
- Anthropic обнаружила в исследовании модели «Mythos» тысячи серьёзных уязвимостей в каждой крупной ОС и браузере; в OpenBSD — один баг возрастом 27 лет.
- На старте у NVIDIA было 60 конкурентов в 3D-графике; выжила одна.
- Отношениям NVIDIA и TSMC около 30 лет, без юридического договора.
- Crusoe в бенчмарке дал 5x throughput против vLLM и 10x более быстрый первый токен.
- Hopper — 7nm чип (по контексту обсуждения); упомянуты A10/A100/H100/H200, L-серия, B-серия как install base.
- Доменные библиотеки CUDA-X строились ~20 лет; среди них cuLitho (вычислительная литография).
Источники
- NVIDIA GTC — ежегодная конференция как «360-градусная вселенная ИИ».
- TSMC, ASML (EUV-машины), Micron, SK Hynix, Samsung — цепочка поставок.
- CUDA, CUDA-X, cuLitho, PyTorch, Triton, vLLM, SGLang, Nemo RL, cuBLAS, NCCL, Mellanox/NVLink/Spectrum-X.
- Crusoe — neocloud, KV-caching для агентных кластеров.
- CoreWeave, Nebius (Nskill/NBS), Lambda — neoclouds, поддержанные NVIDIA.
- OpenAI, Anthropic (модель «Mythos»), Google (TPU), AWS, xAI, Broadcom, Huawei (910C), SMIC, DeepSeek.
- Dylan Patel (SemiAnalysis) — статья о 50x-эффективности Blackwell; бенчмарк InferenceMax.
- Рекламные вставки: Cursor (Composer 2), Jane Street (исследование backdoor-моделей, интерполяция/экстраполяция весов).
- Упомянут Larry Ellison / Oracle (история про ужин и заказ GPU), Sanjay (команда Micron).
Итог
Дженсен Хуанг продаёт не чипы, а тезис: ценность ИИ рождается во всей вертикали «электрон → токен», закон Мура мёртв, рычаг — в архитектуре, экосистеме и доверии, а попытка запереть компьют от Китая лишь выращивает конкурента и отдаёт ему глобальный стандарт.