Коротко
Дарио Амодеи, CEO Anthropic, излагает гипотезу масштабирования: модели, обученные на больших объёмах вычислений и данных, продолжают улучшаться, и через 2-4 года появятся системы интеллекта на уровне нобелевских лауреатов — «страна гениев в дата-центре». Anthropic сейчас на уровне безопасности ASL-2, приближается к ASL-3, при котором модель сможет помочь неподготовленному человеку создать химическое или биологическое оружие. DeepSeek не опроверг законы масштабирования, а подтвердил их — это первый случай, когда китайская компания вышла на паритет с американскими лабораториями, поэтому экспортный контроль над GPU критичен для нацбезопасности США. Через 12 месяцев ИИ будет писать почти весь код, а в перспективе заменит большинство удалённой умственной работы — это потребует пересмотра налоговой системы и понятия «полезности человека». Anthropic вкладывается в механистическую интерпретируемость, конституционный ИИ и политику ответственного масштабирования, нанял исследователя welfare моделей и обсуждает кнопку «I quit this job» для ИИ.
Главный тезис
Кривая масштабирования через 2-4 года приведёт к ИИ, превосходящему почти всех людей почти во всех задачах, и общество, и государство пока катастрофически не осознают масштаб надвигающегося сдвига — главный риск не в том, что Дарио прав или не прав, а в том, что планета не готовится к сценарию, в котором он прав.
Ключевые идеи
- Гипотеза масштабирования была сформулирована внутри OpenAI в 2019-2020: больше вычислений + больше данных + простые алгоритмы = рост интеллекта по всему спектру задач, и эта зависимость держится от $1k бюджетов до $10B.
- Модели «выращивают, а не строят» — они статистические, как развивающийся детский мозг, поэтому формальная верификация невозможна, а истинные способности видны только после деплоя на миллион пользователей.
- Mechanistic interpretability (основатель — со-фаундер Anthropic Chris Olah) — заглядывание внутрь моделей, не имело коммерческой ценности первые 4 года, но Anthropic финансировал команду как общественное благо.
- Constitutional AI — обучение модели по набору принципов вместо человеческого фидбэка, позволяет публично декларировать на каких правилах построена модель.
- Responsible Scaling Policy калибрует риск по аналогии с биобезопасностью: ASL-2 — текущий уровень, ASL-3 наступает, когда модель даёт неподготовленному пользователю возможности на уровне PhD по вирусологии в области CBRN-оружия.
- Anthropic задержал выпуск первого Claude на 6 месяцев перед моментом ChatGPT, осознанно отказавшись «зажечь» гонку.
- ИИ через 3-6 месяцев будет писать 90% кода, через 12 месяцев — почти весь код; человек останется на уровне постановки задачи, архитектуры и безопасности, но «островки человеческого труда» постепенно исчезнут во всех отраслях.
- DeepSeek — не опровержение, а подтверждение законов масштабирования: стоимость заданного уровня интеллекта падает в 4 раза в год, но желание тратить растёт в 10 раз в год.
- Экспортный контроль на GPU — самая важная политика нацбезопасности США во всех областях, а не только в ИИ; через 10-20 лет китайский железный стек догонит, но критический период — ближайшие 10 лет.
- Промышленный шпионаж — «$100-миллионные секреты в нескольких строках кода», и Дарио уверен, что их пытаются красть и иногда успешно.
- Биология — самый оптимистичный фронт: вирусные/бактериальные болезни уже решены, рак, Альцгеймер, шизофрения, депрессия — системные болезни, которые ИИ может закрыть; разница между «5 лет» и «30 лет» зависит от регуляторики (FDA).
- К 2027 индустрия требует +50 ГВт мощностей в США — это половина всей энергии, добавленной в сеть США в 2024.
- Anthropic Economic Index — инструмент privacy-preserving анализа, дополняет ли ИИ или замещает человека в разных профессиях.
- Kyle Fish нанят как AI welfare researcher; обсуждается кнопка «I quit this job» для модели как базовый механизм preference.
- Главный страх Дарио — разрыв осознанности: несколько миллионов людей в Кремниевой долине понимают масштаб, а население видит «улучшенный поиск Google».
Почему это важно
Anthropic — один из 4-5 фронтирных лабораторий, единственная позиционирующая себя как «mission-first». Дарио задаёт повестку, в которой переплетены три игрока: правительство США (которому нужны экспортный контроль, AISI и помощь в защите лабораторий от шпионажа), Китай (DeepSeek доказал способность к инженерному паритету, и Huawei отстаёт от NVIDIA лет на четыре, но догоняет), и сами лаборатории (Anthropic, OpenAI, Google, выигрывающие от RSP-режима, который они устанавливают сами для себя). Выигрывают: NVIDIA, гиперскейлеры, энергетические компании, биотех с быстрым FDA, страны Tier-1 диффузионного правила. Проигрывают: страны Tier-2 без security affidavits, белые воротнички с однородным набором задач, и любая страна, опоздавшая в первые 10 лет гонки за «дата-центр гениев», после чего, по Дарио, военное и экономическое доминирование зацементируется.
Цитаты
«We grow them more than we build them. They're like a child's brain developing.» Мы их скорее выращиваем, чем строим. Они как развивающийся детский мозг.
«It's like having a country of geniuses in a data center.» Это как иметь страну гениев в дата-центре.
«I think we'll be there in three to six months where AI is writing 90% of the code. And then in 12 months, we may be in a world where AI is writing essentially all of the code.» Думаю, через три-шесть месяцев ИИ будет писать 90% кода. А через 12 месяцев — практически весь код.
«I actually think the most societally divisive outcome is if randomly 50% of the jobs are suddenly done by AI.» Самый раскалывающий общество исход — если случайные 50% рабочих мест внезапно займёт ИИ.
«Across all areas, not just AI, the most important policy for the national security of the United States.» Из всех областей, не только ИИ, экспортный контроль — самая важная политика для нацбезопасности США.
«Whoever establishes dominance in this technology will have military and economic dominance everywhere.» Кто установит доминирование в этой технологии, получит военное и экономическое доминирование везде.
«AI is going to be better than almost all humans at almost all things.» ИИ будет лучше почти всех людей почти во всём.
«If it quacks like a duck and it walks like a duck, maybe it's a duck.» Если крякает как утка и ходит как утка, может, это утка.
«There are $100 million dollar secrets that are a few lines of code.» Существуют секреты на сто миллионов долларов, умещающиеся в несколько строк кода.
«They don't know what's about to hit them.» Они не знают, что на них надвигается.
Факты
- Дарио Амодеи — бывший VP of Research в OpenAI, до этого senior research scientist в Google Brain; разрабатывал GPT-2 и GPT-3.
- Anthropic покинул OpenAI вместе с группой, ставшей семью со-фаундерами, в конце 2020 года.
- Один из со-фаундеров — Chris Olah, основатель области mechanistic interpretability.
- Современный Claude — продукт Anthropic, первый релиз был задержан на ~6 месяцев относительно момента, когда могли «перехватить» эффект ChatGPT.
- Стоимость одного и того же уровня интеллекта модели падает примерно в 4× в год, при этом совокупные траты растут примерно в 10× в год.
- DeepSeek потратил несколько миллионов на одну модель, но миллиарды — на R&D; количество чипов сопоставимо с американскими лабораториями.
- Huawei отстаёт от NVIDIA примерно на 4 года в производстве чипов.
- Биденовский diffusion rule делит мир на 3 тира: Tier-1 (большинство развитых стран), Tier-2 (промежуточные с security-affidavits), Tier-3 (Китай, Россия — рестриктивные).
- Anthropic ведёт диалог с US AISI (AI Safety Institute) и сотрудничает по тестированию моделей на CBRN-риски.
- Novo Nordisk (производитель Ozempic) использует модель Anthropic для clinical study report: вместо 10 недель — 10 минут на написание + 3 дня на человеческую проверку.
- К 2027 году ИИ-индустрии нужно +50 гигаватт энергии в США.
- 50 ГВт ≈ суммарный рост энергомощностей США за весь 2024 год.
- Anthropic запустил Anthropic Economic Index для privacy-preserving анализа использования моделей в разных отраслях.
- Нанят Kyle Fish как AI welfare researcher.
- Deep Blue обыграл Каспарова почти 30 лет назад, но Magnus Carlsen остаётся знаменитостью.
- Дарио оценивает уверенность в реализации сценария «страна гениев в дата-центре» в 70-80%.
- Топ-3 риска срыва: военный конфликт вокруг Тайваня (производство GPU), обвал капитализации ИИ-компаний, ошибочность парадигмы reasoning models на собственных мыслях.
Итог
ИИ через несколько лет превратится в распределённый «народ гениев», и единственный реальный вопрос — успеют ли США, Anthropic и общество построить экспортный контроль, безопасность лабораторий, новую экономику смысла и хоть какой-то компас морального статуса самих моделей, прежде чем экспонента поставит всех перед фактом.