Коротко
Первая лекция курса по теории игр: курс определяется через две формулировки нобелевских лауреатов — Майерсона (математические модели конфликта и кооперации между рациональными агентами) и Аумана (интерактивная теория решений). Через игру «угадай 2/3 от среднего» (Keynesian beauty contest) демонстрируется бесконечная регрессия: я думаю о том, что думают они о том, что думаю я. Рациональность в теории игр переопределяется не как «правильность», а как консистентность предпочтений — гурман, выбравший ванильное вместо шоколадного, иррационален; человек, любящий ванильное, — нет. Дальше — индивидуальные решения, ординальная vs кардинальная полезность, фон Нейман-Моргенштерн как способ работать с лотереями. Финал — ожидаемая полезность, риск-аверсия как вогнутость функции полезности.
Главный тезис
Теория игр — это анализ ситуаций стратегической взаимозависимости, где оптимальное действие агента зависит от того, что сделают другие, причём «рациональность» означает не правильность решений, а консистентное преследование своих собственных предпочтений при формировании убеждений в условиях неопределённости.
Ключевые идеи
- 0:25 — определение Майерсона: теория игр изучает математические модели конфликтов и кооперации между интеллектуальными рациональными агентами.
- 0:43 — определение Аумана: теория игр = интерактивная теория решений, отличие от обычной теории решений именно в интеракции.
- 1:21 — классическая игра «угадай 2/3 от среднего» (Keynesian beauty contest) демонстрирует, что выбор зависит не от объективной величины, а от предсказания чужих предсказаний.
- 5:13 — итерация: я думаю о том, что они думают о том, что я думаю — этот регресс и есть суть интерактивных решений.
- 12:03 — в теории игр никогда не называем чужие предпочтения иррациональными; рациональность это не содержание выбора, а консистентность.
- 12:14 — рациональность = консистентность: разные акторы могут иметь разные цели, веса, кандидатов; важна только устойчивость предпочтений.
- 14:23 — введение термина «стратегическая взаимозависимость»: моё лучшее действие зависит от действий других (пенальти, теннисная подача).
- 16:26 — гипотеза: с приходом ИИ допущения о рациональности становятся более убедительными, потому что агенты-LLM ближе к гомогенному рациональному игроку, чем люди.
- 17:50 — ординальные предпочтения задаются как строгий порядок (C ≻ E ≻ T) с подразумеваемой транзитивностью.
- 23:10 — в ординальной полезности сами числа смысла не несут, значимы только их относительные порядки; одни и те же предпочтения можно представить бесконечным числом функций.
- фундаментальная стратегия теории игр: при неопределённости агент формирует субъективные убеждения (вероятности), даже если объективных нет.
- 30:00 — альтернативы ожидаемой полезности (оптимизм/пессимизм = max-max или max-min) отвергаются как менее убедительные.
- 33:19 — переход от ординальной к кардинальной полезности: при неопределённости величины чисел вдруг начинают иметь значение, потому что считается среднее.
- 33:49 — функция полезности фон Неймана-Моргенштерна определена на исходах, а ожидаемая полезность — на лотереях над исходами; путать эти два уровня нельзя.
- 55:24 — риск-аверсия определяется через вогнутость функции полезности: агент предпочитает гарантированное матожидание лотерее с тем же матожиданием.
- 56:54 — ключевое разделение: полезность ≠ деньги, максимизируется не ожидаемая сумма, а ожидаемая полезность.
Почему это важно
Это вводная лекция методологического курса экономики: она задаёт, как именно экономисты моделируют человеческие решения — через индивидуальное максимизирование при субъективных убеждениях. Это рамка, на которой стоят микроэкономика, теория финансов (риск-аверсия → CAPM, опционы), теория организаций, теория аукционов и mechanism design. Лектор намекает, что с ростом доли решений, принимаемых LLM и алгоритмами, эта рамка становится не менее, а более релевантной — потому что искусственные агенты ближе к идеализированному «консистентному максимизатору», чем человек. Игроки в этой картине — Майерсон, Ауман (нобелиаты), фон Нейман и Моргенштерн (основатели), а также неявно — современная индустрия ИИ, которая получает в наследство аппарат теории игр как готовый язык описания взаимодействующих агентов.
Идеи
- В игре «2/3 от среднего» победитель угадал около 24 (две трети от 36) — это уже выше теоретического равновесия в 0, что показывает: люди делают конечное число шагов рассуждения, не бесконечное.
- Во втором раунде той же игры среднее упало с 36 до 21 — публичное обсуждение работает как координация на более «глубокий» уровень мышления.
- Лектор предупреждает: «победителем» может оказаться кто-то с целью «помочь другу выиграть» или просто чудак — модель должна учитывать реальные цели, а не предполагать.
- Цена выигрыша меняет поведение: на 10$ много студентов укажут 100, на 100 000$ — практически никто.
- 18-летний и 60-летний могут иметь разные предпочтения — это требует не отказа от консистентности, а расширения модели (предпочтения в моменте).
- Преподаватель отделяет преференции «как ментальный объект» (что философы и нейроучёные изучают) от «операциональных» преференций экономистов: «А ≻ B» означает буквально «выберет A, когда оба доступны».
- Описание предпочтений через парные сравнения становится громоздким — функция полезности это просто математический трюк для компактности.
- Транзитивность встроена в нумерическое представление: если u(C) > u(E) и u(E) > u(T), то автоматически u(C) > u(T).
- Любая монотонная трансформация ординальной полезности даёт ту же самую функцию предпочтений — например u = 100, 99, 98 равносильна u = 5, 4, 1.
- Ученик в зале указывает на дыру в модели: чтобы корректно описать выбор, нужно явно перечислить ВСЕ доступные опции, включая «никакой напиток».
- «Оба напитка одновременно» — это формально другая отдельная опция, а не сумма двух.
- При неопределённости лектор отказывается анализировать кейс полного отсутствия вероятностей — даже если у вас «нет данных», вы достраиваете убеждения сами через приложение погоды.
- В сложных решениях (выбор работы, доход через 15 лет) допущение «у агента есть точная вероятность» становится более натянутым, но всё равно принимается.
- Индифферентность (равенство ожидаемых полезностей) — это патологический случай, в котором теория не делает предсказания, что выберет агент.
- Различие между лотереей и исходом критично: агент выбирает не исход, а лотерею над исходами (даже если эта лотерея вырожденная).
- Δ(Z) — стандартная нотация для симплекса вероятностей над множеством исходов Z.
- В индивидуальной задаче неопределённость экзогенна (природа); в интерактивной — она становится эндогенной (другие игроки), что требует структуры на убеждениях.
- При множестве в 4 исхода (идти/чай × солнце/дождь) выбор «идти» означает лотерею (p, 1-p, 0, 0) — два невозможных события получают нулевую вероятность.
- Аксиоматика ожидаемой полезности (она вынесена в appendix лекций) — это отдельный кусок теории: какие условия на предпочтения эквивалентны их представлению через E[u].
- Контрпример к максимизации денег: лотерея (10$ с p=0.99, 0 с p=0.01) с матожиданием 9.9 предпочитается лотерее (1000$ с p=0.01, 0 с p=0.99) с матожиданием 10 — потому что функция u(деньги) вогнута.
- Дискуссия о риск-аверсии исторически восходит к XVIII веку (намёк на парадокс Санкт-Петербурга, хотя имя не звучит).
- Лектор подчёркивает методологический шаг: сначала простой пример, потом абстрактная общая модель, потом всё более содержательные приложения.
Инсайты
- Различие ординальной и кардинальной полезности — это не математический каприз, а отражение фундаментального методологического выбора: в детерминированном мире числа полезности не значат ничего, в стохастическом — становятся осмысленными через операцию усреднения.
- Рациональность как консистентность — это деполитизация термина: убирается возможность называть чужие предпочтения «иррациональными», что переносит спор с уровня моральных суждений на уровень внутренней непротиворечивости.
- Бесконечный регресс «я думаю о том, что они думают» структурно неразрешим без точки координации — игра «2/3 от среднего» иллюстрирует, что равновесные предсказания (все указывают 0) проваливаются на людях, и теория должна учитывать ограниченность рациональности.
- Операциональная (revealed preference) трактовка предпочтений делает экономику измеримой ценой потери психологической глубины — это сознательная сделка дисциплины.
- Введение лотерей как первичных объектов выбора (а не исходов) — концептуальный сдвиг: агент никогда не выбирает результат напрямую, только распределение над результатами.
- Различие между функцией полезности на исходах (u: Z→R) и функцией ожидаемой полезности на лотереях (U: Δ(Z)→R) — типичная точка путаницы для студентов и одно из мест, где формализм спасает интуицию.
- Эндогенизация неопределённости — это разделительная линия между индивидуальной теорией решений и теорией игр: как только источник неопределённости — другой агент, нужны равновесные концепции.
- Тезис лектора, что ИИ делает допущения теории игр «более убедительными», — это перенос фокуса: классическая критика «люди не рациональны» теряет силу, если решения принимают алгоритмы, которые буквально оптимизируют функцию.
- Риск-аверсия — не психологическая аномалия, а структурное свойство вогнутости полезности; объяснение, найденное XVIII веком, до сих пор работает как базовый строительный блок финансовой теории.
- Методология «простой пример → абстрактная модель → богатые приложения» — это сама структура того, как мысль организуется в современной экономике, а не педагогический приём.
Цитаты
«die Spieltheorie die Untersuchung mathematischer Modelle von Konflikten und Kooperationen zwischen intelligenten ... rationalen Entscheidungsträgern ist» — 0:25 теория игр — это изучение математических моделей конфликтов и кооперации между интеллектуальными рациональными агентами
«Es handelt sich um interaktive Entscheidungstheorie» — 0:43 Речь идёт об интерактивной теории решений
«In our rationality model, we never say that the people of someone irrational are» — 12:03 В нашей модели рациональности мы никогда не говорим, что чьи-то предпочтения иррациональны
«If it is that, what they like, it is that» — 12:11 Если им это нравится — значит, нравится
«die Rationalitätsannahmen der Spieltheorie in einer Welt künstlicher Intelligenz nützlicher und zwingender werden» — 16:26 допущения о рациональности в теории игр в мире искусственного интеллекта становятся более полезными и убедительными
«This situation is often called as a strategic interdependence» — 14:23 Эту ситуацию часто называют стратегической взаимозависимостью
«the best action for a player is to do, what other people do» — 14:51 лучшее действие игрока зависит от того, что делают другие
«Wenn wir Lotterien bewerten, vergleichen wir nicht nur den erwarteten Geldbetrag der Lotterien. Wir vergleichen den erwarteten Nutzen zwischen den Lotterien» — 55:00 Когда мы оцениваем лотереи, мы сравниваем не ожидаемую сумму денег, а ожидаемую полезность
«die Nutzenfunktion ist nicht dasselbe wie Geld. Man maximiert nicht den erwarteten Geldbetrag. Man maximiert den erwarteten Nutzen» — 56:54 Функция полезности — это не то же самое, что деньги. Максимизируется не ожидаемая сумма денег, а ожидаемая полезность
«Ich bin ein optimistischer Mensch. Man könnte auch sagen, ich bin ein pessimistischer Mensch» — 30:00 Я оптимист. Можно сказать и: я пессимист
«Bei der Entscheidungsfindung unter Unsicherheit ist der Nutzen in diesem Kontext also Kardinal im Gegensatz zu Ordinal» — 33:19 При принятии решений в условиях неопределённости полезность кардинальна, а не ординальна
«Konzentrieren wir uns auf den Fall e, in dem p nicht 3 Fünftel ist» — 38:46 Сосредоточимся на случае, когда p не равно 3/5
«Sie haben recht, im Allgemeinen ist es wichtig, wenn wir ein Auswahlproblem modellieren, jede mögliche Entscheidung zu erfassen» — 24:45 Вы правы — когда мы моделируем задачу выбора, важно учесть каждое возможное решение
«Selbst durch Selbstbeobachtung bilden sie sich ihre Überzeugungen darüber, was die Natur tut, nicht darüber, was andere Spieler tun» — 51:30 Через интроспекцию агент формирует убеждения о том, что делает природа, а не о том, что делают другие игроки
«if u-concav is a, then that means that the people that are a, what we call Risikoavers nennen» — 55:24 если u вогнута, то это означает, что человек — то, что мы называем риск-аверсным
Факты
- Определение Майерсона: теория игр — математические модели конфликта и кооперации между рациональными агентами. Оба процитированных автора (Майерсон и Ауман) — нобелевские лауреаты по экономике.
- В игре «угадай 2/3 от среднего» в классе среднее первого раунда было 36, победитель назвал ~24 (формально 2/3 от 36).
- Во втором раунде среднее упало до 21, победитель назвал 14.
- Один студент назвал 26 во втором раунде с мотивацией «возможно ошибусь в ту же сторону, что и большинство».
- Теоретическое равновесие в этой игре — 0 (или 1 при дискретных числах), эта точка достигается итеративным исключением доминируемых стратегий.
- На MobLab (упомянутая лектором платформа) запускались интерактивные игры в реальном времени.
- Игра «угадай 2/3 от среднего» иногда называется Keynesian beauty contest.
- Аксиоматика ожидаемой полезности — фон Нейман и Моргенштерн; их аппарат вынесен в appendix лекционных заметок курса.
- Курс будет применять теорию игр в основном в экономике, но также частично в политологии и политических переговорах.
- Лектор называет вогнутость функции полезности математическим эквивалентом риск-аверсии.
- Численный пример риск-аверсии: лотерея (10$ с p=0.99) предпочитается лотерее (1000$ с p=0.01), несмотря на меньшее матожидание.
- Лектор отделяет случаи безразличия (p = 3/5 в приведённом примере), где теория не делает предсказания.
- Лектор делает оговорку «true or false I don't know», что тезис об усилении рациональности с ИИ — это одна из точек зрения в дисциплине, а не консенсус.
Источники
- Roger Myerson — нобелевский лауреат, источник первой цитируемой дефиниции теории игр.
- Robert Aumann — нобелевский лауреат, автор определения «interactive decision theory».
- John von Neumann & Oskar Morgenstern — функция полезности фон Неймана-Моргенштерна, аксиоматика ожидаемой полезности.
- MobLab — платформа для интерактивных экспериментальных игр в классе.
- Keynesian beauty contest — альтернативное название игры «2/3 от среднего» (отсылка к Кейнсу).
- Appendix лекционных заметок курса — материалы по аксиоматике ожидаемой полезности.
Итог
Теория игр — это математика рационального выбора в условиях, когда твой выбор зависит от чужого, а чужой — от твоего; всё начинается с консистентности предпочтений и убеждений об неопределённости, а уже из этого строятся ожидаемая полезность, риск-аверсия и весь дальнейший аппарат.