Лекция 1: Введение в принятие индивидуальных решений

MIT OpenCourseWare18 мая 202654 5852 32110 мин чтения25 мая, 21:21

Экономика Стратегия Наука Поведение Образование

Коротко

Первая лекция курса по теории игр: курс определяется через две формулировки нобелевских лауреатов — Майерсона (математические модели конфликта и кооперации между рациональными агентами) и Аумана (интерактивная теория решений). Через игру «угадай 2/3 от среднего» (Keynesian beauty contest) демонстрируется бесконечная регрессия: я думаю о том, что думают они о том, что думаю я. Рациональность в теории игр переопределяется не как «правильность», а как консистентность предпочтений — гурман, выбравший ванильное вместо шоколадного, иррационален; человек, любящий ванильное, — нет. Дальше — индивидуальные решения, ординальная vs кардинальная полезность, фон Нейман-Моргенштерн как способ работать с лотереями. Финал — ожидаемая полезность, риск-аверсия как вогнутость функции полезности.

Главный тезис

Теория игр — это анализ ситуаций стратегической взаимозависимости, где оптимальное действие агента зависит от того, что сделают другие, причём «рациональность» означает не правильность решений, а консистентное преследование своих собственных предпочтений при формировании убеждений в условиях неопределённости.

Ключевые идеи

0:25 — определение Майерсона: теория игр изучает математические модели конфликтов и кооперации между интеллектуальными рациональными агентами.
0:43 — определение Аумана: теория игр = интерактивная теория решений, отличие от обычной теории решений именно в интеракции.
1:21 — классическая игра «угадай 2/3 от среднего» (Keynesian beauty contest) демонстрирует, что выбор зависит не от объективной величины, а от предсказания чужих предсказаний.
5:13 — итерация: я думаю о том, что они думают о том, что я думаю — этот регресс и есть суть интерактивных решений.
12:03 — в теории игр никогда не называем чужие предпочтения иррациональными; рациональность это не содержание выбора, а консистентность.
12:14 — рациональность = консистентность: разные акторы могут иметь разные цели, веса, кандидатов; важна только устойчивость предпочтений.
14:23 — введение термина «стратегическая взаимозависимость»: моё лучшее действие зависит от действий других (пенальти, теннисная подача).
16:26 — гипотеза: с приходом ИИ допущения о рациональности становятся более убедительными, потому что агенты-LLM ближе к гомогенному рациональному игроку, чем люди.
17:50 — ординальные предпочтения задаются как строгий порядок (C ≻ E ≻ T) с подразумеваемой транзитивностью.
23:10 — в ординальной полезности сами числа смысла не несут, значимы только их относительные порядки; одни и те же предпочтения можно представить бесконечным числом функций.
фундаментальная стратегия теории игр: при неопределённости агент формирует субъективные убеждения (вероятности), даже если объективных нет.
30:00 — альтернативы ожидаемой полезности (оптимизм/пессимизм = max-max или max-min) отвергаются как менее убедительные.
33:19 — переход от ординальной к кардинальной полезности: при неопределённости величины чисел вдруг начинают иметь значение, потому что считается среднее.
33:49 — функция полезности фон Неймана-Моргенштерна определена на исходах, а ожидаемая полезность — на лотереях над исходами; путать эти два уровня нельзя.
55:24 — риск-аверсия определяется через вогнутость функции полезности: агент предпочитает гарантированное матожидание лотерее с тем же матожиданием.
56:54 — ключевое разделение: полезность ≠ деньги, максимизируется не ожидаемая сумма, а ожидаемая полезность.

Почему это важно

Это вводная лекция методологического курса экономики: она задаёт, как именно экономисты моделируют человеческие решения — через индивидуальное максимизирование при субъективных убеждениях. Это рамка, на которой стоят микроэкономика, теория финансов (риск-аверсия → CAPM, опционы), теория организаций, теория аукционов и mechanism design. Лектор намекает, что с ростом доли решений, принимаемых LLM и алгоритмами, эта рамка становится не менее, а более релевантной — потому что искусственные агенты ближе к идеализированному «консистентному максимизатору», чем человек. Игроки в этой картине — Майерсон, Ауман (нобелиаты), фон Нейман и Моргенштерн (основатели), а также неявно — современная индустрия ИИ, которая получает в наследство аппарат теории игр как готовый язык описания взаимодействующих агентов.

Идеи

В игре «2/3 от среднего» победитель угадал около 24 (две трети от 36) — это уже выше теоретического равновесия в 0, что показывает: люди делают конечное число шагов рассуждения, не бесконечное.
Во втором раунде той же игры среднее упало с 36 до 21 — публичное обсуждение работает как координация на более «глубокий» уровень мышления.
Лектор предупреждает: «победителем» может оказаться кто-то с целью «помочь другу выиграть» или просто чудак — модель должна учитывать реальные цели, а не предполагать.
Цена выигрыша меняет поведение: на 10$ много студентов укажут 100, на 100 000$ — практически никто.
18-летний и 60-летний могут иметь разные предпочтения — это требует не отказа от консистентности, а расширения модели (предпочтения в моменте).
Преподаватель отделяет преференции «как ментальный объект» (что философы и нейроучёные изучают) от «операциональных» преференций экономистов: «А ≻ B» означает буквально «выберет A, когда оба доступны».
Описание предпочтений через парные сравнения становится громоздким — функция полезности это просто математический трюк для компактности.
Транзитивность встроена в нумерическое представление: если u(C) > u(E) и u(E) > u(T), то автоматически u(C) > u(T).
Любая монотонная трансформация ординальной полезности даёт ту же самую функцию предпочтений — например u = 100, 99, 98 равносильна u = 5, 4, 1.
Ученик в зале указывает на дыру в модели: чтобы корректно описать выбор, нужно явно перечислить ВСЕ доступные опции, включая «никакой напиток».
«Оба напитка одновременно» — это формально другая отдельная опция, а не сумма двух.
При неопределённости лектор отказывается анализировать кейс полного отсутствия вероятностей — даже если у вас «нет данных», вы достраиваете убеждения сами через приложение погоды.
В сложных решениях (выбор работы, доход через 15 лет) допущение «у агента есть точная вероятность» становится более натянутым, но всё равно принимается.
Индифферентность (равенство ожидаемых полезностей) — это патологический случай, в котором теория не делает предсказания, что выберет агент.
Различие между лотереей и исходом критично: агент выбирает не исход, а лотерею над исходами (даже если эта лотерея вырожденная).
Δ(Z) — стандартная нотация для симплекса вероятностей над множеством исходов Z.
В индивидуальной задаче неопределённость экзогенна (природа); в интерактивной — она становится эндогенной (другие игроки), что требует структуры на убеждениях.
При множестве в 4 исхода (идти/чай × солнце/дождь) выбор «идти» означает лотерею (p, 1-p, 0, 0) — два невозможных события получают нулевую вероятность.
Аксиоматика ожидаемой полезности (она вынесена в appendix лекций) — это отдельный кусок теории: какие условия на предпочтения эквивалентны их представлению через E[u].
Контрпример к максимизации денег: лотерея (10$ с p=0.99, 0 с p=0.01) с матожиданием 9.9 предпочитается лотерее (1000$ с p=0.01, 0 с p=0.99) с матожиданием 10 — потому что функция u(деньги) вогнута.
Дискуссия о риск-аверсии исторически восходит к XVIII веку (намёк на парадокс Санкт-Петербурга, хотя имя не звучит).
Лектор подчёркивает методологический шаг: сначала простой пример, потом абстрактная общая модель, потом всё более содержательные приложения.

Инсайты

Различие ординальной и кардинальной полезности — это не математический каприз, а отражение фундаментального методологического выбора: в детерминированном мире числа полезности не значат ничего, в стохастическом — становятся осмысленными через операцию усреднения.
Рациональность как консистентность — это деполитизация термина: убирается возможность называть чужие предпочтения «иррациональными», что переносит спор с уровня моральных суждений на уровень внутренней непротиворечивости.
Бесконечный регресс «я думаю о том, что они думают» структурно неразрешим без точки координации — игра «2/3 от среднего» иллюстрирует, что равновесные предсказания (все указывают 0) проваливаются на людях, и теория должна учитывать ограниченность рациональности.
Операциональная (revealed preference) трактовка предпочтений делает экономику измеримой ценой потери психологической глубины — это сознательная сделка дисциплины.
Введение лотерей как первичных объектов выбора (а не исходов) — концептуальный сдвиг: агент никогда не выбирает результат напрямую, только распределение над результатами.
Различие между функцией полезности на исходах (u: Z→R) и функцией ожидаемой полезности на лотереях (U: Δ(Z)→R) — типичная точка путаницы для студентов и одно из мест, где формализм спасает интуицию.
Эндогенизация неопределённости — это разделительная линия между индивидуальной теорией решений и теорией игр: как только источник неопределённости — другой агент, нужны равновесные концепции.
Тезис лектора, что ИИ делает допущения теории игр «более убедительными», — это перенос фокуса: классическая критика «люди не рациональны» теряет силу, если решения принимают алгоритмы, которые буквально оптимизируют функцию.
Риск-аверсия — не психологическая аномалия, а структурное свойство вогнутости полезности; объяснение, найденное XVIII веком, до сих пор работает как базовый строительный блок финансовой теории.
Методология «простой пример → абстрактная модель → богатые приложения» — это сама структура того, как мысль организуется в современной экономике, а не педагогический приём.

Цитаты

«die Spieltheorie die Untersuchung mathematischer Modelle von Konflikten und Kooperationen zwischen intelligenten ... rationalen Entscheidungsträgern ist» — 0:25 теория игр — это изучение математических моделей конфликтов и кооперации между интеллектуальными рациональными агентами

«Es handelt sich um interaktive Entscheidungstheorie» — 0:43 Речь идёт об интерактивной теории решений

«In our rationality model, we never say that the people of someone irrational are» — 12:03 В нашей модели рациональности мы никогда не говорим, что чьи-то предпочтения иррациональны

«If it is that, what they like, it is that» — 12:11 Если им это нравится — значит, нравится

«die Rationalitätsannahmen der Spieltheorie in einer Welt künstlicher Intelligenz nützlicher und zwingender werden» — 16:26 допущения о рациональности в теории игр в мире искусственного интеллекта становятся более полезными и убедительными

«This situation is often called as a strategic interdependence» — 14:23 Эту ситуацию часто называют стратегической взаимозависимостью

«the best action for a player is to do, what other people do» — 14:51 лучшее действие игрока зависит от того, что делают другие

«Wenn wir Lotterien bewerten, vergleichen wir nicht nur den erwarteten Geldbetrag der Lotterien. Wir vergleichen den erwarteten Nutzen zwischen den Lotterien» — 55:00 Когда мы оцениваем лотереи, мы сравниваем не ожидаемую сумму денег, а ожидаемую полезность

«die Nutzenfunktion ist nicht dasselbe wie Geld. Man maximiert nicht den erwarteten Geldbetrag. Man maximiert den erwarteten Nutzen» — 56:54 Функция полезности — это не то же самое, что деньги. Максимизируется не ожидаемая сумма денег, а ожидаемая полезность

«Ich bin ein optimistischer Mensch. Man könnte auch sagen, ich bin ein pessimistischer Mensch» — 30:00 Я оптимист. Можно сказать и: я пессимист

«Bei der Entscheidungsfindung unter Unsicherheit ist der Nutzen in diesem Kontext also Kardinal im Gegensatz zu Ordinal» — 33:19 При принятии решений в условиях неопределённости полезность кардинальна, а не ординальна

«Konzentrieren wir uns auf den Fall e, in dem p nicht 3 Fünftel ist» — 38:46 Сосредоточимся на случае, когда p не равно 3/5

«Sie haben recht, im Allgemeinen ist es wichtig, wenn wir ein Auswahlproblem modellieren, jede mögliche Entscheidung zu erfassen» — 24:45 Вы правы — когда мы моделируем задачу выбора, важно учесть каждое возможное решение

«Selbst durch Selbstbeobachtung bilden sie sich ihre Überzeugungen darüber, was die Natur tut, nicht darüber, was andere Spieler tun» — 51:30 Через интроспекцию агент формирует убеждения о том, что делает природа, а не о том, что делают другие игроки

«if u-concav is a, then that means that the people that are a, what we call Risikoavers nennen» — 55:24 если u вогнута, то это означает, что человек — то, что мы называем риск-аверсным

Факты

Определение Майерсона: теория игр — математические модели конфликта и кооперации между рациональными агентами. Оба процитированных автора (Майерсон и Ауман) — нобелевские лауреаты по экономике.
В игре «угадай 2/3 от среднего» в классе среднее первого раунда было 36, победитель назвал ~24 (формально 2/3 от 36).
Во втором раунде среднее упало до 21, победитель назвал 14.
Один студент назвал 26 во втором раунде с мотивацией «возможно ошибусь в ту же сторону, что и большинство».
Теоретическое равновесие в этой игре — 0 (или 1 при дискретных числах), эта точка достигается итеративным исключением доминируемых стратегий.
На MobLab (упомянутая лектором платформа) запускались интерактивные игры в реальном времени.
Игра «угадай 2/3 от среднего» иногда называется Keynesian beauty contest.
Аксиоматика ожидаемой полезности — фон Нейман и Моргенштерн; их аппарат вынесен в appendix лекционных заметок курса.
Курс будет применять теорию игр в основном в экономике, но также частично в политологии и политических переговорах.
Лектор называет вогнутость функции полезности математическим эквивалентом риск-аверсии.
Численный пример риск-аверсии: лотерея (10$ с p=0.99) предпочитается лотерее (1000$ с p=0.01), несмотря на меньшее матожидание.
Лектор отделяет случаи безразличия (p = 3/5 в приведённом примере), где теория не делает предсказания.
Лектор делает оговорку «true or false I don't know», что тезис об усилении рациональности с ИИ — это одна из точек зрения в дисциплине, а не консенсус.

Источники

Roger Myerson — нобелевский лауреат, источник первой цитируемой дефиниции теории игр.
Robert Aumann — нобелевский лауреат, автор определения «interactive decision theory».
John von Neumann & Oskar Morgenstern — функция полезности фон Неймана-Моргенштерна, аксиоматика ожидаемой полезности.
MobLab — платформа для интерактивных экспериментальных игр в классе.
Keynesian beauty contest — альтернативное название игры «2/3 от среднего» (отсылка к Кейнсу).
Appendix лекционных заметок курса — материалы по аксиоматике ожидаемой полезности.

Итог

Теория игр — это математика рационального выбора в условиях, когда твой выбор зависит от чужого, а чужой — от твоего; всё начинается с консистентности предпочтений и убеждений об неопределённости, а уже из этого строятся ожидаемая полезность, риск-аверсия и весь дальнейший аппарат.

readmint Pro

То, что вы только что прочитали — это саммари readmint

Оформите доступ — и получайте такой же разбор по любому своему видео. Вставляете ссылку, через 2–3 минуты готов пересказ с главными тезисами и цитатами. Без воды и без перемотки.

Безлимит саммари — сколько угодно видео
Главные тезисы и цитаты без воды
Приоритет в очереди обработки
Без рекламы и сторонних блоков

Получить такое же саммари

Доступ откроется сразу после оплаты — вставите ссылку и начнёте.

Или 4 900 ₽/год — доступ откроется сразу после оплаты.

Ещё с канала «MIT OpenCourseWare»

Все видео

Как говорить

Как говорить

Лек 01. Введение в глубокое обучение

Лек 01. Введение в глубокое обучение