3.4.1. Теория игр: способ динамического моделирования конкуренции
Теория игр[77] – это математическая теория стратегического поведения, анализирующая ситуации, в которых требуется принять решение. Проще говоря, она рассматривает интерактивные и, следовательно, взаимозависимые стратегии конкурирующих субъектов. Однако она также рассматривает и вопросы взаимодействия и коммуникации: чем больше вы знаете о вашем оппоненте, тем правильнее будете реагировать на его поведение. Задача теории игр – найти стратегию, с помощью которой можно добиться оптимального результата в той или иной ситуации. Стратегия необязательно должна быть детерминистской, она может работать и с вероятностями.
Сначала ученых заинтересовали игры с нулевой суммой, затем они переключили внимание на игры с ненулевой суммой и разработали теорию кооперативных и некооперативных игр. Джон фон Нейман заложил основу теории в 1928 г., когда доказал теорему о минимаксе[78]. В 1944 г. совместно с Оскаром Моргенштерном он опубликовал книгу «Теория игр и экономическое поведение», благодаря которой теория игр утвердилась как самостоятельная наука. В 1950 г. Джон Нэш разработал равновесие для игр двух игроков, которое в настоящее время известно под названием «равновесие Нэша». В 1994 г. он был удостоен Нобелевской премии по экономике[79].
Идею, лежащую в основе теории игр, необязательно понимать в чисто математическом смысле: ее основные характеристики можно передать в качественных терминах. Для начала важно сформулировать общее представление о стратегической игре:
• стратегические ситуации моделируются в игровой форме;
• правила игры предусматривают, кто, что и когда может делать;
• есть два или более игроков с принципиально конкурирующими интересами;
• стратегия игрока – это план действий, которые игрок выберет в той или иной ситуации;
• польза или потеря для игрока в результате той или иной ситуации называется выигрышем (или платежом);
• все игроки действуют рационально – они пытаются добиться максимальной пользы в любой ситуации;
• лучший ответ на конкретную стратегию противника тот, который максимизирует собственный выигрыш игрока.
Эти базовые понятия знакомы всем нам по домашним играм вроде «Блек-джека» или «Монополии». Но подобные игры обычно основаны на простой стратегической ситуации, в то время как игры, которые моделируются в экономическом или политическом контексте, намного сложнее.
В вышеупомянутых играх с нулевой суммой для двух игроков один из игроков выигрывает то, что проигрывает другой. Сотрудничество или несотрудничество исключены: с точки зрения структуры, это самая простая форма игры («орел или решка» и т. д.). Коммуникация может быть полностью исключена, поскольку главное для обоих игроков – это победа. В данном случае оптимальное решение в любой игровой ситуации – достичь равновесия: максимизировать минимальный достижимый выигрыш. В играх с ненулевой суммой игроки могут улучшить свое положение за счет сотрудничества, но они также могут сделать свою прибыль выше потери противника путем отказа от сотрудничества. На самом деле игры с ненулевой суммой, как правило, преобладают; их привлекательность – в некооперативном поведении. Для стабильного равновесия решающим фактором является доверие между игроками. Однако, по теории игр, игроки рациональны, а доверие, как правило, не будет рациональным решением – эта проблема станет яснее, когда мы перейдем к рассмотрению «дилеммы заключенного». Некооперативное поведение в играх с ненулевой суммой дифференцируется в агрессивные стратегии, направленные на получение незаслуженного преимущества, и слепые стратегии, следующие принципу случайности.
Существует также понятие доминантной стратегии: каждая возможная комбинация стратегий в игре просчитывается каждым игроком в отдельности, и каждый выбирает стратегию, которая обеспечивает наибольшую пользу с его личной точки зрения. Если игрок выбирает одну и ту же стратегию для каждой из возможных комбинаций, она становится его доминантной стратегией в игре: он всегда выбирает один и тот же вариант стратегии в каждой игровой ситуации. Иными словами, оптимальная стратегия с рациональной точки зрения игрока никогда не зависит от стратегии соперника. Избираемый вариант, который не всегда лучше, а, как правило, хуже, чем любая другая стратегия, известен как доминируемая стратегия – таких стратегий следует избегать. Часто игроки не имеют ни доминантных, ни доминируемых стратегий, и в этом случае лучший ответ или стратегия для игрока зависит от выбора противника (то же применимо и в обратном направлении, по отношению к противнику) – так что выбирается иной вариант в зависимости от конкретной ситуации. Равновесие Нэша обеспечивает решение в такой игре, когда возникает комбинация стратегий, в которых выбор каждого игрока является наилучшим ответом на (взятый как данность) выбор соперника – поэтому нет рационального стимула в одностороннем порядке изменить решение или стабильную ситуацию, так как ни один из игроков не извлечет из нее больше выгоды. Это равновесие известно как «принцип лучшего взаимного ответа» и тоже является решением, если оба игрока имеют доминантные стратегии.
В параллельных играх игроки принимают решения одновременно. Поэтому каждый должен оценивать ситуацию с точки зрения другого и пытаться предугадать результат игры. Такой сценарий описывается в матрице игры или решений, в которой противопоставлены варианты стратегии, открытые для игроков в различных ситуациях. В последовательных играх решения принимаются поочередно. Игрок, чья очередь ходить, должен обдумать, как его действие повлияет на действие оппонента. Для иллюстрации этого сценария используются деревья игры, или решений, и ходы изображаются в виде узлов, от которых в разные стороны отходят возможные варианты. На первый взгляд может показаться, что планировать стратегии для параллельной игры труднее. Но если вы когда-нибудь играли в шахматы, то знаете, что последовательная игра тоже невероятно сложна.
Все игры подразделяются на статические либо динамические. Статические игры имеют место единожды, и их можно повторить при прочих равных условиях (например, «орел или решка»). Динамические игры предполагают многочисленные ходы и явно зависят от изменения обстановки и/или от уроков, извлеченных из предыдущих ходов, – поэтому они проходят через несколько хронологических уровней принятия решений. Они могут быть параллельными, последовательными или даже гибридными, то есть параллельно-последовательными.
Чистые стратегии в играх – это однозначные решения за или против возможного хода или серии ходов. Смешанные стратегии оценивают вероятность (в зависимости от индивидуальных предпочтений риска) для каждого возможного варианта стратегии или хода. В игре с полной информацией игроки знают все стратегии и возможные комбинации, а также все возможные выигрыши (платежи) в игре. Эту информацию также называют техническим аспектом игры. Как только она утрачивает актуальность для всех игроков, возникает состояние неполной информации. В реальной экономике компании обычно не имеют полной информации – разве что в плановой.
Если игрок не знает о стратегическом выборе другого игрока, то это игра с несовершенной информацией. Так всегда бывает с параллельными играми. Если, однако, каждый игрок в любое время знает о том, какой стратегический выбор сделали противники, игра обретает состояние совершенной информации – это относится к играм, ходы в которых исключительно последовательны[80].
«Дилемма заключенного» – пример одновременной игры с ненулевой суммой, отлично иллюстрирующей проблему фундаментальных допущений в теории игр[81]: двое заключенных, А и В, подозреваются в совершении преступления. Максимальный срок тюремного заключения составляет восемь лет. Судья делает каждому из них следующее предложение: «Если ты свалишь вину на второго парня, выйдешь на свободу, а он получит полный срок. Если вы оба откажетесь говорить, у нас есть достаточно доказательств, чтобы посадить каждого из вас на три года. Если вы оба признаетесь, будете приговорены к пяти годам каждый». Заключенные не могут общаться друг с другом, поэтому у каждого из них есть два варианта: сотрудничать со вторым, то есть молчать, или сдать его, то есть признаться. В результате возникают четыре возможные стратегические комбинации, которые, как правило, изображаются в виде платежной матрицы (или матрицы выигрышей) (табл. 5). В этом случае выигрыш, или минус несколько лет тюрьмы, отрицательный, так как тюремное заключение не обладает положительной полезностью. Первая цифра в скобках – это выигрыш заключенного А, а вторая цифра – выигрыш В.
Согласно допущениям теории игр, при принятии решений используется рациональное поведение: каждый игрок хочет максимизировать то, что он лично считает полезным. С позиции А (и с позиции B) в этой ситуации есть два варианта: сотрудничество с другим игроком или предательство. В обоих случаях заключенному выгоднее предать подельника, то есть признаться: нулевой результат лучше, чем –3, а выигрыш в размере –5 лучше, чем –8. Говоря другими словами, свобода лучше, чем три года в тюрьме, а пять лет в тюрьме лучше, чем восемь. Поскольку у обоих игроков одинаковая доминантная стратегия, здесь существует так называемое равновесие доминантных стратегий. Тем не менее в этом случае рациональное поведение приводит к неоптимальному результату, так как оба заключенных признаются и получают по пять лет. Сотрудничество и молчание было бы лучше для обоих, так как им грозил бы только трехлетний срок.
Предположение теории игр о рациональности и связанной с ней максимизацией индивидуальной пользы в общих чертах применимо и в бизнесе. «Дилемма заключенного» доказывает, что компании на рынке должны сотрудничать, чтобы улучшить свое положение «в общем зачете». Например, вместо агрессивных рекламных кампаний для уже известных продуктов имеет смысл сэкономить деньги и сохранить существующую долю рынка.
Тем не менее проблема – и об этом свидетельствует дилемма заключенного – заключается в том, что у каждого игрока всегда есть стимул предать. Если один молчит, другой признается и уходит безнаказанным. Или, если первый обходится без рекламной кампании, другой может быстро получить долю на рынке, запустив такую кампанию. Поэтому совместные решения могут существовать только в том случае, если есть подходящие механизмы санкций.
На основе теории игр было разработано множество стандартных математических стратегий, которые конкурируют друг с другом в компьютерных играх в виде алгоритмов. Самая известная из них – стратегия «око за око». Это стратегия сотрудничества с самого первого хода, когда каждый делает точно такой же ход, какой только что сделал противник. Такая стратегия носит принципиально дружественный характер, хотя может быстро перейти в постоянный отказ от сотрудничества. Вот почему опасно использовать эту стратегию в ситуациях, в которых высока вероятность недопонимания (например, на международном уровне, когда на принятие решений влияют большие расстояния, различия в языках и культуре). Согласно принципам отраслевой экономики, стандартные математические стратегии формулируются в терминах рыночного поведения: есть, например, абсолютные стратегии, когда игрок сигнализирует противнику о приверженности своему выбору, «сжигая мосты»[82]. Такой стратегией может быть вхождение на рынок, связанное с наращиванием существенных фиксированных заводских/производственных мощностей и соответствующих безвозвратных издержек. И есть стратегии, которые угрожают санкциями или обещают вознаграждение в случае сотрудничества. Такие санкции и системы стимулирования, как правило, оговариваются в контрактах.