Равновесие Нэша
В последнее время я часто думаю о равновесии Нэша. Джон Нэш – выдающийся математик, единственный в мире человек, удостоившийся и Нобелевской и Абелевской премии – это такой аналог Нобеля для математиков, для которых, как известно, отдельной Нобелевской премии нет. Далёкие от математики люди могут знать Нэша по фильму «Игры разума».
Равновесие Нэша – одно из ключевых понятий теории игр. Так называется набор стратегий в игре для двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив свою стратегию, если другие участники своих стратегий не меняют. Нэш доказал, что подобные равновесия существуют для всех конечных игр – то есть игр, в которых у игроков ограниченное количество возможных ходов – с любым числом игроков.
Кажется, что это какая-то абстрактная математическая концепция, но на самом деле это не так. Равновесие Нэша определяет исходы множества ситуаций от экономики до политики. Простыми словами его можно переформулировать так: в любых сложных отношениях, – а такие отношения всегда можно представить как математическую игру, – оптимальное состояние*, когда все участники получают выигрыш, зачастую отличается от устойчивого состояния. А вот равновесие Нэша как раз устойчиво – это цугцванг, когда ни один игрок не может улучшить свое положение, если другие игроки не поменяют своих текущих стратегий. А другим игрокам изменять свои текущие стратегии совершенно незачем, потому что это приводит к ухудшению их положения.
В политике равновесие Нэша приводит к тому, что никто из политических акторов в демократических странах с многопартийной системой не предлагает и не продвигает реальных изменений, потому что они ухудшат их позиции. Особенно это касается непопулярных решений – например, сокращения льгот для массовых и политически активных групп граждан. Партия, которая предложит такое решение, рискует потерять поддержку на выборах.
В результате ни одна из крупных партий не предлагает реформу, даже если понимает, что она необходима – потому что при неизменной стратегии конкурента это приведёт к проигрышу. Возникает классическое равновесие Нэша: все участники остаются при своих, потому что любая попытка изменить поведение в одиночку делает ситуацию хуже для инициатора. Результат – нужные обществу реформы не проводятся, проблема усугубляется. Если же кто-то из мейджеров все-таки решается на реформу – на следующих выборах он, с высокой вероятностью, потеряет голоса.
В научном сообществе равновесие Нэша приводит к тому, что ученые продолжают публиковаться ради публикаций, прибегая при этом к разным хитростям, чтобы выпустить побольше статей – от прямых фальсификаций до разбивки исследования на мелкие кусочки, каждый из которых публикуется как отдельная статья. Всем очевидно, что система, когда именно и только публикации являются главным мерилом успеха, порочна и приводит к выхолащиванию смысла, и многие бы хотели ее поменять. Но если отдельный ученый перестанет гнаться за количеством публикаций и будет стараться выпускать только очень хорошие работы, он неизбежно проиграет гонку за гранты и академические должности. Поэтому всё научное сообщество продолжает играть по очевидно вредным правилам, что пагубно сказывается как на науке в целом, так и на благополучии отдельных ученых.
В обществе люди перестают ходить на выборы, потому что считают, что их голос ничего не меняет. В итоге побеждают партии, которые смогли пригнать больше сторонников – а это обычно самые горластые популистские партии или партии, фальсифицирующие результаты.
В авторитарных обществах каждый отдельный член общества не высказывается против происходящего, потому что для него это с очень высокой вероятностью означает ухудшение положения. При этом, если все остальные тоже не начнут высказываться, система в целом не поменяется. А абсолютное большинство всех высказываться не будут – по той же причине, что и первый описанный нами человек.
Вы наверняка слышали про все эти порочные закономерности. Дилемма заключенного, трагедия общин и так далее описаны примерно тогда же, когда Нэш работал над названным в честь него равновесием. Заслуга Нэша заключается в том, что он показал, что для любой конечной игры равновесие Нэша существует. Оно устойчиво, и именно поэтому сложные системы так любят сваливаться в него. Более того, нередко у системы есть более одного равновесия Нэша – но нет никаких гарантий, что хотя бы одно из них соответствует оптимальному состоянию.
На самом деле, из равновесия Нэша есть выходы, но все они так или иначе связаны с изменением исходных параметров игры. Например, участники могут предварительно договориться и совместно принять более выгодное обществу решение. Скажем, политики всех основных стран встречаются и честно обсуждают проблему изменения климата, после чего принимают кооперативное решение, которое в моменте может быть менее выгодно каждой из участвующих стран, но глобально позволит всему человечеству не допустить кризиса. Очевидное слабое место такого решения – читинг и/или неспособность стран найти аргументы или предложить бонусы для кого-то из важных игроков, чтобы он поменял стратегию.
Еще один вариант выхода – изменение системы вознаграждений и издержек так, чтобы кооперативное поведение стало выгодным. Например, когда все магазины стали предлагать пластиковые пакеты исключительно за деньги, людям стало выгоднее брать с собой многоразовые сумки. Количество солнечных панелей и энергосберегающих технологий в частных домохозяйствах резко выросло в тех странах, где за их установку государство компенсировало часть затрат. А количество людей, пристегивающихся в машинах, многократно увеличилось после введения высоких и неизбежных штрафов за отсутствие ремня.
Следующий способ преодолеть равновесие Нэша – повторение игры. Когда акторы взаимодействуют друг с другом неоднократно, репутационные издержки перевешивают сиюминутную выгоду. Например, мастера на онлайн-платформах могут халтурить, но при наличии системы отзывов это становится невыгодным. Впрочем, модель хищник-жертва никто не отменял, и сегодня мы видим, что система отзывов давным-давно сама стала предметом фальсификаций, когда те, кто предлагают услуги, покупают отзывы или накручивают их при помощи ботов. Ну и, очевидно, повторение игры возможно далеко не для всех типов взаимодействий.
Четвертый способ выхода из равновесия Нэша – изменение доступной игрокам информации. Когда большинство считают некое поведение нормой, они сами действуют так же, потому что менять поведение означает пойти против норм общества, а мы этого очень не любим. Люди – социальные существа, и риск подвернуться остракизму для нас крайне болезнен. Но если люди уверятся, что некое поведение – это новая норма или как минимум встречается намного чаще, чем им кажется, они с большей охотой изменят собственное поведение – опять же, потому что захотят быть как все и не захотят быть отвергнутыми из-за «старомодных» воззрений.
Ещё один способ преодолеть равновесие Нэша весьма эффективен, но, очевидно, не понравится большинству читателей. Этот способ – добавление игрока, который влияет на исходы, например, через санкции, субсидии или изменение доступных стратегий. В случае общественных и политических игр это, например, означает появление авторитарных государств.
Правительствам в таких государствах наплевать на мнение избирателей, поэтому они могут проталкивать непопулярные решения, которые они по тем или иным причинам считают важными протолкнуть. И нередко это позволяет таким государствам быть более эффективным в международной политике, так как они могут принимать более радикальные решения и делать это быстрее стран, главы которых вынуждены учитывать мнение избирателей. Можно привести и менее экстремальные примеры такого варианта выхода – скажем, когда государство вводит штраф за выброс несортированного мусора, и тогда даже те, кто считает все климатические инициативы ерундой, начинают его сортировать.
К чему я всё это написала? А вот к чему. Когда мы рассуждаем о чём бы то ни было: о политике, о социальных изменениях, о религии, неважно, мы обычно используем аргументацию либо к рацио, либо к эмоциональным соображениям. Это всё верно, и то, и другое важно для принятия решений. Но также важно не забывать, что решения отдельных людей в конце концов складываются в системы, которые описываются как математические игры. И эти игры управляются по вполне чётким математическим правилам. Равновесие Нэша – ключевая концепция, лежащая в основе всей современной теории игр. И важно всегда смотреть, а какое оно (или они) для данной конкретной игры.
Например, если у вас есть несколько конфликтующих акторов, обладающих каким-то радикальным преимуществом по сравнению с другими (это называется некооперативными играми с асимметрией сил), то никакие действия игроков, у которых такого преимущества нет, скорее всего, не смогут изменить равновесие в игре, только ухудшить положение самих изменяющих. Чтобы система вышла из неоптимального состояния, изменить свои действия должны эти самые главные игроки. А у них такого стимула нет, потому что именно они обладают радикальным преимуществом и не хотят терять его. Теоретически, слабые игроки могут объединиться и, например, выработать какие-то новые правила игры – но, опять же, если они не найдут рычага, который сделает текущую стратегию сильных игроков невыгодной, ничего не изменится.
Как мы обсудили выше, выход из неэффективного равновесия Нэша возможен, если изменить параметры игры так, чтобы рациональный выбор в новых условиях приводил бы к кооперативной стратегии. Но для этого необходим выход за рамки существующей игры. Никакие комбинации действий игроков, не приводящие к такому выходу, особенно если эти игроки не обладают тем самым радикальным преимуществом, не приведут к изменению ситуации. Как мне кажется, если держать это в голове, то оценка очень многих происходящих сейчас как в мире, так и внутри отдельных стран событий выглядит совсем иначе, и уже не так хочется осуждать кого-то или, наоборот, приветствовать чьи-то действия.
* – если говорить совсем строго, здесь подразумевается Парето-оптимум либо социальный максимум. Парето-оптимум – это такое состояние, при котором все ресурсы распределены так, что невозможно улучшить положение какого-то участника, не ухудшив положение кого-то другого. Под социальным максимумом ученые подразумевают состояние, при котором суммарный выигрыш всех участников максимален. То есть мы смотрим не на то, как именно распределены выгоды, а просто складываем их между всеми – и выбираем тот вариант, где общая сумма оказывается наибольшей, даже если кто-то выигрывает сильнее других.
В этом смысле и Парето-оптимум и социальный максимум отличаются от некоего идеалистического равновесия, которое иногда подразумевают борцы за всё хорошее против всего плохого. Такого идеалистического оптимума, когда хорошо всем одновременно, в математике не существует. Его просто невозможно было бы описать, так как интересы участников очень часто конфликтуют, и разрешить эти конфликты порой не представляется возможным – ну скажем, когда одна группа настолько не любит другую, что не представляет себе совместного существования с ней ни в каком варианте.

