Социальная наука будущего может быть настолько же онтологически удивительной, как физика 20-го века
Дон Росс
Глава 1. Принудительная сила институтов в социальной онтологии
Социальные институты — деньги, право, собственность, брак — представляют собой не просто описания наших взаимодействий, но активные силы, формирующие социальную реальность. Их отличительная черта — способность не только направлять, но и ограничивать репертуар действий, создавая устойчивые, самовоспроизводящиеся паттерны поведения. Этот феномен — принудительная сила институтов — и составляет центральную проблему настоящего исследования. Вопрос «что такое социальный институт?» в данном контексте сводится к более конкретному и одновременно фундаментальному: каков источник и механизм силы, которая позволяет институтам предписывать поведение и воспроизводиться даже вопреки интересам отдельных индивидов?
Поиск ответа на вопрос о природе института сталкивается с радикальным расхождением в существующих теоретических подходах. Одни теории, уходящие корнями в философию действия, выводят принудительность из сферы ментального: из коллективных убеждений, интенций и разделяемых правил (Gilbert, 1992; J. Searle, 1995). Другие, развиваемые в рамках экономики и теории рационального выбора, видят её источник в структуре материальных стимулов и стратегических равновесий, возникающих из взаимодействий рационально-эгоистичных агентов (Lewis, 2008; greif2006?). Этот конфликт интерпретаций указывает на более глубокую методологическую проблему — каким способом вообще стоит искать онтологическое основание социальных феноменов?
Философ науки Дон Росс предлагает различать аналитическую и научную социальную онтологию, где основной метод первой — концептуальный анализ, а второй — эмпирические исследования и вывод к наилучшему объяснению (inference to the best explanation, далее IBE)1 (Ross, 2023). Для Росса «натуралистическая метафизика», как он её называет, не применяет концепции, которые не встречаются в теориях, моделях или объяснениях «науки первого порядка».
Аналитическая социальная онтология, исходя из априорного теоретизирования, стремится выявить необходимые и достаточные условия социальных феноменов через логический разбор и интуитивную проверку ключевых понятий — «правило», «интенциональность», «функция» и т.д. Такая онтология утверждает, что она логически предшествует методологии социальных наук (Epstein, 2016; Lauer, 2019; J. Searle, 1995). Иначе говоря, невозможно изучать социальное, не определив заранее его ключевые характеристики, или видовые свойства.
Классическим примером служит проект Джона Сёрла, который через формулу «X считается Y в контексте C» пытается эксплицировать конститутивные правила, лежащие в основе институциональной реальности (J. Searle, 1995). В этой парадигме принудительная сила института логически выводится из факта коллективного принятия определённых статусных функций. Аналитический подход, таким образом, начинает с концептуальных допущений о природе социального и пытается вывести из них структуру реальности. К тому же, этот подход предполагет человеческую уникальность и антропоцентризм: отсутствие ментальных конструктов и разделяемых целей не позволяет животным иметь институты, хотя мы видим протонормативное поведение (кооперативные альянсы с санкциями за нарушение, восприятие справедливости) в животных видах — от ворон (Wascher & Bugnyar, 2013) до шимпанзе (Rudolf von Rohr, Burkart, & van Schaik, 2011).
Научная (натуралистическая) социальная онтология, напротив, использует метод вывода к наилучшему объяснению. Её исходная точка — не интуиция или анализ понятий, а успешные, зрелые научные теории, демонстрирующие предсказательную и объяснительную силу. Онтологические заключения в этом случае не предшествуют научному исследованию, а являются его результатом: мы вправе считать реальным то, что постулируется теориями, наилучшим образом объясняющими наблюдаемые явления (Psillos, 1999). В контексте социальных наук это означает, что онтология институтов должна быть выведена из тех моделей, которые наиболее адекватно описывают их устойчивость, влияние на поведение и, что наиболее важно для нас, принудительную силу.
Важным следствием принятия метода IBE является вопрос о природе социальных категорий. Если мы выводим онтологию из успешных теорий, то должны спросить: на какие единицы ссылаются эти теории? Традиционная философия науки связывает надёжный индуктивный вывод и успех объяснения с существованием естественных видов — категорий, которые обладают внутренней, гомеостатической структурой свойств, позволяющей делать индуктивный вывод (Boyd, 1991; mill1843?). Применение IBE к социальному миру ставит проблему в более чёткой форме: можно ли рассматривать социальные институты как естественные виды, поддерживающие индуктивный вывод?
Критика аналитического подхода со стороны натурализма (Kincaid, 2021; Ross, 2023; churchland2019?) сосредоточена на риске концептуального круга. Анализируя понятия об институтах, мы рискуем вскрыть не устройство социального мира, а структуру наших собственных, исторически и культурно обусловленных, представлений о нём. Как отмечает Патрисия Чёрчленд, концептуальный анализ часто выдаёт камуфлированные теории, которые ошибочно принимают черты наших текущих убеждений за черты мира (churchland2019?). В результате аналитическая социальная онтология, несмотря на свою концептуальную изощрённость, вполне может оказаться оторванной от реальных механизмов, изучаемых эмпирической социальной наукой (Sarkia & Kaidesoja, 2023).
Физика ярко иллюстрирует разницу между научной и аналитической онтологией (Ross, 2023). Онтология, которую описывает физическая теория, формулируется с помощью математического аппарата. Её формулировка аналитическим способом — например, в терминах семантики возможных миров — была бы контринтуитивной и сложной. Онтология, описываемая физикой, обусловлена (и ограничена) её матетматическим языком настолько удачно, что другие формулировки этой онтологии за пределами понятий и методов самой физики просто не нужны.
Социальные науки и социальная онтология не обладают такой прямолинейностью математических формулировок своих концепций, как физика2. Вместо этого они используют «народные» концепции (folk concepts) вроде «убеждений», «групп» и «социальных фактов».
Некоторые философы утверждают, что «народных» онтологий достаточно (Ruben, 1989; thomassen2003?), а другие выдвигают на первый план взаимодействие «народных» и научных онтологий (Guala, 2016a; S. Haslanger, 2018; asta2012?)3. Неоднозначность между «народной» и научной социальной онтологией может зависеть от математического аппарата и его недостаточно развитого характера в социальных науках (который связан скорее с отсутствием теоретического консенсуса внутри социальной науки, а не с нехваткой математических инструментов). Росс также отмечает, что построение социальной онтологии, возможно, потребует её формулировки с помощью математических моделей, чувствительных к структурному моделированию (таких как иерархический байесовский вывод4), а не теории множеств, которую стандартно используют как инструмент для исследования метафизических проблем вроде композиции, онтологической зависимости и отношении части/целого (Fine, 1995; Ross, 2023).
В данной работе мы принимаем установки натуралистической социальной онтологии и метод IBE в качестве основополагающих. Наш выбор обусловлен природой исследуемой проблемы. Если мы хотим объяснить реальный, действующий в мире механизм институционального принуждения, а не реконструировать наше концептуальное понимание последнего, то отправной точкой должны стать не априорные конструкции, а наиболее эффективные из существующих объяснительных моделей, предлагаемых наукой.
Этот выбор означает отказ от тезиса об уникальности и сложности социальной онтологии. Согласно этому тезису, социальная реальность, во-первых, «интерактивна» (зависит от убеждений о ней самих участников и потому изменчива) (Hacking, 1999), а во-вторых, по своей сути нормативна, что делает её недоступной для дескриптивного, естественнонаучного подхода (Ásta, 2024; S. A. Haslanger, 2012).
Здесь становится важным различение интерактивных и нейтральных видов (interactive / indifferent kinds) (Hacking, 1999). Критики натурализма утверждают, что социальные сущности по определению принадлежат к интерактивным видам: наши классификации меняют их, подрывая стабильность, необходимую для индукции и трактовки в качестве естественных видов (Hacking, 1999; Sveinsdóttir, 2013).
Мы оспариваем это утверждение. Хотя социальные институты действительно могут быть чувствительными к убеждениям, это не отменяет возможности существования их как устойчивых структурных паттернов, возникающих из материальных ограничений и сетевых эффектов. Эти паттерны могут обладать достаточной регулярностью, чтобы служить основой для научного обобщения и, следовательно, для IBE.
Задача, таким образом, состоит в том, чтобы найти и описать параметры такой структурной устойчивости, которые и могли бы претендовать на роль «видовых свойств» института в натуралистическом смысле.
В качестве рабочей гипотезы мы принимаем, что таким ключевым видовым свойством является принудительная сила, понимаемая не как «мистическая нормативность» или деонтология, а как поддающийся моделированию механизм поддержания социальной координации.
Помимо этого, интерактивность (или рефлексивность) и нормативность — это не метафизические барьеры, а эмпирические свойства социальных систем, которые должны стать не предпосылкой, а объяснительной целью адекватной социальной онтологии.
Таким образом, наша методологическая позиция заключается в том, что онтология института, и в частности его принудительной силы, должна быть выведена индуктивно из корпуса социальных теорий, которые демонстрируют наибольшую объяснительную силу в отношении наблюдаемых социальных феноменов — стабильности социального порядка. Метод заключается в том, чтобы взять объяснительно успешные теории и сделать вывод о существовании тех сущностей, которые лучше всего объясняют явление. Теория эволюции методом естественного отбора Чарльза Дарвина — пример подобного вывода: есть виды как морфогенетические кластеры, есть процесс (или алгоритм), влияющий на изменение видов. Теория объясняет наблюдаемые феномены (разнообразие видов) лучше альтернативных объяснений (Samir Okasha, 2002, p. 9).
Мы проводим критический анализ основных исследовательских программ, которые претендуют на роль объяснения стабильности институтов и являются кандидатами для вывода онтологии института. Каждая из этих программ имплицитно или эксплицитно предлагает свой ответ на вопрос о «видовых свойствах» института и его онтологическом статусе — является ли он естественным видом:
Институт как равновесие (Раздел 1.1). И хотя истоки этой традиции, идущаей от Дэвида Льюиса, не связаны с институтами per se, её представители в философии, теории игр и новой институциональной экономики отождествляет институт с устойчивым равновесием в стратегическом взаимодействии рациональных агентов. Принудительная сила здесь — сила самоисполняющегося ожидания: индивиду невыгодно отклоняться от установившейся практики, если все остальные её придерживаются. Кандидат на «наилучшее объяснение» — структура стимулов как объективных ограничений.
Институт как система правил (Раздел 1.2). Эта традиция делится на два русла. Конститутивное правило видит в институте систему статусных функций, создаваемых и поддерживаемых коллективным согласием И хотя это эталонные пример аналитической онтологии, у неё есть натуралистическая интенция, которую стоит рассмотреть всерьёз. Регулятивное правило рассматривает институты как формальные и неформальные ограничения, структурирующие взаимодействие. В обоих случаях принудительная сила выводится из нормативной или когнитивной силы правил. Кандидат на «наилучшее объяснение»: власть правила или коллективной интенциональности.
Институт как синтез: «правила-в-равновесии» (Раздел 1.3). Теория Франческо Гуалы и Фрэнка Хиндрикса представляет собой наиболее влиятельную попытку синтеза двух предыдущих подходов (Guala, 2016a; Frank Hindriks & Guala, 2015). Институт здесь понимается как равновесие, стабилизированное экзогенным правилом. Правило координирует ожидания, а равновесие обеспечивает устойчивость. Кандидат на «наилучшее объяснение»: единство нормативной координации и стратегической устойчивости.
Каждая из этих программ предлагает мощный концептуальный аппарат и претендует на то, чтобы схватить суть институциональной реальности. Наша задача — подвергнуть их имманентной критике, оценивая с точки зрения их способности выполнить роль «наилучшего объяснения» в рамках методологии IBE, фокусируясь на ключевом для нас атрибуте — принудительной силе.
Наш выбор в пользу теоретико-игрового и экономического подходов в качестве основного материала для построения онтологии также требует пояснения. Мы отдаём себе отчёт, что социология предлагает несравненно более богатый и детализированный эмпирический портрет социального мира. Однако задача настоящего исследования — не эмпирическое описание, а поиск минимальных онтологических оснований принудительной силы социального. Такую задачу эффективнее решать, двигаясь не «сверху вниз» — от сложных социологических понятий вроде «габитуса», «поля» или «системы, чья онтологическая нагрузка проблематична сама по себе, — а «снизу вверх», от моделей элементарного парного стратегического взаимодействия. Теория игр и институциональная экономика предоставляют наиболее разработанный концептуальный и формальный аппарат для подобного восхождения.
Важно, что мы рассматриваем этот аппарат не как «истину» об обществе, а как эвристический инструмент. Иначе говоря, в данной работе мы не строим социальную метафизику — полную картину социального мира. Вместо этого мы предлагает унифицирующую онтологическую рамку, подходящую для объяснения и методологической поддержки эмпирических исследований социальных институтов в разных социальных дисциплинах. Наша цель — не усилить «экономический империализм» (Mäki, 2009), а использовать мощный инструментарий для прояснения фундаментальной онтологической проблемы. Выводы, полученные с помощью такого эвристического инструмента, в дальнейшем могут быть проверены на возможность интерпретативного расширения на более сложные, нередуцируемо культурные и исторические феномены, изучаемые социологией. Однако первый шаг — построение общей параметрической модели — необходим для придания любым дальнейшим расширениям чёткого онтологического каркаса.
Исходя из изложенного, задача настоящей главы заключается в систематической оценке трёх основных исследовательских программ онтологии социальных институтов, чтобы показать, что ни одна из них не даёт удовлетворительного объяснения принудительной силы институтов, если следовать принципам IBE.
Мы начнём с наиболее формализованного и строгого кандидата — института как равновесия (1.1). Анализ покажет, что, хотя теория игр блестяще объясняет устойчивость, она сталкивается с фундаментальными трудностями при объяснении нормативной силы и нормативного принуждения, сводя их к расчёту издержек.
Затем обратимся к институту как системе правил (1.2). Критика здесь будет двоякой: конститутивные теории (Сёрл и последователи) оказываются «замкнуты» в коллективных представлениях и не объясняют источник принуждения, в то время как регулятивные теории (Норт, Остром) не вполне объясняют мотивацию следованию правилу.
Наконец, мы проанализируем синтетическую модель «правил-в-равновесии» Франческо Гуалы (1.3). Несмотря на её элегантность и объяснительные успехи, мы выявим её глубинную напряжённость: соотношение правил и равновесий и наличие готовой конвенции как условие стабильности института (что подменяет объясняемое готовым объяснением).
Общим итогом главы станет демонстрация того, что существующие подходы, взятые по отдельности или в синтезе, оставляют проблему принудительной силы социального института нерешённой. Этот теоретический тупик создаёт необходимость для разработки новой модели, которая сможет интегрировать сильные стороны рассмотренных программ, преодолев их ограничения. Построению такой модели и будут посвящены последующие главы данного исследования.
Мы начинаем наш анализ с самого фундаментального уровня — с концепции института как равновесия стратегического взаимодействия.
1.1 Институт как равновесие
Ниже мы кратко представим интеллектуальные истоки теоретико-игрового подхода к социальной координации, исходящие от Дэвида Юма и Томаса Гоббса, затем рассмотрим важные для нашей работы понятия теории игр, — игра, выплата, равновесие и несколько их разновидностей — а после представим аналитическую реконструкцию традиции как эндогенизации ограничения, в рамках которого происходит стратегический выбор. Подобная эндогенизация означает, что принуждение «встроено» в структуру стратегического взаимодействия.
Начать стоит с того, что традиция понимания социальной координации как источника социального порядка имеет богатую историю. Аристотель обосновывал социальные конвенции человеческой природой и стремлением к эвдемонии, или процветанию. Он рассматривал людей как «политических животных», которые естественным образом формируют сообщества для достижения коллективного благополучия. Справедливость и добродетель, центральные элементы его этики, считались основой политического порядка. В отличие от более поздних последователей теории общественного договора, Аристотель рассматривал социальную организацию как неотъемлемую часть человеческой рациональности, а не как преднамеренное соглашение (aristotle1998?).
Томас Гоббс переосмыслил социальные конвенции как конструкции, порождаемые насильственным «естественным состоянием» человечества. Он утверждал, что самосохранение побуждает индивидов отказываться от свобод в пользу суверена посредством общественного договора, являющегося результатом явного соглашения и обдумывания (deliberation) (Hobbes, 2016). Таким образом, у Гоббса конвенции возникают из страха и рационального эгоизма, а не из врождённой общительности.
Согласно философу науки Брайану Эпштейну (Epstein, 2018), понятие конвенции впервые было явно использовано в качестве альтернативы понятию соглашения Пуфендорфом (Pufendorf, 1673) для обозначения языка и права. Пуфендорф синтезировал идеи Гоббса с теологическим естественным правом. Соглашаясь с тем, что люди преследуют собственные интересы, он приписывал «закон социальности» божественному предписанию, требующему мирного сосуществования. Для Пуфендорфа естественное право обязывает людей создавать гражданские общества, а Бог является конечным автором социальных конвенций. Тем самым было введено моральное измерение, отсутствующее в инструменталистской системе Гоббса, предполагающее, что конвенции не только утилитарны, но и морально оправданы. Точка зрения Пуфендорфа заключалась в том, что конвенции не обязательно должны быть явно согласованы и могут существовать и функционировать без их преднамеренного создания. Эта интуиция в значительной степени сохранилась в последующей традиции.
Теория социальных конвенций Дэвида Юма (Hume, 1998, 2003) предложила новаторский подход к объяснению того, как конвенции возникают органически в результате взаимодействия, а не в результате рационального замысла или божественного предписания. Анализ Юма основывается на трёх ключевых предпосылках:
- роль обычаев в формировании поведения;
- центральная роль взаимной выгоды;
- искусственность конвенций.
Конвенции рассматриваются как продукты коллективной привычки, а не явного словесного соглашения. Эти компоненты составляют основу его теории, которая связывает психологию, этику и политическую философию.
Концепция Юма предполагает, что человеческое понимание возникает из чувственных впечатлений и идей, вытекающих из них. Это распространяется и на социальное поведение: конвенции возникают не из разума, а из повторяющегося опыта, формирующего привычки. Например, известный пример Юма с двумя гребцами в лодке иллюстрирует, как синхронизация возникает методом проб и ошибок, а не в результате предварительных переговоров:
«Двое мужчин, гребущих веслами в лодке, делают это по соглашению или договоренности, хотя никогда не давали друг другу обещаний» (Hume, 2003).
Однако некоторые современные исследователи утверждают, что подобная координация не является «юмовскими конвенциями», поскольку они, по мнению самого Юма 5, требуют наличия положительной социальной экстерналии, тогда как два преступника могут эффективно покинуть место преступления (Schliesser, 2024). В настоящей работе мы не будем сосредотачиваться на этом морально обусловленном понятии конвенций.
Со временем повторяющиеся поведенческие паттерны закрепляются в конвенциях, поскольку решают практические проблемы, такие как координация труда и установление прав собственности, минимизируя при этом социальные трения. Обычай, как пишет Юм, «делает наш опыт полезным для нас», создавая стабильные ожидания относительно поведения других, даже в отсутствие формальных правил (Hume, 2003). Акцент на привычке бросает вызов рационалистическим теориям вроде Гоббса, показывая, как конвенции возникают, не требуя рациональности, посредством итеративных корректировок.
Юм выделяет четыре ключевые особенности конвенций:
- взаимная выгода: все стороны получают выгоду от соблюдения конвенции (например, синхронная гребля обеспечивает продвижение; стандартизированная валюта облегчает торговлю);
- множество потенциальных решений: теоретически могут работать разные решения (например, грести быстро или медленно), однако последовательность важнее конкретного выбора;
- незапланированное соглашение: конвенции развиваются спонтанно посредством «медленного прогресса» проб и ошибок, а не в результате преднамеренного договора;
- взаимность: соблюдение конвенции зависит от ожидания взаимности со стороны других, создавая самоподдерживающийся цикл доверия.
Для Юма конвенции вроде прав собственности, возникают потому, что люди признают «общий интерес» в стабилизации владения имуществом во избежание конфликтов, даже если их естественные склонности тяготеют к личной выгоде (Hume, 1998). Этот прагматический подход отличает его теорию от моралистических рассуждений, рассматривающих конвенции исключительно как инструменты сдерживания оппортунизма.
Важно отметить, что подход Юма объединил описательную и нормативную области. Показав, как конвенции развиваются от практических потребностей к моральным нормам, он предложил достаточно натуралистическое объяснение социального порядка, избегающее апелляций к божественному закону или метафизической необходимости. Это согласуется с его неприятием причинно-следственной связи как чего-либо, выходящего за рамки наблюдаемой закономерности, и подкрепляет его точку зрения о том, что человеческие институты являются случайными продуктами обычаев, а не вечными истинами.
После Юма философы шотландского Просвещения утверждали, что социальный порядок является результатом взаимодействия отдельных людей, однако такой порядок не был специально задуман ими. Как писал Фергюсон (Ferguson, 1980), «нации натыкаются на установления, которые, действительно, являются результатом человеческой деятельности, но не воплощением какого-либо человеческого замысла».
Льюис возродил и операционализировал идеи Юма в теории конвенций, используя теорию игр и рассматривая конвенции как равновесия, поддерживаемые общими знаниями и прецедентами. В то время как Юм подчёркивал историческую случайность и постепенное возникновение, Льюис сформулировал более строгие критерии рациональности и взаимных ожиданий (lewis2008?). Он рассматривал конвенции как решения проблем координации — класса проблем в теории игр (разделе математики, изучающем стратегическое поведение), — которые требуют от двух или более агентов согласования своих действий для достижения совместно оптимального результата. В следующем разделе мы кратко рассмотрим основные концепции теории игр, прежде чем вернуться к теории конвенций Льюиса, поскольку теория игр будет иметь решающее значение в оставшейся части нашего исследования.
1.1.1 Важные понятия теории игр
Теория игр — это математическая теория, используемая для анализа ситуаций стратегического взаимодействия между рациональными агентами, принимающими решения. Первоначально разработанная Джоном фон Нейманом и Оскаром Моргенштерном в их фундаментальной работе Theory of Games and Economic Behavior (morgenstern1944?), теория игр впоследствии эволюционировала и охватила широкий спектр приложений в экономике, биологии, политической науке и социологии (Gintis, 2009a; osborne2004?). Она предоставляет инструменты для изучения того, как индивиды или группы принимают решения в условиях, когда их результаты зависят не только от собственных действий, но и от действий других. Базовыми элементами теории игр являются игры, игроки, стратегии, выигрыши (выплаты) и равновесия (Zamir, Maschler, & Solan, 2013).
Стратегическая игра в теории игр определяется как формальная модель \[ G = (N, S, P), \] где:
- \(N\) — множество игроков;
- \(S = (S_1, S_2, \dots, S_n)\) — наборы стратегий игроков, где \(S_i\) обозначает множество стратегий, доступных игроку \(i\);
- \(P = (P_1, P_2, \dots, P_n)\) — функции выигрыша, где \[ P_i : S_1 \times S_2 \times \dots \times S_n \rightarrow \mathbb{R} \] задаёт полезность игрока \(i\) при заданном профиле стратегий (myerson1991?).
Стратегия \(s_i \in S_i\) представляет собой полный план действий, которому игрок следует в любой возможной ситуации, возникающей в рамках игры. Выигрыши отражают вознаграждения, которые игроки получают в зависимости от комбинации стратегий, выбранных всеми участниками.
Одним из центральных понятий теории игр является равновесие, при котором ни один игрок не имеет стимула в одностороннем порядке изменять свою стратегию, учитывая стратегии других игроков. Наиболее известным понятием равновесия является равновесие Нэша (РН), введённое Джоном Нэшем в начале 1950-х годов (nash1950?). Профиль стратегий \((s_1^*, s_2^*, \dots, s_n^*)\) образует равновесие Нэша, если для каждого игрока \(i\) выполняется следующее условие: \[ P_i(s_i^*, s_{-i}^*) \geq P_i(s_i, s_{-i}^*) \quad \forall s_i \in S_i. \]
Здесь:
- \(P_i\) — функция выигрыша игрока \(i\);
- \(s_i^*\) — стратегия, выбранная игроком \(i\) в равновесии;
- \(s_{-i}^*\) — профиль стратегий всех остальных игроков, кроме \(i\).
Это неравенство означает, что игрок \(i\) не может увеличить свой выигрыш, односторонне отклоняясь от стратегии \(s_i^*\) к любой другой допустимой стратегии \(s_i\).
Роберт Ауманн в 1974 году ввёл понятие коррелированного равновесия (КР) (Aumann, 1974). Это обобщение равновесия Нэша позволяет игрокам координировать свои стратегии посредством сигналов от доверенного посредника. В отличие от равновесия Нэша, в котором игроки действуют независимо, КР допускает корреляцию стратегий через доступную обоим игрокам информацию. В рамках КР случайный сигнал рекомендует каждому игроку стратегию, и игроки следуют этой рекомендации. Формально КР удовлетворяет следующему условию: \[ \sum_{s'*{-i}} q(s_i, s'*{-i}) \cdot \bigl[P_i(s_i, s'_{-i}) - P_i(s'*i, s'*{-i})\bigr] \geq 0 \quad \forall s_i, s'_i. \]
Здесь:
- \(q(s_i, s'*{-i})\) — вероятность того, что посредник рекомендует стратегию \(s_i\) игроку \(i\) и профиль стратегий \(s'*{-i}\) остальным игрокам;
- \(P_i(s_i, s'*{-i})\) — выигрыш игрока \(i\), если он выбирает стратегию \(s_i\), а остальные игроки выбирают \(s'*{-i}\).
Это неравенство гарантирует, что ожидаемый выигрыш от следования рекомендации не меньше, чем ожидаемый выигрыш от отклонения от неё.
Как отмечал экономист Роджер Майерсон:
«Если на других планетах существует разумная жизнь, то в большинстве из них коррелированное равновесие было бы открыто раньше, чем равновесие Нэша» (Solan & Vohra, n.d.).
КР может рассматриваться как более естественное понятие по сравнению с РН, поскольку его математическая простота и опора на координацию делают его более легко обнаружимым. Майерсон утверждал, что приоритет, отданный равновесию Нэша в научной традиции, мог быть результатом исторической случайности, а не отражением его фундаментальной значимости. В обществах или цивилизациях, где кооперативное поведение поощряется или широко распространены внешние посредники, КР может выступать более интуитивной отправной точкой для анализа стратегических взаимодействий.
В области эволюционной биологии Джон Мейнард Смит и Роберт Прайс в 1973 году ввели понятие эволюционно стабильной стратегии (ЭСС) (maynard1973?). ЭСС — это стратегия \(s^*\), устойчивая к «вторжению» мутантных стратегий, и удовлетворяющая следующему условию: \[ P(s^*, s^*) > P(s', s^*) \quad \text{или} \quad \bigl[P(s^*, s^*) = P(s', s^*) \ \text{и} \ P(s^*, s') > P(s', s')\bigr]. \] Здесь:
- \(P(s^*, s^*)\) — выигрыш, когда и резидент, и захватчик используют стратегию \(s^*\);
- \(P(s', s^*)\) — выигрыш мутанта, использующего стратегию \(s'\), против резидента, придерживающегося стратегии \(s^*\).
Помимо РН, КР и ЭСС, в теории игр были разработаны и другие концепции равновесия, включая совершенное по подыграм (selten1965?), последовательное (sequential) (kreps1982?), байесовское (fudenberg1991?), равновесие дрожащей руки (selten1975?) и другие. Эти уточнения направлены на устранение ограничений равновесия Нэша, особенно в динамических играх. В настоящей диссертации мы сосредоточимся на КР и ЭСС и немного затронем совершенное байесовское равновесие в развёрнутых играх.
Стоит сказать про формы представления игр: нормальную (матричную, стратегическую) и развёрнутую. Игра в нормальной форме фиксирует статичную картину равновесия, когда все участники уже приняли решения и получили выплаты по их итогам. Игра в развёрнутой форме часто похожа на дерево, где каждый узел — принятие решения одним из игроков. Её основная характеристика — отражение последовательности ходов.
| Сотрудничать | Предать | |
|---|---|---|
| Сотрудничать | (3, 3) | (0, 4) |
| Предать | (4, 0) | (1, 1) |
Игра «Дилемма заключённого» в нормальной форме
Также важно другое различение — статических (one-shot) и динамических игр. Оно отражает не форму представления игры, а характер принятия решений игроками в ней. В статических играх решение принимается одновременно и без знания действий других. В динамических — решения последовательны и наблюдаемы обоими игроками. Шахматы — пример такой динамической стратегической ситуации. Важно, что динамические игры могут быть разными: играми в развёрнутой форме, где видна последовательность ходов, повторяющимися играми вроде «Дилеммы заключённого» и другими.
Ещё одно важное для нас различение — полнота информации в динамических играх. Если каждый игрок видит все предыдущие ходы другого игрока или знает, информация в игре полная, а если один из игроков не различает состояния игры (вроде «типа» оппонента), то неполная. Эти различения станут особенно важными при анализе теории правил-в-равновесии в Главе 2.
В целом, проблемы координации и кооперации фундаментальны для социальной философии со времён Гоббса (Hobbes, 2016), а теория игр стала незаменимым инструментом их анализа благодаря своей аналитической строгости и концептуальной ясности.
Проблемы координации возникают, когда индивидам или группам необходимо выбрать одно из нескольких возможных равновесий. Например, по какой стороне дороги ездить. Это создаёт неопределённость относительно того, какое решение будет реализовано. Подобные проблемы отражают ситуации, в которых все стороны выигрывают от согласованных действий, но испытывают трудности с выбором конкретного варианта. Если есть дорога с двумя полосами, то нужно выбрать, по какой стороне ездить всем, чтобы избежать аварий. Важно, что в проблемах координации индивидуальный и общий интерес совпадают — ехать по правой стороне выгодно и каждому отдельному водителю и популяции в целом (Bicchieri, 2005).
Проблемы кооперации, напротив, подчёркивают конфликт между индивидуальной рациональностью и коллективной выгодой: взаимная кооперация обеспечивает лучший результат для всех, однако индивидуальный эгоизм может приводить к социально неэффективным исходам. Например, перевыпас скота на общем пастбище, когда разные пастухи максимизируют индивидуальную полезность, в сумме истощая общий ресурс (ostrom1990?). Равновесие Нэша здесь хуже кооперативного, когда используют общий ресурс ограниченно. Такие проблемы часто требуют механизмов принуждения или ограничения.
Примерами проблем координации и кооперации служат классические игры, такие как «Битва полов» и «Дилемма заключённого». В первой супруги координируют выбор совместного досуга, который устроил бы всех, а во второй два заключённых независимо решают, сотрудничать ли друг с другом или выдать партнёра полиции. Матрицы выигрышей этих игр представлены ниже6.
Чтобы проиллюстрировать различия между концепциями равновесия при решении проблем координации, рассмотрим игру «Битва полов» в рамках чистого РН, смешанного РН и КР.
В чистых стратегиях существуют два равновесия Нэша: оба игрока выбирают либо балет, либо футбол. Эти равновесия обеспечивают идеальную координацию, но по своей сути несправедливы, поскольку один игрок всегда получает не то, что хочет.
Существует также смешанное, то есть вероятностное РН. Пусть муж выбирает балет с вероятностью \(p\) и футбол с вероятностью \(1-p\), а жена выбирает балет с вероятностью \(q\) и футбол с вероятностью \(1-q\). Используя принцип безразличия, согласно которому игрок рандомизирует свои стратегии таким образом, чтобы противник был безразличен к доступным стратегиям, получаем: \[ 2q = 1 - q \Rightarrow q = \frac{1}{3}, \] \[ p = \frac{2}{3}. \] В КР публичный сигнал (например, подбрасывание честной монеты) рекомендует обоим игрокам пойти либо на балет, либо на футбол с равной вероятностью, обеспечивая ожидаемый выигрыш \(1.5\) каждому игроку. КР помогает игрокам получать более высокие выигрыши и справедливость по сравнению как с чистым, так и со смешанным РН, используя общую случайность или коммуникацию (Vanderschraaf, 1995).
Чтобы продемонстрировать, как сигнал влияет на структуру выигрышей, добавим стратегию Следовать сигналу, где игроки выбирают стратегию на основе подбрасывания монеты (Орел = Балет, Решка = Футбол). Это легитимно, поскольку КР — это РН в расширенной игре с дополнительным набором стратегий (Gintis, 2009b, 2009a).
Расширенная игровая матрица принимает следующий вид:
Профиль стратегий \((FS, FS)\) образует РН в расширенной игре, где \(FS\) обозначает стратегию следовать сигналу. КР тем самым может быть представлено как РН в расширенной игре, но при этом оно лучше отражает реальные координационные механизмы.
Возвращаясь к проблемам координации, философ науки Кейлин О’Коннор различает коррелятивные и комплементарные проблемы координации (O’Connor, 2019). В первых успешная координация требует выбора одинаковых действий, во вторых — различных. Например, чтобы избежать столкновения, водителям на разных полосах дороги нужно ехать по правой стороне дороги. А для того, чтобы хорошо подготовиться к вечеринке, одному нужно прибраться в квартире, а другому — заказать пиццу. В первом случае успешная координация зависит от выбора одного и того же действия, во втором — разных.
Теория конвенций Дэвида Льюиса, рассматриваемая в следующем разделе, предлагает систематическое объяснение того, каким образом такие координационные равновесия возникают и закрепляются.
1.1.2 Координационное равновесие: традиция «конвенций» Дэвида Льюиса
Интеллектуальная атмосфера, в которой создавалась работа Дэвила Льюиса Convention, была в значительной степени сосредоточена на вопросах языка, значения и социального поведения.
В середине XX века интерес к влиянию социальных практик на лингвистическое значение неуклонно возрастал, поскольку такие философы, как Уиллард Куайн (quine1960?) и Людвиг Витгенштейн (wittgenstein1953?), утверждали, что значение возникает из совместного употребления внутри сообщества. Витгенштейн подчёркивал, что значение языка формируется через публичное использование, а не задаётся какими-либо внутренними семантическими свойствами. Продолжая эту традицию, Льюис стремился объяснить, каким образом языковые конвенции формируются, стабилизируются и сохраняются в сообществах, предложив систематическое описание их развития во времени. Концептуализируя значение слов как координированное поведение, Льюис заложил основания для понимания языка как социально организованной деятельности, а не как врождённой или сугубо индивидуалистической способности.
Дух времени аналитической философии 1960-х годов был связан с переосмыслением наследия логического позитивизма, который с помощью формальной логики и эмпирической верификации определял значение через аналитически истинные высказывания или эмпирически проверяемые утверждения (Godfrey-Smith, 2003). Однако к 1960-м годам критика со стороны Куайна, Патнэма и других философов поставила под сомнение этот подход — в особенности различие между аналитическими и синтетическими истинами, где первые считались истинными в силу значения, а вторые — в силу их отношения к миру.
Куайн отвергал традиционные представления о необходимости и аналитичности, утверждая, что онтологические обязательства встроены в теории и язык (quine1951?; quine1960?; quine1969?), и подчёркивал роль эмпирических данных и прагматических соображений в формировании убеждений. Его критика аналитичности акцентировала изменяемость языка, показывая, что конвенции являются подвижными, а не фиксированными. Мысленный эксперимент Патнэма «Двойная Земля»7 развил эти идеи далее, отстаивая семантический экстернализм — позицию, согласно которой значение слов зависит от внешних фактов, а не только от ментальных состояний, — тем самым бросая вызов интерналистским теориям значения и подчёркивая роль внешних факторов в языковых практиках. В результате конвенции понимаются как зависящие от контекста и окружающей среды, выходя за рамки чисто внутренних или необходимых определений.
Теория конвенций Льюиса стала ответом на этот интеллектуальный сдвиг, подчёркивая контингентный характер значения. Конвенции возникают как произвольные, но устойчивые решения проблем координации, отражая более прагматичное и гибкое понимание языкового значения и социальных практик. Согласно Льюису, даже самые строгие обычаи начинались как случайные поведенческие паттерны, которые могли бы быть иными, но усиливались с каждой итерацией.
Ещё одной важной философской проблемой, к которой обращался Льюис, была онтология социальных правил и норм, находящаяся под сильным влиянием работ Юма. Льюис развил юмовскую идею о том, что конвенции могут возникать и сохраняться даже при отсутствии централизованного принуждения. Он утверждал, что конвенции являются самоподдерживающимися: после их установления у индивидов нет причин отклоняться от них, пока остальные продолжают им следовать. Главное расхождение с Юмом состояло в акценте на рациональности агентов как источнике такого конформизма, тогда как Юм подчёркивал роль психологической привычки.
Примером может служить развитие денег как средства обмена. Изначально в качестве валюты использовались различные объекты — скот, раковины или металлические монеты. Со временем бумажные деньги получили широкое признание не из-за внутренней ценности, а потому, что люди ожидали, что другие будут принимать их в обмене. Этот вывод впоследствии оказал влияние на теории спонтанного порядка и децентрализованных систем в политической философии и экономике, в частности у Фридриха Хайека (hayek1973?). Объясняя конвенции как естественные результаты повторяющихся социальных взаимодействий, Льюис внёс вклад в более широкое понимание того, как нормы, институты и языковые практики могут возникать органически, без явного замысла или принуждения.
Если проблемы значения, языка и конвенциональности были теми вопросами, которые Льюис стремился решить, а юмовское понимание конвенций — ресурсом аргументации, ему всё же требовался инструмент для построения этого аргумента. Таким инструментом стала теория игр (vonneumann1944?), а в особенности подход Томаса Шеллинга к стратегическому взаимодействию в играх со «смешанными мотивами» (mixed-motive games) и идея «фокальных точек» (Schelling, 1980).
Работы Шеллинга отличались от преобладавшего в теории игр акцента на играх с нулевой суммой, где всегда есть победитель и проигравший. Шеллинг показал, что реальные взаимодействия часто характеризуются «смешанными мотивами», в которых интересы участников одновременно и конфликтуют, и совпадают. Он критиковал ограничения сугубо математического анализа стратегического взаимодействия и отстаивал необходимость эмпирических исследований условий, формирующих поведение, в частности возможности коммуникации и наличия очевидных (salient) альтернатив (Schelling, 1980). Этот расширенный взгляд, включающий как конфликт, так и кооперацию, охватывал именно те феномены сотрудничества и координации, которые привлекли Льюиса в контексте проблемы социальных конвенций.
Ещё одним важным вкладом стало понятие фокальных точек — решений, к которым индивиды естественным образом склоняются в координационных играх без явной коммуникации. Шеллинг продемонстрировал это в экспериментах, где участникам предлагалось выбрать место встречи в Нью-Йорке без предварительной договорённости: подавляющее большинство выбирало полдень на Центральном вокзале, несмотря на отсутствие каких-либо внутренних выигрышных преимуществ у этого места, но благодаря его культурной заметности (schelling1960?).
В исследовании чистых координационных игр Шеллинг анализировал взаимодействия, в которых интересы игроков совпадают, но отсутствует коммуникация, например выбор одинаковых чисел ради вознаграждения. Участники часто сходились на очевидных вариантах, таких как число \(1\), благодаря его свойству как наименьшего положительного целого (schelling1960?). Работы Шеллинга также уточнили концепцию равновесия Нэша, показав, каким образом фокальные точки помогают выделять устойчивые и заметные исходы среди множества равновесий Нэша (Lewis, 2008, p. 78).
Льюис формализовал идеи Шеллинга в теории конвенций, определив их как решения повторяющихся проблем координации, в которых агенты сходятся на фокальных точках благодаря взаимным ожиданиям (Lewis, 2008, p. 43). Конвенции опираются на внешние стимулы, такие как избегание провалов координации, а не на внутренние обязательства. Льюис также подчёркивал, что сама коммуникация является координационной игрой, в которой сигналы получают значение через разделяемые конвенции (Lewis, 2008, p. 95).
Одной из центральных идей, заимствованных Льюисом у Шеллинга, является понятие фокальной точки, или «салентности» (salience, которую дальше мы будем называть «очевидностью»). Он показал, что социальные конвенции возникают как фокальные точки координации. Так, во многих обществах люди ездят по одной стороне дороги не из-за внутреннего предпочтения именно этой стороны, а потому, что универсальное следование одной конвенции обеспечивает безопасность и предсказуемость. Развивая эту мысль, Льюис утверждает, что агенты выбирают наиболее «очевидную» конвенцию — ту, которая «выделяется» среди альтернатив благодаря прецеденту, явному соглашению или внутренним свойствам. Согласно Льюису, «очевидность« — это субъективная психологическая характеристика, независимая от стратегической ситуации, которая управляет возникновением и поддержанием конвенций. В частности, Льюис анализирует, как конвенции возникают (динамика — через первоначальный выбор и последующее усиление «очевидности«) и почему им следуют (статика — из-за подавляющей заметности уже существующей конвенции, формирующей ожидание конформизма). Последователи Льюиса переосмысляют и формализуют понятие «очевидности» в эволюционном и информационном ключе (Gintis, 2007b; O’Connor, 2019, 2020; Skyrms, 2014; Vanderschraaf, 1995).
Ещё одним важным заимствованием у Шеллинга является роль ожиданий и самопринуждения в стратегическом равновесии. Шеллинг показал, что во многих координационных сценариях после установления равновесия отклонение становится иррациональным, поскольку издержки нескоординированных действий превышают потенциальные индивидуальные выгоды. Льюис развивает эту идею, определяя конвенции как самоподдерживающиеся: индивиды следуют им не из-за внешнего принуждения, а потому, что взаимные ожидания делают отклонение затратным. Это особенно наглядно проявляется в языковых конвенциях, где использование определённых слов и грамматических структур сохраняется благодаря ожиданию, что другие будут делать то же самое.
Кроме того, льюисовское понятие общего знания, являющееся фундаментальным для его теории конвенций, восходит к акценту Шеллинга на взаимной осведомлённости в стратегическом взаимодействии, тесно связанному с «очевидностью». Хотя у Шеллинга отсутствовала строгая формализация, он подчёркивал ключевую роль разделяемого понимания для успешной координации. Льюис развил эту идею, утверждая, что устойчивость конвенции требует не только фактического следования ей, но и признания её ожидаемым образцом поведения внутри группы, что делает возможным поддержание конвенций в больших популяциях.
1.1.2.1 Теория конвенций Льюиса
Льюис определял социальную конвенцию как произвольный, но самоподдерживающийся поведенческий паттерн, возникающий из повторяющихся проблем координации между двумя или более игроками. Её отличительной чертой является конформизм участников по отношению к этим паттернам, поскольку они ожидают, что другие будут поступать так же, и это является общим знанием: каждый игрок ожидает конформизма остальных. Отклонение от конвенционального выбора действия приводит к меньшему выигрышу, поэтому у игроков нет стимулов к одностороннему отклонению. Так, если все ездят по правой стороне дороги, для каждого водителя рационально поступать так же, чтобы избежать столкновений. Льюис формулирует понятие конвенции следующим образом (Lewis, 2008, p. 76):
Поведенческая регулярность \(R\) в популяции \(P\) в повторяющейся ситуации \(S\) является конвенцией тогда и только тогда, когда:
- Каждый член \(P\) следует \(R\)
- Каждый индивид ожидает, что остальные будут следовать \(R\)
- Все члены имеют сходные предпочтения относительно возможных поведенческих регулярностей
- Каждый предпочитает всеобщее следование \(R\) при условии, что почти все остальные ему следуют
- Члены популяции также предпочли бы альтернативную регулярность \(R'\), при прочих равных условиях, если \(R'\) и \(R\) являются взаимно исключающими.
Позднее Льюис уточнил свой анализ, допуская редкие отклонения от конвенции, а Брайан Скирмс недавно ввёл понятие квазиконвенций как неустойчивых конвенций, основанных на концепции грубого коррелированного равновесия (coarse correlated equilibrium) (Skyrms, 2023).
Льюисовская конвенция представляет собой особый вид равновесия, называемый координационным равновесием, которое в общих чертах напоминает РН, но выходит за его пределы. В РН ни один участник не может улучшить свой результат посредством одностороннего изменения стратегии. Если отклонение строго снижает выигрыш, равновесие считается строгим. В этом смысле РН представляет собой «устойчивое состояние», в котором каждый индивид действует оптимально, принимая действия других как заданные. Однако льюисовская конвенция расширяет эту концепцию, подчёркивая коллективное предпочтение конформизма даже при наличии незначительных отклонений.
Важной особенностью льюисовского подхода является произвольность конвенций: \(R\) является конвенцией только в том случае, если альтернативная регулярность \(R'\) могла бы столь же успешно выполнять ту же функцию. Это подчёркивает, что конвенции являются контингентными решениями среди множества возможных вариантов, а не внутренне необходимыми структурами, что продолжает идеи Куайна (quine1969?), Патнэма (putnam1975?) и других.
Кроме того, Льюис ввёл понятие общего знания как необходимое условие конвенции, определяя факт \(p\) как общее знание, если:
- все знают \(p\);
- все знают, что все знают \(p\);
- все знают, что все знают, что все знают \(p\), и так далее.
Эта рекурсивная концепция знания стала предметом обширных обсуждений в философской и теоретико-игровой литературе. Роберт Ауманн (Aumann, 1976) и другие предложили формальные модели общего знания, отличающиеся от первоначального неформального подхода Льюиса.
Поскольку теория Льюиса опирается на теорию игр, рациональность играет в ней фундаментальную роль. Льюис предполагал, что агенты инструментально рациональны, то есть выбирают действия, максимизирующие ожидаемую полезность с учётом их убеждений и ожиданий относительно мира и поведения других. Хотя метафора человека как максимизирующего агента подвергалась критике (Paternotte, 2020a), она по-прежнему служит эвристическим ориентиром в экономической теории (Gintis, 2007a; Gintis & Helbing, 2013), биологии (Engel & Singer, 2008; S. Okasha, 2017; Samir Okasha & Binmore, 2012) и человеческой экологии (Sterelny, 2012; mouden2012a?). Вместе с тем существуют альтернативные взгляды на необходимость рациональности для существования конвенций. Например, философ биологии Рут Милликан утверждает, что конвенции стабилизируются исключительно статистической силой прецедента и не требуют рациональности или сознания (Ruth G. Millikan, 2022).
Льюисовская концепция конвенций объединяет поведение, убеждения, предпочтения и ожидания в рамках общего знания и рациональности для объяснения устойчивости конвенций. Каждый элемент определения играет ключевую роль:
- общее знание обеспечивает разделяемое понимание конвенции;
- предпочтение конформизма создаёт стимулы к следованию при условии кооперации других;
- рациональность направляет индивидуальный выбор в контексте общих ожиданий.
Поскольку одной из главных мотиваций анализа Льюиса была философская проблема языкового значения, он стремился показать, что язык укоренён в конвенциях, не требующих предварительного соглашения о терминах. Подобно тому как водители координируются относительно стороны движения без формального контракта, носители языка формируют конвенции употребления звуков или жестов для обозначения определённых объектов через повторяющееся взаимодействие и взаимные ожидания. Льюис рассматривал язык как систему сигналов, в которой значение возникает из конвенциональной связи между сигналами (словами, выражениями) и состояниями мира. Например, слово «кошка» конвенционально сигнализирует наличие представителя семейства кошачьих. Эта конвенция поддерживается тем, что говорящие обычно намерены говорить правду, а слушающие — доверяют этому намерению. Взаимные ожидания и опора на устойчивость связей «сигнал–значение» обеспечивают эффективную коммуникацию как форму координации.
Это привело Льюиса к различению поведенческих и сигнальных конвенций (lewis2008?): первые координируют действия, вторые — значения в коммуникации. В качестве классического примера сигнальной конвенции Льюис приводит историю Пола Ревира и фонарей, вывешенных на колокольне Старой Северной церкви в 1775 году для предупреждения колониального ополчения о наступлении британских войск: два фонаря означали наступление с моря, один — с суши. Действия получателей сообщения различались в зависимости от сигнала. Отправители и получатели координируются вокруг заранее установленного паттерна вида «если \(X\), то \(Y\)»8.
Для Льюиса сигнальные конвенции служат особым случаем, или подтипом, поведенческих конвенций, поскольку разделяют с ними произвольность, конформизм и статус общего знания. Отличие сигнальных конвенций состоит в том, что они включают коммуникацию и интерпретацию значения и решают проблемы координации посредством передачи информации. Они требуют процессов кодирования и декодирования, то есть производства и интерпретации сигналов.
Важной особенностью соотношения этих двух классов конвенций является то, что, по Льюису, сигнальные конвенции фундаментально опираются на уже существующие поведенческие конвенции и формируются под их влиянием. Например, значения слов зависят от соблюдения обеими сторонами установленных норм произношения и грамматики. Сигнальные системы часто демонстрируют вложенность, когда конкретные конвенции встроены в более широкие поведенческие регулярности. Так, поднятие руки для получения слова на собрании является сигнальной конвенцией, вложенной в более общую поведенческую конвенцию очередности высказываний (Vanderschraaf & Skyrms, n.d.).
Существует формальное различие между поведенческими (или «общими», как их называет Льюис) и сигнальными конвенциями. В сигнальных играх игроки выступают либо в роли отправителей, либо в роли получателей: первые обладают приватной информацией о состоянии мира и посылают сигнал, вторые наблюдают сигнал и действуют на его основе. Формально это можно представить следующим образом:
- Состояния мира: \(L\) (лево) и \(R\) (право)
- Сигналы: \(V_1\) и \(V_2\)
- Действия: \(A^L\) (повернуть влево) и \(A^R\) (повернуть вправо)
Если сигнал отправителя, представляющий состояние мира, корректно интерпретируется получателем, оба игрока получают выигрыш \((1, 1)\); если же кодирование или декодирование информации не удаётся, игроки получают \((0, 0)\). В рамках этого «информационного слоя» сигнальных систем существует множество вариантов — объединение сигналов, синонимия, обман и другие — которые подробно изучаются прежде всего философами биологии (Godfrey-Smith, 1991; Huttegger & Skyrms, 2008; Martínez, 2019; Shea, 2018; Skyrms, 2010b, 2010a).
Философ биологии Питер Годфри-Смит уточнил модель Льюиса, различив координацию состояние–действие и координацию действие–действие (Godfrey-Smith, 2014):
- состояние–действие: сигналы сопоставляют состояния мира действиям получателя;
- действие–действие: сигналы синхронизируют действия агентов без обращения к внешним состояниям.
Координация действие–действие позволяет интерпретировать юмовских гребцов как сигнальную систему этого типа: ритм гребков служит императивным сигналом («Греби сейчас!»), который непосредственно координирует совместные действия, а не передаёт информацию о внешних условиях (Martínez & Godfrey-Smith, 2016). Отсутствие экзогенного состояния сводит систему к чистой координационной игре с равновесием Нэша или координационным равновесием, где «сигнал» (ритм гребков) функционирует как самоподдерживающаяся конвенция, эндогенно стабилизированная общими интересами и взаимными ожиданиями. В отличие от зависимой от состояния мира сигнализации, координация действие–действие ориентирована на межличностную синхронизацию через поведенческую обратную связь в реальном времени. Это демонстрирует, как коммуникация может организовывать совместное действие без репрезентативного содержания (representational content), что является важной проблемой в философии биологии и философии сознания.
Парадигматический пример координации «состояние–действие» — тревожные крики мартышек-верветок, специфичные для каждого типа хищника. При виде орла крик побуждает прятаться в траве, при виде змеи — взбираться на дерево (Seyfarth & Cheney, 1990). Совпадение состояния мира, сигнала и действия образует полноценную сигнальную систему, или конвенцию. В данном контексте важно, что конвенция служит функции адаптивной цели — выживанию.
Хотя формально поведенческие и сигнальные конвенции схожи, поскольку обе могут быть описаны как игры с игроками и выигрышами, они различаются тем, что вторые включают дополнительный «информационный слой» между участниками. И хотя сам Льюис считал сигнальные конвенции подтипом поведенческих, их взаимосвязь остаётся неоднозначной. Для Скирмса сигналы информируют действия, а сигнальные сети координируют действия, что неявно предполагает первичность сигнальных конвенций по отношению к поведенческим, а не наоборот. Более того, Скирмс выдвигает тезис о том, что сигнализация ответственна за эволюцию командной работы как таковой (Skyrms, 2010a), что ставит под вопрос иерархию Льюиса и порождает проблему «курицы и яйца», выходящую за рамки данной диссертации.
1.1.2.2 Конвенция как информационная стабильность в теории Вандершраафа
Теория конвенций Льюиса стала отправной точкой для исследований конвенций, и последующие авторы уточняли его теорию, порой до неузнаваемости. Существует множество уточнений, однако мы рассмотрим лишь наиболее важные для нашей темы — разработки Питера Вандершраафа и Брайана Скирмса.
Расплывчатость понятия равновесия была одной из критик теории Льюиса, и этот компонент активно разрабатывался и уточнялся. Две заметные переработки понятия конвенций представлены в виде коррелированных равновесий и эволюционно стабильных стратегий.
Философ науки Питер Вандершрааф (Vanderschraaf, 1995, 1998, 2001) переопределил социальные конвенции как КР через индуктивное обучение, рассматривая их как основу достижения справедливости в смысле взаимной выгоды. Он формализовал понятие «очевидности» как информационные разбиения (information partitions) и применил правило Дирихле9, чтобы показать, как агенты последовательно обновляют свои убеждения о стратегиях других, постепенно приходя к равновесию эндогенно, без предзаданного внешнего сигнала.
Льюис считал координационное равновесие конвенцией, если игроки обладают общим знанием о взаимных ожиданиях. Вандершрааф называет это критерием взаимных ожиданий (КВО) (Vanderschraaf, 1995). У каждого агента есть причина следовать своей части конвенции, ожидая, что другие агенты поступят так же. Льюис утверждал, что равновесие должно быть координационным, чтобы отражать идею о том, что человек, следующий конвенции, хочет, чтобы его намерение было распознано как таковое. Вандершрааф называет это критерием публичных намерений (КПН). Кроме того, с точки зрения Вандершраафа, Льюис полагал, что общее знание КВО необходимо для существования конвенции. Однако, как отмечает Вандершрааф, этого недостаточно, поскольку общее знание КВО может выполняться в любом строгом равновесии Нэша.
Согласно Вандершраафу, конвенция представляет собой профиль стратегий \(\sigma^* = (\sigma_1^*, \ldots, \sigma_n^*)\), в котором каждый агент \(i\) максимизирует ожидаемую полезность так, что \(\mathbb{E}[u_i(\sigma_i^*, \sigma_{-i}^*)] \geq \mathbb{E}[u_i(\sigma_i', \sigma_{-i}^*)]\) для всех альтернативных стратегий \(\sigma_i' \neq \sigma_i^*\), обеспечивая устойчивость к односторонним отклонениям.
Формирование конвенций происходит не посредством когнитивно затратного рационального рассуждения, а через относительно дешёвые механизмы индуктивного обучения. Агенты обновляют свои убеждения о стратегиях оппонентов согласно динамике Дирихле. Делиберативное равновесие определяется как фиксированная точка этой обучающей динамики, в которой убеждения агентов стабилизируются. Стабилизированные совместные убеждения и стратегии, возникающие в результате такого итеративного обновления, соответствуют тому, что Вандершрааф называет эндогенным коррелированным равновесием (ЭКР)10. Это КР, возникающее благодаря индуктивному обучению агентов и взаимному пересмотру убеждений, а не из внешнего устройства корреляции, как это часто представляется в более широкой литературе по теории игр11.
Понимание конвенции как КР допускает более «справедливую» координацию, как это было показано ранее на примере игры «Битва полов». Эта игра имеет смешанное равновесие Нэша, в котором оба агента выбирают свои стратегии с вероятностью \(\frac{2}{3}\). Однако это равновесие не удовлетворяет КПН и не является конвенцией. Тем не менее, существует КР, справедливое для обоих игроков и Парето-предпочтительное по сравнению с равновесиями в чистых стратегиях. При подбрасывании честной монеты задаётся вероятностное пространство \(\Omega = \{H, T\}\) с исходами «орёл» и «решка». У агентов есть общее информационное разбиение \(\mathscr{H} = \{\{H\}, \{T\}\}\), а коррелированная комбинация стратегий задаётся функцией
\[f: \Omega \rightarrow \{A1, A2\} \times \{A1, A2\}\]
где \(f(H) = (A1, A1)\) и \(f(T) = (A2, A2)\). Если выпадает «орел», оба идут на балет, а если «решка» — на футбол.
Ни один игрок не захочет отклоняться, поскольку общий ожидаемый выигрыш каждого игрока в этом равновесии равен Парето-доминирует над выигрышами в РН:
\[ E(u_k \circ f)=\frac{1}{2} \cdot E(u_k \circ f \mid H)+\frac{1}{2} \cdot E(u_k \circ f \mid T)=\frac{3}{2}. \]
Это означает, что каждый игрок предпочитает ожидаемый выигрыш от \(f\) выигрышу смешанного равновесия и чистых РН.
Для Вандершраафа конвенция — это отображение «состояний мира» в комбинации стратегий некооперативной игры, которые удовлетворяют КПН (Vanderschraaf, 1995, p. 67).
Более детально, поскольку Вандершрааф опирается на модель Ауманна (Aumann, 1987), каждый игрок имеет собственное информационное разбиение \(\mathscr{H}*k\) вероятностного пространства \(\Omega\). Элементарные события на \(\Omega\) называются состояниями мира. В каждом состоянии \(\omega\) игрок \(k\) знает, какой элемент \(H*{kj} \in \mathscr{H}*k\) реализовался, но не знает, какое именно \(\omega\). \(H*{kj}\) представляет частную информацию игрока \(k\) о состояниях мира. Хотя \(k\) знает о существовании разбиений оппонентов, он не знает их конкретного содержания. Функция \(f: \Omega \rightarrow S\) задаёт экзогенно коррелированный кортеж стратегий, так что в каждом состоянии мира \(\omega \in \Omega\) каждый игрок \(k\) выбирает комбинацию стратегий \(f(\omega) = (f_1(\omega), \dots, f_n(\omega)) \in S\), коррелированную с \(\omega\). Следовательно, играя \(f_k(\omega)\), игрок \(k\) следует байесовской рациональности и максимизирует ожидаемый выигрыш с учётом частной информации и ожиданий относительно оппонентов.
Ограничение измеримости на \(f_k\) означает, что агент \(k\) знает свою стратегию в каждом \(\omega\). Это определение предполагает, что игроки обладают общим знанием структуры выигрышей, разбиений \(\Omega\) и функции \(f: \Omega \rightarrow S\), что необходимо для вычисления ожидаемых выигрышей и достижения коррелированного равновесия. Если игроки также обладают общим знанием байесовской рациональности, они будут следовать своим частям функции \(f\), ожидая, что другие поступят так же, поскольку таким образом совместно максимизируется ожидаемая полезность.
Вклад Вандершраафа состоит в формализации «очевидности»: он использует общее информационное разбиение \(\mathscr{H}\) как необходимое ограничение, согласующее определение конвенции с духом теории Льюиса. Остаётся вопрос о происхождении самой очевидности. Льюис предполагал, что предыгровая коммуникация, прецеденты и сигналы среды позволяют агентам связывать ожидания и действия с различными «состояниями мира», достигая равновесия. Однако такие источники сталкиваются с проблемой бесконечного регресса, поскольку неясно, как они могли возникнуть без уже существующих конвенциональных правил. Вандершрааф совместно со Скирмсом (Vanderschraaf & Skyrms, 1993) предложили индуктивную делиберацию как механизм формирования очевидности. Она действует через рекурсивную модификацию убеждений: игроки могут достичь коррелированного равновесия без коммуникации, динамически обновляя свои убеждения по общему индуктивному правилу, даже если исходные убеждения не допускают равновесия.
Что для нас самое важное в идеях Вандершраафа? То, что конвенция — это КР, а не РН, причём это эндогенное КР. Оно механистически объясняет принудительную силу конвенции — каким образом агенты приходят к этому равновесию и почему не отклоняются от него. Агенты реекрсивно обновляют свои убеждения из наблюдений за состояниями мира и проецируют последние в действия. Рекурсия делает одни убеждения более заметными просто потому, что они встречались чаще, и это натурализует «очевидность» Льюиса, что делает вклад в натуралистическое объяснение социальной стабильности.
1.1.2.3 Скирмс и конвенция как динамический аттрактор
Скирмс поместил теорию конвенций Льюиса в динамическую и эволюционную рамку. Он показал, как сигнальные конвенции могут возникать в процессе эволюции и обучения агентов с ограниченными когнитивными способностями, что позволяет обойтись без общего знания, индуктивного научения и даже индивидуальной рациональности (Skyrms, 2010a).
Хотя Скирмс фактически создал целую исследовательскую программу с многочисленными последователями (Franke, 2014; Huttegger, 2007a, 2007b; LaCroix, 2020a; O’Connor, 2020), стоит отметить, что он вряд ли сделал бы это без своей ранней, менее известной работы по теории игр, связанной с обобщением концепции ЭСС.
ЭСС, сформулированная Джоном Мейнардом Смитом и Робертом Прайсом (Smith & Price, 1973), — это стратегия, которая, если её примет большинство популяции, не может быть вытеснена никакой мутантной стратегией. Её формулировка предполагает случайное распределение пар12, когда индивиды встречаются для стратегических взаимодействий независимо от своих типов, так что вероятность встретить любую стратегию пропорциональна её частоте в популяции. Хотя это упрощает анализ и даёт элегантные теоретические результаты, оно ограничивает применимость ЭСС к смешанным популяциям и не отражает сложности структурированных взаимодействий.
Скирмс ослабил допущение случайного распределения пар и выяснил, что ЭСС не генерирует устойчивые стратегии при неслучайных парах, возникающих, например, через селекцию по родственникам, сигнальные системы, пространственные или социальные структуры. Эти корреляции создают зависимости взаимодействий, увеличивая вероятность встреч с аналогичной стратегией. Такие зависимости кардинально изменяют эволюционную динамику и могут стабилизировать стратегии вроде кооперации или сигнальной конвенции, которые были бы нестабильны при классических ЭСС (Skyrms, 1994).
Это привело Скирмса к введению понятия адаптивно ратифицируемой стратегии — обобщения ЭСС, которое учитывает, что структура взаимодействий в популяции может формироваться эндогенно, а не быть случайной.
Стратегия считается адаптивно ратифицируемой, если она даёт наибольшую ожидаемую приспособленность в ситуации, когда почти вся популяция уже её использует — с учётом того, что вероятность встретить разные стратегии может зависеть от корреляций в поведении. Иначе говоря, важно не только то, как стратегия работает против случайного оппонента, но и то, что носители схожих стратегий чаще взаимодействуют друг с другом.
Это обеспечивает динамическую устойчивость при репликаторной динамике: даже если появляются мутанты, они не получают систематического преимущества, потому что структура контактов уже «поддерживает» доминирующую стратегию (Skyrms, 1994).
Понятие адаптивно ратифицируемой стратегии позволило Скирмсу ввести ещё одно понятие — коррелированная конвенция (Skyrms, 2014). Это стабильные, но не обязательно Парето-оптимальные паттерны поведения, возможные благодаря любым зависимостям взаимодействий между агентами. Скирмс исследовал множество источников таких корреляций: пространственные взаимодействия (Alexander & Skyrms, 1999), социальные структуры (Skyrms, 2003), социальные сети (Skyrms & Pemantle, 2004) и сигнальные системы (Skyrms, 2010b).
Подход Скирмса к конвенциям отличается от Льюиса тем, что он не опирается на общее знание, заменяя его динамическим давлением эволюции или обучения. Это давление обеспечивает возникновение и сохранение конвенций. Он показал, что даже простейшие организмы вроде бактерий могут приходить к сигнальным системам, аналогичным конвенциям Льюиса, с помощью простых адаптивных механизмов, таких как мутация-селекция или обучение с подкреплением (reinforcement learning, RL) (Skyrms, 2014).
Фреймворк Скирмса моделирует конвенции как стабильные равновесия игр «отправитель–получатель», которые развиваются через RL и эволюционную динамику, а не рациональное размышление. Формально, сигнальная игра включает:
- множество состояний мира \(S = {s_1, s_2, \ldots, s_n}\)
- множество сигналов \(M = {m_1, m_2, \ldots, m_k}\)
- множество действий \(A = {a_1, a_2, \ldots, a_l}\).
Отправитель наблюдает состояние \(s \in S\) и выбирает сигнал \(m \in M\). Получатель, получив \(m\), выбирает действие \(a \in A\). Выплаты \(u_S(s, m, a)\) и \(u_R(s, m, a)\) для отправителя и получателя зависят от того, насколько хорошо действие получателя соответствует состоянию. В отличие от модели Льюиса, которая предполагает общее знание очевидности определенного выбора для координации, Скирмс показывает, что конвенции могут возникать через адаптивные процессы даже при случайных начальных стратегиях и отсутствии фокальных точек. Стоит заметить, что здесь также не нужны критерии Вандершраафа — взаимные ожидания и публичные намерения. Равновесия, которые можно описать как коррелированные (поскольку есть источник корреляции в виде пространственной, сетевой или сигнальной структуры), возникают динамически.
Эволюционную динамику, которая приводит к возникновению конвенций, часто моделируют с помощью алгоритмов обучения с подкреплением (RL), таких как модель Рота-Эрева (Erev & Roth, 1998). Так же поступает и Скирмс. Агенты поддерживают склонности (propensities) \(q_i(x)\) к выбору действий \(x\) (сигналов или ответов), которые обновляются итеративно в зависимости от полученных выплат:
\[ q_{i}^{t+1}(x) = q_{i}^t(x) + \alpha \cdot \left( r_i^t(x) - q_i^t(x) \right), \]
где \(\alpha\) — скорость обучения, а \(r_i^t(x)\) — вознаграждение за действие \(x\) в момент времени \(t\) (Skyrms, 2010a). При многократных взаимодействиях такая динамика обучения приводит к конвергенции на стабильные сигнальные конвенции без необходимости явной координации или рационального предвидения.
Передача информации через сигналы и акцент на информационном содержании сигнала вызвали жаркие дискуссии в философии биологии, критикующие Скирмса за отсутствие причинно-следственной связи (Godfrey-Smith, 2020; Harms, 2004; Shea, 2018) и чрезмерную опору на статистические, а не функциональные связи.
Интересная часть расширения Скирмсом игры сигнализации Льюиса — это неявная опора на эпистемический язык: «наблюдать» состояния мира и «интерпретировать» сигналы для «обновления убеждений». Хотя Скирмс отвергает байесовское толкование своих сигнальных игр (LaCroix, 2020b), его иногда интерпретируют как привнесшего эпистемологию в своих агентов, особенно при сравнении с теориями ментального содержания (Baraghith, 2019; Harms, 2004; Ruth Garrett Millikan, 1987; Ruth Garrett Millikan & Millikan, 2004): отправители «представляют» состояния мира и передают это публичное представление получателю, который затем «интерпретирует» его через свои собственные ментальные состояния. Например, уже упоминавшиеся тревожные сигналы мартышек-верветок: они могут быть описаны как включающие ментальные состояния, где «представляется» орёл и передаётся сигнал другим мартышкам, которые «декодируют» это представление и выбирают соответствующее действие. Хотя это правдоподобно для большинства натуралистических теорий ментального содержания Papineau (2003), это не верно для Скирмса.
Хотя структура игры Льюиса-Скирмса отражает поток информации в эпистемических контекстах (состояние → сигнал → действие), и возникает соблазн рассматривать отправителей и получателей как байесовских агентов с убеждениями, агенты Скирмса обновляют свои поведенческие предрасположенности, а не убеждения, так как не обладают способностью к выводу и могут лишь корректировать свои отображения на основе частоты неудач (Skyrms, 2012).
Система «отправитель–получатель» Скирмса — это информационный канал, сосредоточенный на том, как возникают и стабилизируются эффективные коды (связки сигнал–значение), а не на убеждениях или намерениях агентов. Его сигнальные игры механистичны, как у Мейнарда Смита: учитываются только объективные («онтические») характеристики агентов, такие как частота стратегий в популяции или, в случае сигнальной игры, отображения состояния в сигнал и сигнала в действие в соответствии с частотой координационных сбоев.
Сравним игру Льюиса-Скирмса:
\[ \text{World} \xrightarrow{state} \text{Sender} \xrightarrow{Message} \text{Receiver} \xrightarrow{act} \]
с каналом информации по Шеннону:
\[ \text{Source} \xrightarrow{original , message} \text{Encoder} \xrightarrow{signal} \text{Channel} \xrightarrow{signal} \text{Decoder} \xrightarrow{decoded , message} \]
Философ биологии Маноло Мартинез предлагает «channel-first» подход к сигнальным играм и утверждает, что центральной поведенческой единицей игры Льюиса-Скирмса является не стратегия, а пара кодирования-декодирования, что аналогично вышеупомянутым отображениям (Martínez, 2019).
В этой рамке состояния мира, сигналы и действия могут быть представлены как случайные величины \(S\), \(M\) и \(A\), каждая из которых состоит из дискретных элементов, например состояний, сообщений и действий \([S_1, \dots, S_s]\), с вероятностным распределением \([Pr(S_1), \dots Pr(S_s)]\) по ним. То же самое относится к сообщениям и действиям.
Отправитель наблюдает текущее состояние и передаёт сигнал — один из \(M\) возможных. Получатель получает сигнал и выбирает действие \(A_i\) из множества доступных действий. И сигнал, и выбранное действие являются случайными величинами. Вероятности этих случайных величин связаны через стратегии отправителя и получателя, которые представлены матрицами вероятностей: сигналы, условные на состояния мира, и действия, условные на сигналы.
Критикуя Скирмса, Мартинез отмечает, что тот недостаточно углубился в математическую теорию информации и анализировал информацию только после того, как стратегии были приняты, что не объясняет, как агенты к ним пришли. Мартинез предлагает использовать функцию скорости–искажения Шеннона (rate-distortion function) (Shannon, 1948), чтобы показать минимальную взаимную информацию между состояниями и действиями при минимальном уровне искажения. Это позволяет интерпретировать выплаты как показатели искажения в канале. С этой точки зрения, координационная игра сигнализации, даже включающая обман или блеф, воспринимается как кооперативная информационная структура, поскольку этот код радзеляется обоими агентами и делает полезную работу для обоих, пусть и иногда в большую сторону для одного из них.
В целом, расширение Скирмсом теории конвенций Льюиса отказалось от требований рациональности и ввело более натуралистическое описание сигнальных систем в широком контексте. Ключевое: оно подразумевает минимальную когнитивную архитектуру (или её отсутствие), что кардинально отличается от условных агентов Вандершраафа.
Что важного для нас в идеях Скирмса? Во-первых, предельная натурализация стратегического ограничения с помощью естественных динамических процессов — эволюции и научения. Во-вторых, идея коррелированной конвенции — что любая информационная асимметрия может создать конвенцию динамически. Эти идеи пригодится нам в Главах 3 и 4.
1.1.3 Равновесие с модификаторами выплат: социальные нормы как слабое принуждение
Помимо традиции Льюиса в теоретико-игровом подходе к социальной стабильности есть и другие направления. Оно активно пытается преодолеть ограничение и критику равновесных концепций, сводящих нормативность социальных конвенций к инструментальной рациональности или вовсе к нерациональным агентам и эволюционной динамике. В теориях этого подхода социальная нормативность моделируется с помощью теории игр, что иногда смещает фокус со стабильности социальных контрактов на мотивацию агентов следовать правилам. Эти теории важны, поскольку пытаются объяснить социальную нормативность как основу социальной стабильности и источник принудительной силы, однако они моделируют не структуру координационных стимулов, а структуру нормативных ожиданий.
1.1.3.1 Теория социальных норм Гинтиса
Влиятельная равновесная концепция социальной стабильности, которая, однако, не опирается на идеи Дэвида Льюиса, принадлежит Герберту Гинтису. Он предложил многоуровневую эволюционную модель социальных норм, интегрирующую идеи теории игр, поведенческой экономики, эволюционной биологии и теории сложных систем. Гинтис утверждал, что нормы — это форма социально передаваемого правила поведения, которое коэволюционировала с человеческой способностью к сотрудничеству и наказанию, а их устойчивость объясняется через коэволюцию генов и культуры (Gintis, 2009a; gintis2003?).
Гинтис определял социальную норму как правило поведения, которое:
- Всеобще разделяется в группе,
- Индивидуально интернализуется, так что отклонение вызывает отрицательные эмоции, такие как вина или стыд,
- Принудительно поддерживается через наказание третьей стороны, и
- Обременительно для индивидов, но адаптивно на уровне группы (gintis2003?).
Эволюционная жизнеспособность таких норм возникает из взаимодействия индивидуальной приспособленности и группового отбора: хотя следование нормам может быть затратным для отдельных индивидов, группы с высокой приверженностью нормам — особенно нормам сотрудничества, справедливости или наказания — превосходят менее сплочённые группы в межгрупповой конкуренции. Это формализуется в моделях многоуровневого отбора, где внутри группы динамика благоприятствует эгоизму, а между группами — сотрудничеству, опосредованному нормами.
Как отмечает Влерик (Vlerick, 2019), решения координационных проблем возникают из внутригрупповой динамики, тогда как решения проблем с конфликтом преимущественно формируются через межгрупповую конкуренцию. Внутригрупповые процессы объясняют появление очевидных координационных правил. Для решения проблем с конфликтом, однако, ключевую роль, по мнению Влерика, играют межгрупповые процессы. Они выбирают игровые нормы, которые изменяют выплаты для доступных стратегий через наказания или награды, решая проблему «безбилетников» и создавая более оптимальные равновесия, чем те, что были доступны изначально. Это означает, что социальные нормы изменяют матрицы выплат так, чтобы стратегии, ориентированные на собственный интерес, совпадали с интересами группы, без необходимости самопожертвования. Они формируются взаимодействием между индивидами и между группами: последние выбирают эффективные равновесия, первые — «очевидные». .Санкции применяются для решения проблем конфликта интересов
Гинтис моделирует поддержание и стабильность норм через репликаторную динамику и игры на общественные блага. Пусть \(x_i\) — доля индивидов, использующих стратегию \(i\). Пусть \(f_i\) — приспособленность (ожидаемый выигрыш) стратегии \(i\). Уравнение репликатора:
\[ \dot{x}_i = x_i(f_i - \bar{f}), \]
где \(\bar{f} = \sum_j x_j f_j\) — средняя приспособленность в популяции. Норма устойчива, когда стратегия, которую она кодирует, становится ЭСС благодаря своей адаптивной выгоде на уровне группы.
Особенность норм в подходе Гинтиса — включение сильной взаимности (strong reciprocity), поведенческой черты, характеризующейся сотрудничеством с другими и наказанием несотрудничающих, даже с личными затратами. Сильная взаимность наблюдается эмпирически в межкультурных экспериментах (игры на доверие, ультиматум, игры на общественные блага) и противоречит прогнозам моделей, основанных исключительно на эгоизме (gintis2005?). Гинтис рассматривает эту черту не как аномалию, а как эволюционно устойчивый поведенческий фенотип, поддерживаемый через социализацию, основанную на нормах, и групповой отбор.
Центральная и новаторская идея Гинтиса заключается в том, что социальные нормы трансформируют не только индивидуальные предпочтения, но и структуру самого стратегического взаимодействия, изменяя субъективные представления агентов о выплатах и действиях. Эта трансформация кодируется в так называемой матрице убеждений, отображающей, как агенты воспринимают и оценивают свои стратегические варианты с учётом социальных норм (Gintis, 2009a, ch. 12; gintis2003?).
В классической теории игр игра определяется как:
- множество игроков \(N\),
- множество стратегий \(S_i\) для каждого игрока \(i \in N\),
- функция полезности \(u_i: S \to \mathbb{R}\), задающая выплаты.
Гинтис утверждает, что эта схема неполна для моделирования нормоподчинённого поведения, так как предполагает, что агенты оценивают стратегии на основе статических функций полезности. Социальные нормы, однако, вызывают эндогенные изменения функций полезности, через социально усвоенные ожидания, эмоции вроде вины и стыда и репутационные стимулы. Это отражается через модифицированную функцию выплат:
\[ u'_i(s) = u_i(s) + n_i(s), \]
где \(u'_i\) — нормо-скорректированная полезность, а \(n_i(s)\) кодирует нормативные оценки профиля стратегии \(s\). Функция \(n_i\) зависит от убеждений агента \(i\) о том, что ожидается, что является правильным или наказуемым, — формируя часть матрицы убеждений.
Матрица убеждений — это не просто список убеждений, а когнитивная структура: она кодирует, как игроки трансформируют исходную игру в игру, насыщенную нормами. Например, в дилемме заключённого, если оба игрока считают взаимное предательство морально неправильным и потенциально репутационно опасным, их матрица выплат эндогенно преобразуется в координационную игру или даже в «Охоту на оленя», в зависимости от силы нормативных убеждений.
Для формализации пусть \(M\) — исходная матрица выплат, а \(B\) — матрица убеждений, которая преобразует социальные ожидания, наказания и награды в численные модификаторы. Тогда:
\[ M' = M + B \]
где \(M'\) — нормо-управляемая игра, фактически воспринимаемая и реализуемая игроками.
Таким образом, Гинтис предлагает механизм внедрения норм в стратегическое поведение, связывая рациональную структуру теории игр с эволюционной и культурной психологией. Подход Гинтиса резко отличается от статических или экзогенных моделей норм, таких как конвенции Льюиса, и сближает его с конструктивистскими и динамическими традициями в поведенческой экономике.
Теория Гинтиса рассматривает нормы как культурно передаваемые и биологически обоснованные механизмы, поддерживающие масштабное сотрудничество. В отличие от теорий равновесия или основанных на ожиданиях, его модель встраивает соблюдение норм в коэволюцию генов и культуры и объясняет их устойчивость через многоуровневый отбор.
Для нас наиболее важно, что Гинтис явно вводит механизм, делающий стабилизацию игровых равновесий эндогенным. У Льюиса, Вандершраафа и Скирмса структурное ограничение равновесия — это свойство информации или эволюционной динамики. Гинтис также пытается встроить норму как результат биологической и культурной эволюции, однако норма сама по себе у него являет собой уже готовый механизм стабилизации и по сути чёрный ящик. В традиции Льюиса равновесия ограничены ожиданиями, информацией или динамикой, а у Гинтиса — социальной нормой, уже интернализованной индивидом. Именно эта норма, а точнее, общее знание о ней и модифицируют матрицу игры, делая отклонение от равновесия нерациональным.
Теория Гинтиса — это попытка ответить на обвинения теории игр в выхолащивании нормативности. Иначе говоря, для Гинтиса принудительная сила исходит из двух источников:
- эволюционно- и культурно-сформированной и передаваемой социальной нормы, которая регулирует поведение,
- делая отклонение нерациональным по внутренним причинам (стыд, вина).
Однако, социальная норма в концепции Гинтиса онтологически первичнее равновесия, поскольку является условием его возможности.
1.1.3.2 Социальные нормы как ожидаемые санкции в теории Кристины Биккиери
Философ Кристина Биккиери предложила самостоятельный и ныне ставший мейнстримным эпистемический и психологический подход к социальным нормам, отходящий от традиционных моделей теории игр, функционалистских и чисто поведенческих объяснений (Bicchieri, 2005). Она проводит различие между конвенциями и социальными нормами на основе идеи условных предпочтений (conditional preference). Согласно Биккиери, индивиды следуют правилу, если они:
- ожидают, что достаточно многие другие будут ему следовать (эмпирическое ожидание);
- верят, что достаточно многие другие считают, что они должны ему следовать (нормативное ожидание).
В льюисовских конвенциях значимы только эмпирические ожидания, тогда как нормативные ожидания и потенциальные санкции отсутствуют. Главная «санкция» в традиции Льюиса — провал координации сам по себе. Напротив, по мнению Биккиери, нормы зависят от обоих уровней ожиданий и поддерживаются социальными санкциями — внешними (наказания) или внутренними (чувство вины) (bicchieri2006?). Подход Биккиери подчёркивает, что изменение убеждений агентов относительно установок других может превратить конвенцию в норму.
Используя похожий на Льюиса синтаксис, Биккиери определяет социальную норму как поведенческое правило \(R\) нормой в популяции \(P\) относительно ситуации \(S\), если выполняются следующие условия:
Правило \(R\) распознаётся как применимое в ситуации \(S\);
Достаточно большая часть \(P\) следует \(R\) в \(S\), и каждый индивид \(i \in P\) имеет эмпирическое ожидание, что другие следуют \(R\) в \(S\);
Каждый \(i \in P\) верит, что другие считают, что он должен следовать \(R\) в \(S\) (то есть обладает нормативными ожиданиями);
Каждый \(i \in P\) предпочитает следовать \(R\) при условии, что:
- он верит, что другие следуют \(R\) в \(S\);
- он верит, что другие верят, что он должен следовать \(R\) в \(S\).
Это часто выражается через предпочтение, условное по отношению к ожиданиям:
\[i \text{ предпочитает } R \text{ in } S \iff EE_i(R) \land NE_i(R)\]
где:
- \(EE_i(R)\) — эмпирическое ожидание: «другие будут делать \(R\) в \(S\)»;
- \(NE_i(R)\) — нормативное ожидание: «другие ожидают, что я буду делать \(R\) в \(S\)».
Такая условность принципиально отличает Биккиери от моделей рационального выбора и равновесных подходов. Для неё соблюдение норм зависит не от фиксированных функций полезности, а от контекстно-зависимых сдвигов предпочтений, обусловленных .структурой убеждений, а не структурой стимулов.
В противовес Льюису Биккиери настаивает, что нормы не сводимы к равновесным стратегиям или к взаимно ожидаемому поведению. Они включают предписывающий слой — представление о том, что другие считают, что следует делать. Более того, в отличие от Льюиса, она не требует общего знания регулярности: нормы могут существовать в смешанных популяциях и активироваться локально (bicchieri2006?).
Биккиери утверждает, что соблюдение норм в значительной степени ситуативно и зависит от структуры ожиданий, а не от глубокой интернализации ценностей или длительного морального воспитания, подобного self-command в смежных с теорией игр подходах (Elster, 1989). Экспериментальные данные показывают, что многие индивиды являются условными кооператорами, чувствительными к воспринимаемым ожиданиям, и склонными к стратегическому уклонению от норм, когда нормативный контекст ослаблен (например, никто не смотрит) (bicchieri2006?). В её модели нормы не требуют полной интернализации, как у Гинтиса: они контекстуальны и могут соблюдаться инструментально в соответствующих ситуациях.
По сравнению с классической теорией социальных норм Ульманн-Маргалит, которая концептуализировала нормы прежде всего как решения повторяющихся социальных проблем — координации, кооперации и предотвращения конфликтов — и рассматривала их как функциональные образования (Ullmann-Margalit, 1977), подход Биккиери расходится с этим в двух отношениях:
- Биккиери разрывает связь между возникновением нормы и функциональной необходимостью: не все нормы решают проблемы, поскольку они зависят от структуры убеждений, а не объективных стимулов, и некоторые сохраняются, даже будучи субоптимальными.
- Биккиери выстраивает эпистемическую модель снизу вверх: норма существует не потому, что она решает координационную задачу, а потому что агенты верят, что она существует, и соответствующим образом условливают свои предпочтения. Тем самым существование нормы является психологическим фактом о сетях убеждений, а не просто системным решением.
Таким образом, Биккиери предлагает модель норм как контекстуально активируемых сценариев, укоренённых в микроуровневых эпистемических структурах и способных объяснить вариативность, хрупкость и быстрые изменения социального поведения. Важно также отметить, что агенты Биккиери условны (в смысле conditional preference): они формируют, имеют и обновляют явные убеждения и обладают когнитивными схемами, достаточными для обработки этих убеждений (Bicchieri, Muldoon, & Sontuoso, 2018).
Для нас теория Биккиери важна тем, что объясняет мотивацию поведения, ответственного за социальную стабильность. Она не моделирует принуждение формально, но описывает социальную норму как мягкую внутреннюю форму принуждения, влияющего на общий исход. С точки зрения механизма это похоже на матрицу убеждений Гинтиса, где платежи игроков модифицируются нормами. Но если для Гинтиса нормы — это продукт эволюции и «чёрный ящик», то для Биккиери это эпистемическая сеть, причинно влияющая на выбор стратегий поведения. Иначе говоря, для Биккиери источник социальной стабильности — социальные нормы, понятые как эндогенные и контекстуально активируемые модификаторы платежа.
Слепое пятно теории Биккиери, по нашему мнению — что она объясняет мотивацию действия, но не сам феномен устойчивости: почему вообще норма существует? Она просто берёт норму как данность и использует её для объяснительной работы.
1.1.4 Равновесие с модификатором выплат: сильное принуждение с \(\delta\)-параметрами
В широком спектре теорий — от новой институциональной экономики до исторической политэкономии — институты иногда трактуются как устойчивые паттерны стратегического поведения, поддерживаемые не только ожиданиями, но и механизмами исполнения (enforcement) (Greif & Kingston, 2011; schotter1980?; calvert1995?; kandori1992?; greif2006?). Точнее, институты в этой традиции — это самоподдерживающиеся (self-enforcing) равновесия. Важное отличие от традиции Льюиса — в акценте на механизмах принуждения и контроля, которыми институт себя поддерживает.
Общая интуиция этих подходов — что институт существует постольку, поскольку он трансформирует исходную стратегическую ситуацию, уменьшая привлекательность отклоняющихся стратегий. Формально это может быть представлено как вычитание из выигрыша отклонения величины \(\delta > 0\), интерпретируемой как санкция или потеря будущих возможностей. Важно подчеркнуть, что в данных теориях эндогенны не предпочтения и не нормы, а механизмы принуждения, возникающие из повторяющихся взаимодействий, репутационных эффектов, организационных форм или материальной инфраструктуры. Они отличаются от Гинтиса и Биккиери тем, что моделируют не конкретный механизм принуждения (внутренний — социальные нормы), а материальную структуру принуждения, источник которой может быть разным.
Другое отличие от нормативных и эпистемических подходов — Биккиери и Гинтиса (Bicchieri, 2005; Gintis, 2009b): теории институтов-как-равновесий фокусируются не на том, почему агенты считают некоторое поведение обязательным, а на том, почему отклонение от равновесия становится невыгодным.
Например, Калверт (calvert1995?) буквально приравнивает институт к равновесию, говоря, что «…нет отдельного “животного”, которое можно назвать институтом. Есть только рациональное поведение, обусловленное ожидаемым поведением других… “Институт” — это просто имя определённых частей отдельных видов равновесий».
Согласно экономическому историку Авнеру Грейфу, отождествление институтов с правилами поведения (или даже нормами) несостоятельно, поскольку правила не обладают принудительной силой (greif2006?). Правило — лишь инструкция, которую можно игнорировать. Для объяснения устойчивости социального порядка необходимо ответить на вопрос, почему люди следуют правилам, а не вопрос о том, какие именно правила существуют и как меняются.
Грейф определяет институт как систему социальных факторов, совместно порождающих регулярность поведения. В эту систему входят правила, убеждения, нормы и организации. Однако решающим элементом, обеспечивающим принудительную силу института, являются не нормы или убеждения, а санкции. При этом санкции у Грейфа принципиально не экстернальны — они не добавляются к институту извне в виде издержек принуждения, а возникают эндогенно, как часть равновесного поведения самих агентов.
Санкция у Грейфа — не штраф, налагаемый внешним гарантом, а ожидаемая потеря будущих выгод от кооперации, которую агент несет в результате собственного решения обмануть.
Грейф формулирует эту идею в модели магрибских купцов: санкция за обман — это исключение из сети и потеря всех будущих доходов от торговли внутри коалиции (greif2006?, Гл. 8). Разрыв в приведенной стоимости ожидаемой полезности между честным агентом и обманщиком и есть та дельта, которая удерживает агента от оппортунизма.
Важно подчеркнуть, что у Грейфа санкция не постулируется, как норма у Гинтиса и Биккиери, а выводится из структуры повторяющейся игры. Она не требует наличия государства, писаных законов или специализированных органов принуждения. Санкция возникает из факта, что агенты обладают способностью запоминать прошлое поведение контрагентов и координировать свои будущие действия на основе этой информации. В этом смысле, материальные требования к эндогенной санкции достаточно минимальны.
Принудительная сила института по Грейфу, таким образом, коренится не во внешнем насилии или государстве как гаранте, а в эндогенно сформированных ожиданиях. Это позволяет Грейфу объяснять возникновение порядка в ситуациях, где формальные правовые институты отсутствуют или неэффективны.
Вместе с тем, подход Грейфа обнаруживает границы. Санкция в его модели работает только при условии, что агенты уже обладают способностью к координации и обмену информацией. Сама эта способность — наличие сети, общих когнитивных категорий, механизмов выявления нарушителей — принимается как данность. Грейф не ставит вопроса о том, как возникает первичная способность налагать санкции, как формируются каналы информации и почему вероятность применения санкции может быть различной в разных контекстах. Его анализ блестяще объясняет устойчивость уже сложившихся институтов, но оставляет открытым вопрос о генезисе самой возможности (или необходимости) принуждения.
Санкция у Грейфа является необходимым элементом определения института, однако источник этой санкции и условия ее надежности остаются экзогенными факторами, принимаемыми в качестве предпосылок модели.
В модели магрибских купцов Грейф формализует санкцию как разрыв в приведённой стоимости ожидаемой полезности между честным агентом и агентом, совершившим обман. Этот разрыв возникает эндогенно — из самого факта, что купцы координируют свои действия и отказываются нанимать агента, который когда-либо обманул любого члена коалиции. Центральное уравнение, определяющее условие честности агента, имеет вид:
\[V_h \geq \alpha + V_c^u\]
где \(V_h\) — приведённая стоимость ожидаемой полезности занятого честного агента, \(\alpha\) — немедленный выигрыш от обмана, а \(V_c^u\) — приведённая стоимость ожидаемой полезности безработного агента, однажды совершившего обман. Раскрывая это условие, Грейф получает выражение для минимальной заработной платы \(W^*\), при которой агенту выгодно быть честным. Ключевой результат состоит в том, что \(W^*\) монотонно убывает по \(h_h\) (вероятности найма честного агента) и монотонно возрастает по \(h_c\) (вероятности найма обманщика). В равновесии с коллективными санкциями \(h_c = 0\), что делает обман строго невыгодным.
Купцы не нанимают обманщика не потому, что им запрещает социальная норма или это сопряжено с издержками, а потому что это их наилучший ответ на ожидаемое поведение других купцов. Разрыв в заработной плате (\(W_c^* > W_h^*\)) не назначается централизованно, а возникает как агрегированный результат децентрализованных решений. Грейф показывает, что при \(h_c = 0\) каждый купец строго предпочитает нанимать честного агента, и это предпочтение самоподдерживается. Важно, что это равновесие — не координационное, как в традиции Льюиса, где агенты выбирают одно из равновесий. Этот факт станет особенно важным в Главе 3 при построении нашей собственной модели.
Однако в подходе Грейфа важную роль играют и другие «институциональные элементы» — убеждения, правила, нормы и организации. В частности, «правила» координируют мотивируемое поведение — уточняют ожидания и определяют когнитивные категории, с помощью которых люди обуславливают своё поведение: знаки, символы и понятия.
Мотивация, выраженная в самопринуждающих равновесиях (self-enforcing) зависит от правил — точнее, от когнитивных категорий, в терминах которых формулируются ожидания. Это значит, что институты-как-равновесия невозможны без правил. Это станет особенно важно в при рассмотрении теории правил-в-равновесии в следующем разделе данной главы.
Если правило предшествует равновесию (поскольку оно формирует ожидания, необходимые для равновесия), то эффективность правила не может исходить из самопринуждения (self-enforcement), поскольку оно служит следствием уже работающих ожиданий. Это делает подход Грейфа онтологически неустойчивым — что появляется раньше: правило или равновесие. Однако для Грейфа это не проблема, поскольку его редукция — объяснительная, а не онтологическая.
С точки зрения институтов-как-равновесий, именно ожидаемое поведение других создаёт ограничения поведения, и это поведение должно быть объяснимо эндогенно как часть равновесия (Greif & Kingston, 2011). Ожидания создают ограничения, которые закрепляют поведение. Эти ожидания нужно отражать в равновесии, постольку они по сути определяют институт.
С этим связана другая проблема теории Грейфа: он описывает ожидания как основу стратегических ограничений равновесия, однако не говорит, что изначально мотивирует людей взаимно ожидать определенного исхода. Он объясняет мотивацию действия, а не мотивацию ожидания, мотивирующего действие. Точнее, он принимает «исторический процесс» как данность, маскируя проблему первоначального ожидания (greif2006?). Для работы ожидания уже должна быть решена проблема выбора равновесия. А выбор равновесия, или процесс инститционального изменения — это выбор стратегических ограничений последующих взаимодействий. Поэтому говорить, что ожидания «создают» ограничения не вполне верно — скорее, они подкрепляют уже выбранные ограничения. Это, в свою очередь, говорит о том, что равновесное объяснение института уже степени предполагает его существование как решённой проблемы выбора равновесия и не объясняет его появление из до-институционального состояния.
Подход эндогенного принуждения, и теория Грейфа, в частности, послужит для нас важным отправным пунктом при построении своей модели в Главе 3. Главная идея для нас — эндогенные материальные издержки, встроенные в структуру мотивации.
1.1.5 Критика традиции: выхолащивание нормативности и экономический империализм
Традицию равновесного анализа социальной стабильности критикуют по разным основаниям: «империализм» как необоснованная объяснительная экспансия, выхолащивание нормативности, переоценка рациональности агентов и требования общего знания.
Во многом критика этого подхода связана с критикой самой теории игр и её предпосылок, причём нередко с такой критикой выступают и представители теории игр (Gintis, 2007a, 2009b; Guala, 2006). В частности, Гинтис считает, что предпосылка о рациональности агентов эмпирически опровергнута психологией и экспериментальной экономикой, а теория игр не «возвышается» над другими поведенческими дисциплинами, а комплементарна им (Gintis, 2009b).
Одна из основных критических линий относительно институтов как равновесий и теории игр как способа объяснения социальной стабильности в целом — выхолащивание нормативности. Это неспособность теории игр объяснить моральную сторону нормативности — как люди могут выбирать стратегию исходя из понимания, что делать «правильно» по их мнению, а не просто рационально.
Критики утверждают, что равновесное объяснение редуцирует сложную нормативность к мотивации действия, основанной на рациональности избегания издержек. Например, Сёрл считает, что равновесия не способны схватить нормативность в принципе, потому что она «находится» не в стратегических ограничениях ситуаций взаимодействия, а в статусах, придаваемых объектам с помощью конститутивных правил (J. R. Searle, 2015). Помимо этого, Сёрл считает, что равновесие — это всегда оптимальная конфигурация (что, конечно, не так). Хиндрикс считает, что деонтическая сила правил исходит не из эмпирических ожиданий, а из понимания, почему конкретное правило «правильно» и применимо в конкретной ситуации (F. Hindriks, 2019)
Эмпирические исследования показывают, что индивиды не всегда эгоистичны, и могут быть условными кооператорами (conditional cooperators) или, как их иногда называют, сильными реципрокаторами (Henrich, 2004; gintis2005?). Это означает, что игроки выбирают свою стратегию в зависимости от того, как себя вёл другой игрок в прошлом раунде игры: если «предавал», то условный кооператор тоже «предаст», а если кооперировался — то тоже скооперируется.
В большом обзоре Джеймс Вудворд показывает, что личного интереса в повторяющихся играх (ЛИПИ) эмпирически недостаточно для кооперации. Нужны и нормы, и условные кооператоры — без них кооперация трудно осуществима, если не невозможна вовсе (Woodward, 2009). Аргумент против в том, что социальные нормы позволяют людям с разными мотивациями подчиняться одним и тем же нормам (gibbard1990?). Вудворд, критикуя результатоориентированные теоретико-игровые модели (outcome-based), предлагает включать в них информацию о верованиях и намерениях, чтобы лучше отразить источник мотивации выбора той или иной стратегии (Woodward, 2009, p. 243).
Теории социальной стабильности, так или иначе опирающиеся на идеи Льюиса, сталкиваются с одной и той же проблемой — статус общего знания как необходимого для существования и стабильной работы поведенческого паттерна. Проблема в том, что «общее знание» создаёт проблему бесконечного регресса причин верить (reasons to believe), и разные исследователи по-разному реагируют на этот регресс и его импликации для теории конвенций и институтов.
Распространённое мнение — что, в противовес Льюису, общее знание не необходимо для работы конвенций (Binmore, 2008; Cubitt & Sugden, 2003) или его менее радикальная версия — что индивиды обладают ограниченной рациональностью и фактически не используют бесконечные уровни регресса, потому что это невычислимо и психологически неправдоподобно (Bicchieri, 2005; Gilbert, 1992). В частности, Бинмор считает, что достаточно первого уровня ожиданий для схождения поведения в равновесия (Binmore, 2008). Подобный взгляд делает акцент на предсказуемости поведения других как критически важном условии координации. Бинмор также замечал, что анализ Льюиса подходит только для небольших обществ, поскольку делает акцент на общих наблюдаемых событиях. Франческо Гуала предлагает «координацию без верований» (belief-less), говоря, что повседневные конвенции не требуют трудно вычислимого общего знания и оперируют на уровне дешёвых эвристик (Guala, 2020). В экспериментальных условиях появление лингвистических конвенций сложно исследовать, опираясь на «общее знание» ввиду его неизмеримости. Вместо этого исследователи используют сигнальные игры с подкреплением вроде рассматриваемых Скирмсом (Bruner, O’Connor, Rubin, & Huttegger, 2018).
Другая частая критика, которая обобщает предыдущие — уже не столько самого подхода к институтам как равновесиям, а к теории игр в её попытке объяснить социальную стабильность — это «экономический империализм». Это стремление экономистов использовать методы экономики для объяснения не только экономических, но и политических и социальных феноменов (Mäki, 2009). Гинтис иронизирует, называя теорию игр «молотком, который видит всё вокруг гвоздями» (Gintis, 2009b, xiv). Философ науки Ускали Маки определяет подобный империализм как «форму экономической экспансии, где новые типы объясняемого (explanandum) помещены в территории, оккупированные дисциплинами, отличными от экономики, и где экономика демонстрирует себя как гегемон, обладающий более совершенными теориями и методами и исключающий конкурирующие теории из рассмотрения» (Mäki, 2009, p. 374).
1.2 Институт как система правил
Традиция рассмотрения институтов как правил неоднородна: в неё мы включили как философские, так и экономические подходы. Общее между ними — примат правил в объяснении стабильности институтов, а разница — в характере и функции этих правил. Ниже мы рассмотрим две традиции — философскую традицию коллективной интенциональности и конститутивных правил Джона Сёрла и экономическую традицию регулятивных правил в лице Дугласа Норта, Элинор Остром и других. В первой правила «создают» социальную реальность, а во второй — регулируют поведение.
Идея рассматривать институты как правила берёт начало в работах Макса Вебера (Weber, 1924), который называл институты «правилами игры», и Толкотта Парсона (Parsons, 1937) и развивается во многих социальных науках. Можно сказать, что теории институтов в социологии, философской антропологии и экономике уточняют, как и с помощью чего правила регулируют поведение: как инкорпорированные практики и символическое насилие (bourdeau? — todo), как (само)дисциплинирование тела через паноптический надзор (foucault? — todo), как формальные и неформальные предписания (North, 1990; ostrom1990?) и иначе. Мы начнём рассмотрение этой традиции с подхода конститутивных правил.
1.2.1 Институт как статусные функции и конститутивные правила: традиция Джона Сёрла
Джон Сёрл (J. Searle, 1995) одним из первых сформулировал проблему онтологического статуса социальных фактов и институтов: как можно быть эпистемологически объективным касательно онтологически субъективных вещей? Сёрл показал, что социальные (или, как он их называет, институциональные) факты создаются конститутивными правилами вида «X считается Y в контексте C», где X — факт как таковой (brute fact). Например, «забить мяч в сетку (\(X\)) считается голом (\(Y\)) в футбольном матче (\(C\))» (J. Searle, 1995). Такие правила не просто регулируют уже существующее поведение, а создают новые социальные факты.
По словам Сёрла, «институциональные факты существуют только в системах конститутивных правил» (J. Searle, 1995). Эти правила зависят от коллективного признания (collective acceptance) и имеют принудительную силу13. Коллективное признание зависит от коллективной интенциональности (we-intentionality) — постулируемой Сёрлом когнитивной способности индивидов иметь сонаправленность мысли.
Сёрл считает, что институциональные факты — это статусные функции, присваивающие материальным объектам новый статус, а институты — это системы, делающие возможных создание и поддержанием статусных функций (J. R. Searle, 2015).
Принудительная сила и каузальность конститутивных правил исходят из их «деонтических сил» — создаваемых конститутивными правилами прав, обязанностей, полномочий, разрешений, требований и запретов. Например, факт «Этот человек — судья» наделяет его деонтической силой: правом выносить приговор, обязанностью соблюдать процедуру, полномочиями требовать показания. Эти полномочия имеют причинную силу, потому что мотивируют поведение. Люди признают эти полномочия и действуют в соответствии с ними, а также требуют их признания от других.
Сёрл подчеркивает, что деонтические силы создают мотивы для действия, которые не зависят от личных желаний. Люди платят налоги не потому, что сами хотят, а потому, что есть обязанность их платить, вытекающая из статуса гражданина/налогоплательщика. Каузальная сила конститутивного правила — это способность статусной функции (Y), присвоенной объекту (X) коллективным признанием людей, мотивировать их поведение через систему деонтических сил.
Интеллектуальные корни теории Сёрла уходят в аналитическую философию середины XX века. Он опирается на идеи Джона Остина, который в своей теории речевых актов ввёл понятие перформативов — высказываний, которые «создают» реальность (например, «объявляю вас мужем и женой”) (austin1962?). Сёрл развивает эту идею, показывая, что перформативы лежат в основе институциональных фактов (searle1969?). Другим ключевым интеллектуальным источником идей Сёрла послужил Людвиг Витгенштейн, чьи идеи о языковых играх и правилах (wittgenstein1953?) Сёрл адаптирует для различия между регулятивными и конститутивными правилами. Витгенштейн подчеркивал, что значение возникает из использования, а Сёрл применяет это к социальным институтам, где правила не просто регулируют, но формируют деятельность.
Влияние также заметно от Джона Ролза, который ввёл различение «практических» и «резюмирующих» правил (rawls1955?). Практические правила конституируют практику — задают структуру деятельности заранее и логически предшествуют самой практике. Ролз подчёркивает, что такие правила обосновываются целиком, а не обобщаются из частных случаев. Резюмирующие правила — это обобщения или эмпирические закономерности, выведенные из повторяющихся случаев для предсказания или упрощения. Они обосновываются через сумму утилитарных последствий отдельных действий. Сёрл расширяет эти идеи на социальную реальность: конститутивные правила формулируют логическую структуру практики («X считается Y в контексте C»), а регулятивные — описывают условную логику действия в отдельной ситуации («Если X, то делай Y»).
В более широком контексте теория Сёрла повлияла на социальную онтологию, интегрируя ее с философией разума: коллективная интенциональность — это биологическая способность, возникшая эволюционно, что, по мнению Сёрла, связывает сферу социального с естественными науками (J. Searle, 2010). В русскоязычном академическом дискурсе идеи Сёрла адаптируют для анализа власти и институтов, подчеркивая роль языка в создании нормативных структур (baidlaeva2014?; nikitin2019?).
Теория Сёрла также перекликается с критической теорией, хотя он отвергает редукционизм марксизма или структурализма. Вместо этого он предлагает натуралистический подход: социальные факты объективны эпистемически, несмотря на их субъективную онтологию — зависимость от ментальных состояний (searle2006?).
Будучи зависящей от понятия коллективных представлений и коллективной интенциональности, теория Сёрла не объясняет их строение и возникновение. Подобную натурализацию его проекта продолжают философы, близкие к эволюционной психологии (Gallotti, 2012; Gallotti & Frith, 2013; Tomasello, 2014) и теории «совместного действия» (joint action) в когнитивной науке (Paternotte, 2020b; Sebanz & Knoblich, 2021; Török, Pomiechowska, Csibra, & Sebanz, 2019; Vesper et al., 2017). Одна из основных проблем в этом поле — вопрос производности совместной интенциональности от индивидуальной (I-mode vs. we-mode).
Статус-функции — ключевой компонент теории Сёрла: они наделяют объекты или действия функциями, зависящими не от их физических свойств, а от коллективного принятия этих функций. Именно статусные функции создают «деонтические силы» — принудительную силу институтов. Например, статус «президент» наделяет индивида правом вето и обязывает других признавать его (J. Searle, 2010). Принудительная сила здесь — нормативная: она мотивирует поведение через обязательства, возникающие из коллективной интенциональности, а не внешнего принуждения.
В поздних работах Сёрл вводит «декларации статусных функций» — декларативные речевые акты, создающие реальность (например, объявление войны), подчеркивая роль языка в конституировании институтов (J. Searle, 2010).
1.2.1.1 Последователи Сёрла: уточнение природы коллективной интенциональности — [? как традиция серла решает проблему стабильности социальных институтов]
Последователи Сёрла развивают его идеи в социальной онтологии. Раймо Туомела фокусируется на “мы-аттитюдах” (we-attitudes), интегрируя их в теорию коллективного принятия: институты возникают из совместных интенций, но Туомела подчеркивает роль норм и санкций в поддержании принудительной силы (Tuomela, 2002; tuomela2007?). Фрэнк Хиндрикс, пересматривая роль конститутивных правил, отмечает их нормативность: они касаются статусов с нормативными атрибутами (import), а не только наделения физического объекта статусом, позволяя учитывать неявные институты без явного языка (Frank Hindriks, 2009, 2013).
В русскоязычном академическом пространстве идеи Сёрла в основном применяют к анализу власти, политики и культуры. Язык создает социальные институты с принудительной силой через перформативы, подчеркивая эволюцию от фактов как таковых к институциональным фактам (baidlaeva2014?). Г.Н. Гумницкий исследует минимальные условия политики в онтологии Сёрла, фокусируясь на коллективной интенциональности как основе политических институтов (gumnitskiy2020?). М.А. Никитин связывает язык и культуру в институциональном измерении, развивая идеи о деонтических полномочиях (nikitin2019?). В целом, последователи расширяют теорию, добавляя акцент на неявные правила и эволюционные аспекты, делая её более гибкой для эмпирических наук.
Что их всех объединяет? В стандартных аналитических формулировках, которые Франческо Гуала называет «Стандартной моделью социальной онтологии», социальная онтология описывает слабо ограниченные индивидуалистические основы социальных явлений и имеет три ключевых элемента (Guala, 2007), как их описывает Туомела (Tuomela, 2002):
- рефлексивность
- перформативность
- коллективная интенциональность.
Рефлексивность — идея о том, что социальные сущности в значительной степени состоят из убеждений об убеждениях. Такие убеждения могут быть в индивидуальными или групповыми, в зависимости от того, кто считается их носителем: разделяют «я»-режим и в «мы»-режиме (I-mode, we-mode). Некоторые философы утверждают, что фундаментальные убеждения, составляющие «ткань» социального, находятся в режиме «мы» и не сводятся к режиму «я» (Gilbert, 1992; Schmid, 2023; Tuomela, 2002). Однако существуют также более индивидуалистические описания рефлексивных убеждений, основанные на теории игр (Bicchieri, 2005; Guala, 2016a).
Перформативность — идея о том, что социальные сущности необходимо постоянно поддерживать, демонстрировать или воссоздавать, чтобы они продолжали существовать. Социальная реальность не существует самостоятельно «вовне» — её нужно постоянно воссоздавать и поддерживать (Law, 2004).
Коллективная интенциональность — идея о совместной направленности внимания и/намерения множества индивидов на явление. Именно это намерение и наделяет физические объекты статусом социальных и нормативно-нагруженных. Коллективная интенциональность представляется либо как производная от общих знаний и «я-убеждений» в форме «все знают, что все знают, что \(P\)», где \(P\) — социальный факт, например, социальная норма (Bicchieri, 2005), либо как базовое понятие, делающее общее знание избыточными. Более того, существуют попытки натурализовать коллективную интенциональность, показывая её несводимость к индивидуальной интенциональности (Gallotti, 2012; Rakoczy & Tomasello, 2007).
Согласно идеям рефлексивности и перформативности, наши классификации социального мира помогают его устанавливать и поддерживать, тогда как несоциальные объекты безразличны к нашим классификациям, как это предлагает Ян Хакинг , выделяя интерактивные и нейтральные виды14(Hacking, 1999). Природные объекты не меняют своего поведения в зависимости от этих классификаций, в отличие от социальных объектов. Если социальные сущности состоят из убеждений об убеждениях, то их природа зависит от этих убеждений, и если убеждения меняются, то и социальные сущности — тоже. Для этого индивидам необходимо обладать коллективной интенциональностью в отношении этих убеждений. Например, чтобы деньги существовали, сообщество должно иметь коллективное намерение верить, что определенные физические объекты могут использоваться в качестве средства обмена.
1.2.1.2 Критика традиции конститутивных правил
Теория Сёрла часто подвергалась критике: из-за недостаточности деонтических сил для объяснения следования правилам (Guala & Hindriks, 2015), отсутствия механизма возникновения конститутивных правил (Frank Hindriks, 2009), переоценки роли рационального коллективного признания и «сверхинтеллектуализма» (Gilbert, 1992) и других. Помимо критики внутри философии и социальной онтологии, теория Сёрла подвергалась критике в философии социальной науки — особенно за постулирование примата социальной онтологии над методологией изучения социальной реальности (Kincaid, 2021; Lauer, 2019; Little, 2020; Ross, 2023). Однако почему традиции Сёрла недостаточно для объяснения именно стабильности институтов? Как считают критики традиции и теории Сёрла, в частности, есть несколько причин:
- поверхностное различение типов правил;
- переоценка роли языка и коллективного признания;
- отсутствие объяснения механизма создания и поддержания стабильности института.
Дферрфи Уорнок был одним из первых, кто прокомментировал идеи Сёрла. Она считал, что различение типов правил у Сёрла — лишь лингвистическое: действия конститутивны или регулятивны относительно описания, а не онтологически (warnock1971?). Подобную линию продолжили Дэвид-Хиллел Рубен (ruben1997?) и, что интересно, социолог Энтони Гидденс. Последний считает различение конститутивных и регулятивных правилам искусственным: все правила, по его мнению, имеют оба аспекта. Например, правило «работники должны отмечаться в 8:00» регулирует поведение, но конституирует индустриальную бюрократию (giddens1984?). Миллер (miller2001?) и Людвиг (ludwig2017?) переопределяют конститутивные правила как регулятивные. В частности, Людвиг называет конститутивные правила такими регулятивными правилами, намеренное следование которым и конституирует управляемую им активность. Иначе говоря, конститутивные правила — это просто целенаправленно следуемые регулятивные правила.
Фрэнк Хиндрикс ставит под сомнение акцент Сёрла на языке как источнике всей институциональной власти. Он говорит, что различение регулятивных и конститутивных правила — грамматическое: регулятивные правила формулируются с использованием явных императивов или деонтических терминов, в то время как конститутивные правила — с помощью конструкции «считается как», но оба содержат одно и то же нормативное содержание (Frank Hindriks, 2009). Нормативные обязательства явно присутствуют в регулятивных правилах («Сделай X» / «Если Y, сделай X»), тогда как конститутивные правила подразумевают эти обязательства, не заявляя о них явно. Таким образом, место нормативности на самом деле не отличается между ними; отличается только языковое представление. Несмотря на то, что он предлагает логическую схему сводимости одних к другим, он также считает, что это не умаляет онтологического значения конститутивных правил. Даже если лингвистически они похожи, то онтологически (или, скорее, функционально) — нет, утверждает Хиндрикс.
Хиндрикс показывает, что институты могут существовать без явных деклараций. В
Нам близка точка зрения Уорнока — что различение типов правил зависит от описания, однако вместе с тем, по нашему мнению понятие правил в принципе не вполне способно «схватить» полноту социальной онтологии. Мы согласны, что в социальной онтологии есть место созданию новых сущностей, и в этом — привлекательность интуиций Сёрла о конститутивном правиле и деонтических силах. Однако несмотря на то что отношение учреждения (constitution), как отмечает Линн Бейкер, — это «двигатель новизны», который вводит новые сущности в социальную онтологию (Baker, 2019), понятие конститутивного правила, по нашему мнению, не вполне схватывает это отношение, потому что делает акцент на результате (готовом правиле), а не механизме и динамике учреждения социального института.
Другая лакуна в теоретической традиции Сёрла — переоценка коллективной интенциональности и языка, или «сверхинтеллектуализм», как это назвала Маргарет Гильберт (Gilbert, 1992). Институты, по мнению Сёрла, создаются только целенаправленными речевыми актами. Однако это создаёт трение — можно ли сказать, что наличие такого акта необходимо и достаточно для существования института? Пока люди эволюционно не развили способности к речи, следуя этой логике, институты были невозможны в принципе. Однако сложно отрицать, что эволюционные предки обладали способностью к социальной координации, ведь они, судя по данным когнитивной археологии, организовывали «огненные станции», где был ответственный за разведение огня в укрытии и «прихожане»15 (Sterelny, 2021). Мы могли бы сказать, что эти «станции», наряду с другими формами социальной организации, наделяли людей ролями, статусами и деонтическими полномочиями. Согласно Сёрлу, это не институт, поскольку здесь нет явной декларации статусной функции, а вот согласно Хиндриксу — институт, поскольку есть коллективное принятие и деонтические силы.
Франческо Гуала критикует онтологическую зависимость институтов Сёрла от интенций и языка. Такой подход предполагает инфаллибилизм — что люди не могут ошибаться в своих верованиях относительно того, чем является тот или иной институт по существу, поскольку последний зависит от декларации статусной функции, определяемой самими людьми (Guala, 2016a). С точки зрения философии науки, это противоречит реализму и преграждает путь к научному изучению сущности социальных институтов. Гуала выдвигает тезис каузальной зависимости институтов (в противовес онтологической зависимости) от верований и намерений индивидов. Это значит, что верования и намерения играют роль в функционировании институтатов, но не являются их условиями возможности. Это автоматически означает, что Гуала ставит во главу угла не коллективные намерения и статусные функции как видовые свойства института, поскольку если они не «создают» институт, то это делает что-то другое.
Помимо этого, Гуала совместно с Хиндриксом показывают, что люди могут игнорировать правила и законы (Frank Hindriks & Guala, 2015). Они приводят пример французского закона 1799 года, запрещавшего женщинам носить брюки и «одеваться как мужчина», который был официально отменён лишь в 2010 году. Неудача этого «конститутивного правила» — а французские женщины продолжали носить брюки, несмотря на этот закон — показывает хрупкость определения социальных институтов исключительно через правила. Как и Авнер Грейф, авторы считают, что правила не объясняют мотивацию действия, поскольку любое правило — конститутивное или регулятивное — неизбежно требует (и оставляет в стороне) механизмы приведения себя в исполнение (enforcement).
В целом, традиция Сёрла не объясняет генезис и эволюцию институтов — например, денег из бартера. Видовая характеристика института для этой традиции — наличие статусной функции, которая возможна только при наличии языка и коллективного намерения (atiyah1981?).
<!–> The simplest test for whether a phenomenon or fact is genuinely institutional is to ask, Does its existence imply deontic powers, powers such as those of rights, duties, obligations, requirements, and authorizations? (Searle 2010: 91; see also 8, 9)–>
На наш взгляд, спор о различении типов правил, как и другие аспекты критики, имеют под собой несколько вопросов:
- каковы условия, при которых нечто считается социальным фактом (counts as)?
- каковы условия, при которых нечто фактически функционирует как социальный факт?16
- что значит «функционировать как социальный факт»?
- необходимо ли, чтобы нечто считалось социальным фактом, чтобы функционировать как социальный факт?
- Традиция Сёрла детально отвечает на первый вопрос — если сообщество коллективно наделяет объект статусной функцией, которая имплицирует деонтические силы.
- Однако мы можем сказать, что для Сёрла первый и второй вопрос — одно и то же. И это пытаются опровергнуть исследователи вроде Гуалы, показав онтологическую независимость институтов от верований и намерений. Именно поэтому Гуала и Сёрл непримиримы в своём споре: для последнего суть института — в невозможности отличить «считается» от «функционирует», а для первого — в функционировании без «считается» (Guala, 2018; J. R. Searle, 2015).
- Ответ на третий вопрос — «что значит функционировать как социальный факт» — дать сложнее всего, однако традиционно это означает оказывать каузальное давление и принудительную силу, быть внешним ограничением (Durkheim, 2014; Guala, 2012).
- На четвёртый вопрос — необходимо ли, чтобы нечто считалось социальным фактом, чтобы функционировать как социальный факт — Сёрл ответил бы положительно, а другие вроде Гуалы или Брайана Эпштейна — отрицательно, поскольку наличие коллективных намерений не совпадает с наличием принуждения. В частности, Эпштейн приводит пример с банкроством сети кофеен: если в одну ночь система охлаждения выходит из строя в сразу в нескольких кофейнях, и это заставляет испортиться продукты и снаряжение, то на утро сеть кофеен не способна вести бизнес, и банкротится (Epstein, 2015, pp. 46–47). Это означает, что институциональный факт «сеть кофеен является банкротом» не зависит от конкретных верований.
Несмотря на критику, теория Сёрла остается влиятельной в философии науки, предлагая рамку для анализа, как социальные институты с принудительной силой возникают из коллективных практик и языка. Теперь перейдём к подходу регулятивных правил.
1.2.2 Институт как регулятивные правила
Подход к институтам как регулятивным правилам делает акцент на регуляции поведения, а не на создаваемых статусах с деонтическими силами. Эти правила известны всем в сообществе и ограничивают возможные способы поведения в разных ситуациях, создавая повторяемый и масштабируемый социальный порядок.
Как и в подходах институтов-как-равновесий и конститутивных правил, подход регулятивных правил включает в себя идею принуждения. Однако если в первом случае оно либо элиминировано (в играх координации Льюиса-Вандершраафа-Скирмса), либо эндогенизировано (в играх кооперации Грейфа), а во втором — имплицировано деонтическими силами статусных функцих, то подход институтов-как-правил рассматривает принуждение к следованию правилам отдельно от содержания и процесса формирования самих правил (Greif & Kingston, 2011).
Принуждение к следованию правилам имеет «стоимость издержек». И институт определяется как структура правил — формальных и неформальных — и структура принуждения к следованию им (Greif & Kingston, 2011). Согласно Оливеру Уильямсону (williamson2000?), «транзакционные издержки» — это издержки в процессе стратегического взаимодействия, связанные с ограниченной рациональностью и оппортунизмом участников. Важно, что эффективные правила (или «структуры управления», как их называет Уильямсон) ведут к снижению таких издержек. Эффективность институтов связана с тем, насколько хорошо они минимизируют трансакционные издержки.
Экономист Дуглас Норт — один из заметных представителей подхода институтов-как-правил. Он определяет институты как «правила игры» или «созданные человеком ограничения поведения» и делит их на формальные (законы, бюрократия) и неформальные (традиции, нормы, конвенции). Оба типа принудительны и регулируют поведение, потому что подкреплены силой. Эти «правила игры» структурируют стимулы и ограничения человеческого взаимодействия (North, 1990).
Для Норта институт изменяет стратегическое пространство, если он:
- увеличивает издержки отклонения для игроков;
- повышает предсказуемость санкций;
- снижает транзакционные издержки исполнения.
Хотя Норт не формализует эту идею, её можно было представить как изменение функции выплат для игроков: \[ \pi_i'(s) = \pi_i(s) - \delta_i(s) \] где \(\delta_i(s)\) определяется институциональной средой, а не субъективными убеждениями агента. Хотя Норт признаёт роль идеологий и убеждений, они выступают скорее как факторы, влияющие на эффективность принуждения, чем как конститутивные элементы института. В этом смысле Норт радикально расходится с традицией Льюиса: институты у него не редуцируются к равновесиям ожиданий, поскольку без материальных и организационных механизмов санкционирования равновесие остаётся хрупким и локальным.
Наиболее полный пример подхода регулятивных правил можно найти в теории Элинор Остром (Crawford & Ostrom, 1995; ostrom2005?). Она изучала сообщества, которые без внешнего надзора со стороны муниципалитета или государства регулируют использование общих ресурсов.
Согласно эмпирическим наблюдениями Остром, сообщества способны поддерживать социальный порядок с помощью:
- мониторинга — слежения за исполнением принятых правил,
- градуированных санкций, где размер санкции зависит от «тяжести» и повторяемости нарушения,
- локальных правил применения наказаний — конкретного содержания правил.
Санкции Остром выражает формально как дельта-параметры: \[ \begin{table}[h] \centering \begin{tabular}{|c|c|c|} \hline & $C$ & $D$ \\ \hline $C$ & $-1,-1$ & $-3,0$\\ \hline $D$ & $0,-3$ & $-2,-2$ \\ \hline \end{tabular} \begin{tabular}{|c|c|c|} \hline & $C$ & $D$ \\ \hline $C$ & $-1,-1$ & $-3,0-\delta$\\ \hline $D$ & $0-\delta,-3$ & $-2,-2$ \\ \hline \end{tabular} \caption{\label{fig:delta-transformation-coordination-game}{Delta parameter transforming cooperation game into coordination game.}} \end{table} \]
Подобные параметры трансформируют игру на кооперацию вроде «Дилеммы заключённого» в игру на координацию. Однако в отличие от подхода Грейфа, у которого также есть модификаторы платежа, у Остром санкции — это параметры, которые исследователь добавляет в матрицу выигрышей, описывая экзогенно заданные «издержки мониторинга и принуждения». Она не выводит эти издержки из структуры взаимодействия самих агентов, как это делает Грейф. Вместо этого они постулируются как часть институционального контекста. У Грейфа, напротив, санкция — это эндогенное равновесное явление. Наша позиция, развиваемая в следующих главах, будет ближе к позиции Грейфа.
Остром формулирует концепцию иерархии правил, выделяя четыре уровня:
- операционные (индивидуальное поведение),
- правила коллективного выбора,
- конституционные,
- мета-конституционные.
Каждый следующий уровень определяет правила выбора правил на предыдущем уровне. Так, чтобы изменить операционные правила, нужно обсудить это на уровне правил общего выбора. К тому же, правила более высокого уровня «дороже» изменить — это видно на примере изменения конституции. Подобная идея иерархии правил также есть у Норта. Сразу можно заметить, что подобная идея напоминает бесконечный регресс и проблемы «охраны охранников» (who guards the guardians), согласно которой гарант соблюдения правил вам нуждается в надсмотре из-за отсутствия основания для доверия.
–>
Как замечают Грейф и Кингстон, теории регулятивных правил фокусируются на проблемах выбора эффективных правил. С этим связаны определённые эмпирические успехи представителей этого подхода. Например, Элликсон предполагает, что группы, в которых информация циркулирует легко, склонны создавать эффективные неформальные правила (ellickson1991?). А согласно Остром (ostrom2005?), наиболее эффективные правила создают группы с небольшим числом ответвленных за решение, большими временными горизонтами и схожими интересами участников. В теории Бруссо и Райно (brousseau2008?) новые правила появляются как неформальные, локальные и подвижные порядки, которые «соревнуются» за последователей. Успешные правила распространяются и по мере распространения становятся более глобальными и обязательными, «укрепляясь» в формальные правила.
Согласно Грейфу и Кингстону, исследования Эликсона (ellickson1991?) и Остром (ostrom2005?) показывают проблему немасштабируемости неформальных правил при росте популяции. В качестве примера они приводят eBay, в котором при быстром росте в конце 1990-х перестало хватать механизма доверия продавцу, и руководство ввело формальные санкции против обмана и добавило инструменты для разрешения споров (Greif & Kingston, 2011).
Однако акцент на эффективности правил имеет и обратную сторону. Поскольку для подхода институтов-как-правил принуждение к исполнению правил — отдельный вопрос от их содержания, поведение, не согласующееся с формальными правилами, автоматически объясняется неформальными правилами (Greif & Kingston, 2011).
Проблема в том, что неформальные правила имплицитны, и их сложно определить и измерить. Объяснять поведение неформальными правила, по мнению Грейфа и Кингстона — неверифицируемо. Сама Остром (ostrom2005?) отмечает, что много писаных утверждений имеют форму правила, но не влияют на поведение: они — правила-по-форме, но не правила-в-использовании.
Например, формальное ограничение скорости на шоссе — 65 миль/час, однако многие ездят со скоростью 75 миль/час, и их не штрафуют. Однако при превышении 75 миль/час можно уже получить штраф. Грейф и Кингстон приводят этот пример, чтобы проиллюстрировать разницу между формальными и неформальными правилами и сложность объяснения следованию неформальным правилам (Greif & Kingston, 2011).
Франческо Гуала объясняет этот случай тем, что формальное правило — это сигнал, показывающий, какое поведение ожидается, но никто из водителей не верит, что оно будет соблюдаться: штрафовать за пренебрежительно небольшое превышение — избыточно и расточительно с точки зрения полицейских. Гораздо логичнее штрафовать за большее нарушение и использовать стохастическую стратегию: штрафовать каждую машину, превышающую 75 миль/час; штрафовать некоторые машины, едущие около 75 миль/час; не штрафовать машины, едущие 65-70 миль в час (Frank Hindriks & Guala, 2015).
Однако Остром и Кроуфорд считают, что только правила помогают определить общее основание для стратегий агентов. Это смещает акцент с результата координации на её источник — общее понимание ограничений ситуации (Crawford & Ostrom, 1995).
Несмотря на то, что подход институтов-как-правил рассматривает и правила, и принуждение к их исполнению как структурные элементы института, он ограничивается формированием институтов, а не мотивацией людей следовать правилам. Иначе говоря, принуждение к следованию правилам не рассматривается как мотивация.
Согласно Грейфу и Кингстону, схождение мотивации (aligning motivation) — центральная проблема стабильности института в противовес проблеме выбора правил, минимизирующих «издержки», как это есть в подходе институтов-как-правил (Greif & Kingston, 2011). Это так, поскольку эффективность института, выразимая как низкие транзакционные издержки — это желаемый результат, а не проблема сама по себе. Проблема — в механизме, который создаёт эту эффективность, и для Грейфа и Кингстона это схождение мотивации агентов. Однако Остром и Кроуфорт могли бы возразить, что они не отказываются от равновесного подхода, а только идут «вглубь», рассматривая источник разделяемого понимания стратегий игроков. С нашей точки зрения, это более верный ход, поскольку, как мы показали ранее, институты-как-равновесия предполагают правила как решения проблемы выбора равновесия.
Грейф и Кингстон считают, что несмотря на то, что правило может координировать действия агентов, в конечном счёте именно ожидаемое поведение других мотивирует собственное поведение агента, а не абстрактное правило. Мы с этим согласны, но эти авторы упускают из виду, что ожидания поведения других опираются на что-то.
Отличительная черта подхода институтов-как-правил — его функционалистская перспектива. Институты отзывчивы к интересам и нуждам своих создателей, неважно, созданы ли они намеренно или спонтанно (Greif & Kingston, 2011). Это значит, что правила по определению нацелены на решение определённой проблемы.
Стоит отметить, что различение правил и равновесий в экономике — не онтологическое, а объяснительное. Представители каждого направления не отрицают существования правил или равновесий в своём подходе, а делают акцент на источнике объяснительной силы для стабильности института. Например, у Грейфа как представителя институтов-как-равновесий сами равновесия зависят от разделяемых агентами правил.
Рассмотрев оба подхода к институтам — равновесный и правилоориентированный — и выявив их лакуны, мы можем перейти к синтетической теории правил-в-равновесии, которая пытается преодолеть многие лакуны каждой теории по отдельности.
1.3 Институт как правила-в-равновесии: теория Франческо Гуалы
Франческо Гуала и Фрэнк Хиндрикс предлагают синтез правило-ориентированных и теоретико-игровых подходов к институтам (Guala & Hindriks, 2015). Они называют его теорией правил-в-равновесии (ПвР) и говорят, что он может служить унифицированной социальной онтологией. Эта теория — самая современная и широко обсуждаемая попытка унификации социальной онтологии.
В этой теории регулятивные правила находятся в координационных равновесиях, символически репрезентированных терминами вроде «денег» или «брака» (F. Hindriks & Guala, 2015). Это значит, что агенты выбирают стратегии, основываясь на знании регулятивного правила как устройства корреляции, «рекомендующего» наилучший выбор для агента. Например, «пасти скот, если находишься к югу/северу от реки» — регулятивное правило, помогающее решить территориальный спор и работающее как устройство корреляции. Оно помогает каждому агенту выбрать оптимальную стратегию.
Теория ПвР соединяет подходы, основанные на регулятивных правилах, равновесиях стратегических игр и конститутивных правилах. Первые два дополняют друг друга и составляют собственно правила‑в‑равновесии, а третий дополняет его, предоставляя символическую репрезентацию — возможность описывать поведенческие паттерны вида «Если X, делай Y» как термин вроде «денег» или «брака».
Подход, основанный на правилах — это экономические теории, которые мы рассматривали выше. В них правила направляют и ограничивают поведение в социальном взаимодействии. Они — «человечески созданные ограничения» социальных взаимодействий (North, 1990). Равновесный подход рассматривает институты как поведенческие регулярности и, что наиболее важно, как решения проблем координации (традиция Льюиса) и кооперации (традиция институциональной экономики). Подход конститутивных правил видит институты как системы правил, присваивающих статусы физическим объектам и наделяющих их деонтическими силами (традиция Сёрла).
Авторы утверждают, что концепции конститутивных правил и равновесных объяснений, распространённые в экономике, могут быть интегрированы с помощью понятия КР. Их ключевая идея состоит в том, что конститутивные правила не являются онтологически фундаментальными, а могут быть реконструированы из систем регулятивных правил, действующих в условиях координационных равновесий в повторяющихся играх. Также можно преобразовать любое конститутивное правило обратно в регулятивную форму. Предполагаемая новизна конститутивных правил оказывается вторичной: они маркируют то, что уже установлено стратегиями агентов. Институты, согласно теории правил-в-равновесии, «состоят из регулятивных правил», и конститутивные формулировки могут быть опущены без потери содержания:
Ключевая идея заключается в том, что конститутивные правила можно создавать по своему усмотрению, используя более фундаментальные строительные блоки — регулятивные правила или теоретико-игровые стратегии — путем введения институциональных терминов (Frank Hindriks & Guala, 2015, p. 477).
В КР каждый агент следует условной стратегии вида «если \(X\), делай \(Y\)». Гуала и Хиндрикс отмечают, что это и есть регулятивное правило, как оно встречается у Сёрла (Guala & Hindriks, 2015). Например, два пастуха могут принять стратегии «пасти скот, если находишься к северу от реки» и «пасти скот, если к югу», тем самым решая проблему координации. Стратегия каждого агента эквивалентна регулятивному правилу, предписывающему, что делать при данных обстоятельствах. Следовательно, согласно Гуале и Хиндриксу, институты есть совокупности регулятивных правил, образующих устойчивое КР.
Более того, привычная конститутивная формулировка «X считается Y в контексте C» может быть выведена из регулятивного правила как сокращённая запись. Об этом мы упоминали ранее, говоря про Хиндрикса. Гуала и Хиндрикс показывают, что, вводя новые институциональные термины, можно преобразовать регулятивные условные конструкции в конститутивную форму:
Участок земли к северу от реки (X) считается собственностью племени Нуэр (Y) в контексте локализации соседства племён Нуэр и Динка(C)
По мнению авторов, подход, основанный на правилах, недостаточен, поскольку не может объяснить, почему одни правила соблюдаются, а другие — нет. Чтобы решить эту проблему, необходим равновесный подход, демонстрирующий стратегический характер следования правилам.
Гуала и Хиндрикс иллюстрируют это, сравнивая две парадигмальные игры из теории игр: «дилемму заключённого» и «охоту на оленя».
Хотя взаимное предательство в дилемме заключённого — равновесие Нэша, это не социальный институт, поскольку оно не является самоподдерживающимся из‑за независимости стратегий игроков. Напротив, обоюдное решение охотиться на оленя, а не на зайца (оба варианта также являются равновесиями Нэша) — это, по мнению Гуалы и Хиндрикса, уже институт, поскольку для достижения большего совместного выигрыша требуется корреляция стратегий игроков. Последнее означает, что стратегия является «заметной» и выгодной для игроков, что и объясняет, почему одни правила соблюдаются, а другие — нет.
Однако, как отмечают авторы, понятие коррелированных стратегий игроков как объяснительный принцип устойчивости институтов также недостаточно, поскольку слишком широко. Авторы приводят пример решения проблем координации животными с помощью коррелирующих устройств при отсутствии институтов. Например, самцы бабуинов, львов, ласточек, бабочек и других видов демонстрируют поведенческую модель, которую можно описать в терминах КР: самцы патрулируют территорию для спаривания с самками и вступают в ритуальные бои с нарушителями при встрече. Эта пара стратегий минимизирует возможный ущерб для обеих сторон и позволяет доминирующему самцу занимать территорию и спариваться (smith1982?).
Согласно авторам, различие между «животными конвенциями» и человеческими социальными институтами заключается в спектре сигналов, на которые можно реагировать. Набор сигналов, на которые могут реагировать животные, значительно уже, чем у людей, из‑за тесной связи стимула и реакции, необходимой для достижения координации. Однако, как отмечают Гуала и Хиндрикс с опорой на идеи Кима Стерельны (Sterelny, 2003), люди способны разъединять стимул и поведение с помощью репрезентации окружающей среды, обусловливающей поведение. Иначе говоря, люди, по мнению авторов, способны изобретать и следовать различным правилам при наличии одного и того же коррелирующего устройства.
По мнению Гуалы и Хиндрикса, правила — это репрезентации стратегий в заданной игре. Эти репрезентации не только служат символическими маркерами свойств равновесий, но и значительно экономят когнитивные усилия самим агентам. Как отмечает экономист Масахико Аоки, на идеи которого опираются Гуала и Хиндрикс:
Институт — это самоподдерживающийся, заметный паттерн социального взаимодействия, репрезентированный значимыми правилами, которые знает каждый агент и которые инкорпорированы как разделяемые агентами убеждения о способах разыгрывания игры (Aoki, 2007, p. 6).
Тот же Аоки очерчивает институт как двухуровневую систему, где стратегический выбор агентов создаёт объективное состояние игры, это состояние выражается публичной репрезентацией, эта репрезентация способствует формированию ожиданий и верований, которые служат источником стратегического выбора агентов (Aoki, 2011). Гуала и Хиндрикс согласны с такой механикой функционирования института:
-------------------- --------------
стратегический выбор создаёт → состояние игры
-------------------- --------------
↑
мотивирует выражено как
↓
------------------ -----------------------
верования/ожидания ← выведены публичная репрезентация
------------------ из -----------------------
ИНДИВИД ОБЩЕСТВО
В ответ на ПвР и Сёрл утверждает, что для конститутивных правил необходима нормативность, и конститутивные правила принципиально несводимы к регулятивным. поскольку между ними есть онтологическая разница (J. R. Searle, 2015). Гуала и Хиндрикс же защищают позицию, что конститутивные правила фактически выводимы из регулятивных и, следовательно, редуцируемы к последним (F. Hindriks & Guala, 2015). Однако если для Гуалы важен объяснительный редукционизм, согласно которому и нормативность, и стабильность института объясняются равновесием, то для Хиндрикса в его поздних работах подобный редукционизм уже неприемлем (F. Hindriks, 2019; Frank Hindriks, 2022). Сёрл считает, что чтобы действительно редуцировать конститутивные правила к регулятивным, нужно показать, как регулятивные правила на одном «уровне» генерируют деонтические силы «на уровень выше». Сёрл считает, что это невозможно. Однако в Главе 4 мы предложим вариант, как это может быть возможно.
Важно, что Гуала переосмысляет проект Серла в теоретико-игровых терминах, не отказываясь от его интуиций. Он признаёт, что институциональные статусы влияют на то, как мы классифицируем мир и действуем в нём, но настаивает, что эти статусы всегда согласованы с поведенческими регулярностями, выраженными как КР. Тем самым акцент Серла на конструкции «считается как» можно восстановить как эпифеномен координации — кажущуюся творческую силу языка, которая в действительности является не более чем эффектом коррелированных стратегических профилей. Как формулируют Гуала и Хиндрикс:
… язык — лишь одно из множества координационных устройств и не обладает большей творческой силой, чем подбрасывание монеты или любое другое событие, которое игроки могут использовать для координации своих решений (Guala & Hindriks, 2015).
Гуала и Хиндрикс утверждают, что нормативные аспекты можно моделировать как модификации выигрышей базовой игры, аналогичные \(\delta\)-параметрам у Остром (Crawford & Ostrom, 1995). Нормативное правило добавляет стимулы или санкции, делающие определённые действия — например, кооперацию — более привлекательными. На практике это означает, что если агенты получают «право» или несут «обязанность», мы представляем это, вставляя издержки или выгоды в матрицу выигрышей. Это преобразует игру с ненулевой суммой в координационную игру, где эффективное равновесие становится более заметным.
Гуала показывает, что добавление таких нормативных издержек может создавать новые равновесия, ранее отсутствовавшие, или делать социально оптимальный исход устойчивым. Важно, что эти модификации не требуют введения отдельной онтологической категории помимо стандартных инструментов теории игр. Нормативные силы просто становятся частью равновесной структуры: они обеспечивают координацию, изменяя стимулы. Гуала и Хиндрикс демонстрируют, что любое статусное правило — например, право пользоваться, передавать или исключать — может быть переформулировано как регулятивное правило после включения нормативных полномочий.
По сути, Гуала и Хиндрикс поддерживают трансформационный взгляд: любой институт, описываемый конститутивным правилом, может быть равным образом описан как набор регулятивных норм, включающих необходимые разрешения и запреты. Само существование статуса \(Y\) просто обозначает определённые равновесные отношения между агентами, стоящие «за ним». Переводя статусные функции Серла в терминологию равновесий, унифицированная онтология связывает институциональные «долженствования» со стратегической координацией.
1.3.2 Критика теории правил-в-равновесии
Несмотря на инновационность, теория Гуалы и Хиндрикса не лишена критики, поскольку сведение конститутивных правил к равновесиям, по мнению оппонентов, упускает важные аспекты социальной реальности. Среди линий критики можно выделить:
- Пренебрежение материальными и историческими аспектами
- Нередуцируемость нормативности
- Переоценку роли координации
Кен Бинмор утверждает, что реалистичные модели институтов предполагают повторяющиеся игры, поскольку а реальности взаимодействия повторяются. И есть два способа их смоделировать: рациональный и эволюционный. Рациональный, представленный Льюисом, Бинмор критикует, говоря, что требование общего знания для рабочей конвенции нереалистичное, а сам подход игнорирует историю (Binmore, 2015).
Также Бинмор, соглашаясь с Гуалой и Хиндриксом, считает, что устройства корреляции важны. Однако он настаивает, что они важны настолько, что их структура должна быть предметом детального рассмотрения. Нужно рассматривать равновесие Нэша в расширенной игре, а не коррелированное равновесие в базовой. В этом смысле критика направлена на отсутствие эксплицитной динамической формы игры.
Рабинович хвалит Гуалу за широкий синтез, но высказывает опасения по поводу сосредоточенности на понятии равновесия. Он указывает, что трактовка институтов как «правил‑в‑равновесии» может искажать их онтологию, игнорируя материальные субстраты и историю (Rabinowicz, 2018). Многие институты, такие как университеты, денежные системы, рынки и традиции, включают конкретных людей, практики и блага, а не только абстрактные стратегии. Материальная основа разыгрываемых игр — например, студенты и аудитории в университете, — по утверждению Рабиновича, является неотъемлемой частью институтов, и её нельзя абстрагировать, не проигнорав «базовую онтологию» моделируемых явлений.
Хотя мы согласны, что всегда есть конкретные люди и практики со своей материальной основой, включение «базовой (или народной) онтологии» несущественно для объяснения структуры социальной онтологии, возникновения и устойчивости её ключевых элементов. Также можно сказать, что теория Гуалы уже учитывает подобные «народные» онтологии в виду Y-понятий (деньги, брак и т.д.).
Другой аргумент Рабиновича — что множество возможных КР шире множества РН. Это усложняет, а не упрощает проблему выбора равновесия, поскольку существует бесконечное количество возможных вероятностных распределений, способных порождать множество КР‑конфигураций.
Сёрл критикует ПвР, говоря что равновесия не объясняют деонтическую силу и что невозможно редуцировать конститутивные правила к регулятивным. Он начинает с того, что институциональные факты — это статусные функции, присваивающие материальным объектам новый статус, а институты — это системы, делающие возможных создание и поддержание статусных функций. Он делает сильное утверждение, что любая теория институтов — это теория статусных функций (J. R. Searle, 2015, p. 506).
Согласно Сёрлу, равновесный подход не способен объяснить деонтологию: права и обязанности, служащие определяющей чертой институциональных фактов. При этом он разводит нормативность и деонтическую силу: любое правило нормативно, но не любое создаёт, например, обязательства. Для Сёрла «способность создавать обязательства и права» — определяющее свойство институтов, которое равновесный подход, по его мнению, не схватывает.
Помимо этого Сёрл имплицитно относится к равновесию как чему-то оптимальному и приводит пример федерального закона США 1862 года о частной собственности: что несмотря на закон, люди все равно находили способы его обойти, и это, по мнению Сёрла, не может быть «равновесием Нэша».
Сёрл считает, что чтобы редуцировать конститутивные правила к регулятивным, нужно показать, как регулятивные правила на одном «уровне» генерируют деонтоические силы «на уровень выше». Сёрл считает, что это невозможно.
Роверси менее радикально отстаивает важность конститутивных правил и тоже критикует редукционизм теории (Roversi, 2021). Трактовка конститутивных правил как «сжатых» регулятивных лишает их нормативной сущности. С его точки зрения, этот взгляд не объясняет, почему индивиды чувствуют себя связанными институциональными нормами. Роверси настаивает, что нельзя уловить смысл статуса (например, профессора) одними лишь условными правилами, поскольку они подразумевают более сложное понятие нормативности.
В недавних работах Хиндрикс развивает собственную ветку теории ПвР и критикует Гуалу по тем же основаниям, что Сёрл и Роверси — что инструментальная рациональность равновесий не схватывает нормативности и деонтических оснований следования правилам (F. Hindriks, 2019). В концепции Хиндрикса, которую он называет «правила-и-равновесия», социальные институты — это управляемые нормами социальные практики. Он утверждает, что моделирование социальных норм как санкций, налагающих издержки за их нарушение, недостаточно для восприятия норм агентами как легитимных. В его концепции есть два вида правил: одни создают пространство для игры, вторые его регулируют, что очень похожие на различение конститутивных и регулятивных правил Сёрла.
Согласно Хиндриксу, инструментальный подход не схватывает мотивацию самими нормами, а не издержками её нарушения. Это проблема восприятия агентами стратегических ограничений равновесий как легитимных. Именно нормативные ожидания, по мысли Хиндрикса, и особенно нормативные убеждения, дополняют санкции в качестве источника нормы и её восприятия как легитимной. Социальная норма управляет практикой, если её участники в значительной степени мотивированы следовать её правилу. В этом смысле Хиндрикс разводит нормативность и равновесия. Точнее, он включает нормативность как условие равновесия, что сближает его подход с Биккиери, на работы которой он опирается, а также с Гинтисом.
Хиндрикс чётко разделяет нормы и конвенции: соблюдение норм дополнительно мотивировано, а конвенции подкрепляют сами себя. Биккиери сформулировала эту разницу в терминах личной выгоды и общего интереса (Bicchieri, 2005). Они совпадают в конвенциях и не совпадают в нормах. Это означает, что конвенции могут существовать без норм. Но могут ли нормы существовать без конвенций? Экспериментальные данные Гуалы и Бреннаа говорят, что нет — конвенции обретают нормативные черты в процессе повторяющейся игры (Brennan, Eriksson, Goodin, & Southwood, 2013; Guala & Mittone, 2010).
На наш взгляд отношение нормы, конвенции и института — недоисследованное. Потому что хоть Хиндрикс и говорит, что институт — это нормоуправляемая практика, и что норма — это убеждение о применимости правила в текущем контексте, почему-то его теория (как и теория Гуалы) не способна точно объяснить место и роль каждого из этих понятий и остаётся на уровне метафоры. Мы вернёмся к этой проблеме подробнее в следующей главе, когда будем обсуждать онтологический статус правил в ПвР.
Также мы согласны, что проблема легитимности, о которой говорит Хиндрикс, важна для социальных институтов, однако не вполне ясен статус легитимности как условия возможности института. Насколько она необходима и достаточна, чтобы нечто было институтом? По мысли Хиндрикса, только легитимная норма, мотивирующая поведение, может считаться институтом. Однако, по нашему мнению, подобное утверждение подвержено той же ошибке, что и теория Сёрла — оно не разделяет «считаться легитимным группой людей» и «функционировать как если бы норма была легитимной». В этом смысле подход Хиндрикса продолжает антиреалистическую направленность теории Сёрла.
Ванершрааф критикует ПвР за слишком широкую трактовку институтов и отсутствие механизмов коррекции неравновесных состояний (Vanderschraaf, 2017). С его точки зрения, координационные равновесия не вполне отражают суть институтов: не все конвенции — социальные институты, поскольку последние предполагают права, обязанности и несимметричные роли.
Чтобы показать, что не все конвенции — институты, Вандершрааф использует игру на доверие. В ней Клиент либо доверяет Инвестору свои деньги в размере 1 единицы (\(T\)), либо нет (\(M\)). Если Клиент доверяет, Инвестор использует эти деньги, чтобы создать \(2\alpha \gt 2\) и после этого либо сотрудничает (\(C\), cooperate) c Клиентом, деля с ним выручку поровну, либо нет (\(D\), defect), забирая всё себе.
Ожидаемо, что в такой конфигурации игроки будут следовать неэффективному равновесию (\(M\), \(D-if-T\)), поскольку \(D\) — строго доминирующая стратегия Инвестора, если клиент выбирает доверять (\(T\)), поскольку это классическая «Дилемма заключенного».
Чтобы равновесие стало эффективным, считает Вандершрааф, нужен институт. Для этого он расширяет игру на доверие, следуя идее Роберта Таделиса (tadelis2013?). В ней Инвестор может либо зарегистрироваться (\(R\)) у Гаранта за стоимость \(\epsilon \in (0,1)\), либо нет (\(N\)). Если Инвестор регистрируется, то он платит защитный депозит \(d \gt 2\alpha\) Гаранту, который затем следит за сделкой между Клиентом и Инвестором. Если Клиент доверяет, а Инвестор обманывает, то Гарант забирает депозит Инвестора себе. А если Инвестор не обманывает, то Гарант возвращает ему депозит.
В такой конфигурации обманывать Клиента Инвестору становится невыгодно, поскольку защитный депозит превышает возможный выигрыш от обмана. А регулятивные правила Клиента (\(R_C\)) и Инвестора (\(R_I\)) выглядят так: \[ \begin{gathered} R_I: \text{R then C if T} \\ R_C: \text{T if R, M if N} \end{gathered} \] Вандершрааф называет подобную конфигурацию «открытым институтом», поскольку роли Клиента и Гаранта не связаны между собой и следуют своим стратегиями автоматически. Для «закрытого института» нужны дополнительные механизмы, регулирующие случаи, когда Клиент не доверяет Инвестору, даже если у того есть регистрация с Гарантом, или если Гарант забирает себе депозит даже у честного инвестора.
Наша позиция близка к предложению Вандершраафа и критикует ПвР на подобных основаниях, однако у него не вполне ясна роль правил — конститутивных и регулятивных — в контексте унифицированной социальной онтологии. Если Гарант и есть институт, то как это укладывается в формулу «X считается Y в контексте C»? Также неясно, нужны ли правила онтологически для работы объяснения.
Эдуин критикует ПвР за переоценку координации как основы института (Hédoin, 2016, 2021). Хотя теоретико‑игровой подход Гуалы предлагает элегантную и экономную модель институтов как координационных равновесий, в конечном счёте она слишком «тонка», чтобы охватить полную социальную онтологию институтов. Конструктивный тезис Эдуина призывает к более широкой, нормативно насыщенной и исторически укоренённой рамке, которая признаёт институты как конституирующие предпочтения и идентичности агентов, встроенные в социальные и культурные контексты и наделённые нормативными силами, порождающими подлинные обязательства.
Подобный более богатый подход призван объяснить не только то, как институты решают проблемы координации, но и то, как они формируют социальную жизнь на фундаментальном уровне. Основная новая идея состоит в том, чтобы сделать экзогенные предпочтения эндогенными, где равновесия не отражают предпочтения агентов, а формируют их. Например, институт брака меняет то, как индивиды ценят отношения, а не только то, как они координируют поведение. Это измерение отсутствует в подходе Гуалы, основанном на матрице выигрышей.
Хотя указанная критика высвечивает важные недостатки теории правил‑в‑равновесии, большинство её авторов не углубляются достаточно, чтобы увидеть проблему в самой структуре этой теории, которая влияет на её объяснительную силу.
1.3.3 Глубокая проблема: соотношение правил и равновесий
Обширная критика лишь частично отражает проблему ПвР. Корень проблемы, по нашему мнению, лежит глубже — в отношении между правилами и равновесиями.
Аргументируя унификацию институтов как правил и равнвовесий, Гуала исходит из недостаточности каждого элемента по отдельности: правила могут не иметь принудительной силы и не соблюдаться, а равновесия описывают слишком большой класс феноменов — например, решение территориальных споров у животных (Frank Hindriks & Guala, 2015).
Решение Гуалы — приравнять регулятивные правила вроде «стой на красный, иди на зеленый» к условным стратегиям агентов в играх. Точнее, он говорит, что это два взгляда на одну и ту же сущность: с точки зрения действующего агента это правила, а с точки зрения наблюдателя — условные стратегии, ведущие к коррелированному равновесию (Guala & Hindriks, 2015). Правила, по утверждению Гуалы, «неотъемлемы для достижения равновесий, формирующих институты» (Frank Hindriks & Guala, 2015, p. 463, курсив мой), то есть логически им предшествуют. Однако в другом месте Гуала говорит, что правила — это «репрезентации стратегий <…>, которым должно (ought) следовать в игре» (Frank Hindriks & Guala, 2015, p. 467, курсив мой). При этом долженствование, выражающее принудительный характер институтов, следует из инструментальной рациональности КР — игрокам не выгодно отклоняться от стратегии, предложенной устройством корреляции. Сам Гуала признаёт, что это «слабая нормативность» инструментальной рациональности, а не деонтические силы в полной мере, как это есть у Сёрла (Guala & Hindriks, 2015).
Правила как условие возможности равновесия и как его репрезентация — логические разные объекты. Первые — ex ante, вторые — ex post. Это создаёт круг в определении: правила помогают агентам достичь равновесий и одновременно репрезентируют уже существующие стратегии, которым необходимо следовать в игре, а нормативность возникает из равновесия. Неясно, что из этого онтологически первично — правила или равновесия, и откуда и почему возникает нормативность. Всё это затрудняет определение онтологии социального института. Это значит, что несмотря на вполне успешную объяснительную редукцию, собственно онтологическая унификация не вполне осуществлена — есть две сущности с логически неясным отношением между ними.
В этой главе мы рассмотрели три основные традиции рассмотрения социальных институтов в рамках социальной онтологии, которые пытаются ответить на вопрос об источнике его принудительной силы. Показав сильные и слабые стороны каждой, мы рассмотрели синтез этих традиций в теории ПвР Гуалы и Хиндрикса, и, рассмотрев её существующую критику, нашли критичную лакуну, которая ставит под вопрос объяснительную мощь ПвР — проблему «курицы и яйца» в отношениях правил и равновесий.
В следующей главе мы детально рассмотрим отношение между правилом и равновесием в ПвР, чтобы наметить непротиворечивый путь не только объяснительной, но и онтологической унификации.
Глава 2. Анализ теории правил-в-равновесии Франческо Гуалы: круг в определении и допущение о полноте информации
В этой главе мы детально рассмотрим лакуны теории правил-в-равновесии (ПвР) Франческо Гуалы и Фрэнка Хиндрикса. Это важно сделать, чтобы обнаружить конкретные преграды к логически непротиворечивой унифицированной социальной онтологии.
Поскольку ПвР вбирает в себя многие теории и подходы к социальным институтам как в философии, так и в экономике, анализ её лакун послужит анализом лакун ассимилированных теорий. В частности, проблема отношения правил и равновесий есть как минимум в теориях Авнера Грейфа (greif2006?) и Герберта Гинтиса (Gintis, 2009b).
Как мы будем анализировать ПвР? Мы рассмотрим логику аргументации ПвР, которая во многом опирается на недостаточность правил и равновесий по отдельности для объяснения стабильности социальных институтов. В этом аргументе Гуала и Хиндрикс сравнивают две игры — «Ястреб-Голубь-Буржуа» животных на примере бабочек (далее — ЯГБ) и игру с выпасом скота у людей, структурно похожую на первую. Это сравнение проходит красной нитью через основные работы о ПвР (Guala, 2016b; Guala & Hindriks, 2015; Frank Hindriks & Guala, 2015).
Оценив формальные параметры игр, — источник корреляции, допущения об агентах и их свойствах, предполагаемые концепции равновесия в каждом случае — мы оценим легитимность сравнения этих игр.
Сравнив структуру игр, мы покажем, что это разные игры: первая — игра на конфликт, вторая — на координацию. Проблема логического круга в отношениях правил и равновесий связана с этой разницей игр — чтобы существовало коррелированное равновесие в ПвР, уже должен быть решён конфликт за ресурс.
Далее мы углубимся в эту разницу и вскроем допущения, позволяющие Гуале и Хиндриксу сравнивать столь непохожие внутренне, но идентичные по форме игры. Ключевая лакуна — допущение о полноте информации. Это значит, что ПвР в сухом остатке описывает идеально работающий институт без принуждения: чистая координация без конфликта с полной информацией, где стратегический обман невозможен по правилам игры — коррелированное равновесие предполагает, что устройство корреляции сообщает наилучший способ действия для каждого игрока, и игроку не имеют причин ему не доверять. Это само по себе сильное допущение.
Иначе говоря, мы будем анализировать условия правдивости ключевых аргументов Гуалы и Хиндрикса. Начнём с рассмотрения их сравнения игр.
2.1 Логический круг в отношений правил и равновесий
Аргументация унификации социальной онтологии в теории ПвР строится на недостаточности правил и равновесий по отдельности для объяснения стабильности социальных институтов как повторяющихся правило-ориентированных практик. Гуала и Хиндрикс прикладывают много усилий, чтобы показать, что оба подхода не способны в полной мере объяснить стабильность институтов и делают акцент на том, что каждый из подходов схватывает лишь часть общей картины. Равновесия объясняют мотивацию рациональных эгоистичных агентов, а правила — разделяемые убеждения, которые ограничивают и направляют поведение. Гуала и Хиндрикс, мотивированные идеями философии науки, хотят создать теорию с большей объяснительной глубиной [посмотреть источник в guala2015 kuorlikoski — todo]. Поэтому объединение правил и равновесий в одной теории для них — логичный и, вероятно, единственно возможный шаг.
Одних правил недостаточно, считают авторы, поскольку правила могут существовать, но не действовать, ведь они не схватывают мотивацию агентов. Это, как мы говорили в прошлой главе, отмечали представители обоих подходов — и правил, и равновесий (Greif & Kingston, 2011; ostrom1990?). Равновесий недостаточно, по мысли Гуалы и Хиндрикса, поскольку они схватывают слишком широкий класс феноменов, позволяя описывать взаимодействия не только людей, но и животных. А это затрудняет объяснение институтов как нормативных (деонтических) сущностей.
Чтобы показать, что равновесия схватывают слишком большой класс феноменов, авторы сравнивают две игры, где решением служит коррелированное равновесие (КР) — ЯГБ животных и схожую игру с выпасом скота у людей. Матрицы этих игр идентичны, но названия стратегий отличаются. Аргумент Гуалы и Хиндрикса строится на структурном сходстве этих игр.
В первой игре два самца бабочки разрешают конфликт за территорию, координируя поведение на простом физическом сигнале — «кто первым занял место» (Davies, 1978). При встрече у каждого из них есть три возможных стратегии — две «чистых» и одна условная:
- «драться»
- «отступить»
- «драться, если я занял территорию первым, и отступить, если вторым».
Условная (conditional) стратегия зависит от наблюдаемых признаков среды — наличия или отсутствия оппонента на территории. Гуала и Хиндрикс трактуют равновесие в условных стратегиях как КР.
Во второй игре два человеческих племени — Нуэр и Динка — соседствуют в долине реки и пасут свои стада каждый на своём берегу. Когда река высохла, племена продолжили соблюдать границу (Guala & Hindriks, 2015). В этой игре у членов каждого из племён есть также по три стратегии:
- «пасти скот»
- «не пасти скот»
- «пасти скот, если находишься к югу реки и не пасти, если к северу» (и наоборот для другого племени)
Стратегия членов каждого племени также условна, но зависит уже не от физического маркера — порядка очередности — а от разделяемого правила — «Если земля находится к югу (или к северу — для другого племени) от русла реки, пасти скот»17.
Члены племён, по мысли Гуалы и Хиндрикса, координируют действия на разделяемом убеждении — правиле. Это устройство корреляции, абстрагированное от физического маркера с помощью когнитивной репрезентации разделяемого правила. Здесь равновесие в условных стратегиях также трактуется как КР.
Гуала и Хиндрикс говорят, что несмотря на то, что в обоих случаях — и у животных, и у людей — решением служит КР, разница между ними — в объёме сигналов, которые игроки могут использовать в качестве устройств корреляции (Frank Hindriks & Guala, 2015). Люди, в отличие от животных, могут выбирать, на чем координировать свои действия. Это значит, что у людей может быть гораздо больше равновесий, чем у животных — структурно игры будут похожими, но устройства корреляции будут разными.
Чтобы отразить это в теории, считают авторы, нужно показать источник этих равновесий. Если у животных это генетически предзаданные способы координации (например, бабочки не могут координировать действия ни на чём, кроме как «кто первым занял место» (Guala & Hindriks, 2015)), то у людей — потенциально бесконечное множество возможных устройств корреляции, обусловленная гибкостью языка и культуры. Именно поэтому, считают Гуала и Хиндрикс, к равновесиям необходимо добавить правила — они фиксируют «источник» равновесия и выступают устройством корреляции. Содержание правила — как в «если находишься к югу от реки, паси скот» — подсказывает каждому из игроков наилучшую стратегию действия, и в этом смысле институты — это практики, управляемые правилами: все игроки знают правило и следуют ему, поскольку отклоняться от него невыгодно по условию задачи.
ОСТАНОВИЛСЯ ЗДЕСЬ
–> –> –> –> –> –> –> –> –>
[? какие допущения предполагает каждая игра с формальной точки зрения] Если присмотреться к играм, можно заметить разницу в допущениях — онтологических и эпистемологических. Например, по мнению Бинмора, Гуала и Хиндрикс «мутят воду», приводя пример с ЯГБ, поскольку последняя предполагает эволюционно стабильную стратегию (ЭСС) в качестве концепции равновесия, а не КР (Binmore, 2015).
[? каковы эпистемологические и онтологические допущения каждой из игр]
[? каковы допущения об агентах в играх]
- Гуала сравнивает разные игры:
- эволюционную игру с рациональной, беря за основу
Ястреб-Голубь-Буржуа Мейнарда Смита. Они имеют разные допущения:
- об агентах: фенотипы и индивиды
- об источнике корреляции стратегий: экзогенная (внешняя) и эндогенная (зависит от истории)
- о концепции устойчивости: ЭСС у Мейнарда Смита (а не КР) и КР у Гуалы
- эволюционную игру с рациональной, беря за основу
Ястреб-Голубь-Буржуа Мейнарда Смита. Они имеют разные допущения:
- Вывод: методологическая неточность как основа аргументации не способствует валидности выводов ПвР
[? чем отличаются устройства корреляции в играх]
- Даже приняв методологическую разницу игр, мы видим, что Гуала
сравнивает игру с конфликтом с игрой на координацию, не изменяя
матрицы и незаметно устраняя конфликт внутри Ястреба-Голубя:
- Пример с животными (ЯГБ): Чистая игра с конфликтом. Условная стратегия «Буржуа» — это решение, которое предстоит найти в рамках игры. Никаких внешне данных правил нет.
- Пример с людьми («выпас скота»): Гуала описывает это так: «Племена пасли скот по разные стороны реки. Река высохла. Теперь они продолжают пасти скот по воображаемой линии».
- Ключевой момент: Фраза «продолжают пасти» содержит готовую конвенцию. Но откуда она взялась? В момент, когда река высохла, перед племенами встала точно такая же игра с конфликтом, как у животных (ЯГБ за новый ресурс). Гуала пропускает этот момент и начинает анализ с того, что конвенция уже существует.
- Что должно быть объясняемым (explanandum)? Возникновение и устойчивость принудительной социальной структуры (например, границы, права собственности).
- Что Гуала использует как объясняющее (explanans)? Уже существующую, работающую социальную структуру (конвенцию о разделе по реке), которую он встраивает в начальные условия своей модели.
- Итог: Он строит теорию, где институт (как готовая конвенция) является предпосылкой для объяснения института (как устойчивого равновесия). Это логический круг (petitio principii). Он объясняет институт через самого себя. Это фатально, потому что весь пафос Гуалы — показать, как правила и равновесия совместно порождают институты. Но в его ключевом примере правило («паси на своей стороне») не порождается игрой — .оно дано ей изначально как часть истории
- Вывод 1: Гуала не моделирует возникновение института. Он моделирует воспроизводство уже существующего института в слегка изменившихся условиях (река исчезла, но «правило» осталось). Его модель объясняет не «почему есть граница», а «почему сохраняется инерция уже существующей конвенции о границе, если физический маркер исчез». Это другая, более простая проблема.
- Если рассмортреть пример Гуалы с выпасом скота как настоящую ЯГБ (без предустановленной конвенции в виде реки как границы), то там будет и равновесие, и правило — но не в онтологическом смысле уже существующей конвенции, а как условная стратегия.
- Вывод 2: Это ставит под вопрос необходимость правил для определения института. Возможно, правила не необходимы.
- Рассматривается реалистичная игра ЯГБ без предустановленной конвенции в качестве равновесия
- Находится байесовское равновесие в этой игре с неполной информацией.
- Показывается, что оно отличается от коррелированного равновесия, и что стратегия «всегда посылать сигнал “Владелец” и играть по правилу Буржуа-стратегии» строго выгоднее, чем простая условная стратегия Буржуа.
- Делается вывод, что КР недостаточно для описания института.
<!–> “An institution is a self-sustaining, salient pattern of social interaction, as represented by meaningful rules that every agent knows, and incorporated as agents’ shared beliefs about the ways the game is to be played”.–>
Центральный тезис Гуалы — что КР адекватно описывает устойчивость института. Однако это не так, поскольку работает только в случае допущения о полной информации в игре. Чтобы это показать, представляем игры в развернутой форме и находим байесовское равновесие.
Стратегия Буржуа в ЯГБ является КР в игре с полной информацией — если типы игроков наблюдаемы обоими игроками. Чтобы это показать, введём понятия истории игры и информационного множества.
История \(h \in H\) — конечная последовательность ходов (или узлов дерева) игры в развёрнутой форме \(h = (a_1, a_2,\dots, a_k)\). Информационное множество \(I_R\) — это набор неразличимых для получателя историй игры. Если \(|I_R| > 1\), то получатель не знает, в каком узле игры он находится, что усложняет принятие решения. В ЯГБ в примере Гуалы с животными: \[ \begin{gathered} h_1 = \{\theta_1, m_1\} \\ h_2 = \{\theta_2, m_2\} \\ I_R = \{h\} \end{gathered} \] Поскольку \(I_R = 1\) (истории эквивалентны, так как идентичны по форме), получатель сигнала точно знает, в каком узле игры находится.
А в примере Гуалы с племенами: \[I_R(m_1) = \{h, (\theta_2, m_1)\}\]
Тип отправителя неразличим для получателя сигнала — он видит один и тот же сигнал «я владелец» и когда отправитель действительно «владелец», и когда он «чужак», что обозначено на схеме пунктирной линией. Это создаёт неопределённость и лазейку для эксплуатации получателя.
Поскольку получатель не может различить, в каком узле игры находится и кто его оппонент по реальному типу, отправитель сигнала может всегда посылать сигнал «я — владелец», даже не являясь им фактически.
Введём новую стратегию «Блефующий» и рассчитаем средние платежи согласно стандартным условиям игры «Ястреб-Голубь», где стоимость конфликта выше ценности ресурса \(C > V\), и каждый игрок может быть либо захватчиком, либо владельцем (Maynard Smith, 1982):
- Буржуа (B) — честная стратегия:
- Сигналит свой истинный тип.
- На сигнал «владелец» → Голубь.
- На сигнал «захватчик» → Ястреб.
- Блефующий — обманывающая стратегия:
- Всегда сигналит «владелец».
- На сигнал «владелец» → Голубь.
- На сигнал «захватчик» → Ястреб.
Встреча M vs B:
| M тип | B тип | Сигналы | Действия | Платёж M |
|---|---|---|---|---|
| Владелец | Захватчик | (Владелец, Захватчик) | Ястреб, Голубь | V |
| Захватчик | Владелец | (Владелец, Владелец) | Голубь, Голубь | V/2 |
Встреча B vs. B
| B тип | B тип | Сигналы | Действия | Платёж M |
|---|---|---|---|---|
| Владелец | Захватчик | (Владелец, Захватчик) | Голубь, Голубь | V/2 |
| Захватчик | Владелец | (Захватчик, Владелец) | Голубь, Голубь | V/2 |
Средний платёж M: \[ EU(M,B) = \frac12 \cdot \frac{V}{2} + \frac12 \cdot V = \frac{3V}{4} \]
Выигрыш «Блефующего» строго больше выигрыша Буржуа: \(\frac{3V}{4} > \frac{V}{2}\) при \(C > V\) (и, следовательно, \(V - C < 0\)).
- следование правилу (то есть условной стратегии Буржуа в КР) — не лучший ответ. Вместо этого можно сблефовать и получить больший выигрыш
- чтобы условная стратегия стала КР, нужен модификатор платежа для стратегии блефа: Гуала его либо уже предполагает встроенным в игру (делая институт черным ящиком), либо игнорирует:
\[\frac{3V}{4} - \delta \geq \frac{V}{2} \]
Это означает, что санкция за блеф \(\delta\) должна превышать ожидаемую выгоду от блефа, равную \(\frac{V}{4}\). Значит, институт может быть устойчивым даже при малых санкциях, однако КР все равно этого не объясняет.
- Вывод: концепция коррелированного равновесия недостаточна для описания устойчивости института — для нее принципиальна защита от блефа при неполной информации. КР схватывает лишь финальное состояние работающего института в игре с полной информацией. Поэтому нужна нужна динамическая устойчивость равновесия, которая может объяснить, как стратегия может возникнуть и закрепиться через динамический процесс (обучение, имитация, эволюционный отбор).
- Институт в человеческом обществе не может быть смоделирован как коррелированное равновесие в игре с объективными, проверяемыми сигналами (как у Гуалы). Реальный институт — это попытка установить что-то вроде КР в игре со стратегическими, ненадёжными сигналами.
Общий вывод: Теория «правил-в-равновесии» не выполняет своей основной задачи — объяснить принудительную силу институтов. Она либо тавтологична, либо описывает невозможный объект.
Вывод главы: необходимость динамической онтологии, исходящей из до-институционального состояния и не предполагающая существования готовой конвенции, которая интегрирует и равновесия, и правила в смысле Сёрла.В этой главе мы строим формальную модель игры ЯГБ с неполной информацией и показываем условия динамической (эволюционной) стабильности условной стратегии.
- Поскольку оригинальная игра ЯГБ уже включает в себя термины «захватчик» и «владелец», которые можно трактовать институционально — как наличие или отсутствие уже закрепленного права собственности, мы начнем с симметричной игры Ястреб-Голубь
- Опираясь на эволюционную динамику Скирмса, мы говорим, что условная Буржуа-стратегия, зависимая от информационной асимметрии (сигнала) появляется в игре как результат адаптации в популяции, даже если агенты не обладают понятием собственности.
- Это позволяет получить понятие коррелированной конвенции. Однако она, как мы показали в прошлой главе, предполагает полноту информации.
- Если убрать полноту информации, Буржуа-стратегия перестанет быть ЭСС
- Так же, как и в главе 2 с КР, здесь возникает необходимость компенсации блефа — дельта-параметр
- Это позволяет нам сказать, что устойчивость института не зависит от конкретного равновесия — и ЭСС, и КР в ЯГБ рушатся при неполной информации. Значит, сущность института — не в равновесии.
Чтобы показать, что стратегия \(B\) (Буржуа с неполной информацией) не является ЭСС, достаточно показать, что существует мутант, у которого платёж против Буржуа выше, чем у Буржуа против себя:
\[\exists\ M : \quad \pi(M,B) > \pi(B,B)\]
Буржуа не различает тип соперника, поэтому платёж стандартный: \[ \pi(B,B) = \frac{V}{2} \] * Владелец получает V с вероятностью ¹⁄₂ * Захватчик получает 0 с вероятностью ¹⁄₂
Берём «блефера», который использует неполную информацию о сигнале:
- Всегда сигнализирует «я — владелец»
- В остальном играет по правилу Буржуа: Голубь на сигнал владельца, Ястреб на сигнал захватчика
\[EU(M,B) = \frac12 \cdot \frac{V}{2} + \frac12 \cdot V = \frac{3V}{4}\]
Выигрыш «Блефующего» строго больше выигрыша Буржуа: \(\frac{3V}{4} > \frac{V}{2}\) при \(C > V\) (и, следовательно, \(V - C < 0\)).
Стратегия Буржуа с неполной информацией не является эволюционно устойчивой, поскольку существует мутантная стратегия, избегающая конфликтов и забираюшая ресурс за счет блефа.
Это означает, что условная стратегия сама по себе не может быть эволюционно стабильной: корреляции стратегий недостаточно для стабильных социальных контрактов — вероятность блефа модифицирует платежи и нарушает равновесие.
Восстановление стабильности требует поддерживающего механизма. Для Гуалы подобный механизм — репрезентация агентом равновесия с помощью регулятивного правила: она мотивирует агента выбрать коррелированную стратегию.
Восстановление эволюционной стабильности условной стратегии возможно благодаря введению параметра, который бы выравнивал платежи стратегий Буржуа и Блефующего:
\[\pi(M, B) - \delta < \pi(B, B)\]
Подобный дельта-параметр можно вывести, определив платежи стратегий Буржуа и блефующего чужака.
Вычтем из выплаты блефующего чужака штраф \(\delta\), применяемый к факту эксплуатации неопределенности, а не к самому конфликту: \[ \pi_{M}^\delta=V-\delta \]
Это означает, что эволюционно стабильное равновесие в условных стратегиях не может существовать в среде с ненулевой вероятностью блефа без модификатора платежей. Введение \(\delta\) делает стратегию Буржуа устойчивой на уровне платежа.
Получаем минимальный модификатор платежа, необходимый для поддержания «очевидности» коррелированной (условной и симметричной) стратегии Буржуа для агента:
\[\delta_{\min }={V}{4}\]
Таким образом, \(\delta\)-параметр — это структурная необходимость для восстановления эволюционной стабильности равновесия в условных стратегиях в ситуации неполной информации — возможности несоответствия сигнала типу игрока-отправителя. Этот параметр восстанавливает стабильность за счёт введения стоимости, независимой от реализации конфликта.
- Если положить не одну игру, а несколько идентичных игр, в каждой из которых санкция не гарантирована, то дельты (и ее размера) становится недостаточно
- Если в каждой игре дельта либо применена, либо нет (что выражено бинарной случайной величиной E), то эффективная дельта во всех играх будет \(\delta \cdot \r\), где \(r\) — эмпирическая частота реализации дельты в игре (санкция применена)
- Это позволяет показать, что при низкой надежности компенсации блефа \(r\) во популяции игр Буржуа-стратегия не может быть глобальной ЭСС → равновесие разрушается
Как мы показали в прошлой главе, репрезентация равновесия агентом с помощью регулятивного правила не необходима для поддержания стабильности института. Вместо этого санкция восстанавливает эволюционную стабильность коррелированного равновесия с помощью модификации платежей.
В этой главе я показываю, что институт с модификатором платежа \(\delta\) стабилен только локально, в одной игре, но рушится при наличии множества игр. Это позволит формально отделить институт от протоинститута.
Локальная ESS означает устойчивость стратегии в одной игре \(𝐺_i\). Глобальная устойчивость — в популяции, где много экземпляров игры \(G_N\) происходят в разных местах и моментах. Это пространственная множественность или временная повторяемость:
\[\mathcal{G} = \{G_1, G_2,…,G_N\}\]
Важно, что хотя \(\delta\) — объективный параметр института, его применение в каждой конкретной игре не гарантировано. Санкция может не реализоваться, что аннулирует дисконтирование платежа нарушителя, и он получит платёж \(V\) вместо \(V - \delta\).
Бинарная случайная величина \(E ∈ \{0, 1\}\) определяет, применена ли санкция в конкретной игре: \(1\) означает, что санкция \(\delta\) применена, а \(0\) — не применена. Платежи в локальной игре содержат скрытый параметр \(r \coloneq P(E = 1)\) — объективную вероятность применения санкции. Она означает надёжность механизма принуждения (enforcement), а при рассмотрении популяции игр — частоту реализации санкции в популяции игр. Поскольку в одной локальной игре применение санкции гарантировано (по результатам прошлой главы), то \(r = 1\), поэтому этот параметр скрыт. Однако для популяции игр эффективная санкция будет:
\[\delta_{eff} = 1 \times \delta\]
В популяции игр \(r\) — эмпирическая частота реализации санкции:
\[r = \frac{1}{N} \sum^N_{i=1}E_i\]
Например, есть 5 игр, в трёх из которых санкция была применена: \(E = \{0, 1, 1, 0, 1\}\). Тогда \(r\) по ним будет \(\frac{3}{5} = 0.6\), а эффективная санкция \(\delta_{eff} = 0.6\delta\).
Для глобальной стабильности \((B, B)\) средняя эффективная санкция должна быть выше минимально допустимой:
\[\delta_{eff} = r\delta \geq \delta_{min}\]
Иначе говоря, минимальная частота реализации санкции в популяции игр должна быть:
\[r_{min} = \frac{1}{N} \sum^N_{i=1}E_i = \frac{\delta_{min}}{\delta}\]
Это значение можно назвать порогом институциональности поведенческого паттерна: ниже этого значения применение санкций станет непредсказуемым и институт станет протоинститутом.
- Для поддержания Буржуа-стратегии как глобальной ЭСС нужен механизм или устройство для повышения надёжности санкции \(r\)
- Функция этого механизма — повышение статистической связности (корреляции) или взаимной информации между фактами применения дельты в каждой из игр. Иначе говоря, нужен канал информации между играми, делающий применение санкции после нарушения предсказуемым.
- Подобный механизм и составляет глубинную онтологическую основу институа.
Повышение надежности санкции (то есть частоты ее применения в играх популяции) требует механизма повышения связности между играми — статистической зависимости фактов реализации санкции. Это можно выразить как снижение дисперсии \(D(r)\), энтропии доставки санкции \(H(r)\) или повышение взаимной информации между двумя случайными играми \(I(E_i, E_j) > 0\). Подобный механизм выравнивает среднее значение санкции \(\delta_{eff}\) в популяции игр.
Иначе говоря, для восстановления глобального равновесия, необходимо, чтобы реализация санкции а одной игре была информативной относительно других и была предсказуемой на уровне системы.
Подобный механизм и составляет глубинную онтологическую основу институа.
Статистическая связь между реализациями санкций в играх популяции — это структура информационного канала между играми, а не модификация платежа или отдельная сущность.
- Формально, институт в нашей концепции — это сеть дельта-стабилизированных равновесий в условных стратегиях с высокой взаимной информацией.
- Прото-институт (как часть определения института) —
.это равновесие в условных стратегиях (неважно,
коррелированное, байесовское, ЭСС) в расширенной игре с неполной
информацией и конфликтом интересов, которое является
Парето-улучшением по отношению к существующему равновесию в
базовой (не расширенной) игре
- Эквивалентная ситуация — множество игр с таким равновесием, но с низкой взаимной информацией: применение санкции в одной ситуации ничего не говорит об ее применении в другой.
- для существования института нужны:
- ситуация с конфликтом интересов (описываемые играми ЯГБ, дилемма заключенного, битва полов)
- условная стратегия, решающая конфликт и связанная с чистыми стратегиями (а не как у Гуалы)
- \(\delta\)-параметр — модификатор платежа для стратегии, эксплуатирующей условную стратегию
- равновесие в условных стратегиях (неважно, какое)
- множество структурно идентичных игровых ситуаций с равновесием и дельтой
- любой механизм или устройство, повышающий взаимную информацию (или статистическую корреляцию) о применении санкции между игровыми ситуациями
<!–> Устойчивые институты требуют структур обеспечения санкций, плотность которых пропорциональна информационной хрупкости поддерживаемого равновесия.–>
Источники
–>
Есть мнение, что метод вывода к наилучшему объяснению принципиально недоступен для социальных наук и социологии, в частности, поскольку в них «нет аналогов гравитационных волн или бозона Хиггса» (Hawley, 2018) — то есть, фундаментальных единиц анализа, исходя из которых можно выводить онтологию по лекалам научного реализма (Psillos, 1999). В данном исследовании мы постараемся показать обратное: что IBE — единственно возможный путь к онтологии социального.↩︎
Хотя это и не стало мейнстримом, подобные попытки были во второй половине 20 века в лице «математической социологии» (Fararo, 1989) и унификационных проектов вроде «аналитического ядра социологии» философа Герберта Гинтиса (Gintis, 2007a).↩︎
Это отражает давнюю дискуссию в философии сознания о «народной психологии» и элиминативизме (сведению «ментальных» понятий к состояниям мозга), где одна сторона утверждает, что «народные» понятия, такие как убеждения и желания, приблизительно соответствуют реальным внутренним процессам работы мозга (fodor1983?; gopnik1994?), а другая сторона сводит эти понятия к состояниям мозга и утверждает, что истинные внутренние процессы могут быть описаны только в материальных и механистических терминах (Churchland, 1992; Turner, 2019).↩︎
Иерархический Байес — это модель с вероятностными параметрами, которая допускает иерархические отношения между случайными величинами и их распределениями.↩︎
Как пишет Юм (Hume, 1998), «некоторые утверждают, что справедливость проистекает из человеческих условностей и исходит из добровольного выбора, согласия или объединения людей… если под условностью понимать чувство общего интереса — чувство, которое каждый человек испытывает в своей душе, которое он замечает в своих ближних и которое ведёт его, в согласии с другими, к общему плану или системе действий, направленных на общественную пользу, — следует признать, что в этом смысле справедливость проистекает из человеческих условностей. Ибо если допустить (что, действительно, очевидно), что конкретные последствия конкретного акта справедливости могут быть вредны как для общества, так и для отдельных лиц, то следует, что каждый человек, принимая эту добродетель, должен учитывать весь план или систему и ожидать согласия своих ближних в том же поведении. Если бы все его взгляды сводились к последствиям каждого его собственного поступка, его благожелательности и гуманности, а также “его любви к себе”, то она часто могла бы предписывать ему меры поведения, совершенно отличные от тех, которые соответствуют строгим правилам права и справедливости…». Шлиссер отмечает, что положительная социальная экстерналия является необходимым условием для чисто «юмовской» конвенции (Schliesser, 2024).↩︎
Матрица выигрышей — это математическое представление, показывающее возможные исходы для каждой комбинации стратегий, выбранных игроками.↩︎
На планете, почти во всём идентичной Земле, но где вода состоит не из \(H_2O\), а из \(XYZ\), жители используют слово «вода», однако обозначают им иное вещество. По Патнэму, этот пример показывает, что одних лишь психологических состояний недостаточно для определения значения; внешние факторы, такие как химический состав и условия усвоения, влияют на языковую референцию. Эта идея выражена в его знаменитом тезисе: «значения не находятся в голове».↩︎
Как показал Скирмс (Skyrms, 2010a, 2010b), такие паттерны могут формироваться динамически в повторяющихся играх: как \(X\), так и \(Y\) устанавливаются и распознаются методом проб и ошибок через обучение с подкреплением или другую динамику — обучающую или эволюционную.↩︎
Правило Дирихле — это байесовская процедура обновления, основанная на распределении Дирихле, используемом для моделирования вероятностей на конечном множестве дискретных исходов («распределение распределений»). В моделях обучения правило Дирихле обновляет вероятность, приписываемую каждому распределению, подсчитывая число случаев, когда оно приводило к определённому исходу, например вознаграждению. Эти счётчики служат параметрами распределения Дирихле, которое затем задаёт распределение вероятностей по вариантам. Формально, если вариант \(j\) был вознаграждён \(\gamma_j\) раз, обновлённая вероятность для варианта \(j\) пропорциональна \(\gamma_j\), а вектор вероятностей \(\mathbf{x} = (x_1, \ldots, x_k)\) по \(k\) вариантам таков, что \(x_j \in (0,1)\) и \(\sum_{j=1}^k x_j = 1\). Это правило отражает, как эмпирические частоты формируют вероятностные убеждения в рамках байесовского подхода.↩︎
Различие между «экзогенной» и «эндогенной» информацией, влияющей на выбор стратегии агента, уже присутствует у Аумана (Aumann, 1987). Первый тип информации поступает из внешних сигналов, второй — из рассуждений агентов о том, как рассуждают другие. Ауман не считал это различие важным, поскольку знание экзогенности или эндогенности информации (и даже действий) агентов не способствует достижению КР. Использование Вандершраафом динамики Дирихле прояснило, как эндогенность может способствовать этому, хотя полностью внешний сигнал устранён не был.↩︎
Многие исследователи используют метафоры, подчёркивающие внешний характер КР: «посредник» и «корреляционное устройство» (fudenberg1991?), «хореограф» (Gintis, 2009b) и другие.↩︎
Случайное распределение пар — стандартное предположение в эволюционной теории игр, когда индивиды в большой хорошо смешанной популяции объединяются для взаимодействий случайным образом, т.е. каждый имеет равные шансы встретить любого другого, независимо от его стратегии. В этом контексте ЭСС зависит исключительно от средних выигрышей, определяемых частотами стратегий в популяции, и такие стратегии, как кооперация, обычно не могут сохраниться, если они напрямую не поддерживаются структурой выплат. Отклонения от случайного распределения (ассортативные или структурированные пары) вводят корреляции между стратегиями, что принципиально меняет, какие типы поведения могут быть эволюционно стабильными (Izquierdo, Izquierdo, & Hauert, 2024; Jensen & Rigos, 2018).↩︎
Однако эта принудительная сила не является надындивидуальной, как у Дюркгейма (Durkheim, 2014), определившего социальные факты как способы действия, мышления и чувствования, обладающие принудительной силой. Для Сёрла нет надындивидуальной социальной реальности за пределами коллективного признания.↩︎
Это различие отражает классическое различие между природными и социальными видами, где первые представляют собой «кластеры гомеостатических свойств», наборы необходимых и стабильных характеристик (Boyd, 1991).↩︎
Философ биологии Ким Стерельны утверждает, что социальные институты (или человеческий социальный контракт), понимаемые как разделяемые и поддающиеся принуждению нормы, регулирующие кооперацию и взаимность, возникли до появления сложного языка (Sterelny, 2021). Археологические данные показывают, что ранние гоминины участвовали в кооперативном добывании пищи и согласованном использовании орудий. Это указывает на взаимовыгодное сотрудничество и неявное принуждение к нормам в малых мобильных группах уже около 1,8 млн лет назад (Sterelny, 2016, 2021). Сравнительные исследования приматов также подтверждают правдоподобие доязыковой кооперации и элементарного нормативного контроля, демонстрируя формы взаимности и социальной регуляции у человекообразных обезьян, которые, вероятно, служили основой раннего человеческого сотрудничества (birch2022?). Вместе эти данные поддерживают модель Стерельного, согласно которой прото-социальные контракты, укоренённые в нормах, репутации и координации, существовали в доязыковых обществах, а язык позднее позволил формировать более абстрактные, масштабируемые и формализованные нормы по мере расширения человеческих групп.↩︎
Для Сёрла сама постановка такого вопроса невозможна, мы не можем знать, как работает социальное безотносительно наших намерений и верований относительно него. Согласно Сёрлу, у нас нет другого способа обосновать функционирование чего-то как социального факта, кроме как коллективно признать что-то таковым.↩︎
Хотя эта стратегия связана с высохшим руслом, в ней это русло важно не само по себе, а как средство кодирования информации. Высохшее русло поддерживает (scaffolds) эпистемическую структуру, основанную на общем знании (или общей причине полагать) (Lewis, 2008) о том, что это высохшее русло означает. Это делает «регулятивное правило» Гуалы и Хиндрикса похожим на «социальную норму» Биккиери: оба «активируются» контекстуально и зависят от «когнитивной схемы», как это называет Биккиери. Подобной «схемой» у Гуалы и Хиндрикса выступает когнитивная репрезентация правила как стратегии в игре.↩︎