Социальная наука будущего может быть настолько же онтологически удивительной, как физика 20-го века
Дон Росс
Глава 1. Принудительная сила институтов в социальной онтологии
Социальные институты — деньги, право, собственность, брак — представляют собой не просто описания наших взаимодействий, но активные силы, формирующие социальную реальность. Их отличительная черта — способность не только направлять, но и ограничивать репертуар действий, создавая устойчивые, самовоспроизводящиеся паттерны поведения. Этот феномен — принудительная сила институтов — и составляет центральную проблему настоящего исследования. Вопрос «что такое социальный институт?» в данном контексте сводится к более конкретному и одновременно фундаментальному: каков источник и механизм силы, которая позволяет институтам предписывать поведение и воспроизводиться даже вопреки интересам отдельных индивидов?
Этот вопрос имеет не только практическое, но и метаонтологическое измерение. Согласно философу науки Брайану Эпштейну, проекты социальной онтологии можно разделить на те, что исследуют составляющие социальных сущностей и те, что исследуют механизмы «якорения» социальных категорий — как нечто начинает считаться социальным фактом (Epstein, 2018). Наш вопрос лежит на стыке обоих направлений: мы спрашиваем и о составляющих (что в институте обеспечивает силу?), и о механизме (что делает нечто социальным фактом?). Однако, в отличие от аналитических проектов, мы не будем начинать с априорного различения этих аспектов. Вместо этого мы рассматриваем их как две стороны одной объяснительной задачи.
Поиск ответа на вопрос о природе института сталкивается с радикальным расхождением в существующих теоретических подходах. Одни теории, уходящие корнями в философию действия, выводят принудительность из сферы ментального: из коллективных убеждений, интенций и разделяемых правил (Gilbert, 1992; J. Searle, 1995). Другие, развиваемые в рамках экономики и теории рационального выбора, видят её источник в структуре материальных стимулов и стратегических равновесий, возникающих из взаимодействий рационально-эгоистичных агентов (Lewis, 2008; greif2006?). Этот конфликт интерпретаций указывает на более глубокую методологическую проблему — каким способом вообще стоит искать онтологическое основание социальных феноменов?
Философ науки Дон Росс предлагает различать аналитическую и научную социальную онтологию, где основной метод первой — концептуальный анализ, а второй — эмпирические исследования и вывод к наилучшему объяснению1 (Ross, 2023). Для Росса «натуралистическая метафизика», как он её называет, не применяет концепции, которые не встречаются в теориях, моделях или объяснениях «науки первого порядка».
Аналитическая социальная онтология, исходя из априорного теоретизирования, стремится выявить необходимые и достаточные условия социальных феноменов через логический разбор и интуитивную проверку ключевых понятий — «правило», «интенциональность», «функция» и т.д. Такая онтология утверждает, что она логически предшествует методологии социальных наук (Epstein, 2016; Lauer, 2019; J. Searle, 1995). Иначе говоря, невозможно изучать социальное, не определив заранее его ключевые характеристики, или видовые свойства.
Классическим примером служит проект Джона Сёрла, который через формулу «X считается Y в контексте C» пытается эксплицировать конститутивные правила, лежащие в основе институциональной реальности (J. Searle, 1995). В этой парадигме принудительная сила института логически выводится из факта коллективного принятия определённых статусных функций. Аналитический подход, таким образом, начинает с концептуальных допущений о природе социального и пытается вывести из них структуру реальности. К тому же, этот подход предполагет человеческую уникальность и антропоцентризм: отсутствие ментальных конструктов и разделяемых целей не позволяет животным иметь институты, хотя мы видим протонормативное поведение (кооперативные альянсы с санкциями за нарушение, восприятие справедливости) в животных видах — от ворон (Wascher & Bugnyar, 2013) до шимпанзе (Rudolf von Rohr, Burkart, & van Schaik, 2011).
Научная (натуралистическая) социальная онтология, напротив, использует метод вывода к наилучшему объяснению. Её исходная точка — не интуиция или анализ понятий, а успешные, зрелые научные теории, демонстрирующие предсказательную и объяснительную силу. Онтологические заключения в этом случае не предшествуют научному исследованию, а являются его результатом: мы вправе считать реальным то, что постулируется теориями, наилучшим образом объясняющими наблюдаемые явления (Psillos, 1999). В контексте социальных наук это означает, что онтология институтов должна быть выведена из тех моделей, которые наиболее адекватно описывают их устойчивость, влияние на поведение и, что наиболее важно для нас, принудительную силу.
Важным следствием принятия метода IBE является вопрос о природе социальных категорий. Если мы выводим онтологию из успешных теорий, то должны спросить: на какие единицы ссылаются эти теории? Традиционная философия науки связывает надёжный индуктивный вывод и успех объяснения с существованием естественных видов — категорий, которые обладают внутренней, гомеостатической структурой свойств, позволяющей делать индуктивный вывод (Boyd, 1991; mill1843?). Применение IBE к социальному миру ставит проблему в более чёткой форме: можно ли рассматривать социальные институты как естественные виды, поддерживающие индуктивный вывод?
Критика аналитического подхода со стороны натурализма (Kincaid, 2021; Ross, 2023; churchland2019?) сосредоточена на риске концептуального круга. Анализируя понятия об институтах, мы рискуем вскрыть не устройство социального мира, а структуру наших собственных, исторически и культурно обусловленных, представлений о нём. Как отмечает Патрисия Чёрчленд, концептуальный анализ часто выдаёт камуфлированные теории, которые ошибочно принимают черты наших текущих убеждений за черты мира (churchland2019?). В результате аналитическая социальная онтология, несмотря на свою концептуальную изощрённость, вполне может оказаться оторванной от реальных механизмов, изучаемых эмпирической социальной наукой (Sarkia & Kaidesoja, 2023).
Физика ярко иллюстрирует подход между научной и аналитической онтологией (Ross, 2023). Онтология физики формулируется в математических терминах. Её формулировка аналитическим способом — например, в терминах семантики возможных миров — была бы контринтуитивной и излишне сложной. Она потребовала бы перевода существующих научных концепций на язык аналитической метафизики.
Социальные науки и социальная онтология не обладают такой прямолинейностью математических формулировок своих концепций, как физика2. Вместо этого они используют «народные» концепции (folk concepts) вроде «убеждений», «групп» и «социальных фактов».
Некоторые философы утверждают, что «народных» онтологий достаточно (Ruben, 1989; thomassen2003?), а другие выдвигают на первый план взаимодействие «народных» и научных онтологий (Guala, 2016; S. Haslanger, 2018; asta2012?)3. Неоднозначность между «народной» и научной социальной онтологией может зависеть от математического аппарата и его недостаточно развитого характера в социальных науках (который связан скорее с отсутствием теоретического консенсуса внутри социальной науки, а не с нехваткой математических инструментов). Росс также отмечает, что построение социальной онтологии, возможно, потребует её формулировки с помощью математических моделей, чувствительных к структурному моделированию (таких как иерархический байесовский вывод4), а не теории множеств и подобных инструментов аналитической метафизики (Ross, 2023).
В данной работе мы принимаем установки натуралистической социальной онтологии и метод IBE в качестве основополагающих. Наш выбор обусловлен природой исследуемой проблемы. Если мы хотим объяснить реальный, действующий в мире механизм институционального принуждения, а не реконструировать наше концептуальное понимание последнего, то отправной точкой должны стать не априорные конструкции, а наиболее эффективные из существующих объяснительных моделей, предлагаемых наукой.
Этот выбор означает отказ от тезиса об уникальности и сложности социальной онтологии. Согласно этому тезису, социальная реальность, во-первых, «интерактивна» (зависит от убеждений о ней самих участников и потому изменчива) (Hacking, 1999), а во-вторых, по своей сути нормативна, что делает её недоступной для дескриптивного, естественнонаучного подхода (Ásta, 2024; S. A. Haslanger, 2012).
Здесь становится важным различение интерактивных и безразличных видов (interactive / indifferent kinds) (Hacking, 1999). Критики натурализма утверждают, что социальные сущности по определению принадлежат к интерактивным видам: наши классификации меняют их, подрывая стабильность, необходимую для индукции и трактовки в качестве естественных видов (Hacking, 1999; Sveinsdóttir, 2013).
Мы оспариваем это утверждение. Хотя социальные институты действительно могут быть чувствительными к убеждениям, это не отменяет возможности существования их как устойчивых структурных паттернов, возникающих из материальных ограничений и сетевых эффектов. Эти паттерны могут обладать достаточной регулярностью, чтобы служить основой для научного обобщения и, следовательно, для IBE.
Задача, таким образом, состоит в том, чтобы найти и описать параметры такой структурной устойчивости, которые и могли бы претендовать на роль «видовых свойств» института в натуралистическом смысле.
В качестве рабочей гипотезы мы принимаем, что таким ключевым видовым свойством является принудительная сила, понимаемая не как «мистическая нормативность» или деонтология, а как поддающийся моделированию механизм поддержания социальной координации.
Помимо этого, интерактивность (или рефлексивность) и нормативность — это не метафизические барьеры, а эмпирические свойства социальных систем, которые должны стать не предпосылкой, а объяснительной целью адекватной социальной онтологии.
Таким образом, наша методологическая позиция заключается в том, что онтология института, и в частности его принудительной силы, должна быть выведена индуктивно из корпуса социальных теорий, которые демонстрируют наибольшую объяснительную силу в отношении наблюдаемых социальных феноменов — стабильности социального порядка.
Исходя из методологии IBE, мы проводим критический анализ основных исследовательских программ, которые претендуют на роль наиболее фундаментального объяснения стабильности институтов и, следовательно, являются главными кандидатами для вывода онтологии института. Каждая из этих программ имплицитно или эксплицитно предлагает свой ответ на вопрос о «видовых свойствах» института и его онтологическом статусе — является ли он естественным видом:
Институт как равновесие (Раздел 1.1). Эта традиция, идущая от Дэвида Льюиса и развиваемая в рамках теории игр и новой институциональной экономики, отождествляет институт с устойчивым равновесием в стратегическом взаимодействии рациональных агентов. Принудительная сила здесь — сила самоисполняющегося ожидания: индивиду невыгодно отклоняться от установившейся практики, если все остальные её придерживаются. Кандидат на «наилучшее объяснение» — структура стимулов как объективных ограничений.
Институт как система правил (Раздел 1.2). Эта традиция делится на два русла. Конститутивное правило видит в институте систему статусных функций, создаваемых и поддерживаемых коллективным согласием И хотя это эталонные пример аналитической онтологии, у неё есть натуралистическая интенция, которую стоит рассмотреть всерьёз. Регулятивное правило рассматривает институты как формальные и неформальные ограничения, структурирующие взаимодействие. В обоих случаях принудительная сила выводится из нормативной или когнитивной силы правил. Кандидат на «наилучшее объяснение»: власть правила или коллективной интенциональности.
Институт как синтез: «правила-в-равновесии» (Раздел 1.3). Теория Франческо Гуалы и Фрэнка Хиндрикса представляет собой наиболее влиятельную попытку синтеза двух предыдущих подходов (Guala, 2016; Frank Hindriks & Guala, 2015). Институт здесь понимается как равновесие, стабилизированное экзогенным правилом. Правило координирует ожидания, а равновесие обеспечивает устойчивость. Кандидат на «наилучшее объяснение»: единство нормативной координации и стратегической устойчивости.
Каждая из этих программ предлагает мощный концептуальный аппарат и претендует на то, чтобы схватить суть институциональной реальности. Наша задача — подвергнуть их имманентной критике, оценивая с точки зрения их способности выполнить роль «наилучшего объяснения» в рамках методологии IBE, фокусируясь на ключевом для нас атрибуте — принудительной силе.
Наш выбор в пользу теоретико-игрового и экономического подходов в качестве основного материала для построения онтологии также требует пояснения. Мы отдаём себе отчёт, что социология предлагает несравненно более богатый и детализированный эмпирический портрет социального мира. Однако задача настоящего исследования — не эмпирическое описание, а поиск минимальных онтологических оснований принудительной силы социального. Такую задачу эффективнее решать, двигаясь не «сверху вниз» — от сложных социологических понятий вроде «габитуса», «поля» или «системы, чья онтологическая нагрузка проблематична сама по себе, — а «снизу вверх», от моделей элементарного парного стратегического взаимодействия. Теория игр и институциональная экономика предоставляют наиболее разработанный концептуальный и формальный аппарат для подобного восхождения.
Важно, что мы рассматриваем этот аппарат не как «истину» об обществе, а как эвристический инструмент. Иначе говоря, в данной работе мы не строим социальную метафизику — полную картину социального мира. Вместо этого мы предлагает унифицирующую онтологическую рамку, подходящую для объяснения и методологической поддержки эмпирических исследований социальных институтов в разных социальных дисциплинах. Наша цель — не усилить «экономический империализм» (Mäki, 2009), а использовать мощный инструментарий для прояснения фундаментальной онтологической проблемы. Выводы, полученные с помощью такого эвристического инструмента, в дальнейшем могут быть проверены на возможность интерпретативного расширения на более сложные, нередуцируемо культурные и исторические феномены, изучаемые социологией. Однако первый шаг — построение общей параметрической модели — необходим для придания любым дальнейшим расширениям чёткого онтологического каркаса.
Исходя из изложенного, задача настоящей главы заключается в систематической оценке трёх основных исследовательских программ онтологии социальных институтов, чтобы показать, что ни одна из них не даёт удовлетворительного объяснения принудительной силы институтов, если следовать принципам IBE.
Мы начнём с наиболее формализованного и строгого кандидата — института как равновесия (1.1). Анализ покажет, что, хотя теория игр блестяще объясняет устойчивость, она сталкивается с фундаментальными трудностями при объяснении нормативной силы и нормативного принуждения, сводя их к расчёту издержек.
Затем обратимся к институту как системе правил (1.2). Критика здесь будет двоякой: конститутивные теории (Сёрл и последователи) оказываются «замкнуты» в коллективных представлениях и не объясняют источник принуждения, в то время как регулятивные теории (Норт, Остром) не вполне объясняют мотивацию следованию правилу.
Наконец, мы проанализируем синтетическую модель «правил-в-равновесии» Франческо Гуалы (1.3). Несмотря на её элегантность и объяснительные успехи, мы выявим её глубинную напряжённость: соотношение правил и равновесий и наличие готовой конвенции как условие стабильности института (что подменяет объясняемое готовым объяснением).
Общим итогом главы станет демонстрация того, что существующие подходы, взятые по отдельности или в синтезе, оставляют проблему принудительной силы социального института нерешённой. Этот теоретический тупик создаёт необходимость для разработки новой модели, которая сможет интегрировать сильные стороны рассмотренных программ, преодолев их ограничения. Построению такой модели и будут посвящены последующие главы данного исследования.
Мы начинаем наш анализ с самого фундаментального уровня — с концепции института как равновесия стратегического взаимодействия.
1.1 Институт как равновесие
Ниже мы кратко представим интеллектуальные истоки теоретико-игрового подхода к социальной координации, исходящие от Дэвида Юма и Томаса Гоббса, затем рассмотрим важные для нашей работы понятия теории игр, — игра, выплата, равновесие и несколько их разновидностей — а после представим аналитическую реконструкцию традиции как эндогенизации ограничения, в рамках которого происходит стратегический выбор. Подобная эндогенизация означает, что принуждение «встроено» в структуру стратегического взаимодействия.
Начать стоит с того, что традиция понимания социальной координации как источника социального порядка имеет богатую историю. Аристотель обосновывал социальные конвенции человеческой природой и стремлением к эвдемонии, или процветанию. Он рассматривал людей как «политических животных», которые естественным образом формируют сообщества для достижения коллективного благополучия. Справедливость и добродетель, центральные элементы его этики, считались основой политического порядка. В отличие от более поздних последователей теории общественного договора, Аристотель рассматривал социальную организацию как неотъемлемую часть человеческой рациональности, а не как преднамеренное соглашение (aristotle1998?).
Томас Гоббс переосмыслил социальные конвенции как конструкции, порождаемые насильственным «естественным состоянием» человечества. Он утверждал, что самосохранение побуждает индивидов отказываться от свобод в пользу суверена посредством общественного договора, являющегося результатом явного соглашения и обдумывания (deliberation) (Hobbes, 2016). Таким образом, у Гоббса конвенции возникают из страха и рационального эгоизма, а не из врождённой общительности.
Согласно философу науки Брайану Эпштейну (Epstein, 2018), понятие конвенции впервые было явно использовано в качестве альтернативы понятию соглашения Пуфендорфом (Pufendorf, 1673) для обозначения языка и права. Пуфендорф синтезировал идеи Гоббса с теологическим естественным правом. Соглашаясь с тем, что люди преследуют собственные интересы, он приписывал «закон социальности» божественному предписанию, требующему мирного сосуществования. Для Пуфендорфа естественное право обязывает людей создавать гражданские общества, а Бог является конечным автором социальных конвенций. Тем самым было введено моральное измерение, отсутствующее в инструменталистской системе Гоббса, предполагающее, что конвенции не только утилитарны, но и морально оправданы. Точка зрения Пуфендорфа заключалась в том, что конвенции не обязательно должны быть явно согласованы и могут существовать и функционировать без их преднамеренного создания. Эта интуиция в значительной степени сохранилась в последующей традиции.
Теория социальных конвенций Дэвида Юма (Hume, 1998, 2003) предложила новаторский подход к объяснению того, как конвенции возникают органически в результате взаимодействия, а не в результате рационального замысла или божественного предписания. Анализ Юма основывается на трёх ключевых предпосылках:
- роль обычаев в формировании поведения;
- центральная роль взаимной выгоды;
- искусственность конвенций.
Конвенции рассматриваются как продукты коллективной привычки, а не явного словесного соглашения. Эти компоненты составляют основу его теории, которая связывает психологию, этику и политическую философию.
Концепция Юма предполагает, что человеческое понимание возникает из чувственных впечатлений и идей, вытекающих из них. Это распространяется и на социальное поведение: конвенции возникают не из разума, а из повторяющегося опыта, формирующего привычки. Например, известный пример Юма с двумя гребцами в лодке иллюстрирует, как синхронизация возникает методом проб и ошибок, а не в результате предварительных переговоров:
«Двое мужчин, гребущих веслами в лодке, делают это по соглашению или договоренности, хотя никогда не давали друг другу обещаний» (Hume, 2003).
Однако некоторые современные исследователи утверждают, что подобная координация не является «юмовскими конвенциями», поскольку они, по мнению самого Юма 5, требуют наличия положительной социальной экстерналии, тогда как два преступника могут эффективно покинуть место преступления (Schliesser, 2024). В настоящей работе мы не будем сосредотачиваться на этом морально обусловленном понятии конвенций.
Со временем повторяющиеся поведенческие паттерны закрепляются в конвенциях, поскольку решают практические проблемы, такие как координация труда и установление прав собственности, минимизируя при этом социальные трения. Обычай, как пишет Юм, «делает наш опыт полезным для нас», создавая стабильные ожидания относительно поведения других, даже в отсутствие формальных правил (Hume, 2003). Акцент на привычке бросает вызов рационалистическим теориям вроде Гоббса, показывая, как конвенции возникают, не требуя рациональности, посредством итеративных корректировок.
Юм выделяет четыре ключевые особенности конвенций:
- взаимная выгода: все стороны получают выгоду от соблюдения конвенции (например, синхронная гребля обеспечивает продвижение; стандартизированная валюта облегчает торговлю);
- множество потенциальных решений: теоретически могут работать разные решения (например, грести быстро или медленно), однако последовательность важнее конкретного выбора;
- незапланированное соглашение: конвенции развиваются спонтанно посредством «медленного прогресса» проб и ошибок, а не в результате преднамеренного договора;
- взаимность: соблюдение конвенции зависит от ожидания взаимности со стороны других, создавая самоподдерживающийся цикл доверия.
Для Юма конвенции вроде прав собственности, возникают потому, что люди признают «общий интерес» в стабилизации владения имуществом во избежание конфликтов, даже если их естественные склонности тяготеют к личной выгоде (Hume, 1998). Этот прагматический подход отличает его теорию от моралистических рассуждений, рассматривающих конвенции исключительно как инструменты сдерживания оппортунизма.
Важно отметить, что подход Юма объединил описательную и нормативную области. Показав, как конвенции развиваются от практических потребностей к моральным нормам, он предложил достаточно натуралистическое объяснение социального порядка, избегающее апелляций к божественному закону или метафизической необходимости. Это согласуется с его неприятием причинно-следственной связи как чего-либо, выходящего за рамки наблюдаемой закономерности, и подкрепляет его точку зрения о том, что человеческие институты являются случайными продуктами обычаев, а не вечными истинами.
После Юма философы шотландского Просвещения утверждали, что социальный порядок является результатом взаимодействия отдельных людей, однако такой порядок не был специально задуман ими. Как писал Фергюсон (Ferguson, 1980), «нации натыкаются на установления, которые, действительно, являются результатом человеческой деятельности, но не воплощением какого-либо человеческого замысла».
Льюис возродил и операционализировал идеи Юма в теории конвенций, используя теорию игр и рассматривая конвенции как равновесия, поддерживаемые общими знаниями и прецедентами. В то время как Юм подчёркивал историческую случайность и постепенное возникновение, Льюис сформулировал более строгие критерии рациональности и взаимных ожиданий (lewis2008?). Он рассматривал конвенции как решения проблем координации — класса проблем в теории игр (разделе математики, изучающем стратегическое поведение), — которые требуют от двух или более агентов согласования своих действий для достижения совместно оптимального результата. В следующем разделе мы кратко рассмотрим основные концепции теории игр, прежде чем вернуться к теории конвенций Льюиса, поскольку теория игр будет иметь решающее значение в оставшейся части нашего исследования.
1.1.1 Важные понятия теории игр
Теория игр — это математическая теория, используемая для анализа ситуаций стратегического взаимодействия между рациональными агентами, принимающими решения. Первоначально разработанная Джоном фон Нейманом и Оскаром Моргенштерном в их фундаментальной работе Theory of Games and Economic Behavior (morgenstern1944?), теория игр впоследствии эволюционировала и охватила широкий спектр приложений в экономике, биологии, политической науке и социологии (Gintis, 2009a; osborne2004?). Она предоставляет инструменты для изучения того, как индивиды или группы принимают решения в условиях, когда их результаты зависят не только от собственных действий, но и от действий других. Базовыми элементами теории игр являются игры, игроки, стратегии, выигрыши (выплаты) и равновесия (Zamir, Maschler, & Solan, 2013).
Стратегическая игра в теории игр определяется как формальная модель \[ G = (N, S, P), \] где:
- \(N\) — множество игроков;
- \(S = (S_1, S_2, \dots, S_n)\) — наборы стратегий игроков, где \(S_i\) обозначает множество стратегий, доступных игроку \(i\);
- \(P = (P_1, P_2, \dots, P_n)\) — функции выигрыша, где \[ P_i : S_1 \times S_2 \times \dots \times S_n \rightarrow \mathbb{R} \] задаёт полезность игрока \(i\) при заданном профиле стратегий (myerson1991?).
Стратегия \(s_i \in S_i\) представляет собой полный план действий, которому игрок следует в любой возможной ситуации, возникающей в рамках игры. Выигрыши отражают вознаграждения, которые игроки получают в зависимости от комбинации стратегий, выбранных всеми участниками.
Одним из центральных понятий теории игр является равновесие, при котором ни один игрок не имеет стимула в одностороннем порядке изменять свою стратегию, учитывая стратегии других игроков. Наиболее известным понятием равновесия является равновесие Нэша (РН), введённое Джоном Нэшем в начале 1950-х годов (nash1950?). Профиль стратегий \((s_1^*, s_2^*, \dots, s_n^*)\) образует равновесие Нэша, если для каждого игрока \(i\) выполняется следующее условие: \[ P_i(s_i^*, s_{-i}^*) \geq P_i(s_i, s_{-i}^*) \quad \forall s_i \in S_i. \]
Здесь:
- \(P_i\) — функция выигрыша игрока \(i\);
- \(s_i^*\) — стратегия, выбранная игроком \(i\) в равновесии;
- \(s_{-i}^*\) — профиль стратегий всех остальных игроков, кроме \(i\).
Это неравенство означает, что игрок \(i\) не может увеличить свой выигрыш, односторонне отклоняясь от стратегии \(s_i^*\) к любой другой допустимой стратегии \(s_i\).
Роберт Ауманн в 1974 году ввёл понятие коррелированного равновесия (КР) (Aumann, 1974). Это обобщение равновесия Нэша позволяет игрокам координировать свои стратегии посредством сигналов от доверенного посредника. В отличие от равновесия Нэша, в котором игроки действуют независимо, КР допускает корреляцию стратегий через доступную обоим игрокам информацию. В рамках КР случайный сигнал рекомендует каждому игроку стратегию, и игроки следуют этой рекомендации. Формально КР удовлетворяет следующему условию: \[ \sum_{s'*{-i}} q(s_i, s'*{-i}) \cdot \bigl[P_i(s_i, s'_{-i}) - P_i(s'*i, s'*{-i})\bigr] \geq 0 \quad \forall s_i, s'_i. \]
Здесь:
- \(q(s_i, s'*{-i})\) — вероятность того, что посредник рекомендует стратегию \(s_i\) игроку \(i\) и профиль стратегий \(s'*{-i}\) остальным игрокам;
- \(P_i(s_i, s'*{-i})\) — выигрыш игрока \(i\), если он выбирает стратегию \(s_i\), а остальные игроки выбирают \(s'*{-i}\).
Это неравенство гарантирует, что ожидаемый выигрыш от следования рекомендации не меньше, чем ожидаемый выигрыш от отклонения от неё.
Как отмечал экономист Роджер Майерсон:
«Если на других планетах существует разумная жизнь, то в большинстве из них коррелированное равновесие было бы открыто раньше, чем равновесие Нэша» (Solan & Vohra, n.d.).
КР может рассматриваться как более естественное понятие по сравнению с РН, поскольку его математическая простота и опора на координацию делают его более легко обнаружимым. Майерсон утверждал, что приоритет, отданный равновесию Нэша в научной традиции, мог быть результатом исторической случайности, а не отражением его фундаментальной значимости. В обществах или цивилизациях, где кооперативное поведение поощряется или широко распространены внешние посредники, КР может выступать более интуитивной отправной точкой для анализа стратегических взаимодействий.
В области эволюционной биологии Джон Мейнард Смит и Роберт Прайс в 1973 году ввели понятие эволюционно стабильной стратегии (ЭСС) (maynard1973?). ЭСС — это стратегия \(s^*\), устойчивая к «вторжению» мутантных стратегий, и удовлетворяющая следующему условию: \[ P(s^*, s^*) > P(s', s^*) \quad \text{или} \quad \bigl[P(s^*, s^*) = P(s', s^*) \ \text{и} \ P(s^*, s') > P(s', s')\bigr]. \] Здесь:
- \(P(s^*, s^*)\) — выигрыш, когда и резидент, и захватчик используют стратегию \(s^*\);
- \(P(s', s^*)\) — выигрыш мутанта, использующего стратегию \(s'\), против резидента, придерживающегося стратегии \(s^*\).
Помимо РН, КР и ЭСС, в теории игр были разработаны и другие концепции равновесия, включая совершенное по подыграм (selten1965?), последовательное (sequential) (kreps1982?), байесовское (fudenberg1991?), равновесие дрожащей руки (selten1975?) и другие. Эти уточнения направлены на устранение ограничений равновесия Нэша, особенно в динамических играх. В настоящей диссертации мы сосредоточимся на КР и ЭСС и немного затронем совершенное байесовское равновесие в развёрнутых играх.
Стоит сказать про формы представления игр: нормальную (матричную, стратегическую) и развёрнутую. Игра в нормальной форме фиксирует статичную картину равновесия, когда все участники уже приняли решения и получили выплаты по их итогам. Игра в развёрнутой форме часто похожа на дерево, где каждый узел — принятие решения одним из игроков. Её основная характеристика — отражение последовательности ходов.
| Сотрудничать | Предать | |
|---|---|---|
| Сотрудничать | (3, 3) | (0, 4) |
| Предать | (4, 0) | (1, 1) |
Игра «Дилемма заключённого» в нормальной форме
Также важно другое различение — статических (one-shot) и динамических игр. Оно отражает не форму представления игры, а характер принятия решений игроками в ней. В статических играх решение принимается одновременно и без знания действий других. В динамических — решения последовательны и наблюдаемы обоими игроками. Шахматы — пример такой динамической стратегической ситуации. Важно, что динамические игры могут быть разными: играми в развёрнутой форме, где видна последовательность ходов, повторяющимися играми вроде «Дилеммы заключённого» и другими.
Ещё одно важное для нас различение — полнота информации в динамических играх. Если каждый игрок видит все предыдущие ходы другого игрока или знает, информация в игре полная, а если один из игроков не различает состояния игры (вроде «типа» оппонента), то неполная. Эти различения станут особенно важными при анализе теории правил-в-равновесии в Главе 2.
В целом, проблемы координации и кооперации фундаментальны для социальной философии со времён Гоббса (Hobbes, 2016), а теория игр стала незаменимым инструментом их анализа благодаря своей аналитической строгости и концептуальной ясности.
Проблемы координации возникают, когда индивидам или группам необходимо выбрать одно из нескольких возможных равновесий. Например, по какой стороне дороги ездить. Это создаёт неопределённость относительно того, какое решение будет реализовано. Подобные проблемы отражают ситуации, в которых все стороны выигрывают от согласованных действий, но испытывают трудности с выбором конкретного варианта. Если есть дорога с двумя полосами, то нужно выбрать, по какой стороне ездить всем, чтобы избежать аварий. Важно, что в проблемах координации индивидуальный и общий интерес совпадают — ехать по правой стороне выгодно и каждому отдельному водителю и популяции в целом (Bicchieri, 2005).
Проблемы кооперации, напротив, подчёркивают конфликт между индивидуальной рациональностью и коллективной выгодой: взаимная кооперация обеспечивает лучший результат для всех, однако индивидуальный эгоизм может приводить к социально неэффективным исходам. Например, перевыпас скота на общем пастбище, когда разные пастухи максимизируют индивидуальную полезность, в сумме истощая общий ресурс (ostrom1990?). Равновесие Нэша здесь хуже кооперативного, когда используют общий ресурс ограниченно. Такие проблемы часто требуют механизмов принуждения или ограничения.
Примерами проблем координации и кооперации служат классические игры, такие как «Битва полов» и «Дилемма заключённого». В первой супруги координируют выбор совместного досуга, который устроил бы всех, а во второй два заключённых независимо решают, сотрудничать ли друг с другом или выдать партнёра полиции. Матрицы выигрышей этих игр представлены ниже6.
Чтобы проиллюстрировать различия между концепциями равновесия при решении проблем координации, рассмотрим игру «Битва полов» в рамках чистого РН, смешанного РН и КР.
В чистых стратегиях существуют два равновесия Нэша: оба игрока выбирают либо балет, либо футбол. Эти равновесия обеспечивают идеальную координацию, но по своей сути несправедливы, поскольку один игрок всегда получает не то, что хочет.
Существует также смешанное, то есть вероятностное РН. Пусть муж выбирает балет с вероятностью \(p\) и футбол с вероятностью \(1-p\), а жена выбирает балет с вероятностью \(q\) и футбол с вероятностью \(1-q\). Используя принцип безразличия, согласно которому игрок рандомизирует свои стратегии таким образом, чтобы противник был безразличен к доступным стратегиям, получаем: \[ 2q = 1 - q \Rightarrow q = \frac{1}{3}, \] \[ p = \frac{2}{3}. \] В КР публичный сигнал (например, подбрасывание честной монеты) рекомендует обоим игрокам пойти либо на балет, либо на футбол с равной вероятностью, обеспечивая ожидаемый выигрыш \(1.5\) каждому игроку. КР помогает игрокам получать более высокие выигрыши и справедливость по сравнению как с чистым, так и со смешанным РН, используя общую случайность или коммуникацию (Vanderschraaf, 1995).
Чтобы продемонстрировать, как сигнал влияет на структуру выигрышей, добавим стратегию Следовать сигналу, где игроки выбирают стратегию на основе подбрасывания монеты (Орел = Балет, Решка = Футбол). Это легитимно, поскольку КР — это РН в расширенной игре с дополнительным набором стратегий (Gintis, 2009b, 2009a).
Расширенная игровая матрица принимает следующий вид:
Профиль стратегий \((FS, FS)\) образует РН в расширенной игре, где \(FS\) обозначает стратегию следовать сигналу. КР тем самым может быть представлено как РН в расширенной игре, но при этом оно лучше отражает реальные координационные механизмы.
Возвращаясь к проблемам координации, философ науки Кейлин О’Коннор различает коррелятивные и комплементарные проблемы координации (O’Connor, 2019). В первых успешная координация требует выбора одинаковых действий, во вторых — различных. Например, чтобы избежать столкновения, водителям на разных полосах дороги нужно ехать по правой стороне дороги. А для того, чтобы хорошо подготовиться к вечеринке, одному нужно прибраться в квартире, а другому — заказать пиццу. В первом случае успешная координация зависит от выбора одного и того же действия, во втором — разных.
Теория конвенций Дэвида Льюиса, рассматриваемая в следующем разделе, предлагает систематическое объяснение того, каким образом такие координационные равновесия возникают и закрепляются.
1.1.2 Координационное равновесие: традиция «конвенций» Дэвида Льюиса
Интеллектуальная атмосфера, в которой создавалась работа Дэвила Льюиса Convention, была в значительной степени сосредоточена на вопросах языка, значения и социального поведения.
В середине XX века интерес к влиянию социальных практик на лингвистическое значение неуклонно возрастал, поскольку такие философы, как Уиллард Куайн (quine1960?) и Людвиг Витгенштейн (wittgenstein1953?), утверждали, что значение возникает из совместного употребления внутри сообщества. Витгенштейн подчёркивал, что значение языка формируется через публичное использование, а не задаётся какими-либо внутренними семантическими свойствами. Продолжая эту традицию, Льюис стремился объяснить, каким образом языковые конвенции формируются, стабилизируются и сохраняются в сообществах, предложив систематическое описание их развития во времени. Концептуализируя значение слов как координированное поведение, Льюис заложил основания для понимания языка как социально организованной деятельности, а не как врождённой или сугубо индивидуалистической способности.
Дух времени аналитической философии 1960-х годов был связан с переосмыслением наследия логического позитивизма, который с помощью формальной логики и эмпирической верификации определял значение через аналитически истинные высказывания или эмпирически проверяемые утверждения (Godfrey-Smith, 2003). Однако к 1960-м годам критика со стороны Куайна, Патнэма и других философов поставила под сомнение этот подход — в особенности различие между аналитическими и синтетическими истинами, где первые считались истинными в силу значения, а вторые — в силу их отношения к миру.
Куайн отвергал традиционные представления о необходимости и аналитичности, утверждая, что онтологические обязательства встроены в теории и язык (quine1951?; quine1960?; quine1969?), и подчёркивал роль эмпирических данных и прагматических соображений в формировании убеждений. Его критика аналитичности акцентировала изменяемость языка, показывая, что конвенции являются подвижными, а не фиксированными. Мысленный эксперимент Патнэма «Двойная Земля»7 развил эти идеи далее, отстаивая семантический экстернализм — позицию, согласно которой значение слов зависит от внешних фактов, а не только от ментальных состояний, — тем самым бросая вызов интерналистским теориям значения и подчёркивая роль внешних факторов в языковых практиках. В результате конвенции понимаются как зависящие от контекста и окружающей среды, выходя за рамки чисто внутренних или необходимых определений.
Теория конвенций Льюиса стала ответом на этот интеллектуальный сдвиг, подчёркивая контингентный характер значения. Конвенции возникают как произвольные, но устойчивые решения проблем координации, отражая более прагматичное и гибкое понимание языкового значения и социальных практик. Согласно Льюису, даже самые строгие обычаи начинались как случайные поведенческие паттерны, которые могли бы быть иными, но усиливались с каждой итерацией.
Ещё одной важной философской проблемой, к которой обращался Льюис, была онтология социальных правил и норм, находящаяся под сильным влиянием работ Юма. Льюис развил юмовскую идею о том, что конвенции могут возникать и сохраняться даже при отсутствии централизованного принуждения. Он утверждал, что конвенции являются самоподдерживающимися: после их установления у индивидов нет причин отклоняться от них, пока остальные продолжают им следовать. Главное расхождение с Юмом состояло в акценте на рациональности агентов как источнике такого конформизма, тогда как Юм подчёркивал роль психологической привычки.
Примером может служить развитие денег как средства обмена. Изначально в качестве валюты использовались различные объекты — скот, раковины или металлические монеты. Со временем бумажные деньги получили широкое признание не из-за внутренней ценности, а потому, что люди ожидали, что другие будут принимать их в обмене. Этот вывод впоследствии оказал влияние на теории спонтанного порядка и децентрализованных систем в политической философии и экономике, в частности у Фридриха Хайека (hayek1973?). Объясняя конвенции как естественные результаты повторяющихся социальных взаимодействий, Льюис внёс вклад в более широкое понимание того, как нормы, институты и языковые практики могут возникать органически, без явного замысла или принуждения.
Если проблемы значения, языка и конвенциональности были теми вопросами, которые Льюис стремился решить, а юмовское понимание конвенций — ресурсом аргументации, ему всё же требовался инструмент для построения этого аргумента. Таким инструментом стала теория игр (vonneumann1944?), а в особенности подход Томаса Шеллинга к стратегическому взаимодействию в играх со «смешанными мотивами» (mixed-motive games) и идея «фокальных точек» (Schelling, 1980).
Работы Шеллинга отличались от преобладавшего в теории игр акцента на играх с нулевой суммой, где всегда есть победитель и проигравший. Шеллинг показал, что реальные взаимодействия часто характеризуются «смешанными мотивами», в которых интересы участников одновременно и конфликтуют, и совпадают. Он критиковал ограничения сугубо математического анализа стратегического взаимодействия и отстаивал необходимость эмпирических исследований условий, формирующих поведение, в частности возможности коммуникации и наличия очевидных (salient) альтернатив (Schelling, 1980). Этот расширенный взгляд, включающий как конфликт, так и кооперацию, охватывал именно те феномены сотрудничества и координации, которые привлекли Льюиса в контексте проблемы социальных конвенций.
Ещё одним важным вкладом стало понятие фокальных точек — решений, к которым индивиды естественным образом склоняются в координационных играх без явной коммуникации. Шеллинг продемонстрировал это в экспериментах, где участникам предлагалось выбрать место встречи в Нью-Йорке без предварительной договорённости: подавляющее большинство выбирало полдень на Центральном вокзале, несмотря на отсутствие каких-либо внутренних выигрышных преимуществ у этого места, но благодаря его культурной заметности (schelling1960?).
В исследовании чистых координационных игр Шеллинг анализировал взаимодействия, в которых интересы игроков совпадают, но отсутствует коммуникация, например выбор одинаковых чисел ради вознаграждения. Участники часто сходились на очевидных вариантах, таких как число \(1\), благодаря его свойству как наименьшего положительного целого (schelling1960?). Работы Шеллинга также уточнили концепцию равновесия Нэша, показав, каким образом фокальные точки помогают выделять устойчивые и заметные исходы среди множества равновесий Нэша (Lewis, 2008, p. 78).
Льюис формализовал идеи Шеллинга в теории конвенций, определив их как решения повторяющихся проблем координации, в которых агенты сходятся на фокальных точках благодаря взаимным ожиданиям (Lewis, 2008, p. 43). Конвенции опираются на внешние стимулы, такие как избегание провалов координации, а не на внутренние обязательства. Льюис также подчёркивал, что сама коммуникация является координационной игрой, в которой сигналы получают значение через разделяемые конвенции (Lewis, 2008, p. 95).
Одной из центральных идей, заимствованных Льюисом у Шеллинга, является понятие фокальной точки, или «салентности» (salience, которую дальше мы будем называть «очевидностью»). Он показал, что социальные конвенции возникают как фокальные точки координации. Так, во многих обществах люди ездят по одной стороне дороги не из-за внутреннего предпочтения именно этой стороны, а потому, что универсальное следование одной конвенции обеспечивает безопасность и предсказуемость. Развивая эту мысль, Льюис утверждает, что агенты выбирают наиболее «очевидную» конвенцию — ту, которая «выделяется» среди альтернатив благодаря прецеденту, явному соглашению или внутренним свойствам. Согласно Льюису, «очевидность« — это субъективная психологическая характеристика, независимая от стратегической ситуации, которая управляет возникновением и поддержанием конвенций. В частности, Льюис анализирует, как конвенции возникают (динамика — через первоначальный выбор и последующее усиление «очевидности«) и почему им следуют (статика — из-за подавляющей заметности уже существующей конвенции, формирующей ожидание конформизма). Последователи Льюиса переосмысляют и формализуют понятие «очевидности» в эволюционном и информационном ключе (Gintis, 2007b; O’Connor, 2019, 2020; Skyrms, 2014; Vanderschraaf, 1995).
Ещё одним важным заимствованием у Шеллинга является роль ожиданий и самопринуждения в стратегическом равновесии. Шеллинг показал, что во многих координационных сценариях после установления равновесия отклонение становится иррациональным, поскольку издержки нескоординированных действий превышают потенциальные индивидуальные выгоды. Льюис развивает эту идею, определяя конвенции как самоподдерживающиеся: индивиды следуют им не из-за внешнего принуждения, а потому, что взаимные ожидания делают отклонение затратным. Это особенно наглядно проявляется в языковых конвенциях, где использование определённых слов и грамматических структур сохраняется благодаря ожиданию, что другие будут делать то же самое.
Кроме того, льюисовское понятие общего знания, являющееся фундаментальным для его теории конвенций, восходит к акценту Шеллинга на взаимной осведомлённости в стратегическом взаимодействии, тесно связанному с «очевидностью». Хотя у Шеллинга отсутствовала строгая формализация, он подчёркивал ключевую роль разделяемого понимания для успешной координации. Льюис развил эту идею, утверждая, что устойчивость конвенции требует не только фактического следования ей, но и признания её ожидаемым образцом поведения внутри группы, что делает возможным поддержание конвенций в больших популяциях.
1.1.2.1 Теория конвенций Льюиса
Льюис определял социальную конвенцию как произвольный, но самоподдерживающийся поведенческий паттерн, возникающий из повторяющихся проблем координации между двумя или более игроками. Её отличительной чертой является конформизм участников по отношению к этим паттернам, поскольку они ожидают, что другие будут поступать так же, и это является общим знанием: каждый игрок ожидает конформизма остальных. Отклонение от конвенционального выбора действия приводит к меньшему выигрышу, поэтому у игроков нет стимулов к одностороннему отклонению. Так, если все ездят по правой стороне дороги, для каждого водителя рационально поступать так же, чтобы избежать столкновений. Льюис формулирует понятие конвенции следующим образом (Lewis, 2008, p. 76):
Поведенческая регулярность \(R\) в популяции \(P\) в повторяющейся ситуации \(S\) является конвенцией тогда и только тогда, когда:
- Каждый член \(P\) следует \(R\)
- Каждый индивид ожидает, что остальные будут следовать \(R\)
- Все члены имеют сходные предпочтения относительно возможных поведенческих регулярностей
- Каждый предпочитает всеобщее следование \(R\) при условии, что почти все остальные ему следуют
- Члены популяции также предпочли бы альтернативную регулярность \(R'\), при прочих равных условиях, если \(R'\) и \(R\) являются взаимно исключающими.
Позднее Льюис уточнил свой анализ, допуская редкие отклонения от конвенции, а Брайан Скирмс недавно ввёл понятие квазиконвенций как неустойчивых конвенций, основанных на концепции грубого коррелированного равновесия (coarse correlated equilibrium) (Skyrms, 2023).
Льюисовская конвенция представляет собой особый вид равновесия, называемый координационным равновесием, которое в общих чертах напоминает РН, но выходит за его пределы. В РН ни один участник не может улучшить свой результат посредством одностороннего изменения стратегии. Если отклонение строго снижает выигрыш, равновесие считается строгим. В этом смысле РН представляет собой «устойчивое состояние», в котором каждый индивид действует оптимально, принимая действия других как заданные. Однако льюисовская конвенция расширяет эту концепцию, подчёркивая коллективное предпочтение конформизма даже при наличии незначительных отклонений.
Важной особенностью льюисовского подхода является произвольность конвенций: \(R\) является конвенцией только в том случае, если альтернативная регулярность \(R'\) могла бы столь же успешно выполнять ту же функцию. Это подчёркивает, что конвенции являются контингентными решениями среди множества возможных вариантов, а не внутренне необходимыми структурами, что продолжает идеи Куайна (quine1969?), Патнэма (putnam1975?) и других.
Кроме того, Льюис ввёл понятие общего знания как необходимое условие конвенции, определяя факт \(p\) как общее знание, если:
- все знают \(p\);
- все знают, что все знают \(p\);
- все знают, что все знают, что все знают \(p\), и так далее.
Эта рекурсивная концепция знания стала предметом обширных обсуждений в философской и теоретико-игровой литературе. Роберт Ауманн (Aumann, 1976) и другие предложили формальные модели общего знания, отличающиеся от первоначального неформального подхода Льюиса.
Поскольку теория Льюиса опирается на теорию игр, рациональность играет в ней фундаментальную роль. Льюис предполагал, что агенты инструментально рациональны, то есть выбирают действия, максимизирующие ожидаемую полезность с учётом их убеждений и ожиданий относительно мира и поведения других. Хотя метафора человека как максимизирующего агента подвергалась критике (Paternotte, 2020), она по-прежнему служит эвристическим ориентиром в экономической теории (Gintis, 2007a; Gintis & Helbing, 2013), биологии (Engel & Singer, 2008; S. Okasha, 2017; Samir Okasha & Binmore, 2012) и человеческой экологии (Sterelny, 2012; mouden2012a?). Вместе с тем существуют альтернативные взгляды на необходимость рациональности для существования конвенций. Например, философ биологии Рут Милликан утверждает, что конвенции стабилизируются исключительно статистической силой прецедента и не требуют рациональности или сознания (Ruth G. Millikan, 2022).
Льюисовская концепция конвенций объединяет поведение, убеждения, предпочтения и ожидания в рамках общего знания и рациональности для объяснения устойчивости конвенций. Каждый элемент определения играет ключевую роль:
- общее знание обеспечивает разделяемое понимание конвенции;
- предпочтение конформизма создаёт стимулы к следованию при условии кооперации других;
- рациональность направляет индивидуальный выбор в контексте общих ожиданий.
Поскольку одной из главных мотиваций анализа Льюиса была философская проблема языкового значения, он стремился показать, что язык укоренён в конвенциях, не требующих предварительного соглашения о терминах. Подобно тому как водители координируются относительно стороны движения без формального контракта, носители языка формируют конвенции употребления звуков или жестов для обозначения определённых объектов через повторяющееся взаимодействие и взаимные ожидания. Льюис рассматривал язык как систему сигналов, в которой значение возникает из конвенциональной связи между сигналами (словами, выражениями) и состояниями мира. Например, слово «кошка» конвенционально сигнализирует наличие представителя семейства кошачьих. Эта конвенция поддерживается тем, что говорящие обычно намерены говорить правду, а слушающие — доверяют этому намерению. Взаимные ожидания и опора на устойчивость связей «сигнал–значение» обеспечивают эффективную коммуникацию как форму координации.
Это привело Льюиса к различению поведенческих и сигнальных конвенций (lewis2008?): первые координируют действия, вторые — значения в коммуникации. В качестве классического примера сигнальной конвенции Льюис приводит историю Пола Ревира и фонарей, вывешенных на колокольне Старой Северной церкви в 1775 году для предупреждения колониального ополчения о наступлении британских войск: два фонаря означали наступление с моря, один — с суши. Действия получателей сообщения различались в зависимости от сигнала. Отправители и получатели координируются вокруг заранее установленного паттерна вида «если \(X\), то \(Y\)»8.
Для Льюиса сигнальные конвенции служат особым случаем, или подтипом, поведенческих конвенций, поскольку разделяют с ними произвольность, конформизм и статус общего знания. Отличие сигнальных конвенций состоит в том, что они включают коммуникацию и интерпретацию значения и решают проблемы координации посредством передачи информации. Они требуют процессов кодирования и декодирования, то есть производства и интерпретации сигналов.
Важной особенностью соотношения этих двух классов конвенций является то, что, по Льюису, сигнальные конвенции фундаментально опираются на уже существующие поведенческие конвенции и формируются под их влиянием. Например, значения слов зависят от соблюдения обеими сторонами установленных норм произношения и грамматики. Сигнальные системы часто демонстрируют вложенность, когда конкретные конвенции встроены в более широкие поведенческие регулярности. Так, поднятие руки для получения слова на собрании является сигнальной конвенцией, вложенной в более общую поведенческую конвенцию очередности высказываний (Vanderschraaf & Skyrms, n.d.).
Существует формальное различие между поведенческими (или «общими», как их называет Льюис) и сигнальными конвенциями. В сигнальных играх игроки выступают либо в роли отправителей, либо в роли получателей: первые обладают приватной информацией о состоянии мира и посылают сигнал, вторые наблюдают сигнал и действуют на его основе. Формально это можно представить следующим образом:
- Состояния мира: \(L\) (лево) и \(R\) (право)
- Сигналы: \(V_1\) и \(V_2\)
- Действия: \(A^L\) (повернуть влево) и \(A^R\) (повернуть вправо)
Если сигнал отправителя, представляющий состояние мира, корректно интерпретируется получателем, оба игрока получают выигрыш \((1, 1)\); если же кодирование или декодирование информации не удаётся, игроки получают \((0, 0)\). В рамках этого «информационного слоя» сигнальных систем существует множество вариантов — объединение сигналов, синонимия, обман и другие — которые подробно изучаются прежде всего философами биологии (Godfrey-Smith, 1991; Huttegger & Skyrms, 2008; Martínez, 2019; Shea, 2018; Skyrms, 2010b, 2010a).
Философ биологии Питер Годфри-Смит уточнил модель Льюиса, различив координацию состояние–действие и координацию действие–действие (Godfrey-Smith, 2014):
- состояние–действие: сигналы сопоставляют состояния мира действиям получателя;
- действие–действие: сигналы синхронизируют действия агентов без обращения к внешним состояниям.
Координация действие–действие позволяет интерпретировать юмовских гребцов как сигнальную систему этого типа: ритм гребков служит императивным сигналом («Греби сейчас!»), который непосредственно координирует совместные действия, а не передаёт информацию о внешних условиях (Martínez & Godfrey-Smith, 2016). Отсутствие экзогенного состояния сводит систему к чистой координационной игре с равновесием Нэша или координационным равновесием, где «сигнал» (ритм гребков) функционирует как самоподдерживающаяся конвенция, эндогенно стабилизированная общими интересами и взаимными ожиданиями. В отличие от зависимой от состояния мира сигнализации, координация действие–действие ориентирована на межличностную синхронизацию через поведенческую обратную связь в реальном времени. Это демонстрирует, как коммуникация может организовывать совместное действие без репрезентативного содержания (representational content), что является важной проблемой в философии биологии и философии сознания.
Парадигматический пример координации «состояние–действие» — тревожные крики мартышек-верветок, специфичные для каждого типа хищника. При виде орла крик побуждает прятаться в траве, при виде змеи — взбираться на дерево (Seyfarth & Cheney, 1990). Совпадение состояния мира, сигнала и действия образует полноценную сигнальную систему, или конвенцию. В данном контексте важно, что конвенция служит функции адаптивной цели — выживанию.
Хотя формально поведенческие и сигнальные конвенции схожи, поскольку обе могут быть описаны как игры с игроками и выигрышами, они различаются тем, что вторые включают дополнительный «информационный слой» между участниками. И хотя сам Льюис считал сигнальные конвенции подтипом поведенческих, их взаимосвязь остаётся неоднозначной. Для Скирмса сигналы информируют действия, а сигнальные сети координируют действия, что неявно предполагает первичность сигнальных конвенций по отношению к поведенческим, а не наоборот. Более того, Скирмс выдвигает тезис о том, что сигнализация ответственна за эволюцию командной работы как таковой (Skyrms, 2010a), что ставит под вопрос иерархию Льюиса и порождает проблему «курицы и яйца», выходящую за рамки данной диссертации.
1.1.2.2 Конвенция как информационная стабильность в теории Вандершраафа
Теория конвенций Льюиса стала отправной точкой для исследований конвенций, и последующие авторы уточняли его теорию, порой до неузнаваемости. Существует множество уточнений, однако мы рассмотрим лишь наиболее важные для нашей темы — разработки Питера Вандершраафа и Брайана Скирмса.
Расплывчатость понятия равновесия была одной из критик теории Льюиса, и этот компонент активно разрабатывался и уточнялся. Две заметные переработки понятия конвенций представлены в виде коррелированных равновесий и эволюционно стабильных стратегий.
Философ науки Питер Вандершрааф (Vanderschraaf, 1995, 1998, 2001) переопределил социальные конвенции как КР через индуктивное обучение, рассматривая их как основу достижения справедливости в смысле взаимной выгоды. Он формализовал понятие «очевидности» как информационные разбиения (information partitions) и применил правило Дирихле9, чтобы показать, как агенты последовательно обновляют свои убеждения о стратегиях других, постепенно приходя к равновесию эндогенно, без предзаданного внешнего сигнала.
Льюис считал координационное равновесие конвенцией, если игроки обладают общим знанием о взаимных ожиданиях. Вандершрааф называет это критерием взаимных ожиданий (КВО) (Vanderschraaf, 1995). У каждого агента есть причина следовать своей части конвенции, ожидая, что другие агенты поступят так же. Льюис утверждал, что равновесие должно быть координационным, чтобы отражать идею о том, что человек, следующий конвенции, хочет, чтобы его намерение было распознано как таковое. Вандершрааф называет это критерием публичных намерений (КПН). Кроме того, с точки зрения Вандершраафа, Льюис полагал, что общее знание КВО необходимо для существования конвенции. Однако, как отмечает Вандершрааф, этого недостаточно, поскольку общее знание КВО может выполняться в любом строгом равновесии Нэша.
Согласно Вандершраафу, конвенция представляет собой профиль стратегий \(\sigma^* = (\sigma_1^*, \ldots, \sigma_n^*)\), в котором каждый агент \(i\) максимизирует ожидаемую полезность так, что \(\mathbb{E}[u_i(\sigma_i^*, \sigma_{-i}^*)] \geq \mathbb{E}[u_i(\sigma_i', \sigma_{-i}^*)]\) для всех альтернативных стратегий \(\sigma_i' \neq \sigma_i^*\), обеспечивая устойчивость к односторонним отклонениям.
Формирование конвенций происходит не посредством когнитивно затратного рационального рассуждения, а через относительно дешёвые механизмы индуктивного обучения. Агенты обновляют свои убеждения о стратегиях оппонентов согласно динамике Дирихле. Делиберативное равновесие определяется как фиксированная точка этой обучающей динамики, в которой убеждения агентов стабилизируются. Стабилизированные совместные убеждения и стратегии, возникающие в результате такого итеративного обновления, соответствуют тому, что Вандершрааф называет эндогенным коррелированным равновесием (ЭКР)10. Это КР, возникающее благодаря индуктивному обучению агентов и взаимному пересмотру убеждений, а не из внешнего устройства корреляции, как это часто представляется в более широкой литературе по теории игр11.
Понимание конвенции как КР допускает более «справедливую» координацию, как это было показано ранее на примере игры «Битва полов». Эта игра имеет смешанное равновесие Нэша, в котором оба агента выбирают свои стратегии с вероятностью \(\frac{2}{3}\). Однако это равновесие не удовлетворяет КПН и не является конвенцией. Тем не менее, существует КР, справедливое для обоих игроков и Парето-предпочтительное по сравнению с равновесиями в чистых стратегиях. При подбрасывании честной монеты задаётся вероятностное пространство \(\Omega = \{H, T\}\) с исходами «орёл» и «решка». У агентов есть общее информационное разбиение \(\mathscr{H} = \{\{H\}, \{T\}\}\), а коррелированная комбинация стратегий задаётся функцией
\[f: \Omega \rightarrow \{A1, A2\} \times \{A1, A2\}\]
где \(f(H) = (A1, A1)\) и \(f(T) = (A2, A2)\). Если выпадает «орел», оба идут на балет, а если «решка» — на футбол.
Ни один игрок не захочет отклоняться, поскольку общий ожидаемый выигрыш каждого игрока в этом равновесии равен Парето-доминирует над выигрышами в РН:
\[ E(u_k \circ f)=\frac{1}{2} \cdot E(u_k \circ f \mid H)+\frac{1}{2} \cdot E(u_k \circ f \mid T)=\frac{3}{2}. \]
Это означает, что каждый игрок предпочитает ожидаемый выигрыш от \(f\) выигрышу смешанного равновесия и чистых РН.
Для Вандершраафа конвенция — это отображение «состояний мира» в комбинации стратегий некооперативной игры, которые удовлетворяют КПН (Vanderschraaf, 1995, p. 67).
Более детально, поскольку Вандершрааф опирается на модель Ауманна (Aumann, 1987), каждый игрок имеет собственное информационное разбиение \(\mathscr{H}*k\) вероятностного пространства \(\Omega\). Элементарные события на \(\Omega\) называются состояниями мира. В каждом состоянии \(\omega\) игрок \(k\) знает, какой элемент \(H*{kj} \in \mathscr{H}*k\) реализовался, но не знает, какое именно \(\omega\). \(H*{kj}\) представляет частную информацию игрока \(k\) о состояниях мира. Хотя \(k\) знает о существовании разбиений оппонентов, он не знает их конкретного содержания. Функция \(f: \Omega \rightarrow S\) задаёт экзогенно коррелированный кортеж стратегий, так что в каждом состоянии мира \(\omega \in \Omega\) каждый игрок \(k\) выбирает комбинацию стратегий \(f(\omega) = (f_1(\omega), \dots, f_n(\omega)) \in S\), коррелированную с \(\omega\). Следовательно, играя \(f_k(\omega)\), игрок \(k\) следует байесовской рациональности и максимизирует ожидаемый выигрыш с учётом частной информации и ожиданий относительно оппонентов.
Ограничение измеримости на \(f_k\) означает, что агент \(k\) знает свою стратегию в каждом \(\omega\). Это определение предполагает, что игроки обладают общим знанием структуры выигрышей, разбиений \(\Omega\) и функции \(f: \Omega \rightarrow S\), что необходимо для вычисления ожидаемых выигрышей и достижения коррелированного равновесия. Если игроки также обладают общим знанием байесовской рациональности, они будут следовать своим частям функции \(f\), ожидая, что другие поступят так же, поскольку таким образом совместно максимизируется ожидаемая полезность.
Вклад Вандершраафа состоит в формализации «очевидности»: он использует общее информационное разбиение \(\mathscr{H}\) как необходимое ограничение, согласующее определение конвенции с духом теории Льюиса. Остаётся вопрос о происхождении самой очевидности. Льюис предполагал, что предыгровая коммуникация, прецеденты и сигналы среды позволяют агентам связывать ожидания и действия с различными «состояниями мира», достигая равновесия. Однако такие источники сталкиваются с проблемой бесконечного регресса, поскольку неясно, как они могли возникнуть без уже существующих конвенциональных правил. Вандершрааф совместно со Скирмсом (Vanderschraaf & Skyrms, 1993) предложили индуктивную делиберацию как механизм формирования очевидности. Она действует через рекурсивную модификацию убеждений: игроки могут достичь коррелированного равновесия без коммуникации, динамически обновляя свои убеждения по общему индуктивному правилу, даже если исходные убеждения не допускают равновесия.
1.1.2.3 Скирмс и конвенция как динамический аттрактор
Скирмс поместил теорию конвенций Льюиса в динамическую и эволюционную рамку. Он показал, как сигнальные конвенции могут возникать в процессе эволюции и обучения агентов с ограниченными когнитивными способностями, что позволяет обойтись без общего знания, индуктивного научения и даже индивидуальной рациональности (Skyrms, 2010a).
Хотя Скирмс фактически создал целую исследовательскую программу с многочисленными последователями (Franke, 2014; Huttegger, 2007a, 2007b; LaCroix, 2020a; O’Connor, 2020), стоит отметить, что он вряд ли сделал бы это без своей ранней, менее известной работы по теории игр, связанной с обобщением концепции ЭСС.
ЭСС, сформулированная Джоном Мейнардом Смитом и Робертом Прайсом (Smith & Price, 1973), — это стратегия, которая, если её примет большинство популяции, не может быть вытеснена никакой мутантной стратегией. Её формулировка предполагает случайное распределение пар12, когда индивиды встречаются для стратегических взаимодействий независимо от своих типов, так что вероятность встретить любую стратегию пропорциональна её частоте в популяции. Хотя это упрощает анализ и даёт элегантные теоретические результаты, оно ограничивает применимость ЭСС к смешанным популяциям и не отражает сложности структурированных взаимодействий.
Скирмс ослабил допущение случайного распределения пар и выяснил, что ЭСС не генерирует устойчивые стратегии при неслучайных парах, возникающих, например, через селекцию по родственникам, сигнальные системы, пространственные или социальные структуры. Эти корреляции создают зависимости взаимодействий, увеличивая вероятность встреч с аналогичной стратегией. Такие зависимости кардинально изменяют эволюционную динамику и могут стабилизировать стратегии вроде кооперации или сигнальной конвенции, которые были бы нестабильны при классических ЭСС (Skyrms, 1994).
Это привело Скирмса к введению понятия адаптивно ратифицируемой стратегии — обобщения ЭСС, которое учитывает, что структура взаимодействий в популяции может формироваться эндогенно, а не быть случайной.
Стратегия считается адаптивно ратифицируемой, если она даёт наибольшую ожидаемую приспособленность в ситуации, когда почти вся популяция уже её использует — с учётом того, что вероятность встретить разные стратегии может зависеть от корреляций в поведении. Иначе говоря, важно не только то, как стратегия работает против случайного оппонента, но и то, что носители схожих стратегий чаще взаимодействуют друг с другом.
Это обеспечивает динамическую устойчивость при репликаторной динамике: даже если появляются мутанты, они не получают систематического преимущества, потому что структура контактов уже «поддерживает» доминирующую стратегию (Skyrms, 1994).
Понятие адаптивно ратифицируемой стратегии позволило Скирмсу ввести ещё одно понятие — коррелированная конвенция (Skyrms, 2014). Это стабильные, но не обязательно Парето-оптимальные паттерны поведения, возможные благодаря любым зависимостям взаимодействий между агентами. Скирмс исследовал множество источников таких корреляций: пространственные взаимодействия (Alexander & Skyrms, 1999), социальные структуры (Skyrms, 2003), социальные сети (Skyrms & Pemantle, 2004) и сигнальные системы (Skyrms, 2010b).
Подход Скирмса к конвенциям отличается от Льюиса тем, что он не опирается на общее знание, заменяя его динамическим давлением эволюции или обучения. Это давление обеспечивает возникновение и сохранение конвенций. Он показал, что даже простейшие организмы вроде бактерий могут приходить к сигнальным системам, аналогичным конвенциям Льюиса, с помощью простых адаптивных механизмов, таких как мутация-селекция или обучение с подкреплением (reinforcement learning, RL) (Skyrms, 2014).
Фреймворк Скирмса моделирует конвенции как стабильные равновесия игр «отправитель–получатель», которые развиваются через RL и эволюционную динамику, а не рациональное размышление. Формально, сигнальная игра включает:
- множество состояний мира \(S = {s_1, s_2, \ldots, s_n}\)
- множество сигналов \(M = {m_1, m_2, \ldots, m_k}\)
- множество действий \(A = {a_1, a_2, \ldots, a_l}\).
Отправитель наблюдает состояние \(s \in S\) и выбирает сигнал \(m \in M\). Получатель, получив \(m\), выбирает действие \(a \in A\). Выплаты \(u_S(s, m, a)\) и \(u_R(s, m, a)\) для отправителя и получателя зависят от того, насколько хорошо действие получателя соответствует состоянию. В отличие от модели Льюиса, которая предполагает общее знание очевидности определенного выбора для координации, Скирмс показывает, что конвенции могут возникать через адаптивные процессы даже при случайных начальных стратегиях и отсутствии фокальных точек. Стоит заметить, что здесь также не нужны критерии Вандершраафа — взаимные ожидания и публичные намерения. Равновесия, которые можно описать как коррелированные (поскольку есть источник корреляции в виде пространственной, сетевой или сигнальной структуры), возникают динамически.
ОСТАНОВИЛСЯ ЗДЕСЬ
Центральным понятием в анализе Скирмса является информационное содержание сигналов, которое он количественно оценивает с помощью информационно-теоретических мер. Для априорного распределения вероятностей состояний \(P(S_i)\) и апостериорного распределения, обусловленного сигналом \(m\), \(P(S_i \mid m)\), информация, передаваемая сигналом \(m\), выражается как вектор отношений правдоподобия:
\[ \left( \log_2 \frac{P(S_1 \mid m)}{P(S_1)}, \log_2 \frac{P(S_2 \mid m)}{P(S_2)}, \ldots, \log_2 \frac{P(S_n \mid m)}{P(S_n)} \right), \]
где \(P(S_i)\) — априорная вероятность состояния, а \(P(S_i \mid m)\) — апостериорная вероятность, обусловленная сигналом. Эта формализация связывает концептуальную рамку Льюиса с математическими моделями информации и коммуникации и показывает, как сигнал обновляет условную стратегию получателя в зависимости от состояния мира, направляя выбор действия (Skyrms, 2010a).
Скирмс также исследует равновесия сигнальных систем при частичном совпадении или конфликте интересов между отправителем и получателем. В таких случаях равновесие может включать обманные или частично информативные сигналы. Формально, если функция выплат отправителя \(u_S\) отличается от функции выплат получателя \(u_R\), концепция равновесия расширяется до сигнальных равновесий, где стратегии \(\sigma_S: S \to \Delta(M)\) и \(\sigma_R: M \to \Delta(A)\) удовлетворяют взаимным наилучшим ответам:
\[ \sigma_S(s) \in \arg\max_{m \in M} \mathbb{E}*{a \sim \sigma_R(m)}[u_S(s, m, a)], \quad \sigma_R(m) \in \arg\max*{a \in A} \mathbb{E}_{s \sim P(\cdot \mid m)}[u_R(s, m, a)], \]
где \(\Delta(X)\) — множество вероятностных распределений по \(X\) (skyrms1996?).
Эволюционную динамику, которая приводит к возникновению конвенций, часто моделируют с помощью алгоритмов обучения с подкреплением (RL), таких как модель Рота-Эрева (Erev & Roth, 1998). Агенты поддерживают склонности (propensities) \(q_i(x)\) к выбору действий \(x\) (сигналов или ответов), которые обновляются итеративно в зависимости от полученных выплат:
\[ q_{i}^{t+1}(x) = q_{i}^t(x) + \alpha \cdot \left( r_i^t(x) - q_i^t(x) \right), \]
где \(\alpha\) — скорость обучения, а \(r_i^t(x)\) — вознаграждение за действие \(x\) в момент времени \(t\) (Skyrms, 2010a). При многократных взаимодействиях такая динамика обучения приводит к конвергенции на стабильные сигнальные конвенции без необходимости явной координации или рационального предвидения.
Передача информации через сигналы и акцент на информационном содержании сигнала вызвали жаркие дискуссии в философии биологии, критикующие Скирмса за отсутствие причинно-следственной связи (Godfrey-Smith, 2020; Harms, 2004; Shea, 2018) и чрезмерную опору на статистические, а не функциональные связи.
Интересная часть расширения Скирмсом игры сигнализации Льюиса — это неявная опора на эпистемический язык: «наблюдать» состояния мира и «интерпретировать» сигналы для «обновления убеждений». Хотя Скирмс полностью отвергает байесовское толкование своих сигнальных игр (LaCroix, 2020b), его иногда интерпретируют как привнесшего эпистемологию в своих агентов, особенно при сравнении с теориями ментального содержания (Baraghith, 2019; Harms, 2004; Ruth Garrett Millikan, 1987; Ruth Garrett Millikan & Millikan, 2004): отправители «представляют» состояния мира и передают это публичное представление получателю, который затем «интерпретирует» его через свои собственные ментальные состояния. Например, уже упоминавшиеся тревожные сигналы мартышек-верветок: они могут быть описаны как включающие ментальные состояния, где «представляется» орёл и передаётся сигнал другим мартышкам, которые «декодируют» это представление и выбирают соответствующее действие. Хотя это правдоподобно для большинства натуралистических теорий ментального содержания Papineau (2003), это не верно для Скирмса.
Хотя структура игры Льюиса-Скирмса отражает поток информации в эпистемических контекстах (состояние → сигнал → действие), и возникает соблазн рассматривать отправителей и получателей как байсовских агентов с убеждениями, агенты Скирмса обновляют свои поведенческие предрасположенности, а не убеждения, так как не обладают способностью к выводу и могут лишь корректировать свои отображения на основе частоты неудач (Skyrms, 2012).
Система «отправитель–получатель» Скирмса — это информационный канал, сосредоточенный на том, как возникают и стабилизируются эффективные коды (связки сигнал–значение), а не на убеждениях или намерениях агентов. Его сигнальные игры механистичны, как у Мейнарда Смита: учитываются только объективные («онтические») характеристики агентов, такие как частота стратегий в популяции или, в случае сигнальной игры, отображения состояния в сигнал и сигнала в действие в соответствии с частотой координационных сбоев.
Сравним игру Льюиса-Скирмса:
\[ \text{World} \xrightarrow{state} \text{Sender} \xrightarrow{Message} \text{Receiver} \xrightarrow{act} \]
с каналом информации по Шеннону:
\[ \text{Source} \xrightarrow{original , message} \text{Encoder} \xrightarrow{signal} \text{Channel} \xrightarrow{signal} \text{Decoder} \xrightarrow{decoded , message} \]
Философ биологии Маноло Мартинез предлагает «channel-first» подход к сигнальным играм и утверждает, что центральной поведенческой единицей игры Льюиса-Скирмса является не стратегия, а пара кодирования-декодирования, что аналогично вышеупомянутым отображениям (Martínez, 2019).
В этой рамке состояния мира, сигналы и действия могут быть представлены как случайные величины \(S\), \(M\) и \(A\), каждая из которых состоит из дискретных элементов, например состояний, сообщений и действий \([S_1, \dots, S_s]\), с вероятностным распределением \([Pr(S_1), \dots Pr(S_s)]\) по ним. То же самое относится к сообщениям и действиям.
Отправитель наблюдает текущее состояние и передаёт сигнал — один из \(M\) возможных. Получатель получает сигнал и выбирает действие \(A_i\) из множества доступных действий. И сигнал, и выбранное действие являются случайными величинами.
Вероятности этих случайных величин связаны через стратегии отправителя и получателя, которые представлены матрицами вероятностей: сигналы, условные на состояния мира, и действия, условные на сигналы.
Критикуя Скирмса, Мартинез отмечает, что тот не углубился в информационную теорию и анализировал информацию только после того, как стратегии были приняты, что не объясняет как агенты пришли к этим стратегиям. Мартинез предлагает использовать функцию скорости–искажения Шеннона (Shannon, 1948), чтобы показать минимальную взаимную информацию между состояниями и действиями при минимальном уровне искажения. Это позволяет интерпретировать выплаты как показатели искажения в канале. С этой точки зрения, координационная игра сигнализации, даже включающая обман, воспринимается как более кооперативная информационная структура.
В целом, расширение Скирмсом теории конвенций Льюиса отказалось от требований рациональности и ввело более натуралистическое описание сигнальных систем в широком контексте. Ключевое: оно подразумевает минимальную когнитивную архитектуру (или её отсутствие), что кардинально отличается от условных агентов Вандершраафа.
Таким образом, институциональные теории Грейфа, Норта и Остром предлагают альтернативу как нормативным, так и чисто координационным моделям. В них институты понимаются как равновесия, стабилизированные эндогенно возникающими санкционными структурами, а не разделяемыми нормами или общим знанием. Это позволяет аналитически отделить вопрос происхождения мотивации от вопроса устойчивости равновесия и подготовить почву для формализации институциональной стабильности через параметр \(\delta\).
1.1.3 Равновесие с модификаторами выплат: социальные нормы как слабое принуждение
1.1.3.1 Теория социальных норм Гинтиса
Влиятельная равновесная концепция социальной стабильности, которая, однако, не опирается на идеи Дэвида Льюиса, принадлежит Герберту Гинтису. Он предложил многоуровневую эволюционную модель социальных норм, интегрирующую идеи теории игр, поведенческой экономики, эволюционной биологии и теории сложных систем. Гинтис утверждал, что нормы — это форма социально передаваемого правила поведения, которое коэволюционировала с человеческой способностью к сотрудничеству и наказанию, а их устойчивость объясняется через коэволюцию генов и культуры (Gintis, 2009a; gintis2003?).
Гинтис определял социальную норму как правило поведения, которое:
- Всеобще разделяется в группе,
- Индивидуально интернализуется, так что отклонение вызывает отрицательные эмоции, такие как вина или стыд,
- Принудительно поддерживается через наказание третьей стороны, и
- Обременительно для индивидов, но адаптивно на уровне группы (gintis2003?).
Эволюционная жизнеспособность таких норм возникает из взаимодействия индивидуальной приспособленности и группового отбора: хотя следование нормам может быть затратным для отдельных индивидов, группы с высокой приверженностью нормам — особенно нормам сотрудничества, справедливости или наказания — превосходят менее сплочённые группы в межгрупповой конкуренции. Это формализуется в моделях многоуровневого отбора, где внутри группы динамика благоприятствует эгоизму, а между группами — сотрудничеству, опосредованному нормами.
Как отмечает Влерик (Vlerick, 2019), решения координационных проблем возникают из внутригрупповой динамики, тогда как решения проблем с конфликтом преимущественно формируются через межгрупповую конкуренцию. Внутригрупповые процессы объясняют появление заметных координационных правил. Для решения конкуренции, однако, ключевую роль играют межгрупповые процессы: они выбирают игровые нормы, которые изменяют выплаты для доступных стратегий через наказания или награды, решая проблему «безбилетников» и создавая лучшие равновесия, чем те, что были доступны изначально. Это означает, что социальные нормы изменяют матрицы выплат так, чтобы стратегии, ориентированные на собственный интерес, совпадали с интересами группы, без необходимости самопожертвования. Они формируются взаимодействием между индивидами и между группами: последние выбирают эффективные равновесия, первые — «очевидные» (salient). Санкции применяются для решения проблем конфликта интересов.
Гинтис моделирует поддержание и стабильность норм через репликаторную динамику и игры на общественные блага. Пусть \(x_i\) — доля индивидов, использующих стратегию \(i\) (например, сотрудничество, дефект, наказание). Пусть \(f_i\) — приспособленность (ожидаемый выигрыш) стратегии \(i\). Уравнение репликатора:
\[ \dot{x}_i = x_i(f_i - \bar{f}), \]
где \(\bar{f} = \sum_j x_j f_j\) — средняя приспособленность в популяции. Норма устойчива, когда стратегия, которую она кодирует, становится эволюционно устойчивой (то есть ЭСС) благодаря своей адаптивной выгоде на уровне группы.
Особенность норм в подходе Гинтиса — включение сильной взаимности, поведенческой черты, характеризующейся сотрудничеством с другими и наказанием несотрудничающих, даже с личными затратами. Сильная взаимность наблюдается эмпирически в межкультурных экспериментах (игры на доверие, ультиматум, игры на общественные блага) и противоречит прогнозам моделей, основанных исключительно на эгоизме (gintis2005?). Гинтис рассматривает эту черту не как аномалию, а как эволюционно устойчивый поведенческий фенотип, поддерживаемый через социализацию, основанную на нормах, и групповой отбор.
Центральная и новаторская идея Гинтиса заключается в том, что социальные нормы трансформируют не только индивидуальные предпочтения, но и структуру самого стратегического взаимодействия, изменяя субъективные представления агентов о выплатах и действиях. Эта трансформация кодируется в так называемой матрице убеждений, отображающей, как агенты воспринимают и оценивают свои стратегические варианты с учётом социальных норм (Gintis, 2009a, ch. 12; gintis2003?).
В классической теории игр игра определяется как:
- множество игроков \(N\),
- множество стратегий \(S_i\) для каждого игрока \(i \in N\),
- функция полезности \(u_i: S \to \mathbb{R}\), задающая выплаты.
Гинтис утверждает, что эта схема неполна для моделирования нормоподчинённого поведения, так как предполагает, что агенты оценивают стратегии на основе статических функций полезности. Социальные нормы, однако, вызывают эндогенные изменения функций полезности, через социально усвоенные ожидания, эмоции (вина, стыд) и репутационные стимулы. Это отражается через модифицированную функцию выплат:
\[ u'_i(s) = u_i(s) + n_i(s), \]
где \(u'_i\) — норма-корректированная полезность, а \(n_i(s)\) кодирует нормативные оценки профиля стратегии \(s\). Функция \(n_i\) зависит от убеждений агента \(i\) о том, что ожидается, что является правильным или наказуемым, — формируя часть матрицы убеждений.
Матрица убеждений — это не просто список убеждений, а когнитивная структура: она кодирует, как игроки трансформируют исходную игру в игру, насыщенную нормами. Например, в дилемме заключённого, если оба игрока считают взаимное предательство морально неправильным и потенциально репутационно опасным, их матрица выплат эндогенно преобразуется в координационную игру или даже в «Охоту на оленя», в зависимости от силы нормативных убеждений.
Для формализации пусть \(M\) — исходная матрица выплат, а \(B\) — матрица убеждений, которая преобразует социальные ожидания, наказания и награды в численные модификаторы. Тогда:
\[ M' = M + B \]
где \(M'\) — нормо-управляемая игра, фактически воспринимаемая и реализуемая игроками.
Таким образом, Гинтис предлагает механизм внедрения норм в стратегическое поведение, связывая рациональную структуру теории игр с эволюционной и культурной психологией. Подход Гинтиса резко отличается от статических или экзогенных моделей норм, таких как конвенции Льюиса, и сближает его с конструктивистскими и динамическими традициями в поведенческой экономике.
Теория Гинтиса рассматривает нормы как культурно передаваемые и биологически обоснованные механизмы, поддерживающие масштабное сотрудничество. В отличие от теорий равновесия или основанных на ожиданиях, его модель встраивает соблюдение норм в коэволюцию генов и культуры и объясняет их устойчивость через многоуровневый отбор.
Для нас наиболее важно, что Гинтис явно вводит механизм, делающий стабилизацию игровых равновесий эндогенным. У Льюиса, Вандершраафа и Скирмса структурное ограничение равновесия — это системное свойство информации, среды или эволюционной динамики. Гинтиса также пытается встроить норму как результат биологической и культурной эволюции, однако норма сама по себе у него являет собой уже готовый механизм стабилизации. У традиции Льюиса равновесия ограничены ожиданиями, информацией или динамикой, а у Гинтиса — социальной нормой, уже интернализованной индивидом. Именно эта норма, а точнее, общее знание о ней и модифицируют матрицу игры, делая отклонение от равновесия нерациональным.
Теория Гинтиса — это попытка ответить на обвинения теории игр в выхолащивании нормативности. Иначе говоря, для Гинтиса принудительная сила исходит из двух источников: (1) эволюционно- и культурно-сформированной и передаваемой социальной нормы, которая регулирует поведение, (2) делая отклонение нерациональным по внутренним причинам (стыд, вина). Однако, по нашему мнению, социальная норма в концепции Гинтиса онтологически важнее равновесия, поскольку является условием его возможности.
1.1.3.2 Социальные нормы как ожидаемые санкции в теории Кристины Биккиери
Философ Кристина Биккиери предложила самостоятельный и ныне ставший мейнстримным эпистемический и психологический подход к социальным нормам, отходящий от традиционных моделей теории игр, функционалистских и чисто поведенческих объяснений (Bicchieri, 2005). Она проводит различие между конвенциями и социальными нормами на основе идеи условных предпочтений. Согласно Биккиери, индивиды следуют правилу, если они:
- ожидают, что достаточно многие другие будут ему следовать (эмпирическое ожидание);
- верят, что достаточно многие другие считают, что они должны ему следовать (нормативное ожидание).
В льюисовских конвенциях значимы только эмпирические ожидания, тогда как нормативные ожидания и потенциальные санкции отсутствуют. Напротив, реальные нормы зависят от обоих уровней ожиданий и поддерживаются социальными санкциями — внешними (наказания) или внутренними (чувство вины) (bicchieri2006?). Подход Биккиери подчёркивает, что изменение убеждений агентов относительно установок других может превратить конвенцию в норму, предоставляя практически значимые выводы для публичной политики и институционального дизайна.
Биккиери утверждает, что поведенческое правило \(R\) является социальной нормой в популяции \(P\) относительно ситуации \(S\), если выполняются следующие условия:
Правило \(R\) распознаётся как применимое в ситуации \(S\).
Достаточно большая часть \(P\) следует \(R\) в \(S\), и каждый индивид \(i \in P\) имеет эмпирическое ожидание, что другие следуют \(R\) в \(S\).
Каждый \(i \in P\) верит, что другие считают, что он должен следовать \(R\) в \(S\) (то есть обладает нормативными ожиданиями).
Каждый \(i \in P\) предпочитает следовать \(R\) при условии, что:
- он верит, что другие следуют \(R\) в \(S\);
- он верит, что другие верят, что он должен следовать \(R\) в \(S\).
Это часто выражается через предпочтение, условное по отношению к ожиданиям:
\[ i \text{ prefers to do } R \text{ in } S \iff EE_i(R) \land NE_i(R) \]
где:
- \(EE_i(R)\) — эмпирическое ожидание: «другие будут делать \(R\) в \(S\)»;
- \(NE_i(R)\) — нормативное ожидание: «другие ожидают, что я буду делать \(R\) в \(S\)».
Такая условность принципиально отличает Биккиери от моделей рационального выбора и равновесных подходов. Для неё соблюдение норм зависит не от фиксированных функций полезности, а от контекстно-зависимых сдвигов предпочтений, обусловленных структурой убеждений.
В противовес Льюису Биккиери настаивает, что нормы не сводимы к равновесным стратегиям или к взаимно ожидаемому поведению. Они включают предписывающий слой — представление о том, что другие считают, что следует делать. Более того, в отличие от Льюиса, она не требует общего знания регулярности: нормы могут существовать в смешанных популяциях и активироваться локально (bicchieri2006?).
Биккиери утверждает, что соблюдение норм в значительной степени ситуативно и зависит от структуры ожиданий, а не от глубокой интернализации ценностей или длительного морального воспитания, подобного self-command в смежных с теорией игр подходах (Elster, 1989). Экспериментальные данные показывают, что многие индивиды являются условными кооператорами, чувствительными к воспринимаемым ожиданиям, и склонными к стратегическому уклонению от норм, когда нормативный контекст ослаблен (bicchieri2006?). В её модели нормы не требуют полной интернализации: они высоко контекстуальны и могут соблюдаться инструментально в соответствующих ситуациях.
По сравнению с классической теорией социальных норм Ульманн-Маргалит , которая концептуализировала нормы прежде всего как решения повторяющихся социальных проблем — координации, кооперации и предотвращения конфликтов — и рассматривала их как функциональные образования (Ullmann-Margalit, 1977), подход Биккиери расходится с этим в двух отношениях:
- Биккиери разрывает связь между возникновением нормы и функциональной необходимостью: не все нормы решают проблемы, и некоторые сохраняются, даже будучи субоптимальными.
- Она выстраивает эпистемическую модель снизу вверх: норма существует не потому, что она решает координационную задачу, а потому что агенты верят, что она существует, и соответствующим образом условливают свои предпочтения. Тем самым существование нормы является психологическим фактом о сетях убеждений, а не просто системным решением.
Таким образом, Биккиери предлагает модель норм как контекстуально активируемых сценариев, укоренённых в микроуровневых эпистемических структурах и способных объяснить вариативность, хрупкость и быстрые изменения социального поведения. Важно также отметить, что агенты Биккиери полностью условны: они формируют, имеют и обновляют явные убеждения и обладают когнитивными схемами, достаточными для обработки этих убеждений (Bicchieri, Muldoon, & Sontuoso, 2018).
- написать, почему нам важна теория Биккиери — TODO
- сказать, что у Биккиери нормы объясняют мотивацию, но не устойчивость: как агент следует норме а не почему норма вообще существует → TODO
1.1.4 Равновесие с модификатором выплат: сильное принуждение с \(\delta\)-параметрами
В работе «Институты и путь к современной экономике» Авнер Грейф предлагает определение института, в котором проблема санкций занимает центральное, но специфическое место. Исходная посылка Грейфа состоит в критике подхода «институты-как-правила», развитого Дугласом Нортом и Элинор Остром. Согласно Грейфу, отождествление институтов с правилами поведения несостоятельно, поскольку правила сами по себе не обладают принудительной силой. Правило — это лишь инструкция, которую можно игнорировать. Для объяснения устойчивости социального порядка необходимо ответить на вопрос, почему люди следуют правилам, а не вопрос о том, какие именно правила существуют. Этот сдвиг проблематики Грейф называет переходом от анализа правил к анализу мотивации.
Грейф определяет институт как систему социальных факторов, совместно порождающих регулярность поведения. В эту систему входят правила, убеждения, нормы и организации. Однако решающим элементом, обеспечивающим принудительную силу института, являются не правила сами по себе, а санкции. При этом санкции у Грейфа принципиально не экстернальны — они не добавляются к институту извне в виде издержек принуждения, а возникают эндогенно, как часть равновесного поведения самих агентов. Санкция — это не штраф, налагаемый внешним гарантом, а ожидаемая потеря будущих выгод от кооперации, которую агент несет в результате собственного решения обмануть. Грейф формулирует эту идею в модели магрибских купцов: санкция за обман — это исключение из сети и потеря всех будущих доходов от торговли внутри коалиции. Разрыв в приведенной стоимости ожидаемой полезности между честным агентом и обманщиком и есть та дельта, которая удерживает агента от оппортунизма.
Важно подчеркнуть, что у Грейфа санкция не постулируется, а выводится из структуры повторяющейся игры. Она не требует наличия государства, писаных законов или специализированных органов принуждения. Санкция возникает из самого факта, что агенты обладают способностью запоминать прошлое поведение контрагентов и координировать свои будущие действия на основе этой информации. Принудительная сила института, таким образом, коренится не во внешнем насилии, а в эндогенно сформированных ожиданиях. Это позволяет Грейфу объяснять возникновение порядка в ситуациях, где формальные правовые институты отсутствуют или неэффективны.
Вместе с тем, подход Грейфа обнаруживает границы. Санкция в его модели работает только при условии, что агенты уже обладают способностью к координации и обмену информацией. Сама эта способность — наличие сети, общих когнитивных категорий, механизмов выявления нарушителей — принимается как данность. Грейф не ставит вопроса о том, как возникает первичная способность налагать санкции, как формируются каналы информации и почему вероятность применения санкции может быть различной в разных контекстах. Его анализ блестяще объясняет устойчивость уже сложившихся институтов, но оставляет открытым вопрос о генезисе самой возможности принуждения. Таким образом, в традиции, представленной Грейфом, санкция является необходимым элементом определения института, однако источник этой санкции и условия ее надежности остаются экзогенными факторами, принимаемыми в качестве предпосылок модели.
В модели магрибских купцов Грейф формализует санкцию как разрыв в приведённой стоимости ожидаемой полезности между честным агентом и агентом, совершившим обман. Этот разрыв возникает эндогенно — из самого факта, что купцы координируют свои действия и отказываются нанимать агента, который когда-либо обманул любого члена коалиции. Центральное уравнение, определяющее условие честности агента, имеет вид:
\[V_h \geq \alpha + V_c^u\]
где \(V_h\) — приведённая стоимость ожидаемой полезности занятого честного агента, \(\alpha\) — немедленный выигрыш от обмана, а \(V_c^u\) — приведённая стоимость ожидаемой полезности безработного агента, однажды совершившего обман. Раскрывая это условие через уравнения Беллмана для \(V_h\), \(V_h^u\) и \(V_c^u\), Грейф получает выражение для минимальной заработной платы \(W^*\), при которой агенту выгодно быть честным. Ключевой результат состоит в том, что \(W^*\) монотонно убывает по \(h_h\) (вероятности найма честного агента) и монотонно возрастает по \(h_c\) (вероятности найма обманщика). В равновесии с коллективными санкциями \(h_c = 0\), что делает обман строго невыгодным.
Это принципиально отличается от того, как Элинор Остром и Дуглас Норт вводят санкции в свои модели. У Остром санкции — это параметры, которые исследователь добавляет в матрицу выигрышей, описывая экзогенно заданные «издержки мониторинга и принуждения». Она не выводит эти издержки из стратегического взаимодействия самих агентов; они постулируются как часть институционального контекста. У Грейфа, напротив, санкция — это эндогенное равновесное явление. Купцы не нанимают обманщика не потому, что им запрещает правило или это сопряжено с издержками, а потому что это их наилучший ответ на ожидаемое поведение других купцов. Разрыв в заработной плате (\(W_c^* > W_h^*\)) не назначается централизованно, а возникает как агрегированный результат децентрализованных решений. Грейф показывает, что при \(h_c = 0\) каждый купец строго предпочитает нанимать честного агента, и это предпочтение самоподдерживается.
Таким образом, можно выделить две различные традиции концептуализации санкций в институциональном анализе. Первая традиция, представленная Нортом и Остром, рассматривает санкции как экзогенные дельта-параметры — добавки к платежам, происхождение и устойчивость которых не объясняются в рамках модели. Вторая традиция, представленная Грейфом, рассматривает санкции как эндогенные равновесные феномены — они возникают из структуры ожиданий и стратегического поведения агентов.
В широком спектре институциональных теорий — от новой институциональной экономики до исторической политэкономии — институты трактуются как устойчивые паттерны стратегического поведения, поддерживаемые не только ожиданиями, но и механизмами исполнения (enforcement) (Greif & Kingston, 2011; calvert1995?; kandori1992?; greif2006?). В отличие от нормативных и эпистемических подходов вроде Биккиери и Гинтиса (Bicchieri, 2005; Gintis, 2009b), теории институтов-как-равновесий фокусируются не на том, почему агенты считают некоторое поведение обязательным, а на том, почему отклонение от равновесия становится невыгодным.
Например, Калверт (calvert1995?) приравнивает институт к равновесию, говоря, что «…нет отдельного животного, которое можно назвать институтом. Есть только рациональное поведение, обусловленное ожидаемым поведением других… “Институт” — это просто имя определённых частей отдельных видов равновесий».
Грейф же определяет институт как систему элементов, экзогенных для индивида, но эгдогенных для самой системы — верований, ожиданий и норм (greif2006?). «Правила» относятся к поведению, эндогенно мотивированному самопринуждающими (self-enforcing) верованиями и ожиданиями.
В подходе институтов-как-равновесий Грейфа «правила» координируют поведение — уточняют ожидания и определяют когнитивные категории, с помощью которых люди обуславливают своё поведение: знаки, символы и понятия.
Мотивируемое поведение зависит от когнитивных категорий и способности правил координировать ожидания, основанные на этих категориях. Мотивация, выраженная в самопринуждающих равновесиях (self-enforcing) зависит от правил — точнее, от когнитивных категорий, в терминах которых формулируются ожидания. Это значит, что институты-как-равновесия невозможны без правил.
Чтобы «правило» имело значение, поведение должно быть самопринуждающим и обусловленным видимыми аспектами ситуациями (Greif & Kingston, 2011).
Если правило предшествует равновесию (поскольку оно формирует ожидания, необходимые для равновесия), то эффективность правила не может исходить из самопринуждения (self-enforcement), поскольку оно служит следствием уже работающих ожиданий. Это создает проблему курицы и яйца — что появляется раньше: правило или равновесие.
Подход институтов-как-равновесий ставит теорию мотивации в центр исследования, тем самым эндогенизируя («делая внутренним») принуждение к следованию правилам.
Грейф и Кингстон считают, что несмотря на то, что правило может координировать действия агентов, в конечном счёте именно ожидаемое поведение других мотивирует поведение, а не само абстрактное правило.
С точки зрения институтов-как-равновесий, именно ожидаемое поведение других создаёт ограничения поведения, и это поведение должно быть объяснимо эндогенно как часть равновесия (Greif & Kingston, 2011). Ожидания создают ограничения, которые закрепляют поведение. Эти ожидания нужно отражать в равновесии, постольку они по сути определяют институт.
Теория Грейфа описывает ожидания как основу стратегических ограничений равновесия, однако он не говорит, что изначально мотивирует людей взаимно ожидать определенного исхода. Точнее, он принимает «исторический процесс» как данность, маскируя проблему «первоначального ожидания» (greif2006?). Для работы ожидания уже должна быть решена проблема выбора равновесия. А выбор равновесия, или процесс инститционального изменения — это выбор стратегических ограничений последующих взаимодействий, поэтому говорить, что ожиданию создают ограничения не вполне верно — скорее, они подкрепляют уже выбранные институциональные ограничения. Это, в свою очередь, говорит о том, что даже равновесное объяснение института уже в некоторой степени предполагает его существование как решённой проблемы выбора равновесия и не объясняет его появление из до-институционального состояния.
Согласно Грейфу и Кингстону, схождение мотивации — центральная проблема стабильности института в противовес проблеме выбора правил, минимизирующих «издержки», как это есть в подходе институтов-как-правил (Greif & Kingston, 2011). Это так, поскольку эффективность института, выразимая как низкие транзакционные издержки — это желаемый результат, а не проблема сама по себе. Проблема — в механизме, который создаёт эту эффективность, и для Грейфа и Кингстона это схождение мотивации агентов.
Общая интуиция этих подходов — что институт существует постольку, поскольку он трансформирует исходную стратегическую ситуацию, уменьшая привлекательность отклоняющихся стратегий. Формально это может быть представлено как вычитание из выигрыша отклонения величины \(\delta > 0\), интерпретируемой как санкция или потеря будущих возможностей. Важно подчеркнуть, что в данных теориях эндогенны не предпочтения и не нормы, а механизмы принуждения, возникающие из повторяющихся взаимодействий, репутационных эффектов, организационных форм или материальной инфраструктуры.
В работах Авнера Грейфа институты анализируются как равновесия в повторяющихся и взаимосвязанных играх, где устойчивость поведения обеспечивается через репутационные и коллективные санкции (greif2006?). Классический пример — торговые коалиции магрибских купцов, где нарушение контракта в одной сделке приводит к потере доступа к сети взаимодействий в будущем.
Формально Грейф моделирует ситуацию как повторяющуюся игру с неполной информацией, где ожидаемая полезность стратегии \(s_i\) для агента \(i\) имеет вид:
\[ U_i(s_i) = \sum_{t=0}^{\infty} \beta^t \mathbb{E}[\pi_i(s_i, s_{-i})] - \delta_i(s_i) \]
где \(\delta_i(s_i)\) отражает ожидаемые потери от репутационных санкций. Ключевой момент состоит в том, что \(\delta_i\) не задана экзогенно: она возникает из плотности и связности торговой сети, из способности агентов распространять информацию и координировать наказания.
В отличие от нормативных теорий, у Грейфа не требуется, чтобы агенты считали нарушение морально неправильным. Достаточно того, что санкции статистически надёжно следуют за отклонением. Институты у Грейфа — это равновесия, стабилизированные межвременной связностью санкций, а не интернализированными нормами.
[[00-inbox/greif2011]]
1.1.5 Критика традиции: выхолащивание нормативности и экономический империализм
Common knowledge denotes an epistemic state within a group wherein a proposition p is known by all members, and each member knows that every other member knows p, recursively extending to an infinite level of iterated knowledge. This recursive nature differentiates it from mutual knowledge, which necessitates only that each individual knows p. Consequently, common knowledge represents an idealized, stringent condition profoundly impacting coordination and strategic interaction, prompting investigation into its feasibility and real-world relevance.
As Cubitt & Sugden (2003) underline, Lewis’s initial conception of common knowledge did not imply unconstrained cognitive capacity of idealized agents. As they put forward, a proposition p is common knowledge if a state of affairs A exists where everyone has a reason to believe A holds, A indicates to everyone that everyone has a reason to believe A holds, and A indicates to everyone that p. This definition generates an infinite chain of “reasons to believe” rather than an infinite chain of “knowledge” as justified true belief suggesting a more pragmatic approach towards achieving coordination. This approach acknowledges the limitations of human epistemic capabilities and focuses on the justification for beliefs about states of affairs and others’ beliefs about them rather than in absolute certainty on every level of iterated knowledge. Nevertheless, the majority of scholars interpret Lewisian conventions as computationally and cognitively demanding.
Gilbert (1992) criticized the infinite regress of Lewis’s common knowledge. She challenged the psychologically implausible requirement of infinite levels of iterated knowledge, arguing it is unnecessary for explaining social phenomena like collective belief and convention. Gilbert proposed a framework centered on joint commitment, asserting that social facts emerge from situations where individuals are collectively committed to intend or believe something as a unified body, rather than through an infinite chain of individual beliefs about others’ beliefs. This joint commitment involves a shared intention or belief held by a group as a collective entity, irrespective of individual members’ personal convictions—for instance, a group’s shared commitment despite private doubts. This approach provides a means to understand shared social states and collective actions, generating shared obligations and expectations that drive behavior and shape attitudes, thereby avoiding the demanding epistemic requirements of common knowledge.
(bicchieri1993?) argued that real-world agents operate under bounded rationality, which is more psychologically plausible. Individuals possess finite processing capacity and memory, which makes an infinite regress of knowledge untenable. Bicchieri investigated how agents form beliefs and expectations about others’ actions in coordination games, emphasizing mutual expectations and the potential for coordination through learning and repeated interactions, even without full common knowledge. She highlighted the role of social norms, proposing that they function through conditional preferences – individuals preferring to conform if they expect others to do so – and normative expectations, which are beliefs about what others believe one ought to do. This allows coordination to emerge and persist through observation, belief updating, and conformity, irrespective of the norm’s common knowledge status.
(heifetz1999?) underscored the limitations of the common knowledge assumption in dynamic settings and games with temporal imprecision where communication is not instantaneous or unreliable. The coordinated attack problem when two parties agree to attack at the same time exemplifies how the absence of guaranteed, instantaneous communication can preclude the establishment of common knowledge, leading to suboptimal outcomes. Researchers have investigated alternative, weaker notions like finite levels of mutual knowledge or common belief to account for imperfections in real-world information and bounded rationality, offering potentially more accurate models of coordination and cooperation.
One of the more radical criticisms of the common knowledge requirement comes from evolutionary game theory, a branch of game theory pioneered by Maynard Smith (1982) which assumes natural selection and evolutionary dynamics as a source of solutions for strategic games instead of rationality of self-interested actors with complete information. These criticisms doubt the necessity of common knowledge for conventions.
For example, Binmore (2008) challenged the infinite levels of common knowledge posited by Lewis, arguing that agents only require first-order expectations regarding others’ behavior to converge on an equilibrium. This perspective emphasizes accurate prediction of actions as a critical element for coordination, with rational players responding accordingly. Binmore’s evolutionary approach highlighted cultural evolution’s role in shaping these common understandings and norms, suggesting societies develop and transmit effective coordination strategies over time based on promoting social stability, a dynamic process which refines coordination strategies rather than a static, pre-existing condition of full common knowledge. He also noted that Lewis’s analysis of conventions confines its usage to small-scale societies as it implies observing public events being observed by another party. And this is not realistic in larger populations. Binmore suggested that conventions do not generally require common knowledge overall and can be established in evolutionary environments with only one level of reasoning instead of infinite hierarchy of beliefs. He also notes that everyday conventions mostly operate via automatic behavior and low-level mutual expectations.
Guala (2020) put forward a similar argument about “belief-less” coordination where most everyday conventions do not require iterated beliefs and hence cognitive capacities for meta-representation. Means-ends rationality and cheap heuristics are said to be sufficient13.
Сёрл критикует идею равновесия, говоря, что, например, частная
собственность в США изначально контролировалась федеральным
законом 1862 года.
Важно, что, по словам Сёрла, закон был создан, насаждён и
*принуждал* (enforce).
Сёрл говорит про принуждение как часть деонтических сил
конститутивных правил. Также он говорит про блеф и что понятие
равновесия не схватывает эти тонкости.
(с) проблема не в равновесии и не в его неприменимости, а в том,
что оно здесь репрезентирует: эта ситуация описывается равновесием
с блефом и дельта-параметром
Согласно Сёрлу, равновесный подход не способен создать и объяснить деонтологию: права и обязанности, служащие определяющей чертой институциональных фактов.
1.2 Институт как система правил
1.2.1 Институт как статусные функции и конститутивные правила: традиция Джона Сёрла
Сёрл считает, что институциональные факты — это статусные функции (присваивающие материальным объектам новый статус), а институты — это системы, делающие возможных создание и поддержанием статусных функций
Согласно Сёрлу, любая теория институтов — это теория статусных функций
Теория Джона Сёрла представляет собой фундаментальный вклад в философию общества, фокусируясь на онтологии социальных институтов. Разработанная в работах от «Речевых актов» (1969) до “Создания социального мира” (2010), она объясняет, как социальная реальность конструируется через коллективную интенциональность и язык, подчеркивая роль конститутивных правил в создании институциональных фактов с принудительной силой. Принудительная сила здесь понимается как деонтические полномочия — права, обязанности и санкции, которые обязывают индивидов к определенному поведению в контексте институтов, таких как деньги, брак или государство. Эта сила не физическая, а нормативная, возникающая из коллективного признания (J. Searle, 1995). Теория интегрирует элементы философии языка, разума и общества, предлагая унифицированный подход к пониманию, как «физические факты» (brute facts) преобразуются в «институциональные» через правила и статус-функции.
Интеллектуальные корни теории Сёрла уходят в аналитическую философию середины XX века. Он опирается на идеи Дж. Остина, чья теория речевых актов ввела понятие перформативов — высказываний, которые «создают» реальность (например, «объявляю вас мужем и женой”) (austin1962?). Сёрл развивает это, показывая, что перформативы лежат в основе институциональных фактов (searle1969?). Другим ключевым интеллектуальным источником идей Сёрла послужил Людвиг Витгенштейн, чьи идеи о языковых играх и правилах (wittgenstein1953?) Сёрл адаптирует для различия между регулятивными и конститутивными правилами. Витгенштейн подчеркивал, что значение возникает из использования, а Сёрл применяет это к социальным институтам, где правила не просто регулируют, но конституируют деятельность.
Влияние также заметно от Джона Ролза, чья статья “Two Concepts of Rules” (rawls1955?) ввела понятие конститутивных правил для игр вроде шахмат. Сёрл расширяет это на социальную реальность, включая принудительную силу институтов. В более широком контексте теория Сёрла повлияла на социальную онтологию, интегрируя ее с философией разума: коллективная интенциональность — это биологическая способность, возникшая эволюционно, что, по мнению Сёрла, связывает социальное с естественными науками (J. Searle, 2010). В русскоязычном академическом дискурсе влияние Сёрла видно в работах по социальной философии, где его идеи адаптируются для анализа власти и институтов, подчеркивая роль языка в создании нормативных структур (baidlaeva2014?; nikitin2019?).
Теория Сёрла также перекликается с критической теорией, хотя он отвергает редукционизм марксизма или структурализма. Вместо этого он предлагает натуралистический подход: социальные факты объективны эпистемически, несмотря на их субъективную онтологию — зависимость от ментальных состояний (searle2006?).
Центральным элементом теории Сёрла является различие между регулятивными и конститутивными правилами. Регулятивные правила регулируют уже существующие формы поведения (например, “не ходи по траве”), имея форму “Делай X” или “Если Y, то делай X” (Searle, 1969). Конститутивные правила, напротив, создают новые формы поведения, делая возможными институциональные факты. Их форма – “X считается Y в контексте C”, где X – brute fact (например, кусок бумаги), Y – статус-функция (например, деньги), а C – институциональный контекст (например, экономическая система) (Searle, 1995).
Статус-функции — ключевой компонент: они наделяют объекты или действия функциями, не зависящими от физических свойств, а от коллективного принятия. Это создает «деонтические силы» — принудительную силу институтов, включая положительные (права, разрешения) и отрицательные (обязанности, санкции) аспекты. Например, статус “президент” наделяет индивида правом вето, обязывая других признавать это (J. Searle, 2010). Принудительная сила здесь — нормативная: она мотивирует поведение через обязательства, возникающие из коллективной интенциональности, а не внешнего принуждения.
Коллективная интенциональность — биологически примитивная способность, позволяющая “мы-интенции” (мы делаем что-то вместе), в отличие от индивидуальной “я-интенции”. Она лежит в основе социальных фактов, которые иерархически строятся: от brute facts к институциональным, с языком как необходимым средством представления статус-функций (Searle, 2006). В поздних работах Сёрл вводит “Status Function Declarations” — декларативные речевые акты, создающие реальность (например, объявление войны), подчеркивая роль языка в конституировании институтов (Searle, 2010).
В русском контексте теория адаптируется для анализа эволюции институтов: конститутивные правила объясняют, как социальные сущности, такие как власть, приобретают принудительную силу через коллективное признание (Гумницкий, 2020). Компоненты теории можно представить в таблице:
| Компонент | Описание | Пример | Роль в принудительной силе |
|---|---|---|---|
| Конститутивные правила | “X считается Y в C”; создают новые формы поведения | Кусок бумаги (X) считается деньгами (Y) в экономике (C) | Генерируют статус-функции, наделяющие деонтическими полномочиями (обязанности платить) |
| Регулятивные правила | Регулируют существующие практики | Правила этикета | Поддерживают, но не создают принудительную силу; могут эволюционировать в конститутивные |
| Статус-функции | Функции, наложенные коллективно, независимо от физических свойств | Брак как статус | Создают права и обязанности, обеспечивая принудительную силу (например, юридические обязательства) |
| Коллективная интенциональность | Примитивные “мы-интенции” | Совместная охота или выборы | Основа признания, делающего деонтические полномочия обязательными |
| Деонтические полномочия | Права, обязанности, санкции | Право собственности | Принудительная сила: мотивируют compliance через нормативные ожидания |
Key Citations - Austin, J. L. (1962). How to Do Things with Words. Oxford University Press. - Байдлаева, А. К. (2014). Власть и язык: теория создания социальных институтов. Вестник КазНУ. Серия философия. Серия культурология. Серия политология, 2(48), 78-85. URL - Buekens, F. (2014). Institutions without constitutive rules? In Deconstructing Searle’s Making the Social World (ed. F. Hindriks). Oxford University Press. - Epstein, B. (2015). The Ant Trap: Rebuilding the Foundations of the Social Sciences. Oxford University Press. - Giddens, A. (1984). The Constitution of Society: Outline of the Theory of Structuration. Polity Press. - Guala, F. (2010). The philosophy of social science: Metaphysical and empirical. Philosophy Compass, 5(4), 254-264. - Гумницкий, Г. Н. (2020). Фундаментальная онтология Джона Серля и минимальные условия политического. Вестник Томского государственного университета. Философия. Социология. Политология, 55, 5-17. URL - Hindriks, F. (2009). Constitutive rules, language, and ontology. Erkenntnis, 71(2), 253-275. URL - Hindriks, F. (2013). Restructuring Searle’s Making the Social World. Philosophy of the Social Sciences, 43(3), 373-389. - Hindriks, F. (2015). Deconstructing Searle’s Making the Social World. Philosophy of the Social Sciences, 45(3), 363-369. - Lawson, T. (2012). Ontology and the study of social reality: Emergence, organisation, community, power, social relations, corporations, artefacts and money. Cambridge Journal of Economics, 36(2), 345-385. - Miller, S. (2010). The Moral Foundations of Social Institutions: A Philosophical Study. Cambridge University Press. - Никитин, А. П. (2019). Связь языка и культуры в социально-институциональном измерении: решение проблемы в аналитической традиции. Философия и культура, 1, 45-56. - Ransdell, J. (1971). Constitutive rules and speech-act analysis. The Journal of Philosophy, 68(13), 385-400. - Rawls, J. (1955). Two concepts of rules. The Philosophical Review, 64(1), 3-32. - Ruben, D.-H. (1997). John Searle’s The Construction of Social Reality. Philosophy and Phenomenological Research, 57(2), 443-447. - Searle, J. R. (1969). Speech Acts: An Essay in the Philosophy of Language. Cambridge University Press. - Searle, J. R. (1995). The Construction of Social Reality. Free Press. - Searle, J. R. (2006). Social ontology: Some basic principles. Anthropological Theory, 6(1), 12-29. - Searle, J. R. (2010). Making the Social World: The Structure of Human Civilization. Oxford University Press. - Tuomela, R. (2002). The Philosophy of Social Practices: A Collective Acceptance View. Cambridge University Press. - Tuomela, R. (2007). The Philosophy of Sociality: The Shared Point of View. Oxford University Press. - Warnock, G. J. (1971). The object of morality. Methuen. - Wittgenstein, L. (1953). Philosophical Investigations. Blackwell.
Searle’s social ontology distinguishes two kinds of rules: regulative rules, which govern actions that can occur independently, and constitutive rules, which create new kinds of social reality (J. Searle, 1995, 2010). In Searle’s formulation, constitutive rules take the schematic form: \[ X \text{ counts as } Y \text{ in context } C \] where \(X\) is a pre‐institutional entity or action, \(Y\) is a status function, a social role or function assigned to \(X\), and \(C\) is the relevant context or domain (J. Searle, 1995). For example, “putting the ball in the net (\(X\)) counts as scoring a goal (\(Y\)) in a game of football (\(C\))” (J. Searle, 1995). Such rules do not merely regulate pre‐existing behavior; they create new social facts. In Searle’s own words, “institutional facts only exist within systems of constitutive rules” (J. Searle, 1995).
- Constitutive vs. Regulative. A constitutive rule makes a novel institutional action possible, whereas a regulative rule simply prescribes behavior within an already existing framework (J. Searle, 1995). Chess provides a classic example: the constitutive rules of chess create the possibility of the game, whereas a regulative rule would say, for instance, “if you touch a piece you must move it” (J. Searle, 1995).
- Status Functions and Deontic Powers. Under a rule \(X\) counts as \(Y\) in \(C\), \(Y\) is a status function attached to \(X\), and carrying this status typically confers normative powers (rights, obligations, etc.) on the bearer. Thus if a community collectively accepts that certain actions or objects bear status \(Y\), those actions have deontic powers. Searle often emphasizes that constitutive rules imply deontic powers: e.g. a wedding ring (\(X\)) gives someone the status of “married person” (\(Y\)), along with associated rights and duties. In Searle’s framework, linguistic declarations often play a role: he introduces the idea of a Status Function Declaration, a speech act that imposes or announces status functions as binding (J. Searle, 2010).
Searle identifies institutions with systems of constitutive rules. He writes that “an institution is any system of constitutive rules of the form \(X\) counts as \(Y\) in \(C\)” (J. Searle, 1995). Thus, for Searle, political offices, legal entities, money, marriages, etc., exist because underlying constitutive rules assign new status functions to physical or social substrates. These rules are held in place by collective acceptance of the community. In Searle’s view, the syntax “\(X\) counts as \(Y\) in \(C\)” – often called the counts-as locution – succinctly captures the logic of institutional facts.
Searle’s theory posits that social reality is built upon constitutive rules that are creatively implemented: they not only regulate behavior but generate the very phenomena like institutions and roles they describe (J. Searle, 1995, 2010).
1.2.1 Последователи Сёрла: уточнение природы коллективной интенциональности
Последователи Сёрла развивают его идеи в социальной онтологии, часто уточняя или расширяя их. Раймо Туомела фокусируется на “мы-аттитюдах” (we-attitudes), интегрируя их в теорию коллективного принятия: институты возникают из совместных интенций, но Туомела подчеркивает роль норм и санкций в поддержании принудительной силы (Tuomela, 2002; 2007). Франк Хиндрикс предлагает “статусный аккаунт”, ревизуя конститутивные правила: они касаются статусов с нормативными атрибутами (import), а не только “counts-as”, позволяя учитывать неявные институты без явного языка (Hindriks, 2009; 2013). Брайан Эпштейн критикует, но развивает теорию, вводя “grounding” институциональных фактов в социальных практиках (Epstein, 2015).
В русском академическом пространстве последователи, такие как А.К. Байдлаева, применяют теорию к анализу власти: язык создает социальные институты с принудительной силой через перформативы, подчеркивая эволюцию от brute facts к институциональным (Байдлаева, 2014). Г.Н. Гумницкий исследует минимальные условия политики в онтологии Сёрла, фокусируясь на коллективной интенциональности как основе политических институтов (Гумницкий, 2020). М.А. Никитин связывает язык и культуру в институциональном измерении, развивая идеи о деонтических полномочиях (Никитин, 2019). Эти авторы часто интегрируют Сёрла с русской традицией социальной философии, подчеркивая роль норм в постсоветских институтах.
Другие, как Тони Лоусон, диалогизируют с Сёрлом, подчеркивая социальные тотальности вместо институциональных фактов, но признавая сходство в онтологии (Lawson, 2012). В целом, последователи расширяют теорию, добавляя акцент на неявные правила и эволюционные аспекты, делая её более гибкой для эмпирических наук.
In its standard analytic formulations, which Guala (2007) even calls the “Standard Model of Social Ontology” (SMOSO), social ontology describes the loosely constrained individualistic foundations of social phenomena and has three key elements (Tuomela, 2002):
- reflexivity
- performativity
- collective intentionality.
Reflexivity is a property of social entities to be largely comprised of beliefs about beliefs. There are I-mode and we-mode formulations of reflexive beliefs. Some philosophers say that initial and most basic beliefs comprising “the fabric“ of the social are essentially in We-mode and are not reducible to I-mode (Gilbert, 1992; Schmid, 2023; Tuomela, 2002). However, there are also more individualistic accounts of reflexive beliefs based on game theory (Bicchieri, 2005; Guala, 2016).
Performativity amounts to social entities needing to be continuously maintained, performed or recreated. And collective intentionality, in its turn, refers to joint directedness of multiple individuals towards a phenomenon that contributes to its constitution. Collective intentionality tends to be presented either as a derivative of common knowledge and I-beliefs of the form “everyone knows that everyone knows that P“, where P is some social fact like social norm (Bicchieri, 2005), or as a primitive notion which makes common knowledge redundant. Moreover, there are attempts to naturalize collective intentionality by showing its irreducibility to individual intentionality (Gallotti, 2012; Rakoczy & Tomasello, 2007).
A prominent example is Searle (1995) who asks whether it is possible to be epistemologically objective about ontologically subjective issues. How can we know the truths about things whose existence depends on our representations or feelings, for example, about money, property and marriage? By analysing these distinctions of ontology/epistemology and objectivity/subjectivity, Searle arrived at an idea of a missing ingredient that allows for a picture of ontologically subjective entities, which is constitutive rules of the form “X counts as Y in C”.
Here, our classifications of the social world help establish and maintain it, whereas non-social objects are indifferent to our classifications of it, as Hacking (1999) puts forward with his distinction of interactive and indifferent kinds14. Nature’s objects do not change their behaviour given these classifications of them as opposed to social objects. This idea illustrates the notions of reflexivity and performativity characteristic for the “Standard model”. If social entities are comprised of beliefs about beliefs, their nature depends on these beliefs, and if beliefs change, social entities change accordingly. If social entities depend on beliefs about them, it is needed to constantly perform those to maintain them. To do this, individuals need to have collective intentionality about these beliefs. For example, for money to be itself, a relevant community has hold a collective intention to believe that certain physical entities can be used as a medium of exchange.
1.2.2 Критика теории Сёрла
Критика теории Сёрла многоаспектна и касается как концептуальных основ, так и применения. Энтони Гидденс аргументирует, что различие между конститутивными и регулятивными правилами искусственно: все правила имеют оба аспекта (например, правило “работники должны отмечаться в 8:00” регулирует, но конституирует бюрократию) (Giddens, 1984). Дэвид-Хиллел Рубен и Джеффри Уорнок видят в нём лишь лингвистическую особенность: действия конститутивны или регулятивны относительно описания, а не онтологически (Ruben, 1997; Warnock, 1971). Джозеф Рансделл критикует фокус на “connotation” (условиях) за счет “import” (нормативных последствий), предлагая правила “X считается Z” для интеграции норм (Ransdell, 1971).
Франк Хиндрикс указывает на проблемы в поздних работах: переоценка роли языка (институты могут существовать без явных деклараций), путаница в Status Function Declarations и игнорирование непризнанных прав (Hindriks, 2013; 2015). Филип Бюкенс предлагает альтернативу: институциональные объекты, как деньги, объясняются действиями и стимулами, без необходимости в статусе Сёрла (Buekens, 2014). Франческо Гвала критикует умозависимость: она подразумевает инфаллибилизм (нет ошибок об институтах), противореча реализму (Guala, 2010). Кроме того, теория не учитывает моральные ограничения: институты могут быть тривиальными или коррумпированными (например, расизм как институт) (Miller, 2010).
В русском контексте критика фокусируется на политике: Гумницкий отмечает, что минимальные условия (коллективная интенциональность, присвоение функций, конститутивные правила) игнорируют историческую эволюцию без явного принятия (Гумницкий, 2020). Никитин подчеркивает несовместимость с культурными контекстами, где принудительная сила возникает из неявных норм (Никитин, 2019). Общая критика: теория слишком формалистична, не объясняя эволюцию институтов из регулятивных практик (например, деньги из бартера) без коллективного акта (Atiyah, 1981).
Несмотря на критику, теория Сёрла остается влиятельной в философии науки, предлагая рамку для анализа, как социальные институты с принудительной силой возникают из коллективных практик и языка.Hindriks (2005) has challenged several aspects of Searle’s constitutive-rule framework. His deconstruction focuses on the notions of status functions and the role of language. Broadly, Hindriks argued that Searle’s theoretical apparatus is misleading, and that a more streamlined account can be given by focusing on collective acceptance and normative powers.
Status Functions as Deontic Powers. Hindriks finds the term status function confusing and somewhat redundant. He suggests dropping the “function” and simply treating statuses as normative powers. In his words, “we can do without the term function while retaining the term status,” instead explicating statuses directly as the bundle of deontic powers they grant (Frank Hindriks, 2009). By equating statuses with deontic powers (rights, obligations), Hindriks makes the normative dimension of institutions explicit, rather than hiding it under the metaphor of a “function” (Frank Hindriks, 2009). Indeed, Searle himself has acknowledged that “all status functions are deontic powers,” which supports Hindriks’s move toward a more direct terminology (Frank Hindriks, 2009).
Redundancy of Status Function Declarations. Searle’s idea of a Status Function Declaration – a speech act that supposedly creates or recognizes a status – is, for Hindriks, unnecessary. He argues that the two key claims Searle attributes to such declarations (that collective acceptance is necessary and sufficient for the status) are already implicit in the standard “counts-as” formulation. Once we accept that institutional statuses require collective acceptance, and that collective acceptance alone brings them into being (the “Collective Acceptance Principle”), the special notion of a Status Function Declaration adds nothing new (F. Hindriks & Guala, 2015). Introducing declarations suggests without argument that only explicit speech acts can create institutions; Hindriks finds this unjustified and unhelpful. He concludes that Searle’s extra machinery (the Status Function Declaration with its “double direction of fit”) should be abandoned since it “does not add anything of value” (F. Hindriks & Guala, 2015).
Linguistic vs. Normative Distinction. Hindriks also questions Searle’s emphasis on language as the source of all institutional power. In his earlier work, Hindriks has argued that the regulative/constitutive distinction is mainly a grammatical one: regulative rules are phrased with explicit imperatives or deontic terms, while constitutive rules are phrased with the “counts-as” locution, but both embed the same normative content (Frank Hindriks, 2009). Normative obligations figure explicitly in regulative rules (“Do X” / “If Y do X”), whereas constitutive rules imply those obligations without stating them overtly. Thus, the locus of normativity is not really different between the two; only the linguistic presentation is. Hindriks calls for a view of institutions that centers on collective commitment and acceptance of standards, rather than on linguistic declarations per se (Frank Hindriks, 2009).
1.2.2 Институт как регулятивные правила
Грейф и Кингстон утверждают, что подход институтов-как-правил придерживается функционалистской перспективы — институты отзывчивы к интересам и нуждам своих создателей (Greif & Kingston, 2011). Иначе говоря, институты выполняют функции, угодные их создателям.
Подход институтов-как-правил рассматривает принуждение к следованию правилам отдельно от содержания и процесса формирования правил.
В подходе институтов-как-правил принуждение к следованию правилам имеет «стоимость издержек». И институт определяется как структура правил — формальных и неформальных — и структура принуждения к следованию им.
Несмотря на то, что подход институтов-как-правил рассматривает и правила, и принуждение к их исполнению как структурные элементы института, он ограничивается формированием институтов, а не мотивацией людей следовать правилам. Иначе говоря, принуждение к следованию правилам не рассматривается как мотивация.
В подходе институтов-как-правил иногда выделяют иерархии правил. Например. Остром (ostrom2005?) выделяет 4 вида: операционные, правила коллективного выбора, конституционные, мета-конституционные. Каждый следующий уровень определяет правила выбора правил на предыдущем уровне. К тому же, правила более высокого уровня «дороже» изменить. Это похоже не бесконечный регресс и проблемы охраны охранников, но все равно не решает проблему мотивации.
Согласно Оливеру Уильямсону (williamson2000?), «трансакционные издержки» — это издержки в процессе стратегического взаимодействия, связанные с ограниченной рациональностью и оппортунизмом участников. Важно, что некоторые правила (или «структуры управления») ведут к снижению таких издержек. Эффективность институтов связана с тем, насколько хорошо они минимизируют трансакционные издержки.
На основе эмпирических исследований Элликсон предполагает, что группы, в которых информация циркулирует легко, склонны создавать эффективные неформальные правила (ellickson1991?).
Согласно Остром (ostrom1990?), наиболее эффективные правила создают группы с небольшим числом ответвтенных за решение, большими временными горизонтами и схожими интересами участников.
Согласно Грейфу и Кингстону, исследования Эликсона (ellickson1991?) и Остром (ostrom2005?) показывают проблему немасштабируемости неформальных правил при росте популяции. В качестве примера они приводят eBay, в котором при быстром росте в конце 1990-х механизма доверия продавцу перестало хватать, и руководство ввело формальные санкции против обмана и для разрешения споров (Greif & Kingston, 2011).
В теории Бруссо и Райно (brousseau2008?) новые правила появляются как неформальные, локальные и подвижные порядки, которые «соревнуются» за последователей. Успешные правила распространяются и по мере распространения становятся более глобальными и обязательными, «укрепляясь» в формальные правила. Это совместимо с моей теорией: условные стратегии создают локальные равновесия с дельтой, а по мере роста популяции игр и их связности эти стратегии становятся обязательными.
Поскольку для подхода институтов-как-правил принуждение к исполнению правил — отдельный вопрос от их содержания, поведение, не согласующееся с формальными правилами, автоматически объясняется неформальными правилами (Greif & Kingston, 2011). Однако проблема в том, что неформальные правила иплицитны, и их сложно определить и измерить. Объяснять поведение неформальными правила — неверифицируемо.
Остром (ostrom2005?) отмечает, что много писаных утверждений имеют форму правила, но не влияют на поведение: они — правила-по-форме, но не правила-в-использовании.
Согласно Норту, «ключ к пониманию процесса изменения — в интенциональности игроков, учреждающих институциональные изменения, и в их понимании проблем» (north2005?).
ОСТАНОВИЛСЯ ЗДЕСЬ
1.2.2.1 Дуглас Норт: институты как структуры стимулов и ограничений
Дуглас Норт определяет институты как «правила игры» и делит их на формальные (законы) и неформальные (нормы, конвенции). Важно, что оба типа правил принудительны (enforcing) — они регулируют поведение, потому что подкреплены силой.
Дуглас Норт предлагает более абстрактное, но концептуально совместимое понимание институтов как «правил игры», которые структурируют стимулы и ограничения человеческого взаимодействия (North, 1990). Он различает формальные институты (законы, контракты, бюрократические процедуры) и неформальные (обычаи, традиции, нормы), однако в обоих случаях центральным остаётся вопрос принуждения.
Для Норта институт изменяет стратегическое пространство, если он:
- увеличивает издержки отклонения;
- повышает предсказуемость санкций;
- снижает трансакционные издержки исполнения.
Хотя Норт не формализует эту идею, сделать это можно было бы как изменение функции выплат: \[ \pi_i'(s) = \pi_i(s) - \delta_i(s) \] где \(\delta_i(s)\) определяется институциональной средой, а не субъективными убеждениями агента. Хотя Норт признаёт роль идеологий и убеждений, они выступают скорее как факторы, влияющие на эффективность принуждения, чем как конститутивные элементы института.
В этом смысле Норт радикально расходится с традицией Льюиса: институты у него не редуцируются к равновесиям ожиданий, поскольку без материальных и организационных механизмов санкционирования равновесие остаётся хрупким и локальным.
1.2.2.1 Элинор Остром: эндогенные санкции и локальная устойчивость
Элинор Остром предлагает анализ институтов коллективного управления, показывая, что устойчивые режимы возможны и без централизованного государства (ostrom1990?). Однако вопреки популярным интерпретациям, её теория не является нормативной в строгом смысле.
Остром подчёркивает роль:
- мониторинга,
- градуированных санкций,
- повторяемости взаимодействий,
- локальных правил применения наказаний.
Санкции у Остром эндогенны в том смысле, что они возникают из структуры взаимодействий и распределения информации, а не из абстрактных норм. Даже если участники артикулируют нормативные основания правил, устойчивость режима зависит от того, насколько санкции реально применяются и насколько они предсказуемы.
Формально её подход можно представить как локальное равновесие в повторяющейся игре с вероятностным мониторингом:
\[ \mathbb{E}[\pi_i(\text{deviate})] = \pi_i - p \cdot \delta \]
где \(p\) — вероятность обнаружения отклонения, а \(\delta\) — величина санкции. Институт стабилен, если ожидаемые потери превышают выигрыш от отклонения.
Различение правил и равновесие в экономике — не онтологическое, а объяснительное. Представители каждого направления не отрицают существования правил или равновесий в своём подходе, а делают акцент на источнике объяснительной силы для стабильности института. Например, у Грейфа как представителя институтов-как-равновесий сами равновесия зависят от разделяемых агентами правил. Возможно, Гуала смешивает онтологию и объяснение.
1.3 Институт как правила-в-равновесии: теория Франческо Гуалы
Описывается теория правил-в-равновесии (ПвР) Франческо Гуалы, её критика со стороны коллег, а также критика автора, направленная на лакуны в аргументации и, следовательно, нелегитимные теоретические выводы ПвР.
1.3.1 Теория правил-в-равновесии
Философы Франческо Гуала и Фрэнк Хиндрикс предлагают синтез правило-ориентированных и теоретико-игровых подходов к институтам (Guala & Hindriks, 2015). Они называют его теорией правил-в-равновесии и говорят, что он может служить унифицированной социальной онтологией.
В этой теории регулятивные правила находятся в координационных равновесиях, символически репрезентированных теоретическими терминами вроде «денег» или «брака» (F. Hindriks & Guala, 2015). Эта теория соединяет подходы, основанные на регулятивных правилах, равновесиях стратегических игр и конститутивных правилах. Первые два являются взаимодополняющими и составляют собственно правила‑в‑равновесии, а третий дополняет его, предоставляя символическую репрезентацию.
Подход, основанный на правилах — это экономические теории, которые мы рассматривали выше. В них правила направляют и ограничивают поведение в социальном взаимодействии. Они — «человечески созданные ограничения» социальных взаимодействий (North, 1990). В социологии традиция трактовки институтов как правил восходит к классикам вроде Макса Вебера (Weber, 1924) и Толкотта Парсонса (Parsons, 2015), и продолжает развиваться сегодня. Равновесный подход рассматривает институты как поведенческие регулярности и, что наиболее важно, как решения проблем координации (традиция Льюиса) и кооперации (традиция институциональной экономики). Подход конститутивных правил видит институты как системы правил, присваивающие статусы и функции физическим объектам и наделяющие их деонтическими силами (традиция Сёрла).
Авторы утверждают, что концепции конститутивных правил и равновесных объяснений, распространённые в экономике, могут быть интегрированы с помощью понятия КР. Их ключевая идея состоит в том, что конститутивные правила не являются онтологически фундаментальными, а могут быть реконструированы из систем регулятивных правил, действующих в условиях координационных равновесий в повторяющихся играх (Guala & Hindriks, 2015).
В КР каждый агент следует условной стратегии вида «если \(X\), делай \(Y\)». Гуала и Хиндрикс отмечают, что это и есть регулятивное правило, как оно встречается у Сёрла (Guala & Hindriks, 2015). Например, два пастуха могут принять стратегии «пасти скот, если находишься к северу от реки» и «пасти скот, если к югу», тем самым решая проблему координации. Стратегия каждого агента эквивалентна регулятивному правилу, предписывающему, что делать при данных обстоятельствах. Следовательно, согласно Гуале и Хиндриксу, институты есть совокупности регулятивных правил, образующих устойчивое КР.
Более того, привычная конститутивная формулировка «X считается Y в контексте C» может быть выведена из регулятивного правила как сокращённая запись. Гуала и Хиндрикс показывают, что, вводя новые институциональные термины, можно преобразовать регулятивные условные конструкции в конститутивную форму:
\[ \text{Участок земли к северу от реки (X) считается *собственностью* племени Нуэр (Y) в контексте локализации соседства племён Нуэр и Динка(C)} \]
По мнению авторов, подход, основанный на правилах, недостаточен, поскольку не может объяснить, почему одни правила соблюдаются, а другие — нет. Чтобы решить эту проблему, необходим равновесный подход, демонстрирующий стратегический характер следования правилам.
Гуала и Хиндрикс иллюстрируют это, сравнивая две парадигмальные игры из теории игр: «дилемму заключённого» и «охоту на оленя».
Хотя взаимное предательство в дилемме заключённого — равновесие Нэша, это не социальный институт, поскольку оно не является самоподдерживающимся из‑за независимости стратегий игроков. Напротив, обоюдное решение охотиться на оленя, а не на зайца (оба варианта также являются равновесиями Нэша) — это уже институт, поскольку для достижения большего совместного выигрыша требуется, как пишут Гуала и Хиндрикс, корреляция стратегий игроков. Последнее означает, что стратегия является «очевидной» и выгодной для игроков, что и объясняет, почему одни правила соблюдаются, а другие — нет.
Однако, как отмечают авторы, понятие коррелированных стратегий игроков как объяснительный принцип устойчивости институтов также недостаточно, поскольку слишком широко. Авторы приводят пример решения проблем координации животными с помощью коррелирующих устройств при отсутствии институтов. Например, самцы бабуинов, львов, ласточек, бабочек и других видов демонстрируют поведенческую модель, которую можно описать в терминах КР: самцы патрулируют территорию для спаривания с самками и вступают в ритуальные бои с нарушителями при встрече. Эта пара стратегий минимизирует возможный ущерб для обеих сторон и позволяет доминирующему самцу занимать территорию и спариваться (smith1982?).
Согласно авторам, различие между «животными конвенциями» и человеческими социальными институтами заключается в спектре сигналов, на которые можно реагировать. Набор сигналов, на которые могут реагировать животные, значительно уже, чем у людей, из‑за тесной связи стимула и реакции, необходимой для достижения координации. Однако, как отмечают Гуала и Хиндрикс с опорой на идеи Кима Стерельны (Sterelny, 2003), люди способны разъединять стимул и поведение с помощью репрезентации окружающей среды, обусловливающей поведение. Иначе говоря, люди, по мнению авторов, способны изобретать и следовать различным правилам при наличии одного и того же коррелирующего устройства.
Правила — это репрезентации стратегий в заданной игре. Эти репрезентации не только служат символическими маркерами свойств равновесий, но и значительно экономят когнитивные усилия. Подводя итог учёту правил‑в‑равновесии, как отмечает экономист Масахико Аоки, на идеи которого опираются Гуала и Хиндрикс:
«Институт — это самоподдерживающийся, салиентный паттерн социального взаимодействия, репрезентированный значимыми правилами, которые знает каждый агент и которые инкорпорированы как разделяемые агентами убеждения о способах разыгрывания игры» (Aoki, 2007, p. 6).
Тот же Аоки очерчивает институт как двухуровневую систему, где стратегический выбор агентов создаёт объективное состояние игры, это состояние выражается публичной репрезентацией, эта репрезентация способствует формированию ожиданий и верований, которые служат источником стратегического выбора агентов (Aoki, 2011). Гуала и Хиндрикс согласны с такой механикой функционирования института:
-------------------- --------------
стратегический выбор создаёт → состояние игры
-------------------- --------------
↑
мотивирует выражено как
↓
------------------ -----------------------
верования/ожидания ← выведены публичная репрезентация
------------------ из -----------------------
ИНДИВИД ОБЩЕСТВО
В ответ на теорию правил-в-равновесии Cёрл утверждает, что для конститутивных правил необходима нормативность, и конститутивные правила принципиально несводимы к регулятивным. поскольку между ними есть онтологическая разница (J. R. Searle, 2015). Гуала и Хиндрикс же защищают позицию, что конститутивные правила фактически выводимы из регулятивных и, следовательно, редуцируемы к последним (F. Hindriks & Guala, 2015).
Сёрл считает, что чтобы действительно редуцировать конститутивные правила к регулятивным, нужно показать, как регулятивные правила на одном «уровне» генерируют деонтоические силы «на уровень выше». Сёрл считает, что это невозможно. Однако как мы покажем в Главе 4, это может быть возможным.
Важно, что Гуала переосмысляет проект Серла в теоретико-игровых терминах, не отказываясь от его интуиций. Он признаёт, что институциональные статусы влияют на то, как мы классифицируем мир и действуем в нём, но настаивает, что эти статусы всегда согласованы с поведенческими регулярностями, выраженными как КР. Тем самым акцент Серла на конструкции “counts-as” можно восстановить как эпифеномен координации — кажущуюся творческую силу языка15, которая в действительности является не более чем эффектом коррелированных стратегических профилей. Как формулируют Гуала и Хиндрикс:
“язык — лишь одно из множества координационных устройств и не обладает большей творческой силой, чем подбрасывание монеты или любое другое событие, которое игроки могут использовать для координации своих решений” (Guala & Hindriks, 2015).
Гуала и Хиндрикс утверждают, что нормативные аспекты можно моделировать как модификации выигрышей базовой игры, аналогичные \(\delta\)-параметрам у Остром (Crawford & Ostrom, 1995). Нормативное правило добавляет стимулы или санкции, делающие определённые действия — например, кооперацию — более привлекательными. На практике это означает, что если агенты получают «право» или несут «обязанность», мы представляем это, вставляя издержки или выгоды в матрицу выигрышей. Это преобразует игру с ненулевой суммой в координационную игру, где эффективное равновесие становится более заметным.
Гуала показывает, что добавление таких нормативных издержек может создавать новые равновесия, ранее отсутствовавшие, или делать социально оптимальный исход устойчивым. Важно, что эти модификации не требуют введения отдельной онтологической категории помимо стандартных инструментов теории игр. Нормативные силы просто становятся частью равновесной структуры: они обеспечивают координацию, изменяя стимулы. Гуала и Хиндрикс демонстрируют, что любое статусное правило — например, право пользоваться, передавать или исключать — может быть переформулировано как регулятивное правило после включения нормативных полномочий.
По сути, Гуала и Хиндрикс поддерживают трансформационный взгляд: любой институт, описываемый конститутивным правилом, может быть равным образом описан как набор регулятивных норм, включающих необходимые разрешения и запреты. Само существование статуса \(Y\) просто обозначает определённые равновесные отношения между агентами, стоящие «за ним». Переводя статусные функции Серла в терминологию равновесий, унифицированная онтология связывает институциональные «долженствования» со стратегической координацией.
1.3.2 Критика теории правил-в-равновесии
Несмотря на свою инновационность, теория Гуалы и Хиндрикса не лишена критики, поскольку сведение конститутивных правил к равновесиям, по мнению оппонентов, упускает важные аспекты социальной реальности.
Пренебрежение материальными и историческими аспектами
Бинмор утверждает, что реалистичные модели институтов предполагают повторяющиеся игры. И есть два способа их смоделировать: рациональный и эволюционный. Рациональный, представленный Льюисом, Бинмор критикует, говоря, что требование общего знания для рабочей конвенции нереалистичное, а сам подход игнорирует историю (Binmore, 2015).
Бинмор, соглашаясь с Гуалой и Хиндриксом, считает, что устройства корреляции важны. Однако он настаивает, что они важны настолько что их структура должна быть предметом детального рассмотрения. Нужно рассматривать равновесие Нэша в расширенной игре, а не коррелированное равновесие в базовой. В этом смысле критика направлена на отсутствие эксплицитной динамической формы игры.
Рабинович хвалит Гуалу за широкий синтез, но высказывает опасения по поводу сосредоточенности на понятии равновесия. Он указывает, что трактовка институтов как «правил‑в‑равновесии» может искажать их онтологию, игнорируя материальные субстраты и историю (Rabinowicz, 2018).
Многие институты, такие как университеты, денежные системы, рынки и традиции, включают конкретных людей, практики и блага, а не только абстрактные стратегии. Материальная основа разыгрываемых игр — например, студенты и аудитории в университете, — по утверждению Рабиновича, является неотъемлемой частью институтов, и её нельзя абстрагировать, не проигнорав «базовую онтологию» моделируемых явлений.
Эта критика представляется нам неубедительной, поскольку понятие «базовой онтологии» вводит в заблуждение, подразумевая некую «народную онтологию» и приверженность концептуальному анализу, который рассматривает интуицию о социальном мире как валидную отправную точку для онтологического исследования. Модели абстрагируют несущественные части рассматриваемых систем.
Хотя мы согласны, что всегда есть конкретные люди и практики со своей материальной основой, включение «базовой (или народной) онтологии» несущественно для объяснения структуры социальной онтологии, возникновения и устойчивости её ключевых элементов. Также можно сказать, что теория Гуалы уже учитывает подобные «народные» онтологии в виду Y-понятий (деньги, брак и т.д.).
Другой аргумент Рабиновича — что множество возможных КР шире множества РН. Это усложняет, а не упрощает проблему выбора равновесия, поскольку существует бесконечное количество возможных вероятностных распределений, способных порождать множество КР‑конфигураций.
Нередуцируемость нормативности
Сёрл критикует ПвР, говоря что равновесия не объясняют деонтическую силу и что невозможно редуцировать конститутивные правила к регулятивным. Он начинает с того, что институциональные факты — это статусные функции, присваивающие материальным объектам новый статус, а институты — это системы, делающие возможных создание и поддержание статусных функций. Он делает сильное утверждение, что любая теория институтов — это теория статусных функций (J. R. Searle, 2015, p. 506).
Согласно Сёрлу, равновесный подход не способен объяснить деонтологию: права и обязанности, служащие определяющей чертой институциональных фактов. При этом он разводит нормативность и деонтическую силу: любое правило нормативно, но не любое создаёт, например, обязательства. Для Сёрла «способность создавать обязательства и права» — определяющее свойство институтов, которое равновесный подход, по его мнению, не схватывает.
Помимо этого Сёрл имплицитно относится к равновесию как чему-то оптимальному и приводит пример федерального закона США 1862 года о частной собственности: что несмотря на закон, люди все равно находили способы его обойти, и это, по мнению Сёрла, не может быть «равновесием Нэша».
Сёрл считает, что чтобы редуцировать конститутивные правила к регулятивным, нужно показать, как регулятивные правила на одном «уровне» генерируют деонтоические силы «на уровень выше». Сёрл считает, что это невозможно.
Роверси менее радикально отстаивает важность конститутивных правил и тоже критикует редукционизм теории (Roversi, 2021). Трактовка конститутивных правил как «сжатых» регулятивных лишает их нормативной сущности. С его точки зрения, этот взгляд не объясняет, почему индивиды чувствуют себя связанными институциональными нормами. Роверси настаивает, что нельзя уловить смысл статуса (например, профессора) одними лишь условными правилами, поскольку они подразумевают более сложное понятие нормативности.
В недавних работах Хиндрикс развивает собственную ветку теории ПвР и критикует Гуалу по тем же основаниям, что Сёрл и Роверси — что инструментальная рациональность равновесий не схватывает нормативности и деонтических оснований следования правилам (F. Hindriks, 2019). В концепции Хиндрикса, которую он называет «правила-и-равновесия», социальные институты — это управляемые нормами социальные практики. Он утверждает, что моделирование социальных норм как санкций, налагающих издержки за их нарушение, недостаточно для восприятия норм агентами как легитимных. В его концепции есть два вида правил: одни создают пространство для игры, вторые его регулируют.
Согласно Хиндриксу, инструментальный подход не схватывает мотивацию самими нормами, а не издержками её нарушения. Это проблема восприятия агентами стратегических ограничений равновесий как легитимных. Именно нормативные ожидания, по мысли Хиндрикса, и особенно нормативные убеждения, дополняют санкции в качестве источника нормы и её восприятия как легитимной. Социальная норма управляет практикой, если её участники в значительной степени мотивированы следовать её правилу. В этом смысле Хиндрикс разводит нормативность и равновесия.
Переоценка роли координации
Ванершрааф критикует ПвР за слишком широкую трактовку институтов и отсутствие механизмов коррекции неравновесных состояний (Vanderschraaf, 2017). С его точки зрения, координационные равновесия не вполне отражают суть институтов: не все конвенции — социальные институты, поскольку последние предполагают права, обязанности и несимметричные роли.
Чтобы показать, что не все конвенции — институты, Вандершрааф использует игру на доверие. В ней Клиент либо доверяет Инвестору свои деньги в размере 1 единицы (\(T\)), либо нет (\(M\)). Если Клиент доверяет, Инвестор использует эти деньги, чтобы создать \(2\alpha \gt 2\) и после этого либо сотрудничает (\(C\), cooperate) c Клиентом, деля с ним выручку поровну, либо нет (\(D\), defect), забирая всё себе.
Ожидаемо, что в такой конфигурации игроки будут следовать неэффективному равновесию (\(M\), \(D-if-T\)), поскольку \(D\) — строго доминирующая стратегия Инвестора, если клиент выбирает доверять (\(T\)), поскольку это классическая «Дилемма заключенного».
Чтобы равновесие стало эффективным, считает Вандершрааф, нужен институт. Для этого он расширяет игру на доверие, следуя идее Роберта Таделиса (tadelis2013?). В ней Инвестор может либо зарегистрироваться (\(R\)) у Гаранта за стоимость \(\epsilon \in (0,1)\), либо нет (\(N\)). Если Инвестор регистрируется, то он платит защитный депозит \(d \gt 2\alpha\) Гаранту, который затем следит за сделкой между Клиентом и Инвестором. Если Клиент доверяет, а Инвестор обманывает, то Гарант забирает депозит Инвестора себе. А если Инвестор не обманывает, то Гарант возвращает ему депозит.
В такой конфигурации обманывать Клиента Инвестору становится невыгодно, поскольку защитный депозит превышает возможный выигрыш от обмана. А регулятивные правила Клиента (\(R_C\)) и Инвестора (\(R_I\)) выглядят так: \[ \begin{gathered} R_I: \text{R then C if T} \\ R_C: \text{T if R, M if N} \end{gathered} \] Вандершрааф называет подобную конфигурацию «открытым институтом», поскольку роли Клиента и Гаранта не связаны между собой и следуют своим стратегиями автоматически. Для «закрытого института» нужны дополнительные механизмы, регулирующие случаи, когда Клиент не доверяет Инвестору, даже если у того есть регистрация с Гарантом, или если Гарант забирает себе депозит даже у честного инвестора.
Наша позиция близка к предложению Вандершраафа и критикует ПвР на подобных основаниях, однако у него не вполне ясна роль конститутивных правил в контексте унифицированной социальной онтологии. Если Гарант и есть институт, то как это укладывается в формулу «X считается Y в контексте C»?
Эдуин критикует ПвР за переоценку координации как основы института (Hédoin, 2016, 2021). Хотя теоретико‑игровой подход Гуалы предлагает элегантную и экономную модель институтов как координационных равновесий, в конечном счёте она слишком «тонка», чтобы охватить полную социальную онтологию институтов. Конструктивный тезис Эдуина призывает к более широкой, нормативно насыщенной и исторически укоренённой рамке, которая признаёт институты как конституирующие предпочтения и идентичности агентов, встроенные в социальные и культурные контексты и наделённые нормативными силами, порождающими подлинные обязательства.
Подобный более богатый подход призван объяснить не только то, как институты решают проблемы координации, но и то, как они формируют социальную жизнь на фундаментальном уровне. Основная новая идея состоит в том, чтобы сделать экзогенные предпочтения эндогенными, где равновесия не отражают предпочтения агентов, а формируют их. Например, институт брака меняет то, как индивиды ценят отношения, а не только то, как они координируют поведение. Это измерение отсутствует в подходе Гуалы, основанном на матрице выигрышей.
- добавить критику бинмора и других из симпозиуема
- добавить критику из новой статьи (посмотреть researchrabbit)
Хотя указанная критика высвечивает важные недостатки теории правил‑в‑равновесии, большинство её авторов не углубляются достаточно, чтобы увидеть проблему в самой структуре этой теории, которая влияет на её объяснительную силу.
1.3.3 Глубокая проблема: соотношение правил и равновесий
Корень проблемы, по моему мнению, глубже — в отношении между правилами и равновесиями в теории Гуалы. Аргументируя унификацию институтов как правил и равнвовесий, Гуала исходит из недостаточности каждого элемента по отдельности: правила могут не иметь принудительной силы и не соблюдаться, а равновесия описывают слишком большой класс феноменов — например, решение территориальных споров у животных (Frank Hindriks & Guala, 2015).
Решение Гуалы — приравнять регулятивные правила вроде «стой на красный, иди на зеленый» к условным стратегиям агентов в играх. Точнее, он говорит, что это два взгляда на одну и ту же сущность: с точки зрения действующего агента это правила, а с точки зрения наблюдателя — условные стратегии, ведущие к коррелированному равновесию (Guala & Hindriks, 2015). Правила, по утверждению Гуалы, «неотъемлемы для достижения равновесий, формирующих институты» (Frank Hindriks & Guala, 2015, p. 463, курсив мой), то есть логически им предшествуют. Однако в другом месте Гуала говорит, что правила — это «репрезентации стратегий <…>, которым должно (ought) следовать в игре» (Frank Hindriks & Guala, 2015, p. 467, курсив мой). При этом долженствование (принудительный характер институтов) следует из инструментальной рациональности КР — игрокам не выгодно отклоняться от стратегии, предложенной устройством корреляции. Сам Гуала признаёт, что это «слабая нормативность» инструментальной рациональности, а не деонтические силы в полной мере, как это есть у Сёрла (Guala & Hindriks, 2015).
Теория Гуалы создаёт круг в определении: правила помогают агентам достичь равновесий и одновременно репрезентируют уже существующие стратегии, которым необходимо следовать в игре, а нормативность возникает из равновесия. Неясно, что онтологически первично — правила или равновесия, и откуда и почему возникает нормативность. Всё это затрудняет определение онтологии социального института.
Для Гуалы именно правило как репрезентация равновесия мотивирует поведение. Грейф и Кингстон говорят, что это не необходимо (Greif & Kingston, 2011).
Во второй главе я подробно рассматриваю отношение между правилом и равновесием в теории Гуалы.
<!–> Устойчивые институты требуют структур обеспечения санкций, плотность которых пропорциональна информационной хрупкости поддерживаемого равновесия.–>
Источники
–>
Есть мнение, что метод вывода к наилучшему объяснению принципиально недоступен для социальных наук и социологии, в частности, поскольку в них «нет аналогов гравитационных волн или бозона Хиггса» (Hawley, 2018) — то есть, фундаментальных единиц анализа, исходя из которых можно выводить онтологию по лекалам научного реализма (Psillos, 1999). В данном исследовании мы постараемся показать обратное: что IBE — единственно возможный путь к онтологии социального.↩︎
Хотя это и не стало мейнстримом, подобные попытки были во второй половине 20 века в лице «математической социологии» (Fararo, 1989) и унификационных проектов вроде «аналитического ядра социологии» философа Герберта Гинтиса (Gintis, 2007a).↩︎
Это отражает давнюю дискуссию в философии сознания о «народной психологии» и элиминативизме (сведению «ментальных» понятий к состояниям мозга), где одна сторона утверждает, что «народные» понятия, такие как убеждения и желания, приблизительно соответствуют реальным внутренним процессам работы мозга (fodor1983?; gopnik1994?), а другая сторона сводит эти понятия к состояниям мозга и утверждает, что истинные внутренние процессы могут быть описаны только в материальных и механистических терминах (Churchland, 1992; Turner, 2019).↩︎
Иерархический Байес — это модель с вероятностными параметрами, которая допускает иерархические отношения между случайными величинами и их распределениями.↩︎
Как пишет Юм (Hume, 1998), «некоторые утверждают, что справедливость проистекает из человеческих условностей и исходит из добровольного выбора, согласия или объединения людей… если под условностью понимать чувство общего интереса — чувство, которое каждый человек испытывает в своей душе, которое он замечает в своих ближних и которое ведёт его, в согласии с другими, к общему плану или системе действий, направленных на общественную пользу, — следует признать, что в этом смысле справедливость проистекает из человеческих условностей. Ибо если допустить (что, действительно, очевидно), что конкретные последствия конкретного акта справедливости могут быть вредны как для общества, так и для отдельных лиц, то следует, что каждый человек, принимая эту добродетель, должен учитывать весь план или систему и ожидать согласия своих ближних в том же поведении. Если бы все его взгляды сводились к последствиям каждого его собственного поступка, его благожелательности и гуманности, а также “его любви к себе”, то она часто могла бы предписывать ему меры поведения, совершенно отличные от тех, которые соответствуют строгим правилам права и справедливости…». Шлиссер отмечает, что положительная социальная экстерналия является необходимым условием для чисто «юмовской» конвенции (Schliesser, 2024).↩︎
Матрица выигрышей — это математическое представление, показывающее возможные исходы для каждой комбинации стратегий, выбранных игроками.↩︎
На планете, почти во всём идентичной Земле, но где вода состоит не из \(H_2O\), а из \(XYZ\), жители используют слово «вода», однако обозначают им иное вещество. По Патнэму, этот пример показывает, что одних лишь психологических состояний недостаточно для определения значения; внешние факторы, такие как химический состав и условия усвоения, влияют на языковую референцию. Эта идея выражена в его знаменитом тезисе: «значения не находятся в голове».↩︎
Как показал Скирмс (Skyrms, 2010a, 2010b), такие паттерны могут формироваться динамически в повторяющихся играх: как \(X\), так и \(Y\) устанавливаются и распознаются методом проб и ошибок через обучение с подкреплением или другую динамику — обучающую или эволюционную.↩︎
Правило Дирихле — это байесовская процедура обновления, основанная на распределении Дирихле, используемом для моделирования вероятностей на конечном множестве дискретных исходов («распределение распределений»). В моделях обучения правило Дирихле обновляет вероятность, приписываемую каждому распределению, подсчитывая число случаев, когда оно приводило к определённому исходу, например вознаграждению. Эти счётчики служат параметрами распределения Дирихле, которое затем задаёт распределение вероятностей по вариантам. Формально, если вариант \(j\) был вознаграждён \(\gamma_j\) раз, обновлённая вероятность для варианта \(j\) пропорциональна \(\gamma_j\), а вектор вероятностей \(\mathbf{x} = (x_1, \ldots, x_k)\) по \(k\) вариантам таков, что \(x_j \in (0,1)\) и \(\sum_{j=1}^k x_j = 1\). Это правило отражает, как эмпирические частоты формируют вероятностные убеждения в рамках байесовского подхода.↩︎
Различие между «экзогенной» и «эндогенной» информацией, влияющей на выбор стратегии агента, уже присутствует у Аумана (Aumann, 1987). Первый тип информации поступает из внешних сигналов, второй — из рассуждений агентов о том, как рассуждают другие. Ауман не считал это различие важным, поскольку знание экзогенности или эндогенности информации (и даже действий) агентов не способствует достижению КР. Использование Вандершраафом динамики Дирихле прояснило, как эндогенность может способствовать этому, хотя полностью внешний сигнал устранён не был.↩︎
Многие исследователи используют метафоры, подчёркивающие внешний характер КР: «посредник» и «корреляционное устройство» (fudenberg1991?), «хореограф» (Gintis, 2009b) и другие.↩︎
Случайное распределение пар — стандартное предположение в эволюционной теории игр, когда индивиды в большой хорошо смешанной популяции объединяются для взаимодействий случайным образом, т.е. каждый имеет равные шансы встретить любого другого, независимо от его стратегии. В этом контексте ЭСС зависит исключительно от средних выигрышей, определяемых частотами стратегий в популяции, и такие стратегии, как кооперация, обычно не могут сохраниться, если они напрямую не поддерживаются структурой выплат. Отклонения от случайного распределения (ассортативные или структурированные пары) вводят корреляции между стратегиями, что принципиально меняет, какие типы поведения могут быть эволюционно стабильными (Izquierdo, Izquierdo, & Hauert, 2024; Jensen & Rigos, 2018).↩︎
A quite important clarification here is that to be “on the same page” about the need of common knowledge and the degree of rationality, we need to take into account the stage of a convention in question: is it just forming or is it already stable? It seems intuitive to suggest that earlier rounds of play require more explicit beliefs and cognitive demands than later rounds when strategies become more automatic and probabilities of actions of others are easier to predict. It is less costly to converge on an equilibrium in later rounds of play, so we need to be explicit about the state of play when discussing the need for common knowledge and cognitive demands of conventions.↩︎
This distinction mirrors the classic one of natural and social kinds, where the former are “homeostatic property clusters”, sets of necessary and stable features (Boyd, 1991).↩︎
Серл делает деонтические силы институциональных фактов зависимыми от языка. В то же время данные когнитивной археологии, что ранние гоминины могли решать проблемы координации без языка. Философ биологии Ким Стерельны утверждает, что социальные институты (или человеческий социальный контракт), понимаемые как разделяемые и поддающиеся принуждению нормы, регулирующие кооперацию и взаимность, возникли до появления сложного языка (Sterelny, 2021). Археологические данные показывают, что ранние гоминины участвовали в кооперативном добывании пищи и согласованном использовании орудий. Это указывает на взаимовыгодное сотрудничество и неявное принуждение к нормам в малых мобильных группах уже около 1,8 млн лет назад (Sterelny, 2016, 2021). Сравнительные исследования приматов также подтверждают правдоподобие доязыковой кооперации и элементарного нормативного контроля, демонстрируя формы взаимности и социальной регуляции у человекообразных обезьян, которые, вероятно, служили основой раннего человеческого сотрудничества (birch2022?). Вместе эти данные поддерживают модель Стерельного, согласно которой прото-социальные контракты, укоренённые в нормах, репутации и координации, существовали в доязыковых обществах, а язык позднее позволил формировать более абстрактные, масштабируемые и формализованные нормы по мере расширения человеческих групп. Хотя Серл не рассматривал институты как решения координационных проблем, это важно с точки зрения натуралистической социальной онтологии.↩︎