26.04.2010, 00:01

Кнуты и пряники: Идеал управления

Как построить общество, в котором люди были бы законопослушны и помогали бы друг другу? Карать ли построже, или награждать пощедрей? Свой ответ дает теория игр.

Редакция сайта

Одной из основ успешно функционирующего человеческого сообщества является какая-либо форма договора, законодательства, исполнение норм которого подкрепляется разными видами стимулов. Стимулы эти могут быть как позитивными (награда), так и негативными (наказание), и каждый раз человечество отчаянно решает, каким же должно быть оптимальное сочетание того и другого, чтобы общество могло достичь максимального уровня кооперации при минимальных издержках.

Помощь в этой действительно нелегкой работе, которая до сих пор решалась исключительно неточными методами гуманитарных наук, может оказать математика — а еще точнее — та ее область, что зовется теорией игр.

Австрийские ученые Кристиан Хильб (Christian Hilbe) и Карл Сигмунд (Karl Sigmund), используя компьютерное моделирование, оценили, как различные виды стимулов влияют на поведение отдельных индивидуумов — и насколько эффективная социальная кооперация возникает из разных стратегий, с той или иной степенью использования «кнута» и/или «пряника».

Как отмечают ученые, эффективность той или иной политики в плане отношения затрат общества и полученных им от этого выгод зависит от обстоятельств и характера самого общества. Например, в социуме, где доминирует кооперативное поведение, массово награждать его чересчур невыгодно, а там, где «человек человеку — волк», наоборот, невыгодным оказывается слишком строгое и активное использование жесткой политики.

В основу построенной учеными модели легла известная «дилемма заключенного». Мы писали о ней в связи с другим, не менее интересным исследованием, посвященным бактериям: «Колония решила».

Напомним, что суть этой задачи состоит в выборе, сотрудничать ли со следствием, который ставится перед парой сообщников. Если да, то сотрудничающий преступник получает скидку и проведет в тюрьме 2 года, а его сообщник загремит на все 6 лет. Если оба расколются, то получат по 4 года, но если оба предпочтут запирательство, то их придется выпустить (допустим, у следователя недостаточно улик). Казалось бы, надо молчать — но преступник не знает о решении своего напарника, и если он будет молчать, а тот проговорится, то он получит «по полной». В рамках этой задачи оптимальное решение для индивидуума — рассказать все, а для коллектива — молчать.

Однако в данном случае математики слегка изменили условия игры: решение принимал лишь один из «заключенных», второй же использовался в качестве стимула. Его решение диктовали ученые, в зависимости от того, хотели ли они вознаграждать или наказывать первого игрока.

Иначе говоря, первый игрок имел возможность выбирать из четырех стратегий — постоянное сотрудничество; постоянное соперничество; сотрудничество, но лишь в том случае, если соперничество явно будет наказано; наконец, соперничество, если только сотрудничество не будет вознаграждено. Тем временем второй игрок либо не предлагал никакого стимула, либо предлагал сплошные наказания, либо только награды, либо те и другие в разной пропорции.

Различные сочетания стратегий, которые использовались игроками, приводили к различной динамике развития «отношений» между ними. Однако некоторые из форм этих «общественных отношений» оказывались куда более стабильными, чем другие, а одно из сочетаний и вовсе оказалось равновесием Нэша, то есть ситуацией, в которой ни один из игроков не будет в одностороннем порядке менять свою стратегию, поскольку это в любом случае не даст ему никакого выигрыша. Таким равновесным состоянием оказалось использование первым игроком тактики оппортунизма (т.е. сотрудничества, если предательство будет наказано) — в то время, как второй игрок, не стимулируя сотрудничество, непременно наказывает предательство.

В построенной учеными модели различные сочетания стратегий обоих игроков рано или поздно эволюционировали к такой равновесной позиции. И в эволюции этой Хильб и Сигмунд выделили ключевой шаг: момент перехода первого игрока от стратегии «буду соперничать, если только сотрудничество не награждается» к стратегии «буду сотрудничать, пока соперничество наказывается».

Так вот, согласно полученным математиками результатам скорость, с которой первый игрок приходит к этой фазе и проходит ее, может заметно возрастать, если второй игрок поначалу делает заметный акцент на вознаграждении за сотрудничество — а затем на наказании за соперничество.

Соответственно, по мнению математиков, способ превратить «волчье» общество в «овечье» очевиден: на первых порах активнее использовать стратегию «пряника», понемногу активизируя и «кнут», по мере того, как число асоциальных элементов будет уменьшаться.

«В последние годы наблюдается очень бурная дискуссия о том, может ли вообще (а если может, то — как именно) намеренное стимулирование (наказанием и вознаграждением) изменять общество в лучшую сторону», — говорит Кристиан Хильб. Заметим, что дискуссии этой куда больше лет, и во времена Советского Союза ее суть была широко известна в чеканной формулировке «Бытие определяет сознание» (из формулы очевидно и решение, которое давала этой проблеме тогдашняя официальная идеология).

Однако результат Хильба и Сигмунда далеко не столь однозначен. В различных условиях эффективными оказываются оба вида стимулов: награда оказывается эффективной в движении к более развитому обществу, но эффективность эта снижается, когда общество уже достигло определенного уровня законопослушности. Тут на сцену выступает наказание.

По публикации PhysOrg.Com

zrab07 01 Мая 2010, 15:05

"Как это не предусмотрено? Избиратели не выберут их на следующих выборах - это и есть наказание." С неизбранием как видом наказания нельзя согласиться потому, что президент или депутаты своим личным решением определяют, будут они подлежать указанной ответственности или нет. Действительно – если депутат (президент) решил не баллотироваться на следующий срок – следовательно, он заведомо избежал даже этой небольшой ответственности (в форме морального наказания в случае не избрания). Для президента Конституцией предусмотрено только 2 срока полномочий. Так что в течение второго срока он вообще может на работу не ходить, все равно не выберут. "В тюрьму, или бомбу с кодом)..." - идеал управления - это не только кнуты, но и про пряники нельзя забывать.

ivedcloud 28 Апреля 2010, 14:04

weaponchick: как будто выбирают те, кого кто-то наказывает и поощряет по своему усмотрению. много антиутопий написано и снято на тему идеального общества. но таково невозможно - каждый способ несет определенную слабину. идеальное общество возможно, если его граждане будут сознательны. и более духовны (не в смысле религий и те пе, а в смысле мудрости и знания). только тогда, имея всех без исключения с сознанием можно думать об идеальном обществе. чтоб можно было человеку и быть индивидуальностю, и общим. такой себе макрокосм и микрокосм в социуме)))). люди - они люди. делить на волков и овец - то же, что делить на мужчин и женщин. но это не значит, что у принадлежащего к той или иной категории будут строго определенные качетва.

turik 26 Апреля 2010, 13:04

С помощью данных из этой статьи можно построить общество построенное не страхе и корысти- когда же из волков и овец людьми станем?

vitaly_from_st 26 Апреля 2010, 11:04

далекоидущие выводы не стоит делать на основании этого исследования. не все так просто

zrab07 26 Апреля 2010, 08:04

Авторы статьи и ученые не оспаривают применение обоих стимулов - поощрение и наказание. Но есть "труженики" на которых данные стимулы не распространяются - исполнительная (президенты и тд) и законодательная (думы и тд) органы власти. При любом раскладе наказание к ним не предусмотрено. Какую "оптимальную" модель развития общества (а они ведь рули общества) предложат ученые? Или наказание существует только для тех, кто не у кормушки?