Теория игр и теория рационального выбора

ТЕОРИЯ ИГР И ТЕОРИЯ РАЦИОНАЛЬНОГО ВЫБОРА

Основные понятия. Теория игр — математический метод изучения оптимальных стратегий в конфликтных ситуациях. Чтобы сделать возможным математический анализ конфликтной ситуации, необходимо отвлечься от второстепенных факторов и построить упрощенную модель ситуации. Математическая модель конфликтной ситуации называется игрой. Всем известны такие формализованные модели конфликтных ситуаций, которые в буквальном смысле слова являются играми: шашки, шахматы, домино, лото, карточные игры. Именно от них математическая теория игр взяла свое название и терминологию: стороны, участвующие в конфликтной ситуации, именуются игроками, их действия — ходами, а результат столкновения для каждой стороны — ее выигрышем. Выигрыш не всегда имеет количественное выражение, но, как правило, для него можно подобрать числовую характеристику. В частности, если выигрыш не имеет количественного выражения, числовой характеристикой выигрыша можно считать его вероятность.

Джон Форбс Нэш-младший (1928—2015) — американский математик, ставший лауреатом Нобелевской премии в области экономики, опубликовав исследование «Анализ равновесия в теории некооперативных игр». В области теории игр с ненулевой суммой он обнаружил возможность «некооперативного равновесия», при которой обе стороны используют стратегию, приводящую к устойчивому равновесию. Впоследствии этот результат получил название «Равновесие Нэша».

Если в игре сталкиваются интересы двух противников, то игра называется парной. Здесь мы ограничимся рассмотрением таких конфликтных ситуаций, которые можно свести к парным играм. Будем обозначать игроков А и В. Для удобства игрока А иногда называют «мы», а игрока В — «наш противник».

Если в парной игре стороны представляют противоположные интересы, т. е. каждый игрок заинтересован только в увеличении своего собственного выигрыша, то игра называется антагонистической. В реальности есть такие конфликтные ситуации, где в роли противника выступает не человек, а обстоятельства: погодные условия,

спрос на различные виды товара, предполагаемые итоги голосования, расписание автобусов. В подобных играх принято называть противника «природой», а сами эти игры — играми с «природой».

Платежная матрица.

Пусть Аь А2, ..., Ат — все возможные ходы игрока А, Вь В2,

Вп — все возможные ходы его противника, игрока В, а^ — значение выигрыша игрока Л при выборе игроками ходов Д и В-. Выпишем эти значения в прямоугольную таблицу-матрицу, строки которой соответствуют ходам А, столбцы — ходам противника — игрока В. Такая таблица называется платежной матрицей, или просто матрицей игры.

Пример 1. Каждый из двух игроков одновременно называет одну из сторон монеты (герб, цифра) либо молчит. Если оба игрока сделали один и тот же ход, то игрок А платит игроку В 2 руб., если же их ходы различны, то Л получает от В 1 руб.

Платежная матрица имеет вид:

-2

1

1

1

-2

1

1

1

-2

Пример 2. Пусть в нашем распоряжении имеется три вида вооружения А], А2, А3, у противника — три вида самолетов Вь В2, В3. Наша задача — поразить самолет, задача противника — сохранить его непораженным. При применении оружия Аг самолеты Вг, В2, В3 поражаются с вероятностями 0,9, 0,4 и 0,2, соответственно, при применении А2— с вероятностями 0,3, 0,6 и 0,8, при применении А3— с вероятностями 0,5, 0,7 и 0,2. Построим платежную матрицу игры.

У нас три хода — три варианта выбора вооружения — А 1j А-2’ А3. У противника также три хода — выбор самолета Вь В2, В3. Наш выигрыш равен 1, если самолет поражен, и 0, если он не поражен. Однако определить точное значение выигрыша при выборе нашего хода и хода противника нельзя — самолет поражается лишь с определенной вероятностью, и выигрыш — величина случайная. Здесь мы должны принять в качестве числового значения выигрыша его математическое ожидание — в данном случае — его вероятность. Тогда платежная матрица выглядит так:

0,9

0,4

0,2

0,3

0,6

0,8

0,5

0,7

0,2

Как разумно вести себя в каждой из этих ситуаций?

Принцип минимакса в антагонистических играх. Рассмотрим пример 2, приведенный выше. Определим сначала рациональный выбор хода игрока Л. В платежной матрице есть клетка с выигрышем 0,9 — это самый большой его выигрыш. Чтобы получить его, надо выбрать ход А3. Но ведь наш разумный противник должен понимать, что мы польстимся на этот выигрыш, а значит, он должен ответить нам ходом В3. Тогда вместо предполагаемого выигрыша 0,9 мы получим лишь выигрыш 0,2. Нет, мы не можем так рисковать. Какую же стратегию выбрать? Исходя из принципа осторожности, мы должны выбрать тот ход, при котором наш минимальный выигрыш максимален. Как же выбрать такой ход? Для каждого нашего хода найдем самый неудачный, самый маленький выигрыш. Легко видеть, что для хода Aj самым плохим выигрышем является 0,2 (это — минимальное число первой строки), для А2 — это число 0,3, для А3 — 0,2. Выпишем эти числа в дополнительный столбец платежной матрицы, обозначим их через ар

0,9

0,4

0,2

0,2

0,3

0,6

0,8

0,3

0,5

0,7

0,2

0,2

Максимальное из чисел а, равно 0,3, и оно соответствует ходу Д2- Если мы выберем этот ход, то самое малое, что мы можем получить, это выигрыш 0,3. При других вариантах мы рискуем получить меньше:

Выигрыш max jmin{ay j|, в нашем случае это 0,3, называется

нижней ценой игр, или максимином, а стратегия игрока А, ему соответствующая — максиминной стратегией. Максимин — наш гарантированный выигрыш. Если мы поведем себя осторожно, то меньше 0,3 не получим.

Теперь встанем на позицию нашего противника. Как он должен рассуждать? Ему бы хотелось, чтобы мы взяли самый маленький выигрыш, а именно 0,2. Для этого ему необходимо сделать ход В3. Но этого недостаточно. Мы ведь можем разгадать его замысел, ответив ему ходом А2, и взять выигрыш 0,8. Понимая это, игрок В остережется этого хода. Вообще он, как и мы, попробует перестраховаться: из самых плохих исходов он выберет лучший. Самыми плохими для

него исходами при ходах Вь В2, В3 являются наши выигрыши 0,9, 0,7, 0,8. Это максимальные числа столбцов, обозначим их через Ь;:

Припишем эти числа в дополнительную строку платежной матрицы.

0,9

0,4

0,2

0,3

0,6

0,8

0,5

0,7

0,2

0,9

0,7

0,8

Самым лучшим для В из этих исходов является минимальное из этих чисел, это число 0,7:

Это число соответствует стратегии В3, оно называется верхней ценой игры, или минимаксом, а стратегия игрока В, ему соответствующая — минимаксной стратегией. Если игрок В будет вести себя осторожно, то больше 0,7 он нам не отдаст.

Итак, если оба игрока соблюдают принцип осторожности, то они выберут ходы, соответствующие максимину и минимаксу. В теории игр эта пара ходов называется минимаксной парой, а выбор этой пары называется принципом минимакса. Принцип минимакса рекомендует следующую линию поведения: поступай так, чтобы при наихудшем для тебя поведении противника получить максимальный выигрыш (минимальный проигрыш). Для данного примера минимаксные стратегии — А2, В2, при использовании их обоими игроками игрок Л сбивает самолет противника с вероятностью 0,6.

Определение. Выигрыш игрока А при выборе игроками ходов по принципу минимакса называется ценой игры.

Игры с природой. При рассмотрении приведенного выше примера при выборе оптимального хода мы предполагали, что наш противник так же разумен, как и мы, и делает все возможное, чтобы уменьшить наш выигрыш. Такой принцип поведения лежит в основе антагонистических игр. Однако в играх с природой в роли противника выступает не человек, а обстоятельства. Этим обстоятельствам безразлична величина своего и нашего выигрыша, и они не разрабатывают ответную стратегию. В этом случае игра не является антагонистической, но понятия оптимальной стратегии и цены игры остаются в силе. В силе остается и способ их нахождения, однако из пары оптимальных стратегий достаточно найти только одну — свою. Следует отметить, что, применяя оптимальную стратегию в играх с природой, мы получаем хороший шанс взять выигрыш больше цены игры, ведь природа не старается применять оптимальную стратегию. Рассмотрим пример игры с природой.

Задача. Рассмотрим следующую ситуацию. Во время туристической поездки в Китай соседка по гостинице Зина рассказала Маше, что собирается купить на рынке щенков-пекинесов, с тем, чтобы продать их в России. В России щенка можно продать по цене 3000 руб. В Китае они стоят гораздо дешевле — один щенок стоит 1000 руб., но, если берешь больше, то за второго, третьего и т. д. платишь всего по 500 руб. Правда, больше трех щенков провозить через границу не разрешается. Зина занимается продажей щенков регулярно. Она привозит щенков из Китая, просто дает объявление в Интернете, и, как правило, за два-три дня щенков разбирают. Правда, сама она не работает и может ждать покупателей сколько угодно. Зина предложила и Маше купить щенков на продажу. Маша сразу было отказалась: Маша работает и больше трех дней после поездки заботиться о щенках не может, а сами они настолько малы, что без ухода погибнут. Тогда Зина предложила Маше взять у нее телефон одного знакомого, к кому можно обратиться в случае, если щенков не купили. Непроданных щенков можно отдать этому человеку, приплатив за каждого по 500 руб. (таков его бизнес). Продав щенков, деньгами он не поделится, но хотя бы можно быть спокойной, что щенки не погибнут. Как поступить Маше?

Решение. Сначала построим платежную матрицу игры. Обозначим А0, Аг, А2, А3 соответственно решения: щенков не покупать, купить одного, купить двух, купить трех щенков (больше трех покупать нет смысла по условию). Обозначим В0, Вь В2, В3 соответственно следующие состояния природы: покупателей на щенков не найдется, найдется один покупатель, найдутся двое, найдутся трое или больше желающих (по условию, это один и тот же ход природы). Платежная матрица игры задается таблицей:

0,0

0,0

0,0

0,0

-1,5

2,0

2,0

2,0

-2,5

1,0

4,5

4,5

-3,5

0,0

3,5

7,0

Например, посмотрим, как строится строка, соответствующая ходу А2. Маша покупает двух щенков за 1,5 тыс. руб. Если никто их не покупает (В0), то Маша относит их к знакомому Зины и теряет еще 1 тыс. руб. Ее выигрыш в этом случае -2,5. Если купят одного щенка CBj), то она получит за него 3 тыс. руб., но за второго ей самой придется доплатить 0,5 тыс. руб., ее выигрыш в этом случае —

1 тыс. руб. (-1,5 + 3 - 0,5 = 1). Допустим, купят обоих щенков (В2), она получит за них 6 тыс. руб., и с учетом их стоимости (1,5 тыс. руб.) выигрыш составит 4,5 тыс. руб. Если у кого-то появятся желающие купить еще щенков (В3), ситуация при ходе А2 не изменится.

Остальные строки заполняются аналогичным образом.

Критерии выбора оптимального хода.

Критерий Лапласа основан на следующем соображении. Оценкой стратегии считают соответствующий ей средний выигрыш — математическое ожидание выигрыша. Для вычисления математического ожидания выигрыша при каждой стратегии игрока Л желательно знать набор вероятностей возможных состояний природы (состояний природы В). Если о состоянии природы ничего неизвестно, то все ее состояния считаются равновероятными. Оптимальной является та стратегия, средний выигрыш которой максимален. Для нашего примера вероятность состояний природы неизвестна, а значит, вероятность каждого состояния принимается —. Оптимальной

по критерию Лапласа является стратегия А2.

Критерий Вальда основан на гипотезе крайней осторожности. Она формулируется так: при выборе стратегии надо рассчитывать на самый худший из возможных вариантов. Этот критерий рекомендует из всех возможных плохих вариантов выбирать наименее плохой. Мы уже рассматривали этот принцип, соответствующая ему стратегия называется максиминной. Для нашего примера макси- минной стратегией является А0.

Критерий Севиджа основан на преобразовании платежной матрицы в матрицу рисков. Риском г^ игрока А при использовании стратегией Л, называется разность между выигрышем, который игрок А получил бы, если бы знал состояние В,, и тем выигрышем, который он получает, выбирая А(, не зная состояние природы. Поясним это понятие на примере последней платежной матрицы. Предположим, Маша выбрала стратегию Ах — купила одного щенка. Пусть природа находится в состоянии В2 (объявились два покупателя). Если бы Маша заранее знала об этом, она купила бы двух щенков и получила бы «навар» 4,5 тыс. руб., а так у нее выигрыш 2 тыс. руб. Разница составляет 2,5 тыс. руб. Вот эта неиспользованная возможность, о которой Маша, конечно, сожалеет, называется риском.

Строго говоря, риск в данной клетке — это разность между самым большим числом столбца и числом в данной клетке. Матрица эисков имеет вид:

Максимальный риск по строке

0,0

2,0

4,5

7,0

7,0

1,5

0,0

2,5

5,0

5,0

Максимальный риск по строке

2,5

1,0

0,0

2,5

2,5

3,5

2,0

1,0

0,0

3,5

Меньше всего мы рискуем, выбирая ход Л2- Он и считается оптимальным по критерию Севиджа.

Сведем все полученные результаты в общую таблицу.

Критерий

Лапласа

Критерий

Вальда

Критерий Сэвиджа (максимальные риски)

0,0

0,0

0,0

0,0

0,0

0,0

7,0

-1,5

2,0

2,0

2,0

  • 4у5
  • 4

-1,5

5,0

-2,5

1,0

4,5

4,5

4

-2,5

2,5

-3,5

0,0

3,5

7,0

  • 7
  • 4

-3,5

3,5

Вернемся к вопросу о том, как поступить Маше с покупкой щенков. Однозначного ответа нет. По критерию Лапласа и Сэвиджа, следует купить двух щенков, по критерию Вальда — щенков покупать не следует.

Уточненный критерий Лапласа. Мы использовали критерий Лапласа, ничего не зная о вероятностях состояния природы, поэтому сочли их равновероятными. Усложним задачу. Допустим, Зина рассказала Маше подробнее о том, как быстро у нее расходятся щенки (напомним, что Машу интересует продажа щенков за первые три дня). За последние десять поездок только раз Зине не удалось продать щенков за первые три дня. Трижды у нее находился только один покупатель, четыре раза она продала за этот период двух щенков, и дважды ей удалось найти трех покупателей. Теперь у нас есть вероятности состояний природы, и мы можем уточнить оптимальный ход по критерию Лапласа. Напомним, что средний выигрыш, или, что, то же самое, математическое ожидание выигрыша для рассматриваемой задачи рассчитывается по формуле

Состояния природы и их вероятности

Математическое ожида- ние выигрышей

0,10

0,30

0,40

0,20

0,00

0,00

0,00

0,00

0,00

Состояния природы и их вероятности

Математическое ожида- ние выигрышей

0,10

0,30

0,40

0,20

-1,50

2,00

2,00

2,00

1,65

-2,50

1,00

4,50

4,50

2,75

-3,50

0,00

3,50

7,00

2,45

Согласно уточненному критерию Лапласа, следует купить двух щенков.

Ответ. Согласно критерию Лапласа, щенков покупать не надо. Согласно критерию Сэвиджа и критерию Лапласа, следует купить двух щенков.

В общем случае оптимальные стратегии, полученные по разным критериям, могут не совпадать. Это не должно вызывать недоумение, ведь они основаны на различных гипотезах. Гипотеза является только предположением, а не знанием. Различные предположения, естественно, приводят к различным результатам. Однако, если несколько разных критериев указывают на одну и ту же стратегию, то есть все основания выбрать именно ее.

Задача. В теории вероятностей рассматривается задача, известная как задача о выборе жениха. Принцесса должна выбрать жениха из п претендентов. Одного за другим к ней подводят молодых людей. Если от данного юноши она отказалась, то вернуть его она уже не может. А если она отказала всем претендентам, то по велению отца-короля она должна выйти замуж за того, кто в очереди оказался последним. Требуется найти наиболее разумную линию поведения принцессы.

Согласитесь, что в аналогичной роли может оказаться любой из нас. Представьте такую ситуацию. Временно вы занимаете должность, которая вас не устраивает. Вы надеетесь получить лучшую должность. И вам, действительно, время от времени предлагают другие должности. Если вы отказываетесь от предложения, то свободную должность сразу же занимает кто-то из ваших коллег. Вы знаете, что предложения не могут сыпаться бесконечно, и на каком-то из них вы должны остановиться. На каком?

Еще одна похожая ситуация. Предположим, в течение года вы должны купить или получить от государства квартиру. Раз в два- три месяца вам предлагают посмотреть одну из квартир, и если вас она не устраивает, вы можете подождать следующую. Правда, нет никакой гарантии, что следующая окажется лучше. Квартиру, от которой вы отказываетесь, сразу же занимает другая семья, так что «передумать» вы уже не можете. Как вести себя в такой ситуации?

В ситуации принцессы из нашей задачи время от времени оказывается каждый из нас. Надо ее решать.

Решение. Попробуем свести эту задачу к матричной игре. Во- первых, упорядочим потенциальных «женихов» (по красоте, или по уму, или по богатству, и т. д., это зависит от вкуса принцессы), при этом будем считать, что каждого можно сравнить с каждым. Проранжируем их в порядке возрастания достоинств (а не в порядке поступления!): самый лучший претендент получает самый большой ранг. Принцесса не знает, в какой последовательности (по рангам) пойдут женихи, но линию поведения она должна выработать заранее. Какие у нее варианты выбора?

Онможет решить так: выберу первого, сразу все и закончится. А может быть, она заранее решит выбрать второго. А может быть, она из любопытства захочет посмотреть всех, и тогда ей придется выбрать последнего. Обозначим эти ходы Аь А2, ..., Ап (п — число всех претендентов). Отметим, что шансы выбрать в женихи лучшего из претендентов, какой бы ход из этих мы ни выбрали, одинаковы: очевидно, что вероятность выбора лучшего каждый раз равна —

п

(кстати, вероятность выбора самого плохого претендента тоже каж-

U

дыи раз равна —).

п

Рассмотрим еще один вариант выбора. Первого претендента следует отвергнуть, какой бы он ни был, а вот претендента с номером к выбрать в женихи в том и только в том случае, если он лучше предыдущего. Обозначим эту стратегию Ап+1. Выигрышем принцессы будем считать ранг выбранного жениха.

Ходами противника принцессы естественно считать различные способы организации очереди претендентов. А так как они получают номер (не ранг, а именно номер в очереди на показ принцессе) по мере поступления, то ситуацию можно считать игрой с природой.

Отметим, что если претендентов п, то существует п! = 1 • 2 •... • п способов организации очереди. Если, например, женихов 5, то ходов природы (вариантов очередей) 120.

Ограничимся тремя женихами. Тогда очередь из них можно сформировать шестью различными способами: (123), (132), (213), (231), (312), (321). Это и есть ходы природы. Что, например, представляет собой ход (213)? Это означает, что первым, с которым познакомят принцессу, будет претендент, который получил бы ранг 2, вторым, кто к ней зайдет, будет самый слабый претендент, его ранг равен 1, а последним, если она дождется его, появится претендент ранга 3. Очевидно, что при данных условиях задачи все ходы природы равновероятны. У принцессы при трех претендентах 4 хода.

Составим матрицу выигрышей и найдем оптимальный ход принцессы по принципу Лапласа, по принципу Вальда и по принципу Сэвиджа.

Платежная матрица и средние и минимальные выигрыши по каждой строке:

123

132

213

231

312

321

Средний

выигрыш

Минимальный

выигрыш

1,0

1,0

2,0

2,0

3,0

3,0

2,0

1,0

2,0

3,0

1,0

1,0

1,0

2,0

2,0

1,0

3,0

2,0

3,0

3,0

2,0

1,0

2,0

1,0

2,0

3,0

3,0

3,0

2,0

1,0

2,3

1,0

Мы видим, что по критерию Лапласа оптимальным ходом является А4, а по критерию Вальда все стратегии равноценны.

Матрица рисков имеет вид:

123

132

213

231

312

321

Максимальный

риск

2

2

1

1

0

0

2

1

0

2

0

2

1

2

0

1

0

2

1

2

2

1

0

0

0

1

2

2

Критерий Севиджа не дает никаких рекомендаций, согласно ему все стратегии равноценны.

Ответ. Принцессе следует сделать ход Л4, по крайней мере, есть критерий, рекомендующий именно эту стратегию.

Правильность такого выбора подтверждается следующими соображениями. При выборе всех остальных ходов вероятность выбрать

1

в женихи самого лучшего претендента равна —, такова же вероятность выбрать при этих стратегиях самого плохого. Посчитаем вероятность выбора лучшего претендента при использовании стратегии Ал. Очевидно, что она равна —. А вот вероятность выбрать при

этом самого плохого вдвое меньше, чем при других вариантах, — 1

она равна —.

В заключение отметим следующее. Если претендентов в женихи больше, чем три, то шансы выбрать лучшего из них при выработанной линии поведения увеличиваются. Если их четверо, вероятность

выбрать лучшего равна —. Если же просто заранее задумать, которого по счету претендента из очереди выбрать, то вероятность получить лучшего из четверых равна — (независимо от задуманного но-

мера претендента в очереди). Такова же в этом случае вероятность получить самого плохого. А вот если придерживаться выработанной стратегии, то вероятность получения самого плохого жениха совсем 1 „

невелика, всего —. Все эти числа для четырех претендентов легко проверить.

Итак, при выборе работы, квартиры, мужа, жены и т. д. есть смысл от первого предложения отказаться, а остановиться на том, которое лучше предыдущего. Конечно, к этой рекомендации можно отнестись как к шутке, но можно взять ее на вооружение.

Теория рационального выбора пришла в политологию из социологии и экономической теории. Она пытается объяснить общую ситуацию действиями каждого отдельного индивида или отдельной группы индивидов, объединенных общей целью. В основу рассуждений и действий индивида ставятся две основные характеристики — эгоизм и рационализм. Первое означает, что любыми своими действиями субъект стремится максимизировать собственную выгоду, второе — что при этом он заботится об уменьшении (минимизации) усилий, затрачиваемых на достижение цели. Рациональный выбор исключает риск, либо, если он неизбежен, минимизирует его. Таким образом, теория рационального выбора исследует конфликтные ситуации и прогнозирует выход из них. Основные достижения теории рационального выбора связаны с тем, что для анализа конфликтных ситуаций она привлекает математическую теорию игр. Это позволяет сводить все многообразие человеческой деятельности к нескольким упрощенным моделям — играм, методы решения которых разработаны в теории игр.

Теория рационального выбора — общий термин для различных подходов теории действия в экономических и социальных науках. Эти подходы описывают рациональное поведение действующих субъектов в сфере общественных отношений.

Теория рационального выбора ориентируется на классическую политическую экономию Адама Смита (1723—1790). Свои идеи шотландский ученый изложил в фундаментальном труде «Исследование о природе и причинах богатства народов».

Рассмотрим модель конфликтной ситуации, к которой политологи очень часто сводят реальные конфликты.

Дилемма заключенного. Двое подозреваемых в тяжком преступлении находятся под стражей и изолированы друг от друга. Им известно, что если оба они признаются в совершении преступления, то, с учетом чистосердечного признания, каждый будет осужден на 10 лет; если оба не признаются, то они могут быть осуждены за менее значительное преступление, скажем, за незаконное владение оружием: каждый будет осужден на 3 года; если же один

признается, а другой нет, то признавшийся будет заключен на 1 год, а упорствующий получит полную кару — 25 лет. Как разрешится эта ситуация?

Решение. Каждый из заключенных, обозначим их Л и В, имеет две стратегии: признаться и не признаваться, А1} А2 и Вь В2 соответственно.

Эту ситуацию нельзя свести к антагонистической матричной игре или к игре с природой. А значит, нельзя построить платежную матрицу и использовать разработанные критерии для выбора оптимальных ходов. Однако, используя условия задачи, можно построить таблицу выигрышей (а точнее сказать, проигрышей) для каждого игрока и, используя принципы рационального выбора, предсказать, чем закончится для каждого заключенного данная ситуация.

Матрица проигрышей игрока А

Матрица проигрышей игрока В

Ходы

By

в2

Ходы

By

В2

А!

10

1

А

10

25

а2

25

3

а2

1

3

Поясним, как построены эти матрицы.

Встанем на точку зрения А. Напомним, что в основе рассуждения лежит идея рационального выбора: поступаем так, как выгоднее нам, и никакими моральными обязательствами себя не отягощаем. Мы, т. е. заключенный А, рассуждаем следующим образом. Предположим, В признается. Что меня ждет? Либо 10 лет заключения (если я признаюсь), либо 25 (если я не признаюсь); так получен первый столбец матрицы проигрышей А. Значит, если В признается, мне лучше признаться.

Предположим теперь, что В не признается. Тогда мне грозит либо 1 год заключения (если я признаюсь), либо 3 года (если я не признаюсь) — это второй столбец матрицы проигрышей А. Значит, если В не признается, мне тоже выгоднее признаться. В любом случае заключенному А выгоднее признаться.

Но В рассуждает так же, а значит, примет аналогичное решение. Таким образом, естественно ожидать, что оба заключенных признаются и получат по 10 лет заключения.

Теперь предположим, что нашим заключенным удалось установить связь хотя бы на минуту, и они сговорились не признаваться (это куда выгоднее тому и другому, ведь тогда они оба получат всего по 3 года заключения). Заметим, что матрицы проигрышей не изменились.

Посмотрим, как должен рассуждать А. Допустим, В сдержит слово. Тогда, если я слово сдержу, то получу 3 года заключения, а если нарушу, то всего 1 год. Так уж лучше слово в этом случае нарушить. Теперь предположим, что В нарушит договор и признается. Тогда я получу либо 10 лет, если тоже признаюсь, либо все 25, если буду молчать. Значит, в этой ситуации выгоднее признаваться.

Так как В рассуждает аналогичным образом, он тоже выберет признание, и ситуация разрешится так же: заключенные получат по 10 лет заключения каждый.

Ответ. Итак, независимо от того, сговорились подозреваемые или нет, каждый из них должен признаться и получить по 10 лет заключения.

Таким образом, благодаря теории игр рационального выбора, управление понимается как процесс:

  • • в котором участвуют две и более сторон, ведущих борьбу за реализацию своих интересов, каждая из сторон имеет свою цель и использует некоторую стратегию;
  • • которая может вести к выигрышу или проигрышу — в зависимости от поведения других игроков;
  • • теория игр помогает выбрать лучшие стратегии с учетом представлений о других участниках, их ресурсах и их возможных поступках.

Вопросы и задания для самоконтроля

  • 1. Рассмотрим следующую ситуацию. Каждый из двух игроков, А и В, записывает на листе бумаги целое число. Если оба игрока написали число одной четности, то игрокЛ платит игроку В 1 руб., в противном случае А получает 1 руб. от В. Составьте платежную матрицу этой игры.
  • 2. Дана платежная матрица игры с природой:

4

-2

0

0

1

-3

-1

3

-1

Найдите оптимальный ход игрока А по принципу Вальда, по принципу Сэвиджа и по принципу Лапласа (считая все состояния природы равновероятными) .

3. Торговый агент должен встретиться с иногородним клиентом, поскольку хочет лично вручить ему заказ на 3000 условных денежных единиц. Если агент поедет поездом, то потеряет на работе день, который принес бы ему 1500 условных денежных единиц. Полет самолетом позволит сохранить рабочий день, но если самолет не полетит из-за тумана, то личная встреча с клиентом не состоится, и день на работе будет потерян. В этом случае придется говорить с клиентом по телефону, что уменьшит сумму заказа на 500 условных денежных единиц. Вероятность тумана оценивается

как ОД (по статистике, в это время года один день из десяти туманный). Какое решение должен принять агент?

  • 4. Уровень доходов гражданина Иванова в фирме, где он работает по совместительству, составляет 60 тыс. руб. в год. Подоходный налог составляет 13 %, но Иванов может не заявлять о своем дополнительном заработке в налоговую инспекцию и не платить налог с этой части заработка. В случае обнаружения утаивания доходов Иванов, кроме налога, должен будет уплатить штраф в размере половины заработной платы (т. е. 30 тыс. руб.). Известно, что в этой фирме налоговой инспекцией проверяют доходы каждого третьего работника. Стоит ли Иванову заявлять о своем дополнительном заработке?
  • 5. Чтобы подработать, студент взял на вечер анкеты для проведения телефонного опроса. За выполнение этой работы студент должен получить 400 руб. Однако уже после того, как договор о выполнении работы был заключен, ему позвонили и предложили репетиторское занятие, за которое пообещали заплатить 500 руб. Время занятия — с 8 до 10 ч вечера, именно в то самое время, когда он должен проводить телефонный опрос. Можно сорвать опрос, но по договору за срыв опроса предусмотрены штрафные санкции — 300 руб. Можно отказаться от репетиторства в пользу опроса. Есть еще один вариант — провести репетиторское занятие, а потом подделать анкеты — заполнить их самому, не проводя опроса. Подделка тоже предусмотрена в договоре: если проверка покажет, что анкеты подделаны, а проверяют каждого пятого интервьюера, то придется вернуть зарплату (400 руб.) и заплатить штраф 2000 руб. Как поступить?

Рекомендуемая литература

Конюховский, П. В. Теория игр + CD / П. В. Конюховский, А. С. Малова. — Москва, 2019.

Теория игр: основные понятия / под научной редакцией А. М. Тарасье- ва. — Москва, 2019.

Челноков, А. Ю. Теория игр / А. Ю. Челноков. — Москва, 2019.

Шагин, В. Л. Теория игр / В. Л. Шагин. — Москва, 2019.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >