Парадоксы нетранзитивности в теории вероятности

Как справедливо указывает крупнейший популяризатор математики XX в. Мартин Гарднер, «теория вероятности изобилует парадоксами, которые, казалось бы, противоречат здравому смыслу и озадачивают непосвященных»[1]. А поскольку парадокс в собственном смысле — предмет внимания именно логиков, легко понять принципы проникновения проблематики математической теории вероятности в собственно логику (помимо чисто технического применения аппарата последней к анализу правдоподобных рассуждений). Поэтому нам совершенно невозможно обойтись в нашем курсе (особенно с учетом его ярко выраженного уклона в «нестандартность» и «вскрытие мозга») без подробного рассказа о парадоксах теории вероятности. Среди множества известных к настоящему моменту подобных парадоксов особое место занимают так называемые парадоксы нетранзитивности.

Некоторое двухместное отношение называется транзитивным, если и только если при условии, что оно связывает попарно объекты А и В, В и С, оно связывает также объекты А и С. Можно привести массу примеров как транзитивных, так и нетранзитивных отношений. Так, отношение «больше», заданное на множестве, скажем, целых чисел, транзитивно — из того, что А больше В, г В больше С, логически следует, что А больше С. Транзитивно отношение «старше», заданное на множестве игральных карт: если карта А старше карты В, а карта В старше карты С, то карта А старше карты С. Транзитивно отношение «односельчанин», ибо если А и В, В п С живут в одном селе, значит, А и С тоже живут в одном селе. А вот отношение «ученик» нетранзитивно — если А ученик В, г В ученик С, совершенно не факт, что А ученик С (вспомните великую тройку Сократ — Платон — Аристотель). А отношение «отец» не только нетранзитивно, оно аититранзитивио: если А отец В, г В отец С, А в принципе не может быть отцом С. Не является транзитивным также отношение «сосед»: если дома А

и В с одной стороны и В и С — с другой располагаются рядом, это еще нс значит, что можно утверждать о том, что и дома Л и С располагаются рядом (вспомните «парадокс неточных понятий»!). Парадоксы нетранзи- тивности в теории вероятности основываются на том, что точные математические расчеты опровергают обыденные представления о транзитивности тех или иных отношений.

Приведем несколько примеров парадоксов нетранзитивности.

Рассмотрим комплект из 4 необычных игральных костей. Вместо стандартного набора чисел-очков (1, 2, 3, 4, 5, 6) на их гранях нанесены другие числа. На первой кости (Л): 0, 0, 4, 4, 4, 4. На второй кости (В): 3, 3, 3, 3, 3, 3. На третьей (С): 2, 2, 2, 2, 6, 6. На четвертой (D): 1, 1, 1, 5, 5, 5. Разумеется, в «игровом измерении» кости теперь не равноценны. Если один игрок выберет себе кость А, а другой — кость В, то при их бросании (в сущности, второму игроку в данном случае даже не надо бросать кость — у него всегда «выпадает» три очка) первый игрок выиграет с вероятностью 4/6 = 2/3 (так как «побивающая» тройку четверка нанесена на 4 гранях из 6, а «проигрывающий» тройке ноль — на двух оставшихся). При длительной серии бросков (скажем, «до десяти побед») у второго игрока практически нет шансов на итоговый выигрыш. Для примера: в серии даже до 3 побед первый игрок выигрывает (со счетом 3:0, 3:1 или 3:2) с вероятностью 192/243 = 79%, т.е. в среднем в четырех раундах из пяти. Теперь сравним кости В и С. Ясно, что кость В победит с той же вероятностью 2/3 (игрок с костью С выигрывает, только выбросив шестерку, а шестерок на гранях кости С только две из шести). Далее, кость С с вероятностью 2/3 победит кость D. Поясним. Благоприятные для кости С исходы: шестерка при любом исходе броска кости D или двойка против единицы. Вероятность первого — 1/3, второго — 4/6 х 3/6 = 12/36 = 1/3. 1/3 + 1/3 = 2/3. А теперь внимание! Как мы выяснили, кость Л «вдвое сильнее» кости В. Кость В «вдвое сильнее» кости С, а кость С «вдвое сильнее» кости D. Здравый смысл подсказывает, что кость Л должна быть заведомо сильнее кости D (причем, вполне вероятно, в восемь раз). А элементарная математика говорит, что кость D сильнее кости Л в те же два раза. В этом нетрудно убедиться: кость D побеждает кость Л, или если на ней выпадает пятерка (1/2 случаев), или если на ней выпадает единица, а на кости Л — ноль (вероятность этого — 3/6 х 2/6 = = 636 = 1/6). В сумме получаются искомые две трети: 1/2 + 1/6 = 4/6 = 2/3! Отношение «быть сильнее в два раза», заданное указанным образом на множестве игральных костей, не является транзитивным (хорошей аналогией к нашему примеру может служить детская игра «камень — ножницы — бумага»). Среди этих костей не существует сильнейшей, как бы удивительно это ни звучало. Если предложить партнеру самому выбрать кость для поединка, то какую бы кость он ни взял, вы всегда сможете найти ту, которая будет «побивать» его кость с «убойной» вероятностью 2/3! Чем не средство заработать?

Ясно, что, как и в случаях «парадоксов следования» (см. подпараграф 3.7.2), мы имеем дело с парадоксом не в собственном смысле (т.е. не с наличием логического противоречия), а с парадоксом как «вызовом здравому смыслу» (оказывается, отношение «быть сильнее», определенное указанным образом для игральных костей, просто-напросто не является транзитивным! Но это просто факт, с которым надо смириться, никакого противоречия тут нет). Это всегда надо помнить, когда мы говорим о парадоксах теории вероятности. И в этом их кардинальное отличие от парадоксов теории множеств (Кантора, Рассела), которые своим существованием вскрывают внутреннюю противоречивость аксиом теории.

Кеннет Appov (1921-2017)

Анализ феномена нетранзитивности сыграл решающую роль в знаменитом доказательстве Кеннетом Арроу («парадокс Арроу») принципиальной невозможности существования идеальной демократической избирательной системы (за что он в 1972 г. был удостоен Нобелевской премии по экономике). Выделив некие пять условий, которые, по всеобщему мнению (согласию), являются необходимыми компонентами идеальной избирательной системы, Арроу математически доказал их логическую несовместимость, используя аппарат теории вероятностей. Крупнейший экономист XX в. Пол Самуэльсон так сформулировал суть открытия Арроу: «Усилия лучших умов... направленные на поиск идеальной демократии, оказываются поисками химеры из-за внутреннего логического противоречия исходных принципов... Разрушительное открытие Арроу заняло в математической политологии такое же место, какое занимает в математической логике доказанная Куртом Гёделем теорема о принципиальной неполноте любой математической теории, содержащей аксиомы арифметики»[2].

Теорема: Бутерброд лучше вечного блаженства. Доказательство: Что

может быть лучше вечного блаженства? Да ничего. А бутерброд — это лучше, чем ничего. Следовательно, бутерброд лучше вечного блаженства.

Г1о Р. Смаллиану

Расскажем о парадоксах голосования несколько подробнее, опираясь на разъяснения М. Гарднера. Возьмем для начала самую простую систему: в бюллетене три кандидата; можно проголосовать только за одного из них; получивший большинство голосов объявляется победителем. У претендента Л 40% явных сторонников (т.е. меньше половины), а 60% остального населения его люто ненавидит.

Но симпатии этой остальной части распределены поровну между двумя достойными людьми — претендентами В и С. Ясно, что выиграет А (40% против 30 у каждого из конкурентов). Одной из возможных попыток избежать этого парадокса является введение ранжирования претендентов каждым избирателем (т.е. каждый из них должен упорядочить А, В, С в порядке их субъективного предпочтения). А теперь представим, что 1/3 избирателей составляет такую тройку: АВС, 1/3 — такую: ВСА, и 1/3 — такую: САВ. Ясно, что 2/3 избирателей предпочитают В перед С, а С перед Л. Беда заключается в том, что те же 2/3, оказывается, предпочитают Л перед В. «Если вместо кандидатов взять законопроекты, станет ясно, как легко правящая партия может хитростью провести нужное ей решение, выбрав, какую пару законопроектов надлежит первой поставить на голосование»[3]. Скажем, надо провести закон С. Но ясно, что этому мешает подавляющее преимущество над этим проектом С проекта В. Поэтому сначала ставятся на голосование А и В, и В устраняется. А дальше проект С (во втором туре) легко побеждает А. Многие ли знают, что в подобных голосованиях нельзя использовать аргумент к транзитивности («Раз вы так предпочитаете А перед В, a С перед А, значит, С — самый лучший проект!»)? Что это, говоря прямо, манипуляция, в основе которой лежит самый настоящий софизм? А софизмы — ведомство логики...

Парадокс нетранзитивносги в избирательных моделях впервые был открыт крупным деятелем французского Просвещения маркизом Кондорсе (и его коллегами) в конце XVIII в. и известен во Франции как «эффект Кондорсе». Заново «переоткрыл» этот парадокс Льюис Кэрролл. Однако политологи не осознавали важности этого открытия в своей области до середины XX в., пока не появилась работа некоего Дункана Блэка, посвященная принятию решений комитетами. Дискуссии вокруг «парадокса Арроу» продолжаются до сих пор. Приме- „„ чательно, что многие эксперты находят выход из тупика (1743—1794)

(«От какого именно из пяти критериев демократии _

отказаться?») в избрании диктатора, который волевым решением сломает сложившуюся ситуацию.

Выполните упражнения 17—18 из Практикума.

Еще один поражающий воображение казус теории вероятности — парадокс, открытый математиком У. Пенни. М. Гарднер пишет: «Ситуация эта малоизвестна, и большинство математиков просто не могут поверить в нее, когда впервые слышат об открытии Пенни. Это — заведомо самое красивое надувательство (мы хотим вступиться перед Гарднером за парадокс нетранзитивных костей, который, с нашей точки зрения, как минимум, не хуже. — К. М.) если надувательство может быть красивым, — рассчитанное на простака».

Предположим, что мы бросаем обычную монетку. Если бросить ее три раза, то может выпасть любой из 8 равновероятных исходов («О» — орел, «Р» — решка): ООО, OOP, ОРО, ОРР, POO, POP, РРР. Один из игроков выбирает себе одну тройку, другой — другую. После этого они начинают бросать монету (кто ее бросает — не важно) до тех пор, пока в серии исходов не появится какая-то из двух выбранных ими троек. Победителем объявляется тот, чья именно была эта тройка. Короче говоря, выигрывает та тройка, которая в серии бросаний монеты выпадает раньше. «На первый взгляд кажется, что одна тройка появляется с такой же вероятностью, как и другая, но это не так даже для пар исходов» (Гарднер).

Выполните упражнение 19 из Практикума.

Для троек исходов картина становится просто фантастической, очень напоминая игру в нетранзитивные кости. Какую бы тройку не назвал первый игрок, второй всегда сможет подобрать лучшую тройку. В таблице приведены «самые адекватные ответы» игрока В и вероятность, с которой он победит. Как видим, эта вероятность не менее 2/3 (как и в случае с костями).

Выбор А

Ответ В

Вероятность победы В

ООО (РРР)

РОО (ОРР)

7/8

РОО (ОРР)

РРО (OOP)

2/3

РРО (OOP)

ОРР (РОО)

3/4

ОРО (POP)

OOP (РРО)

2/3

Выполните упражнение 20 из Практикума.

Стоит заметить, что нетранзитивность сохраняется и для групп из п исходов, если п > 3. Исследовавший парадокс Пенни математик Б. Волк открыл еще одну фантастическую аномалию, как таковую не связанную с нетранзитивностью, но наглядно демонстрирующую всю загадочность теории вероятности. «Аномалия Волка» связана с таким понятием, как время ожидания. Для группы из п исходов временем ожидания называется среднее число бросаний (в длинной серии) до первого появления данной группы из п исходов. Время ожидания для О и Р равно 2 («со второго раза должно выпасть»; вероятность каждого из этих исходов равна 1/2). Для двух исходов время ожидания таково: OP (РО) — 4, ОО (РР) — 6. В случае с тройками никакого противоречия с вышеприведенной таблицей по-прежнему не возникает: исходы OOP, ОРР, РОО и РРО имеют время ожидания 8, исходы ОРО и POP — ожидание 10, исходы ООО и РРР — ожидание 14. Для каждой из этих троек тройка, выигрывающая у нее, имеет меньшее или равное время ожидания, что, простите за тавтологию, вполне ожидаемо.

Но случай с четверками исходов окончательно хоронит здравый смысл! Для четверки РОРО время ожидания равно 20, а для четверки ОРОО — 18. Однако четверка РОРО с вероятностью 9/14 (почти 65%) встречается в серии испытаний раньше, чем четверка ОРОО!

Иначе говоря (лапидарная формулировка «аномалии Волка»), «менее частое событие (в длинной серии испытаний) с большей вероятностью происходит раньше, чем более частое событие. В этом нет логического противоречия, но все же нельзя не признать, что среднее время ожидания обладает в данном случае необычными свойствами» (М. Гарднер). «Аномалия Волка» проявляется и тогда, когда сравниваются п-ки разной длины. Так, время ожидания для четверки РРОО равно 16, а время ожидания для тройки ООО — лишь 14. Но РРОО появится в последовательности раньше, чем ООО, с вероятностью 7/12 (почти 60%). А группа РООО - со временем ожидания тоже 16 — побьет тройку ООО вообще с вероятностью 7/8 (87,5%)! Парадокс: вероятность того, что менее вероятное событие чаще опережает в появлении более вероятное событие, больше 1/2.

Д. Силверман предложил игру «слепой Пенниант», в которой игроки одновременно выбирают свои тройки. Вопрос об оптимальной стратегии такого выбора весьма непрост. Не сомневаемся, заинтересовавшиеся вопросом читатели смогут сами удовлетворить этот свой интерес[4].

  • [1] Гарднер М. Крестики-нолики. URL: http://fantbooks.com/index.php7idl=4&category=sf&author=gardner-m&book= 1988&page= 19.
  • [2] Цит по: Гарднер М. Путешествие во времени. М., 1990. С. 68—69.
  • [3] Цит по: Гарднер М. Путешествие во времени. М., 1990. С. 69.
  • [4] См., например: The College Mathematics Journal, 1987. Jan. P. 74—76.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >