Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Антагонистические матричные игры





 

Рассмотрим конечную парную игру с нулевой суммой. Обозначим через a выигрыш игрока A, а через b – выигрыш игрока B. Так как a = – b, то при анализе такой игры нет необходимости рассматривать оба этих числа – достаточно рассматривать выигрыш одного из игроков. Пусть это будет, например, A. В дальнейшем для удобства изложения сторону A будем условно именовать " мы ", а сторону B – " противник ".

 

Пусть у нас имеется m возможных стратегий A 1, A 2, …, Am, а у противника n возможных стратегий B 1, B 2, …, Bn (такая игра называется игрой m×n). Предположим, что каждая сторона выбрала определенную стратегию: мы выбрали Ai, противник Bj. Если игра состоит только из личных ходов, то выбор стратегий Ai и Bj однозначно определяет исход игры – наш выигрыш (положительный или отрицательный). Обозначим этот выигрыш через aij (выигрыш при выборе нами стратегии Ai, а противником – стратегии Bj).

 

Если игра содержит кроме личных случайные ходы, то выигрыш при паре стратегий Ai, Bj есть величина случайная, зависящая от исходов всех случайных ходов. В этом случае естественной оценкой ожидаемого выигрыша является математическое ожидание случайного выигрыша. Для удобства будем обозначать через aij как сам выигрыш (в игре без случайных ходов), так и его математическое ожидание (в игре со случайными ходами).

 

Предположим, что нам известны значения aij при каждой паре стратегий. Эти значения можно записать в виде матрицы, строки которой соответствуют нашим стратегиями (Ai), а столбцы – стратегиям противника (Bj):

 

Bj Ai B 1 B 2 Bn
A 1 a 11 a 12 a 1 n
A 2 a 21 a 22 a 2 n
Am am 1 am 2 amn

 

Такая матрица называется платежной матрицей игры или просто матрицей игры.

 

Заметим, что построение платежной матрицы для игр с большим количеством стратегий может представлять непростую задачу. Например, для шахматной игры число возможных стратегий так велико, что построение платежной матрицы является практически неосуществимым. Однако, в принципе любая конечная игра может быть приведена к матричной форме.

 

 

Рассмотрим пример 1 антагонистической игры 4×5. В нашем распоряжении есть четыре стратегии, у противника – пять стратегий. Матрица игры следующая:

 

Bj Ai B 1 B 2 B 3 B 4 B 5
A 1          
A 2          
A 3          
A 4          

 

Какой стратегией нам (т.е. игроку A) воспользоваться? Какую бы мы ни выбрали стратегию, разумный противник ответит на нее той стратегией, для которой наш выигрыш будет минимальным. Например, если мы выберем стратегию A 3 (соблазнившись выигрышем 10), противник в ответ выберет стратегию B 1, и наш выигрыш будет всего лишь 1. Очевидно, исходя из принципа осторожности (а он – основной принцип теории игр), надо выбирать ту стратегию, при которой наш минимальный выигрыш максимален.

 

 

Обозначим через αi минимальное значение выигрыша для стратегии Ai:

 

и добавим к матрице игры столбец, содержащий эти значения:

 

Bj Ai B 1 B 2 B 3 B 4 B 5 минимум в строках αi  
A 1              
A 2              
A 3              
A 4             максимин

 

Выбирая стратегию, мы должны предпочесть ту, для которой значение αi максимально. Обозначим это максимальное значение через α:

 

Величина α называется нижней ценой игры или максимином (максимум минимального выигрыша). Стратегия игрока A, соответствующая максимину α, называется максиминной стратегией.

 

В данном примере максимин α равен 3 (соответствующая клетка в таблице выделена серым цветом), а максиминная стратегия – A 4. Выбрав эту стратегию, можем быть уверены, что при любом поведении противника выиграем не меньше, чем 3 (а может быть и больше при "неразумном" поведении противника"). Эта величина – наш гарантированный минимум, который мы можем себе обеспечить, придерживаясь наиболее осторожной ("перестраховочной") стратегии.

 

Теперь проведем аналогичные рассуждения за противника B. Он заинтересован в том, чтобы обратить наш выигрыш в минимум, то есть отдать нам поменьше, но должен рассчитывать на наше, наихудшее для него, поведение. Например, если он выберет стратегию B 1, то мы ответим ему стратегией A 3, и он отдаст нам 10. Если выберет B 2 – мы ему ответим A 2, и он отдаст 8 и т. д. Очевидно, осторожный противник должен выбрать ту стратегию, при которой наш максимальный выигрыш будет минимален.


 

Обозначим через βj максимальные значения в столбцах платежной матрицы (максимальный выигрыш игрока A, или, что то же самое, максимальный проигрыш игрока B) для стратегии Ai:

 

и добавим к матрице игры строку, содержащую эти значения:

 

Bj Ai B 1 B 2 B 3 B 4 B 5 минимум в строках αi  
A 1              
A 2              
A 3              
A 4             максимин
максимум в столбцах βj              
      минимакс        

 

Выбирая стратегию, противник предпочтет ту, для которой значение βj минимально. Обозначим его через β:

7.ЧТО НАЗЫВАЕТСЯ ВЕРХНЕЙ ЦЕННОЙ ИГРЫТеперь проведем аналогичные рассуждения за противника B. Он заинтересован в том, чтобы обратить наш выигрыш в минимум, то есть отдать нам поменьше, но должен рассчитывать на наше, наихудшее для него, поведение. Например, если он выберет стратегию B 1, то мы ответим ему стратегией A 3, и он отдаст нам 10. Если выберет B 2 – мы ему ответим A 2, и он отдаст 8 и т. д. Очевидно, осторожный противник должен выбрать ту стратегию, при которой наш максимальный выигрыш будет минимален.

 

Обозначим через βj максимальные значения в столбцах платежной матрицы (максимальный выигрыш игрока A, или, что то же самое, максимальный проигрыш игрока B) для стратегии Ai:

 

и добавим к матрице игры строку, содержащую эти значения:

 

Bj Ai B 1 B 2 B 3 B 4 B 5 минимум в строках αi  
A 1              
A 2              
A 3              
A 4             максимин
максимум в столбцах βj              
      минимакс        

 

Выбирая стратегию, противник предпочтет ту, для которой значение βj минимально. Обозначим его через β:

 

Величина β называется верхней ценой игры или минимаксом (минимум максимального выигрыша). Соответствующая минимаксу стратегия противника (игрока B), называется минимаксной стратегией.

 

 

Минимакс – это значение выигрыша, больше которого заведомо не отдаст нам разумный противник (иначе говоря, разумный противник проиграет не больше, чем β). В данном примере минимакс β равен 5 (соответствующая клетка в таблице выделена серым цветом) и достигается он при стратегии противника B 3.


 

Итак, исходя из принципа осторожности («всегда рассчитывай на худшее!»), мы должны выбрать стратегию A 4, а противник – стратегию B 3. Принцип осторожности является в теории игр основным и называется принципом минимакса.

 

Рассмотрим пример 2. Пусть игроки A и В одновременно и независимо друг от друга записывают одно из трех чисел: либо «1», либо «2», либо «3». Если сумма записанных чисел оказывается четной, то игрок B платит игроку A эту сумму. Если сумма нечетная, то эту сумму выплачивает игрок A игроку В.

 

Запишем платежную матрицу игры, и найдем нижнюю и верхнюю цены игры (номер стратегии соответствует записанному числу):

 

Bj Ai B 1 B 2 B 3 минимум в строках αi  
A 1   –3   –3 максимин
A 2 –3   –5 –5  
A 3   –5   –5  
максимум в столбцах βj          
  минимакс        

 

Игрок A должен придерживаться максиминной стратегии A 1, чтобы выиграть не меньше –3 (то есть чтобы проиграть не больше 3). Минимаксная стратегия игрока B – любая из стратегий B 1 и B 2, гарантирующая, что он отдаст не более 4.

 

Тот же самый результат мы получим, если будем записывать платежную матрицу с точки зрения игрока В. Фактически, эта матрица получается путем транспонирования матрицы, построенной с точки зрения игрока A, и изменения знаков элементов на противоположный (так как выигрыш игрока A – это проигрыш игрока В):

 

Aj Bi A 1 A 2 A 3 минимум в строках αi  
B 1 –2   –4 –4 максимин
B 2   –4   –4  
B 3 –4   –6 –6  
максимум в столбцах βj          
  минимакс        

 

Исходя из этой матрицы следует, что игрок B должен придерживаться любой из стратегий B 1 и B 2 (и тогда он проиграет не более 4), а игрок A – стратегии A 1 (и тогда он проиграет не более 3). Как видно, результат в точности совпадает с полученным выше, поэтому при анализе не важно, с точки зрения какого игрока мы его проводим.

 

8 ЧТО НАЗЫВАЕТСЯ ЦЕННОВОЙ ИГРОЙ.

 

 

9.В ЧЕМ СОСТОЙТ ПРИНЦЕП МИНИМАКСА. 2. Нижняя и верхняя цена игры. Принцип минимакса

Рассмотрим матричную игру типа с платежной матрицей

.

Если игрок А выберет стратегию Аi, то все его возможные выигрыши будут элементами i -й строки матрицы С. В наихудшем для игрока А случае, когда игрок В применяет стратегию, соответствующую минимальному элементу этой строки, выигрыш игрока А будет равен числу .

Следовательно, для получения наибольшего выигрыша, игроку А нужно выбирать ту из стратегий, для которой число максимально.


· Число

называется нижней ценой игры, а стратегия игрока А, соответствующая наибольшему из чисел , называется максимальной.

Таким образом, если игрок А будет придерживаться максиминной стратегии, то ему гарантирован выигрыш, не меньший, чем , при любом поведении игрока В.

Проанализируем теперь платежную матрицу с точки зрения игрока В, заинтересованного в том, чтобы игрок А выиграл, как можно меньше.

Если игрок В выберет стратегию Вj, то все возможные выигрыши игрока А будут элементами j -го столбца платежной матрицы С. В наихудшем для игрока В случае, когда игрок А применяет стратегию, соответствующую максимальному элементу этого столбца, выигрыш игрока В будет равен числу .

Следовательно, игроку В нужно выбрать такую стратегию, для которой число минимально.

· Число

называется верхней ценой игры, а стратегия игрока В, соответствующая наименьшему из чисел , называется минимаксной.

Таким образом, если игрок В применяет минимаксную стратегию, то игрок А не может выиграть больше, чем .

· Принцип осторожности, заставляющий игроков придерживаться максиминной и минимаксной стратегий соответственно, называют «Принципом минимакса», а минимаксную стратегию называют общим термином «Минимаксные стратегии».

Пример 2.1. Найти нижнюю и верхнюю цены игры с платежной матрицей

.

Решение. В каждой строке платежной матрицы найдем наименьший элемент, и запишем его справа от матрицы. В каждом столбце платежной матрицы найдем наибольший элемент, и запишем его снизу от матрицы. В результате получим таблицу

.

Нижняя цена игры

.

Верхняя цена игры

.







Date: 2016-05-25; view: 1518; Нарушение авторских прав



mydocx.ru - 2015-2024 year. (0.024 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию