Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать неотразимый комплимент Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?

Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Понятие чистых и смешанных стратегий

Если в игре каждый из противников применяет одну и ту же стратегию, то про эту игру говорят, что она происходит в чистых стратегиях, а стратегии игроков А и В будут называться чистыми стратегиями.В антагонистической игре пара стратегий называется равновесной (устойчивой), если ни одному из игроков невыгодно отступать от своих стратегий.Применять чистые стратегии имеет смысл, если игроки знают о действиях противника. Если этого нет, то идея равновесия нарушается и игра может вестись как получится.Стратегии А1 В1 – устойчивы по отношению к информации о поведении противника.Признаком устойчивости пары стратегий это равенство верхней и нижней цены игры. И случай А1 В1 будет

ν = α = β. ν > 0, то игрок А будет в выигрыше, если ν < 0, то в выигрыше игрок В. Если ν = 0, в этом случае игра справедлива для обоих игроков. Не все матричные игры имеют седловые точки.

Теорема: каждая игра с полной информацией имеет седловую точку и следовательно решает в чистых стратегиях, т.е. имеется пара устойчивых стратегий, дающих устойчивый выигрыш равный ν.Если матрица не имеет седловую точку, то цена игры лежит α<ν<β. Это означает, что первый игрок, используя максиминный принцип, обеспечит себе выигрыш не менее, чем α. А второй игрок придерживаясь минимаксного подхода обеспечит себе проигрыш не больше верхней цены игры. Игра будет оптимальна, если оба игрока будут применять смешанные стратегии.Случайная величина, значениями которой являются чистые стратегии, называется смешанной стратегией для этого игрока.

Задать смешанную стратегию это значит задать те вероятности, с которыми используются чистые стратегии.

SA = || p1, p2 …. pm || ,SB = || q1, q2 …. qm || , A: ∑ pi = 1 ,B: ∑ qi = 1

Игра может повторяться несколько раз, но в каждой партии игрок придерживается смешанной стратегии, где чистые стратегии придерживаются вероятности pi и qj.

Модель смешанные стратегий отличается от модели чистых стратегий. В случае смешанных стратегий тактика поведения игроков будет более гибкой, т.к. игроки знают заранее какую чистую стратегию они применят.



Предположим что и игрок А и игрок В придерживаются смешанной стратегии. Необходимо определить А: ∑∑ aijpiqj

Для игрока В ожидаемый проигрыш равен ожидаемому выигрышу игрока А. Выигрыш первого игрока и средний проигрыш второго игрока равны друг другу.

18.Методы решения конечной игры двух лиц порядка m*n.

Предположим, что все элементы платёжной матрицы 0≤aij. Тогда α≤ν≤β. Согласно основной теореме матричных игр, любая матричная игра имеет 2 оптимальные смешанные стратегии.

SA = (p1, p2, … , pn)

SB = (p1, p2, … , pn)

Решаем игру для игрока А, при этом предполагая что игрок В использует только чистые стратегии. Тогда

a11p1 + a21p2 + … + am1pm ≥ ν : B1

a12p1 + a22p2 + … + am2pm ≥ ν : B2 (1)

a1np1 + a2np2 + … + amnpm ≥ ν : Bn

X1 = P1/ν , X2 = P2/ν … Xm = Pm

a11X1… + am1pm ≥ 1

a1nX1… + am1pm ≥ 1 (2)

p1+p2+…+pm=1

X1+X2+…+Xm = 1/ν (3)

max ν!

L(x) = X1+X2+…+Xm -> min (4)

Определим задачу линейного программирования.

X10…Xm0

ν = 1/( X10+X20…Xm0) (5)

p1 = X10опт

p2 = X20опт (6)

….

min L(x) = ∑xi

∑aij : 1≤xi (7) (прямая задача)

0≤xi (i=1,2..)

В:

a11q1 + a21q2 + … + am1qm < ν : A1

a21q1 + a22q2 + … + am2qm < ν : A2 (8)

am1q1 + am2q2 + … + amnqm < ν : Am

Y1 = q1/ν , Y2 = q2/ν … Ym = qm

q1+q2+…+qn=1

y1+y2+…+yn=1/ν

L(y)=∑yj -> max

∑aij , yi≤1 (i=1,2…) (9) (двойственная задача)

0≤yi

y10+y20…ym0 = 1/νопт

νопт = 1/∑ym0

q1 = y10опт

q2 = y20опт

….

ν=1/∑xi = 1/∑yi = 1/min L(x) = 1/ max L(y) (11)

  B1 B2 B3 αi
A1
A2
A3
βj  

 

1) α = 1, β = 3

2) Нет упрощений.

3) Прямая задача

L(x)=x1+x2+x3 => min

x1+3x2+x3 >= 1

2x1+x2+x3>=1

3x1+x2+x3>=1

xi>=0

x1=2/9, x2=2/9, x3=1/9

max L(x)=5/9

ν=1/(2/9+2/9+1/9)=9/5

p1=x1*ν=2/5

p2=2/5

p3=1/5

SA=(2/5, 2/5, 1/5)

двойственная задача

L(y) = y1+y2+y3 => max

y1+2y2+3y3≤ 1 y1=2/9

3y1+y2+y3≤1 => y2=2/9 max L(y) = 5/9

y1+3y2+y3≤1 y3=1/9

yj>=0

y1=a1

ν=1/(2/9+2/9+1/9)=9/5

q1=y2*ν=(2/9)*(9/5)=2/5

q2=(2/9)*(9/5)=2/5

q3=(1/9)*(9/5)=1/5

νопт=9/5

SB=(2/5, 2/5, 1/5)

 

Задача mxn сводится к задаче линейного программирования.

Приближённый метод решения матричных игр mxn (Браун-Робинсон).

Игрок А и игрок В поочерёдно применяют чистые стратегии. Каждый игрок пытается увеличить свой выигрыш, используя максиминые или минимаксные подходы. Минимизируется (максимизируется) не средний выигрыш, а накопленный. В теории показывается, что такой метод неизбежно даст нам оптимальный выигрыш и оптимальные смешанные стратегии.



  В1 В2 В3
А1
А2
А3
       

 

3* 8* 9*     36*
3* 4* 12* 13*    
7*    
                   

 

1*
3*
4*
6*
9*
10*
12*
     
     
     
34*

 

Сделано 20 шагов.

Подсчитав количество звёздочек суммарных выигрышей р1 => 7, p2 =>8, p3 => 5. SA: p1=7/20, p2=8/20/, p3=5/20

SB: q1=8/20, q2=8/20, q3=4/20

β=37

α=36

ν=(α+β)/∑ = (α/20 + β/20)/∑ = (36/20 + 37/20)/2 =1,82

ν=1,8


<== предыдущая | следующая ==>
Рекомендация | 





Date: 2015-11-15; view: 1509; Нарушение авторских прав

mydocx.ru - 2015-2019 year. (0.01 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию