![]() Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
![]() Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
![]() |
Решение игры в смешанных стратегиях
Теорема 3. Для того чтобы смешанные стратегии
Нахождение оптимальной стратегии можно свести к решению задачи линейного программирования. Пусть требуется найти оптимальные стратегии для игры с заданной платежной матрицей (1), для которой aij строго больше нуля (аij >0, i= Разделим левую и правую части в выражении (3) на положительную величину u:
Введем обозначение
Поскольку игрок А стремится сделать свой гарантированный выигрыш (u) как можно большим (u ® max), то величина f(x) =
Хi ³ 0; i =
Если Х* = ( Для игрока В используя выражение (4), получим
g(y) =
yj ³ 0; j =
Решение игры u =
Пример. Найти оптимальные смешанные стратегии игры, заданной следующей платежной матрицей:
Сведем данную задачу к задаче линейного программирования.
Найдем оптимальную стратегию игрока А – (
f(x) = X1 + X2 ® min.
10X1 + 4X2 ³ 1, 3X1 + 5X2 ³ 1,
X1, X2 ³ 0.
f(x) = 0,21; X1 = 0,026; X2 = 0,184,
отсюда
u = Найдем оптимальную стратегию игрока В – (
g(y) = y1 + y2 + y3 ® max.
8y1 + 4y2 + 5y3 £ 1,
y1, y2 , y3 ³ 0.
g(y) = 0,21; y1 = 0; y2 = 0,0526; y3 = 0,158,
отсюда
q1 = 0; q2 = 4,76 × 0,0526 = 0,25; q3 = 4,76 × 0,158 = 0,75.
Таким образом, применяя свою первую чистую стратегию с вероятностью 0,124 и вторую – с вероятностью 0,876, игрок А выигрывает величину 4,76. Игрок В, применяя свою вторую чистую стратегию с вероятностью 0,25 и третью – с вероятностью 0,75, проигрывает величину 4,76, иначе он проигрывает больше.
Игра два на два (2 х 2) Рассмотрим игру, в которой у игроков А и В по две стратегии. Платежная матрица имеет вид
Рассмотрим случай, когда игра не имеет седловой точки. Теорема 4. Пусть
имеет место равенство pi = 0. А если pi > 0, то
Аналогично, если для некоторых j
то для этих j qj = 0. А если qj > 0, то
Определим оптимальную смешанную стратегию
а12 × p1 + а22 × p2 = u, p1 + p2 = 1.
Решив следующую систему, найдем оптимальную стратегию
а21 × q1 + а22 × q2 = u, q1 + q2 = 1.
Рассмотрим первую систему. Вычитая из первого равенства второе, получая (а11 - а12) × p1 + (а21 - а22) × p2 = 0.
Подставим P2 = 1 - P1, тогда
(а11 - а12) × p1 + (а21 - а22) (1- p1 ) = 0,
отсюда оптимальная смешанная стратегия для игрока А – А*(p1, p2)
P1 = (а22 - а21)/(а11 - а12 + а22 - а21),
P2 = 1- P1 = (а11 - а12)/(а11 - а12 + а22 - а21). цена игры u = (а11 × а22 - а21 × а12)/ (а11 - а12 + а22 - а21).
Рассуждая аналогично, для определения оптимальной стратегии игрока В получая q1 = (а22 - а12)/(а11 - а12 + а22 - а21),
q2 = (а11 - а21)/(а11 - а12 + а22 - а21).
Пример. Имеются две конкурирующие фирмы А и В, выпускающие изделия двух модификаций. Изучение спроса покупателей показало, что если выпускаются изделия первой модификации обеими фирмами, А1 и В1, то 40 % покупателей предпочитают изделия фирмы А и 60 % - фирмы В. Если выпускаются изделия А1 и В2, то 90 % покупателей приобретают изделия А. Если изготавливаются изделия А2 и В1, будет продано 70 % изделий фирмы А. Наконец, если выпускаются изделия второй модификации А2 и В2 обеими фирмами, то 20 % покупателей предпочитают изделия фирмы А. Решение. Представим выигрыш фирмы А в табличной форме
а11 = 40 % - 60 % = -20 %; а12 = 90 % - 10 % = 80 %;
а21 = 70 % - 30 % = 40 %; а22 = 20 % - 80 % = -60 %.
Нижняя цена игры составляет (-20), верхняя равна 40. Игра не имеет седловой точки. Найдем оптимальные смешанные стратегии
p1 = (-60 - 40)/(-20 –80-60-40) =
u = [-20 × (-60)- 40 × 80]/ (-20 –80-60-40) = 10;
q1 = (-60 - 80)/(-20 –80-60-40) =
Выигрыш фирмы А в соответствии с ценой игры составит 10 %. Следовательно, А – В = 10 %, но А + В = 100 %, тогда А = 55 %; В = 45 %. Следовательно, при таких оптимальных стратегиях изделия фирмы А будут покупать 55 % потребителей, а фирма В – 45 % покупателей.
Date: 2015-07-24; view: 404; Нарушение авторских прав |