Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
|
Приведение матричной игры к задаче линейного программирования
Игра в общем случае не имеет наглядной геометрической интерпретации. Ее решение достаточно трудоемко при больших т и п, однако принципиальных трудностей не имеет, поскольку может быть сведено к решению задачи линейного программирования. Покажем это. Пусть игра задана платежной матрицей . Игрок А обладает стратегиями , игрок В – стратегиями . Необходимо определить оптимальные стратегии и , где – вероятности применения соответствующих чистых стратегий , , . Оптимальная стратегия удовлетворяет следующему требованию. Она обеспечивает игроку А средний выигрыш, не меньший, чем цена игры v, при любой стратегии игрока В и выигрыш, равный цене игры v, при оптимальной стратегии игрока В. Без ограничения общности полагаем v > 0; этого можно добиться, сделав все элементы . Если игрок А применяет смешанную стратегию против любой чистой стратегии игрока В, то он получает средний выигрыш, или математическое ожидание выигрыша (т.е. элементы j-гo столбца платежной матрицы почленно умножаются на соответствующие вероятности стратегий и результаты складываются). Для оптимальной стратегии все средние выигрыши не меньше цены игры v, поэтому получаем систему неравенств: Каждое из неравенств можно разделить на число . Введем новые переменные: . Тогда система принимает вид (1*) Цель игрока А – максимизировать свой гарантированный выигрыш, т.е. цену игры v. Разделив на равенство, получаем, что переменные удовлетворяют условию: . Максимизация цены игры v эквивалентна минимизации величины , поэтому задача может быть сформулирована следующим образом: определить значения переменных , maк, чтобы они удовлетворяли линейным ограничениям (*) и при этом линейная функция (2*) обращалась в минимум. Это задача линейного программирования. Решая задачу (1*)–(2*), получаем оптимальное решение и оптимальную стратегию. Для определения оптимальной стратегии следует учесть, что игрок В стремится минимизировать гарантированный выигрыш, т.е. найтиmax. Переменные удовлетворяют неравенствам (3*) которые следуют из того, что средний проигрыш игрока В не превосходит цены игры, какую бы чистую стратегию не применял игрок А. Если обозначить (4*), то получим систему неравенств: (5*) Переменные удовлетворяют условию . Игра свелась к следующей задаче. Date: 2016-05-25; view: 482; Нарушение авторских прав |