Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
|
Управляемые цепи Маркова. Выбор стратегии ⇐ ПредыдущаяСтр 3 из 3 Завод по изготовлению телевизоров, находясь в состоянии 1, может увеличить спрос путем организации рекламы. Это требует добавочных затрат и уменьшает доход. В состоянии 2 завод может увеличить вероятность перехода в состояние 1 путем увеличения затрат на исследования. Выделим две стратегии. Первая состоит в отказе от затрат на рекламу и исследования, а вторая - в согласии на них. Пусть матрицы переходных вероятностей и матрицы доходов для данных стратегий имеют вид:
В рассмотренной ситуации имеет место управляемая цепь Маркова. Управление соответствует выбору стратегии. Пусть каждому состоянию соответствует конечное множество решений (или альтернатив), элементы которого обозначим номерами . Пространством стратегий К называется прямое произведение множеств решений . Пусть в i-м состоянии имеется не одно, а множеств переходных вероятностей . При имеем случай неуправляемой цепи Маркова. Если система находится в состоянии и принимается решение то - она получает доход ; - ее состояние в следующий момент времени определяется вероятностью , где - вероятность того, что система из состояния при выборе решения перейдет в состояние . Таким образом, смысл -го решения в i-м состоянии заключается в выборе одного набора переходных вероятностей из возможных. Предполагается, что доход ограничен при всех и . Кроме того,
, при всех и .
Управляемой цепью Маркова называется конструкция, задаваемая параметрами , где К- решения, Р -вероятности переходов, r -доходы. Доход, полученный за несколько шагов, является случайной величиной, зависящей от начального состояния и принимаемых в каждый момент времени решений. Назовем решение, принимаемое в конкретный момент, частным управлением. Тогда управление есть последовательность решений в моменты n = 1, 2,... Качество управления можно оценить средним суммарным доходом (при конечном времени) или среднем доходом в единицу времени (при бесконечном времени). Пусть (2) Стратегией называется последовательность решений
где - вектор вида (2), i-я компонента которого, обозначаемая через , является решением, принимаемым в состоянии в момент п. Другими словами, задание стратегии означает полное описание в каждый момент времени t =1, 2,..., п,... конкретных решений, которые должны были бы приниматься в i-м состоянии, если бы система находилась в нем в рассматриваемый момент. Стратегия обозначается через и называется стационарной. Стратегия называется марковской, если решение , принимаемое в каждом конкретном состоянии, не зависит от предшествующих состояний и принимавшихся в них решений. В случае марковской стратегии решения могут зависеть только от момента времени п. Обозначим произвольную конечную часть стратегии через . Пусть зафиксированы произвольная стратегия некоторый момент времени п. Если в этот момент система находилась в состоянии , то в следующий (п+1)- й момент времени она будет находиться в состоянии с вероятностью , где . Тогда матрица переходных вероятностей в момент п имеет вид
Таким образом, при фиксированной стратегии получаем цепь Маркова с матрицами перехода Обозначим - вектор суммарных средних доходов, полученных до любого момента n включительно, для некоторой стратегии . Стратегия максимизирующая , то есть удовлетворяющая неравенству ≥ при любых называется оптимальной Верны следующее утверждения: Утверждение 1. Для бесконечного времени существует оптимальная стационарная стратегия. Утверждение 2. Для конечного времени существует оптимальная марковская стратегия. Таким образом, решение (при бесконечном времени) зависит только от состояния, в котором находится система, и не зависит ни от момента времени, ни от всей предыдущей траектории последовательности состояний и принятых решений). В случае конечного времени оптимальная стратегия является марковской, т. е. может зависеть еще и от момента времени принятия решения.
Контрольные вопросы: 1. Сформулируйте теорему о предельных вероятностях. 2. В каких областях могут применяться цепи Маркова? 3. Приведите пример использования управляемых цепей Маркова. Литература: 1. Высшая математика для экономистов: Учебник для вузов / Н.Ш. Кремер, Б.А. Путко, И.М. Тришин, М.Н.Фридман. Под ред. Н.Ш. Кремера. – М.: ЮНИТИ, 2005. – 471 с. 2. Общий курс высшей математики для экономистов: Учебник. / Под ред. В.И. Ермакова. –М.: ИНФРА-М, 2006. – 655 с. 3. Сборник задач по высшей математике для экономистов: Учебное пособие / Под ред.В.И. Ермакова. М.: ИНФРА-М, 2006. – 574 с. 4. Данко П.Е., Попов А.Г., Кожевникова Т.Я. Высшая математика в упражнениях и задачах. Ч. 1, 2. – М.: Оникс 21 век: Мир и образование, 2005. – 304 с. Ч. 1; – 416 с. Ч. 2. 5. Математика в экономике: Учебник: В 2-х ч. / А.С. Солодовников, В.А. Бабайцев, А.В. Браилов, И.Г. Шандара. – М.: Финансы и статистика, 2006. 6. Шипачев В.С. Высшая математика: Учебник для студ. вузов – М.: Высшая школа, 2007. – 479 с.
|