Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
|
В 24. Общая постановка задачи динамического программирования
Рассматривается управляемый процесс, например, распределение средств между предприятиями, использование ресурсов в течение ряда лет, замены оборудования и т.п. В результате управления система (объект управления) S переводится из состояния S0 в состояние Sn. Предположим, что управление можно разбить на n шагов, т.е. решение принимается последовательно на каждом шаге, а управление, переводящее систему S из начального состояния в конечное представляет собой n пошаговых управлений. Обозначим через Хk управление на k-том шаге (k = 1, 2, …., n). Переменные Хk удовлетворяют некоторым ограничениям и в этом смысле называются допустимыми (Хk может быть числом, точкой в n-мерном пространстве, качественным признаком). Пусть Х (х1, х2, …, хn) – управление, которое переводит систему из состояния S0 в Sn. Обозначим через Sk состояние системы после k-того шага управления. Получаем последовательность состояний. Показатель эффективности расследуемого управления – целевая функция – зависит от начального состояния и управления. Z = F(S0, X) Сделаем несколько предположений. 1. Состояние Sk системы в конце k-ого числа зависит только от предшествующего состояния Sk-1 и управления на k-ом шаге Хk (и не зависит от предшествующих состояний и управлений). Это положение записывается в виде S = φk (Sk-1, Xk), k= 1, 2, …, n и полученные уравнения называется уравнениями состояний. 2. Целевая функция Z является аддитивной от показателя эффективности каждого шага. Обозначим показатель эффективности k-ого шага через Zk = fk (Sk-1, Xk), k= 1, 2, …, n тогда fk (Sk-1, Xk). Задача динамического планирования (пошаговой оптимизации) формулируется в виде: требуется определить такое допустимое управление Х, которое переводит систему S из состояния S0 в состояние Sn таким образом, что целевая функция Z принимает наибольшее (наименьшее) значение. Выделим особенности задачи динамического программирования: 1. Задача оптимизации интерпретируется как n-шаговый процесс управления 2. Целевая функция равна сумме целевых функций каждого шага 3. Выбор управления на k-том шаге зависит только от состояния системы к этому шагу и не влияет на предшествующие шаги (нет обратной связи). 4. Составляющие Sk после k-ого шага управления зависит только от предшествующего состояния Sk-1 иуправления Хk (отсутствие последствий). 5. На каждом шаге управление Хk зависит от конечного числв управляющих переменных, а состояние Sk – от конечного числа параметров. Сформулированные предположения (допущения) и особенности задачи динамического программирования есть список требований, которым должна удовлетворять некая задача, для того, чтобы она могла быть решена методом динамического программирования. Следует помнить, что бывают различные способы решения подобных задач, применяемые в зависимости от вида функций, ограничений, размерности и т.п. Рассмотрим вычислительную схему динамического программирования, которая окажется безразличной к способам задания функций и ограничений. Вычислительная схема связана с принципом оптимальности и использует рекуррентные состояния Беллмана. Рассмотрим вычислительную схему задачи динамического программирования. Для этого необходимо сформулировать принцип оптимальности и построить рекуррентные соотношения (уравнения) Беллмана.
Date: 2016-02-19; view: 473; Нарушение авторских прав |