Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
|
Динамическое программирование. Принцип оптимальности Беллмана. Уравнение Беллмана.Многие процессы проектирования систем управления, как и сам процесс проектирования, являются многоэтапными (многошаговыми). Весьма эффективным методом оптимизации сложных многошаговых процессов является динамическое программирование (планирование). Этот метод был предложен и развит американским математиком Р. Беллманом в 60-х годах нашего столетия. В основу метода положен интуитивно очевидный принцип, названный принципом оптимальности, который можно сформулировать следующим образом: оптимальное поведение в данный момент времени определяется только состоянием объекта (системы) в этот момент времени и конечным желательным состоянием и не зависит от поведения в прошлом. При использовании этого метода можно заменить исходную сложную задачу отыскания многошагового управления последовательным решением некоторого количества существенно более простых одношаговых задач оптимизации. Основной метол динамического программирования - метод рекуррентных соотношений, базирующийся на принципе оптимальности.
Рис.2.3.2. Геометрическая интерпретация динамического программирования.
Задача динамического программирования формулируется следующим образом: из множества допустимых управлений необходимо найти такое , которое переводит объект (систему) из начального состояния в конечное так, чтобы целевая функция (критерий качества) принимала максимальное значение Оптимизация управления многошагового процесса, таким образом, сводится к нахождению такой последовательности управлений которая обеспечивает достижение максимального значения целевой функции или, что то же, минимального значения затрат (потерь, штрафов), т. е. По определению.
В общем случае для (n–1)-шагового процесса, начинающегося с состояния , получим уравнение Беллмана представляющее собой рекуррентное соотношение, позволяющее последовательно определять оптимальное уравнение на каждом шаге управляемого процесса. Характерной особенностью метода динамического программирования является совмещение простоты решения задач оптимизации на отдельном шаге с учетом самых отдаленных последствий этого шага. Действительно, выбор управления на каждом шаге производится не только исходя из минимизации потерь (или максимизации выигрыша) на данном шаге, т. е. минимизации величины но и из минимизации суммарных потерь на всех последующих шагах. В уравнении Беллмана n–1 означает число шагов до конца процесса. Введем новые обозначения: n–1=K, Здесь х и U означают состояние объекта и управление за К шагов до конца процесса. С учетом новых обозначений уравнение Беллмана представим в виде здесь означает то состояние, к которому переходит объект из состояния при применении управления U. Для расчетов на ЭВМ последнее соотношение удобнее записать в виде Значения вычисляют заранее и представляют в виде таблицы, которая хранится в памяти ЭВМ. Метод динамического программирования применим не для всех задач. А лишь для задач с определенной структурой зависимости управления на различных шагах процесса и для целевых функций специального вида - аддитивных функционалов от траектории.
|