Динамическое программирование. Принцип оптимальности Беллмана. Уравнение Беллмана.

⇐ ПредыдущаяСтр 17 из 48Следующая ⇒

Многие процессы проектирования систем управления, как и сам процесс проектирования, являются многоэтапными (многошаговыми). Весьма эффективным методом оптимизации сложных многошаговых процессов является динамическое программирование (планирование). Этот метод был предложен и развит американским математиком Р. Беллманом в 60-х годах нашего столетия. В основу метода положен интуитивно очевидный принцип, названный принципом оптимальности, который можно сформулировать следующим образом: оптимальное поведение в данный момент времени определяется только состоянием объекта (системы) в этот момент времени и конечным желательным состоянием и не зависит от поведения в прошлом.

При использовании этого метода можно заменить исходную сложную задачу отыскания многошагового управления последовательным решением некоторого количества существенно более простых одношаговых задач оптимизации. Основной метол динамического программирования - метод рекуррентных соотношений, базирующийся на принципе оптимальности.

Рис.2.3.2. Геометрическая интерпретация динамического программирования.

Задача динамического программирования формулируется следующим образом: из множества допустимых управлений необходимо найти такое , которое переводит объект (систему) из начального состояния в конечное так, чтобы целевая функция (критерий качества) принимала максимальное значение

Оптимизация управления многошагового процесса, таким образом, сводится к нахождению такой последовательности управлений которая обеспечивает достижение максимального значения целевой функции или, что то же, минимального значения затрат (потерь, штрафов), т. е.

По определению.

В общем случае для (n–1)-шагового процесса, начинающегося с состояния , получим уравнение Беллмана

представляющее собой рекуррентное соотношение, позволяющее последовательно определять оптимальное уравнение на каждом шаге управляемого процесса.

Характерной особенностью метода динамического программирования является совмещение простоты решения задач оптимизации на отдельном шаге с учетом самых отдаленных последствий этого шага. Действительно, выбор управления на каждом шаге производится не только исходя из минимизации потерь (или максимизации выигрыша) на данном шаге, т. е. минимизации величины но и из минимизации суммарных потерь на всех последующих шагах.

В уравнении Беллмана n–1 означает число шагов до конца процесса. Введем новые обозначения: n–1=K, Здесь х и U означают состояние объекта и управление за К шагов до конца процесса.

С учетом новых обозначений уравнение Беллмана представим в виде

здесь означает то состояние, к которому переходит объект из состояния при применении управления U.

Для расчетов на ЭВМ последнее соотношение удобнее записать в виде

Значения вычисляют заранее и представляют в виде таблицы, которая хранится в памяти ЭВМ.

Метод динамического программирования применим не для всех задач. А лишь для задач с определенной структурой зависимости управления на различных шагах процесса и для целевых функций специального вида - аддитивных функционалов от траектории.

⇐ Предыдущая 12 13 14 15 161718 19 20 21 Следующая ⇒

Date: 2016-07-18; view: 913; Нарушение авторских прав

mydocx.ru - 2015-2026 year. (0.598 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию