Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
|
Динамическое программирование. Принцип оптимальности Беллмана. Уравнение Беллмана.
Многие процессы проектирования систем управления, как и сам процесс проектирования, являются многоэтапными (многошаговыми). Весьма эффективным методом оптимизации сложных многошаговых процессов является динамическое программирование (планирование). Этот метод был предложен и развит американским математиком Р. Беллманом в 60-х годах нашего столетия. В основу метода положен интуитивно очевидный принцип, названный принципом оптимальности, который можно сформулировать следующим образом: оптимальное поведение в данный момент времени определяется только состоянием объекта (системы) в этот момент времени и конечным желательным состоянием и не зависит от поведения в прошлом. При использовании этого метода можно заменить исходную сложную задачу отыскания многошагового управления последовательным решением некоторого количества существенно более простых одношаговых задач оптимизации. Основной метол динамического программирования - метод рекуррентных соотношений, базирующийся на принципе оптимальности.
Рис.2.3.2. Геометрическая интерпретация динамического программирования.
Задача динамического программирования формулируется следующим образом: из множества допустимых управлений
Оптимизация управления многошагового процесса, таким образом, сводится к нахождению такой последовательности управлений
По определению.
представляющее собой рекуррентное соотношение, позволяющее последовательно определять оптимальное уравнение на каждом шаге управляемого процесса. Характерной особенностью метода динамического программирования является совмещение простоты решения задач оптимизации на отдельном шаге с учетом самых отдаленных последствий этого шага. Действительно, выбор управления на каждом шаге производится не только исходя из минимизации потерь (или максимизации выигрыша) на данном шаге, т. е. минимизации величины В уравнении Беллмана n–1 означает число шагов до конца процесса. Введем новые обозначения: n–1=K, С учетом новых обозначений уравнение Беллмана представим в виде
здесь Для расчетов на ЭВМ последнее соотношение удобнее записать в виде
Значения Метод динамического программирования применим не для всех задач. А лишь для задач с определенной структурой зависимости управления на различных шагах процесса и для целевых функций специального вида - аддитивных функционалов от траектории.
Date: 2016-07-18; view: 897; Нарушение авторских прав |