![]() Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
![]() Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
![]() |
Общая схема применения метода динамического программирования⇐ ПредыдущаяСтр 11 из 11
Предположим, что все требования, предъявляемые к задаче динамического программирования, выполнены. Построение модели динамического программирования и метода решения а рамках этой модели сводится к следующим моментам: 1. Выбирают способ деления процесса на шаги 2. Определяют параметры состояния Sk и управления xk на каждом шаге. 3. Записывают уравнения состояний 4. Вводят целевые функции k-ого числа и суммарную целевую функцию 5. Вводят в рассмотрение условные максимумы или минимумы
6. Записывают рекуррентные соотношения (уравнения) Беллмана для 7. Решают последовательно уравнения Беллмана (условная оптимизация) и получают две последовательности функций: { 8. определяется оптимальное управление
Рассмотрим как работает эта схема на примере задачи об оптимальном распределении ресурсов между двумя отраслями на n лет. Планируется деятельность двух отраслей производства на n лет. Начальные ресурсы S0. Средства х, вложенные в первую отрасль в начале года, дают прибыль f1(x) < x, аналогично для второй отрасли: функция прибыли равна f2(x), а возврата – g2(х) (g2(х) < x). В конце года все возвращенные средства заново перераспределяются между первой и второй отраслью, новые средства не поступают, прибыль в производство не вкладывается. (Последние условия определяют вид уравнений состояний, если поступают новые средства или часть прибыли вкладывается в производство, это можно легко учесть, т.к. алгоритм метода динамического программирования это допускают). Требуется распределить имеющиеся средства между двумя отраслями производства на n лет так, чтобы суммарная прибыль за n лет от обеих отраслей была максимальна. Необходимо: а) построить модель динамического программирования для данной задачи и вычислительную схему; б) решить задачу при условии, что S0= 10000 ед., n = 4, f1(x) = 0,6х, f2(x) = 0,5х, g1(х) = 0,7х, g2(х) = 0,8х. Решение. Процесс распределения средств между двумя отраслями производства разворачивается во времени, решения принимаются в начале каждого года, следовательно, образуется делением на шаги: номер шага - номер года. Управляемая система – две отрасли производства, а управление состоит в выделении средств каждой отрасли в очередном году. Параметры состояния к началу k-ого года – Sk-1(k=1, …, n) – количество средств, подлежащих распределению. Переменных управления на каждом шаге две: хk – количество средств, выделенных первой отрасли и уk – второй отрасли. Т.к. все средства Sk, распределяются, то Sk-1= хk + уk или уk = Sk-1- хk и поэтому управление на k-ом шаге зависит лишь от одной переменной хk. Уравнения состояний выражают остаток средств, возвращенных в конце k-ого года. Sk= g1(хk) + g2(Sk-1- хk) Показатель эффективности k-ого года – прибыль, полученная от обеих отраслей: f1(хk) + f2(Sk-1- хk) Суммарный показатель эффективности – целевая функция задачи – прибыль за n лет:
Пусть Рекуррентные соотношения Беллмана (уравнения) имеют вид:
Для нашего конкретного случая уравнения состояний: Sk= 0,7 хk + 0,8(Sk-1- хk) Целевая функция k-ого шага 0,6 хk +0,5 (Sk-1- хk) = 0,5 Sk-1 + 0,1хk Целевая функция задачи: Функциональные уравнения (соотношения Беллмана)
Проводим условную оптимизацию. IV Шаг. Используем уравнение (*). Обозначим через Z4 функцию, стоящую в скобках, Z4 = 0,1 х4 + 0,5 S3; функция Z4 – линейная Z4 = 0,1 х4 + а; а = 0,5 S3, возрастающая, т.к. угловой коэффициент 0,1>0. Поэтому максимум достигается н конце интервала. Мы помним, что 0≤ х4 ≤ S3, т.е. интервал [0, S3], следовательно III Шаг.
Найдем S3 из уравнений состояний S3 = 0,8 S2 – 0,1х3 и подставим это S3 в правую часть.
Те же самые расстояния – функция линейная, возрастающая, поэтому максимум достигается в конце отрезка или интеграла [0, S2], т.е. х3 (S2) = S2, т.е. II Шаг.
Найдем S2 из уравнения состояния S2 = 0,8S1 – 0,1х2 и подставим
Получена линейная убывающая функция. Она убывает в интервале [0, S1]. Максимальное значение достигается в точке х2 = 0 Таким образом, I Шаг.
Из уравнения состояния S1 = 0,8 S0 – 0,1 х1, подставим это значение в
Как и в предыдущем случае максимум достигается в начале отрезка
На этом условная оптимизация заканчивается. Используя результаты и исходные данные получим Zmax =
Вывод: оптимальная прибыль за четыре года, полученная от двух отраслей производства при наличии начальных средств 10000 ед., равна 15528 ед. при условии, что первая отрасль получает по годам (0, 0, 6400, 4480), а вторая (10000, 8000, 0, 0).
Date: 2016-02-19; view: 426; Нарушение авторских прав |