Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
|
Обработка результатов эксперимента на основе регрессии
Часто целью исследования является определение функциональной связи между факторами и откликом (реакцией модели) по данным, полученным при экспериментах с моделью объекта или непосредственно с объектом. Такая цель достигается регрессионным анализом значений факторов и отклика . Под регрессией в теории вероятностей и математической статистике понимают зависимость среднего значения какой-либо величины от некоторой другой (других) величины. Регрессионный анализ - это совокупность методов построения и исследования регрессионной зависимости между величинами (в нашем случае между факторами и откликом) по статистическим данным. Статистические данные накапливаются при проведении эксперимента. Формальная схема эксперимента выглядит так (рис. 5.6).
Прямоугольник представляет исследуемый объект или его математическую модель. Обозначения на рис. 5.6: - значения факторов, ; - случайный фактор, помеха. Будем считать, что эта случайная величина имеет нормальное распределение с матожиданием . Влияние помехи на отклик аддитивное, то есть ее случайные значения прибавляются к значениям отклика; - искомая функциональная зависимость между факторами и откликом. Отклик - величина случайная. представляет собой среднее значение отклика (так как ): . Исследуемый объект представляется как "черный ящик", никаких предположений о виде функции нет. Поэтому представим ее в виде аппроксимирующего полинома: Этот полином получил название уравнения регрессии, а коэффициенты - коэффициенты регрессии. От точности подбора коэффициентов регрессии зависит точность представления . Коэффициенты определяются путем обработки полученных в ходе эксперимента варьируемых значений факторов и откликов. Однако из-за ограниченного числа наблюдений точные значения получить нельзя, будут найдены их оценки : Поэтому уравнение регрессии принимает вид: Вообще-то метку над теперь надо бы изменить, так как вместо в уравнении теперь стоят , но мы этого делать не будем, чтобы не загромождать изложение новыми значками. В уравнении регрессии могут участвовать и так называемые "совместные эффекты" ( и т. п.) или степени значений факторов ( и т. п.). Совместные эффекты и степени факторов можно обозначать обобщенным фактором. Например, уравнение регрессии можно представить так: Итак, для определения выражения надо:
Выбор уравнения регрессии обычно начинают с линейной модели. Например, для двухфакторного эксперимента ее вид: Если окажется, что такая аппроксимация дает неприемлемые отклонения при сравнении с экспериментальными точками отклика y, то модель усложняется, например, так: или и т.д. Коэффициенты регрессии для выбранного уравнения определяются из условия минимума суммы квадратов ошибок, вычисленных по все экспериментальным точкам. Это делается так. Введем обозначения: - значение -го фактора в наблюдении номер ; - значение отклика в -м наблюдении; - значение отклика, вычисленное по принятому уравнению регрессии и данным . Очевидно, сумма квадратов ошибок между экспериментальными значениями и вычисленными по уравнению регрессии для всех наблюдений равна: Для определения минимума ошибки? возьмем частные производные от по всем неизвестным коэффициентам регрессии , и приравняем их нулю: Нетрудно убедиться, что это условие минимума, а не максимума. Очевидно: Для лучшей наглядности выделим неизвестные коэффициенты регрессии и получим: Выражение (5.3) представляет собой систему из уравнений для нахождения неизвестных коэффициентов регрессии , которые окончательно определят выбранное уравнение регрессии. Нахождение коэффициентов регрессии справедливо при следующих допущениях:
Пример 5.8. На модели объекта проведен однофакторный эксперимент из пяти наблюдений, результаты которого сведены в таблицу (табл. 5.10). Найти функциональную связь фактора с откликом .
Решение Примем, что кроме управляемого фактора при проведении эксперимента на объект воздействует случайный фактор, распределенный по нормальному закону с математическим ожиданием . Также предположим, что эта связь - линейная, следовательно, уравнение регрессии нужно определять в виде: Неизвестных коэффициентов два: и . Запишем (5.3) в виде двух уравнений для и в каждом из них разложим суммы по индексу : Так как , получим: Подставим данные эксперимента из табл. 5.10 в систему (5.4): Решим систему из двух уравнений и получим: , . Следовательно, искомое уравнение регрессии: Доверительные границы для истинных значений и примера 5.8 определяются как обычно: где - аргумент распределения Стьюдента; - среднеквадратические отклонения величин и соответственно. Значения определяются из таблицы распределения Стьюдента для степеней свободы и задаваемом уровне достоверности . Пусть , тогда . Значения находятся по формулам: Данные для вычисления , представлены в табл. 5.11.
С уровнем достоверности Большой размах доверительных границ объясняется малым числом наблюдений в данном эксперименте. Доверительные границы для y принимают разные значения в зависимости от значений факторов [33]. На практике часто ограничиваются обобщенными оценками адекватности построенной модели: величиной среднего абсолютного отклонения или (и) величиной среднеквадратической ошибки на единицу веса Весом или степенью свободы эксперимента называют разность между числом наблюдений и числом коэффициентов регрессии . Предположим, что линейная модель недостаточно точно отображает связь между фактором и откликом . Введем в рассмотрение более сложную нелинейную модель: Для определения коэффициентов регрессии обозначим и получим двухфакторную линейную модель: В этом случае уравнение (5.3) раскрывается так: В уравнениях принято: Так как , , то система принимает вид: Подставим значения фактора и отклика из табл. 5.10: Решим систему из трех уравнений с тремя неизвестными и получим: . Таким образом, получено новое уравнение регрессии: По значениям и нетрудно убедиться в том, что нелинейная модель более точно отображает моделируемый процесс (см. табл. 5.10), чем линейная. В рассмотренном примере ошибка модели определялась по тем же данным, по которым и была определена сама модель. Однако при сокращенных планах экспериментов (см. п. 4.3) можно выполнить все или часть "сэкономленных" наблюдений для получения так называемых проверочных данных, которые и использовать для вычисления ошибки или . В этом случае оценка адекватности модели будет более объективна, хотя число наблюдений в эксперименте увеличивается, и экономии их не будет. По уравнению регрессии можно сделать ориентировочную оценку чувствительности отклика к изменению того или иного фактора. Например, в уравнении влияние фактора на отклик незначительно по сравнению с другими, так как коэффициент намного меньше остальных коэффициентов. В программном пакете MS Excel есть функция "Регрессия", которая может выполнить всесторонний регрессионный анализ данных компьютерного эксперимента. Пример 5.9. В ремонтное подразделение поступают вышедшие из строя средства связи (СС) с интервалами времени, подчиненными показательному закону с математическим ожиданием . В каждом СС могут быть неисправными в любом сочетании блоки A, B, C с вероятностями , , соответственно. Ремонтное подразделение ремонтирует СС путем замены неисправных блоков исправными блоками. В момент поступления неисправного СС в ремонтное подразделение вероятности наличия в нем исправных блоков соответственно . Наличие и замена блока обязательно при любом сочетании неисправных блоков. Построить имитационную модель "Система ремонта" с целью определения вероятности ремонта СС с неисправными блоками , и , , за время . По результатам эксперимента получить уравнение регрессии, связывающее вероятность ремонта СС с вероятностями . Решение Постановка примера 5.9 аналогична постановке примера 3.8. Отличие состоит в том, что введен фактор времени - интервалы поступления неисправных СС. Это учтено в модели, при разработке которой использовался алгоритм примера 3.8 (см. рис. 3.18). Для построения уравнения регрессии введем обозначения: - отклик модели, вероятность ремонта СС с неисправными блоками и за время ; - фактор, представляющий вероятность ; - фактор, представляющий вероятность ; - фактор, представляющий вероятность ; - фактор, представляющий вероятность ; - фактор, представляющий вероятность . Исходные данные и результаты эксперимента с моделью в количестве 32 наблюдений приведены в табл. 5.12. По этим данным функция "Регрессия" из MS Excel сформировала искомое уравнение:
Кроме вычисленных оценок коэффициентов регрессии функция "Регрессия" выдает также результаты регрессионного анализа (табл. 5.13): вычисленные значения откликов , разность между ними и измеренными в эксперименте в каждом наблюдении , среднеквадратические ошибки в определении коэффициентов регрессии и откликов при определенных значениях факторов и некоторые другие.
Пример 5.10. На узел связи поступают заявки на передачу сообщений. Интервалы времени поступления заявок подчинены показательному закону с математическим ожиданием . На узле связи имеются два канала передачи данных. При поступлении очередной заявки в интервале времени вероятности того, что каналы и будут свободны, соответственно равны и . При поступлении заявок после времени вероятности того, что каналы и будут свободны, соответственно равны и . Сообщение передаётся по любому свободному каналу. Если оба канала заняты, заявка теряется. Построить имитационную модель "Обработка запросов на узле связи" с целью определения абсолютного и относительного числа потерянных заявок из их общего количества, поступивших на узел связи за время , . Получить уравнение регрессии, связывающее относительную долю обслуженных заявок с интервалами их поступления и вероятностями . Решение Имитационная модель построена в соответствии с алгоритмом (см. рис. 3.21). Для построения уравнения регрессии введем обозначения: - отклик модели, вероятность ремонта СС с неисправными блоками , и , , за время ; - фактор, представляющий вероятность ; - фактор, представляющий вероятность ; - фактор, представляющий вероятность ; - фактор, представляющий вероятность ; - фактор, представляющий интервалы поступления заявок . Исходные данные и результаты эксперимента приведены в табл. 5.14. Для регрессионного анализа также использовалась функция "Регрессия" MS Excel. Получено искомое уравнение:
Результаты регрессионного анализа, аналогичные рассмотренным в примере 5.9 (табл. 5.13), приведены в табл. 5.15.
Вопросы для самоконтроля
|
6. Лекция: Моделирование в GPSS World: версия для печати и PDA Лекция посвящена четырем видам объектов: модель, процесс моделирования, отчет и текстовый. | |||||||||||||||||||||
6.1. Основы построения и принципы функционирования языка имитационного моделирования
Модель разрабатывается на языке GPSS и состоит из операторов, а объект " Модель " создается при помощи встроенного текстового редактора. Объект " Процесс моделирования " - это результат трансляции модели. Далее процесс моделирования запускается с помощью команд GPSS. По завершении моделирования, как правило, автоматически создается объект " Отчет ".
Текстовый объект (текстовый файл GPSS World) предназначен для упрощения разработки больших моделей и создания библиотеки исходных текстов. То есть модель может быть разделена на наборы операторов, представляющие собой отдельные текстовые файлы, а затем объектом "Процесс моделирования" собрана из них. Объект "Процесс моделирования" может также создавать новые текстовые файлы с фрагментами модели, результатами моделирования, а также считывать и записывать данные в текстовые файлы.
GPSS World предназначена для имитационного моделирования систем с дискретными и непрерывными процессами. Языком моделирования в ней является язык GPSS, улучшенный встроенным языком программирования низкого уровня PLUS. Язык GPSS построен в предположении, что модель сложной системы можно представить совокупностью элементов и логических правил их взаимодействия в процессе функционирования моделируемой системы. Набор абстрактных элементов, называемых объектами, небольшой. Также набор логических правил ограничен и может быть описан стандартными операциями. Комплекс программ, описывающих функционирование объектов и выполняющих логические операции, является основой для создания программной модели.
Кроме этого комплекса в составе GPSS World имеется программа- планировщик, выполняющая следующие функции:
Рассмотрим назначение объектов GPSS. Динамическими объектами являются транзакты, которые создаются в определенных точках модели, продвигаются планировщиком через блоки, а затем уничтожаются. Транзакты являются аналогами единиц - потоков в реальной системе. Они могут представлять собой различные элементы даже в одной модели. С каждым транзактом связаны параметры, которые используются для конкретных данных. Каждый транзакт может иметь любое число параметров. Параметры нумеруются или им даются имена. Номера параметров и имена используются для ссылок на значения, присвоенные параметрам. Транзактам может присваиваться приоритет. Приоритет определяет предпочтение, которое получает транзакт, когда он и другие транзакты претендуют на один и тот же ресурс. Объекты аппаратной категории - это абстрактные элементы, на которые может быть декомпозирована реальная система. Воздействуя на эти объекты, транзакты могут изменять их состояние и влиять на движение других транзактов. К объектам этого типа относятся одноканальные устройства, памяти (многоканальные устройства) и логические ключи. Одноканальные устройства (ОКУ) представляют собой оборудование, которое в любой момент времени может быть занято только одним транзактом. Например, один канал передачи данных, одноканальный ремонтный орган, один станок изготовления деталей, одно транспортное средство. Многоканальные устройства (МКУ) предназначены для имитации оборудования, осуществляющего параллельную обработку. Они могут быть использованы одновременно несколькими тран-зактами. МКУ можно использовать в качестве аналога, например, многоканального ремонтного органа, нескольких каналов связи. Для моделирования такого оборудования, как переключатели, имеющие только два состояния, в GPSS используются логические ключи. Операционные объекты, т. е. блоки, задают логику функционирования модели системы и определяют пути движения транзактов между объектами аппаратной категории. В блоках могут происходить события четырех основных типов:
В зависимости от назначения блоки подразделяются на несколько групп.
Вычислительная категория служит для описания таких ситуаций в процессе моделирования, когда связи между компонентами моделируемой системы посредством процессом наиболее просто и компактно выражаются в виде математических (аналитических и логических) соотношений. Для этих целей в качестве объектов вычислительной категории введены арифметические и булевы переменные и функции. Переменные представляют собой сложные выражения, которые включают константы, системные числовые атрибуты (СЧА), библиотечные арифметические функции, арифметические и логические операции. Выражения могут применяться в переменных и операторах GPSS. При применении в переменных выражения определяются командами GPSS. При применении в операторах GPSS выражения определяются как часть языка PLUS. Каждому объекту соответствуют атрибуты, описывающие его состояние в данный момент времени. Они доступны для использования в течение всего процесса моделирования и называются системными числовыми атрибутами (СЧА). Например, объект вычислительной категории - генератор случайных чисел имеет СЧА RNn - число, вычисляемое генератором равномерно распределенных случайных чисел номер n; у объекта динамической категории - транзакта СЧА: PR - приоритет обрабатываемого в данный момент транзакта; Pi - значение i-го параметра активного транзакта и др. Всего в GPSS World имеется свыше 50 СЧА. Булевы переменные позволяют пользователю проверять в одном блоке GPSS одновременно несколько условий, исходя из состояния или значения этих условий и их атрибутов. С помощью функций пользователь может производить вычисления непрерывных или дискретных функциональных зависимостей между аргументом функции (независимая величина) и зависимым значением функции. Кроме библиотечных арифметических функций GPSS World имеет 24 встроенных генератора случайных чисел. Объекты запоминающей категории обеспечивают обращения к сохраняемым значениям. Ячейки сохраняемых величин и матрицы ячеек сохраняемых величин используются для сохранения некоторой числовой информации. Любой активный транзакт может произвести запись информации в эти объекты. Впоследствии записанную в эти объекты информацию может считать любой транзакт. Матрицы могут иметь до шести измерений. К статистическим объектам относятся очереди и таблицы. В любой системе движение потока транзактов может быть задержано из-за недоступности устройств. В этом случае задержанные транзакты ставятся в очередь - еще один тип объектов GPSS. Учет этих очередей составляет одну из основных функций планировщика. Планировщик автоматически накапливает определенную статистику относительно устройств и очередей. Кроме этого пользователь может собирать дополнительную статистическую информацию, указав специальные точки в модели. Для облегчения табулирования статистической информации в GPSS предусмотрен специальный объект - таблица. Таблицы используются для получения выборочных распределений некоторых случайных величин. Таблица состоит из частотных классов (диапазонов значений), куда заносится число попаданий конкретного числового атрибута в каждый, тот или иной, частотный класс. Для каждой таблицы вычисляется также математическое ожидание и среднеквадратическое отклонение. К группирующей категории относятся три типа объектов: числовая группа, группа транзактов и списки. При моделировании транзакты хранятся в списках. Существует пять видов списков, только в одном из которых в любой момент времени может находиться транзакт:
Одноканальное устройство имеет:
Многоканальное устройство имеет:
Список пользователя содержит транзакты, удаленные пользователем из списка текущих событий и помещенные в список пользователя как временно неактивные. Списки пользователя используются для организации очередей с дисциплинами, отличными от дисциплины "первым пришел - первым обслужен". Date: 2015-07-17; view: 649; Нарушение авторских прав |