![]() Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
![]() Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
![]() |
Прогнозное значение определяется путем подстановки в уравнение регрессии соответствующего прогнозного значения Затем вычисляется средняя стандартная ошибка прогноза
и строится доверительный интервал прогноза Интервал может быть достаточно широк за счет малого объема наблюдений.
Регрессии, нелинейные по включенным переменным, приводятся к линейному виду простой заменой переменных, а дальнейшая оценка параметров производится с помощью МНК. Гиперболическая регрессия: Линеаризующее преобразование:
Регрессии, нелинейные по оцениваемым параметрам, делятся на два типа: внутренне нелинейные Экспоненциальная регрессия: Линеаризующее преобразование:
Степенная регрессия: Линеаризующее преобразование:
Показательная регрессия: Линеаризующее преобразование:
Логарифмическая регрессия: Линеаризующее преобразование:
2. Решение типовых задач Пример 1.1. По 15 предприятиям отрасли (табл. 1.1) известны: 1) определить зависимость 2) построить корреляционные поля и график уравнения линейной регрессии 3) сделать вывод о качестве модели и рассчитать прогнозное значение Таблица 1.1
Решение: 1) В Excel составим вспомогательную таблицу 1.2. Таблица 1.2
Вычислим количество измерений С помощью функции ∑ (Автосумма) на панели инструментов Стандартная найдем сумму всех Вычислим выборочные средние: Заполним столбцы D, E, F. Например, в ячейку D2 поместим = B2*C2, затем на клавиатуре нажмем ENTER. Щелкнем левой кнопкой мыши по ячейке D2 и, ухватив за правый нижний угол этой ячейки (черный плюсик), потянем вниз до ячейки D16. Произойдет автоматическое заполнение диапазона D3 – D16. Для вычисления в ыборочной ковариации между Выборочную дисперсию для
Рис. 1.1. Решение примера 1.1 в Excel Выборочный коэффициент корреляции Выборочный коэффициент линейной регрессии Коэффициент 2) Подставляя в найденное уравнение регрессии фактические значения С помощью Мастера диаграмм строим корреляционные поля (выделяя столбцы со значениями
Рис. 1.2. График зависимости объема произведенной продукции 3) Для оценки качества построенной модели регрессии вычислим: • коэффициент детерминации • среднюю ошибку аппроксимации. Для этого в столбце H вычислим С помощью На уровне значимости 0,05 Так как
Рис. 1.3. Диалоговое окно функции FРАСПОБР Средний коэффициент эластичности Рассчитаем прогнозное значение Найдем Средняя стандартная ошибка прогноза:
На уровне значимости Доверительный интервал прогноза: 206,33-79,48 Выполненный прогноз затрат на выпуск продукции оказался надежным (1-0,05=0,95), но неточным, так как диапазон верхней и нижней границ доверительного интервала составляет 3. Решение задач с помощью электронных таблиц Excel Решение эконометрических задач можно упростить, используя встроенные функции. Активизируем Мастер функций любым из способов: • в главном меню выбрать Вставка / Функция; • на панели инструментов Стандартная щелкнуть по кнопке Для вычисления выборочных средних используем функцию СРЗНАЧ(число1:числоN) из категории Статистические. Выборочная ковариация между Выборочные дисперсии определяются статистической функцией ДИСПР(число1:числоN). Выборочный коэффициент корреляции между Параметры линейной регрессии 1 способ) С помощью встроенной функции ЛИНЕЙН. Порядок действий следующий: 1. Выделить область пустых ячеек 5x2 (5 строк, 2 столбца) для вывода результатов регрессионной статистики или область 1x2 – для получения только коэффициентов регрессии. 2. С помощью Мастера функций среди Статистических выбрать функцию ЛИНЕЙН и заполнить ее аргументы (рис. 1.4):
Рис. 1.4. Диалоговое окно ввода аргументов функции ЛИНЕЙН Известные_значения_y – диапазон, содержащий данные результативного признака Y; Известные_значения_x – диапазон, содержащий данные объясняющего признака X; Конст – логическое значение (1 или 0), которое указывает на наличие или отсутствие свободного члена в уравнении; ставим 1; Статистика – логическое значение (1 или 0), которое указывает, выводить дополнительную информацию по регрессионному анализу или нет; ставим 1. 3. В левой верхней ячейке выделенной области появится первое число таблицы. Для раскрытия всей таблицы нужно нажать на клавишу <F2>, а затем – на комбинацию клавиш <CTRL> + <SHIFT> + <ENTER>. Дополнительная регрессионная статистика будет выведена в виде (табл. 1.3): Таблица 1.3
В результате применения функции ЛИНЕЙН получим:
(2 способ) С помощью инструмента анализа данных Регрессия можно получить результаты регрессионной статистики, дисперсионного анализа, доверительные интервалы, остатки, графики подбора линий регрессии, графики остатков и нормальной вероятности. Порядок действий следующий: 1. Необходимо проверить доступ к Пакету анализа. Для этого в главном меню нужно выбрать Сервис / Настройки и напротив Пакета анализа установить флажок. 2. Выбрать в главном меню Сервис / Анализ данных / Регрессия и заполнить диалоговое окно (рис. 1.5): Входной интервал Y – диапазон, содержащий данные результативного признака Y; Входной интервал X – диапазон, содержащий данные объясняющего признака X; Метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет; Константа-ноль – флажок, указывающий на наличие или отсутствие свободного члена в уравнении; Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона; Новый рабочий лист – можно задать произвольное имя нового листа, на который будут выведены результаты. Для получения информации об остатках, графиков остатков, подбора и нормальной вероятности нужно установить соответствующие флажки в диалоговом окне. В результате получим итоги как на рис. 1.6.
Рис. 1.5. Диалоговое окно ввода параметров инструмента Регрессии
Рис. 1.6. Результаты применения инструмента Регрессия В Excel линия тренда может быть добавлена в диаграмму с областями гистограммы или в график. Для этого: 1. Необходимо выделить область построения диаграммы и в главном меню выбрать Диаграмма / Добавить линию тренда. 2. В появившемся диалоговом окне (рис. 1.7) выбрать вид линии тренда и задать соответствующие параметры.
Рис. 1.7. Диалоговое окно типов линии тренда Для полиноминального тренда необходимо задать степень аппроксимирующего полинома, для линейной фильтрации – количество точек усреднения. Выбираем Линейная для построения уравнения линейной регрессии. В качестве дополнительной информации можно показать уравнение на диаграмме и поместить на диаграмму величину В результате получим линейный тренд (рис. 1.9).
Рис. 1.8. Диалоговое окно параметров линии тренда
Рис. 1.9. Линейный тренд Нелинейные модели регрессии иллюстрируются при вычислении параметров уравнения Ii. Модель множественной регрессии 1. Основные определения и формулы Множественная регрессия – регрессия между переменными где
Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель. Уравнение множественной линейной регрессии в случае Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов. Строится система нормальных уравнений: Решение этой системы позволяет получить оценки параметров регрессии с помощью метода определителей
где
Для двухфакторного уравнения коэффициенты множественной линейной регрессии можно вычислить по формулам: Частные уравнения регрессии характеризуют изолированное влияние фактора на результат, ибо другие факторы закреплены на неизменном уровне. Эффекты влияния других факторов присоединены в них к свободному члену уравнения множественной регрессии. Это позволяет на основе частных уравнений регрессии Средние коэффициентами эластичности показывают на сколько процентов в среднем изменится результат при изменении соответствующего фактора на 1%: Их можно сравнивать друг с другом и соответственно ранжировать факторы по силе их воздействия на результат. Тесноту совместного влияния факторов на результат оценивает коэффициент (индекс) множественной корреляции: Величина индекса множественной корреляции лежит в пределах от 0 до 1 и должна быть больше или равна максимальному парному индексу корреляции: Чем ближе значение индекса множественной корреляции к 1, тем теснее связь результативного признака со всем набором исследуемых факторов. Сравнивая индексы множественной и парной корреляции, можно сделать вывод о целесообразности (величина индекса множественной корреляции существенно отличается от индекса парной корреляции) включения в уравнение регрессии того или иного фактора. При линейной зависимости совокупный коэффициент множественной корреляции определяется через матрицу парных коэффициентов корреляции: где
Частные коэффициенты корреляции характеризуют тесноту линейной зависимости между результатом и соответствующим фактором при устранении влияния других факторов. Если вычисляется, например, Частные коэффициенты корреляции, измеряющие влияние на или по рекуррентной формуле: Для двухфакторного уравнения:
Частные коэффициенты корреляции изменяются в пределах от -1 до +1. Сравнение значений парного и частного коэффициентов корреляции показывает направление воздействия фиксируемого фактора. Если частный коэффициент корреляции Порядок частного коэффициента корреляции определяется количеством факторов, влияние которых исключается. Например, Зная частные коэффициенты корреляции (последовательно первого, второго и более высокого порядка), можно определить совокупный коэффициент множественной корреляции: Качество построенной модели в целом оценивает коэффициент (индекс) множественной детерминации, который рассчитывается как квадрат индекса множественной корреляции: Если число параметров при Чем больше величина Значимость частных коэффициентов корреляции проверяется аналогично случаю парных коэффициентов корреляции. Единственным отличием является число степеней свободы, которое следует брать равным Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью Мерой для оценки включения фактора в модель служит частный Для двухфакторного уравнения частные
Если фактическое значение Для оценки значимости коэффициентов чистой регрессии по где
При дополнительном включении в регрессию нового фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться. Если это не так, то включаемый в анализ новый фактор не улучшает модель и практически является лишним фактором. Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по При построении уравнения множественной регрессии может возникнуть проблема мультиколлинеарности факторов. Считается, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами. Чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И наоборот, чем ближе к 1 определитель, тем меньше мультиколлинеарность факторов. Для применения МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это означает, что для каждого значения фактора Наличие гетероскедастичности можно наглядно видеть из поля корреляции (рис. 2.1).
а) б) в) Рис. 2.1.Примеры гетероскедастичности: а) дисперсия остатков растет по мере увеличения б) дисперсия остатков достигает максимальной величины при средних значениях переменной в) максимальная дисперсия остатков при малых значениях
Для проверки выборки на гетероскедастичность можно использовать метод Гольдфельда-Квандта (при малом объеме выборки) или критерий Бартлетта (при большом объеме выборки). Последовательность применения теста Гольдфельда-Квандта: 1) Упорядочить данные по убыванию той независимой переменной, относительно которой есть подозрение на гетероскедастичность. 2) Исключить из рассмотрения 3) Разделить совокупность из 4) Вычислить остаточную сумму квадратов для первой
Если необходимо включить в модель факторы, имеющие два или более качественных уровней (пол, профессия, образование, климатические условия, принадлежность к определенному региону и т.д.), то им должны быть присвоены цифровые метки, т.е. качественные переменные преобразованы в количественные. Такого вида сконструированные переменные называют фиктивными (искусственными) переменными. Коэффициент регрессии при фиктивной переменной интерпретируется как среднее изменение зависимой переменной при переходе от одной категории к другой при неизменных значениях остальных параметров. Значимость влияния фиктивной переменной проверяется с помощью
2. Решение типовых задач Пример 2.1. По 15 предприятиям отрасли (табл. 2.1) изучается зависимость затрат на выпуск продукции 1) Построить уравнение множественной линейной регрессии. 2) Вычислить и интерпретировать: • средние коэффициенты эластичности; • парные коэффициенты корреляции, оценить их значимость на уровне 0,05; • частные коэффициенты корреляции; • коэффициент множественной корреляции, множественный коэффициент детерминации, скорректированный коэффициент детерминации. 3) Оценить надежность построенного уравнения регрессии и целесообразность включения фактора Таблица 2.1
Решение: 1) В Excel составим вспомогательную таблицу 2.2. Таблица 2.2 Аналогично примеру 1.1 вычислим: Затем найдем коэффициенты множественной линейной регрессии и оформим вывод результатов как на рис. 2.2. Например, для вычисления значения коэффициента Уравнение множественной линейной регрессии примет вид:
Таким образом, при увеличении объема произведенной продукции
Рис. 2.2. Решение примера 2.1 в Excel 2) Для вычисления средних коэффициентов эластичности воспользуемся формулой: Найдем значения парных коэффициентов корреляции:
Значения парных коэффициентов корреляции указывают на весьма тесную связь Значимость парных коэффициентов корреляции оценим с помощью Фактическое значение Так как фактические значения Вычислим частные коэффициенты корреляции по формулам:
Получим При сравнении значений коэффициентов парной и частной корреляции приходим к выводу, что из-за сильной межфакторной связи коэффициенты парной и частной корреляции отличаются довольно значительно. Date: 2016-06-09; view: 13602; Нарушение авторских прав |