Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Задание к работе

Лабораторная работа №1. Парная линейная регрессия

(с дополнением к пункту 17)

Цель работы

Построение парной линейной регрессии и проверка значимости.

Проверка статистической значимость значений коэффициентов регрессии и коэффициента корреляции.

Вычисление доверительных интервалов параметров линейной регрессии.

Построение прогноза и вычисление стандартных ошибок прогноза

 

Содержание отчета и представление работы

Отчет по работе оформляется в виде файла Excel и должен содержать полученные результаты с необходимыми пояснениями.

 

Задание к работе

Исходные данные смоделированы на основе линейной эконометрической модели:

,

где случайные величины взаимно независимы и нормально распределены с нулевым математическим ожиданием и дисперсией .

Исходные данные представляют собой двумерную выборку

По выборке необходимо построить парную линейную регрессию и проверить ее статистическую значимость.

 

1. Для заданных исходных данных постройте поле корреляции — диаграмму зависимости показателя от фактора : тип диаграммы «Точечная» (без отрезков, соединяющих точки).

 

 

Рис. 1. Диаграмма зависимости показателя от фактора .

 

2. Найдите выборочные характеристики , , , , , , , используя средства Excel, результаты вычислений оформить в виде таблицы (рис. 2.):

— выборочные средние значения и , функция AVERAGE/ СРЗНАЧ.

Вычисления в Excel реализованы по формулам , ;

 

— смещенные выборочные оценки дисперсии и , функция VARP/ ДИСПР.

В Excel реализованы формулы , .

 

— смещенные выборочные средние квадратические отклонения и , STDEVP/ СТАНДОТКЛОНП. Вычисления в Excel выполнены по формулам

, .

выборочный коэффициент корреляции , функция CORREL/ КОРРЕЛ. В Excel реализуется формула: .

 

 

Рис. 2. Выборочные характеристики, вычисленные средствами Excel.

 

3. Найдите коэффициенты a и b выборочной линейной регрессии, используя средства Excel

 

Для вычисления коэффициентов воспользуйтесь встроенной функцией LINEST/ ЛИНЕЙН (функция находится в категории “Статистические” и вычисляет выборочные оценки и параметров уравнения регрессии ):

 

1) В свободном месте рабочего листа выделите область ячеек размером 5 строк и 2 столбца для вывода результатов.

 

2) В Мастере функций (категория “Статистические”) выберите функцию LINEST /ЛИНЕЙН.

 

3) Заполните поля аргументов функции:

 

Известные_значения_y адреса ячеек, содержащих значения признака ;

 

Известные_значения_x адреса ячеек, содержащих значения фактора ;

 

Константа логическое значение, указывающее на наличие свободного члена a в уравнении регрессии: укажите значение поля Константа равное 1, тогда свободный член рассчитывается обычным образом (если значение поля Константа равно 0, то свободный член полагается равным 0);

 

Статистика логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет: укажите значение поля Статистика равное 1, тогда выводится дополнительная регрессионная информациям (если Статистика = 0, то выводятся только оценки параметров уравнения регрессии — оценки a и b).

 

4) После того, как будут заполнены все аргументы функции, нажмите комбинацию клавиш <CTRL> + <SHIFT> + <ENTER>.

Расчеты параметров регрессионной модели выводятся в виде таблицы:

 

Таблица 1.

 

Значение коэффициента Значение коэффициента
Стандартная ошибка коэффициента Стандартная ошибка коэффициента
Коэффициент детерминации Оценка стандартного отклонения остатков
-статистика Число степеней свободы, равное
Регрессионная сумма квадратов Остаточная сумма квадратов

 

 

 
 


 

-статистика Число степеней свободы

 

 

Регрессионная сумма квадратов Остаточная сумма квадратов

 

 

Рис. 3. Таблица результатов использования функции LINEST /ЛИНЕЙН.

 

4. Проверьте значения коэффициентов , непосредственным вычислением по формулам:

 

 

 

, , ,

 

 

 

 

Рис. 4. Таблица значений коэффициентов , , полученных непосредственным вычислением по формулам.

 

5. Вычислите значения по уравнению эмпирической регрессии:

.

 

6. Постройте на корреляционном поле прямую линию выборочной линейной регрессии по точкам .

 

 

 

Рис. 5. Результаты выполнения пунктов 5 и 6.

 

7. Вычислите остатки .

8. Постройте график остатков (тип диаграммы — «Точечная»).

 

 

Рис. 5. График остатков .

 

9. Найдите величину средней ошибки аппроксимации :

 

.

10. Вычислите коэффициент детерминации непосредственно по формуле:

 

 

 

Сравните полученное значение коэффициента детерминации с вычисленным ранее с помощью функции CORREL/ КОРЕЛЛ выборочным коэффициентом корреляции.

 

11. Рассчитайте оценку , стандартные ошибки параметров линейной регрессии , и коэффициента корреляции непосредственно по формулам.

– несмещенная оценка дисперсии возмущений (теоретической остаточной дисперсии);

 

– стандартная ошибка коэффициента регрессии ;

 

– смещенные выборочное среднее квадратическое отклонения ;

 

– стандартная ошибка коэффициента регрессии ;

– выборочный коэффициент корреляции;

– смещенное выборочное среднее квадратическое отклонения .

 

12. Вычислите соответствующие значения – статистик для коэффициентов регрессии , и коэффициента корреляции . Проверьте статистическую значимость полученных значений коэффициентов регрессии и коэффициента корреляции.

Статистика при выполнении гипотезы распределена по закону Стьюдента с n - 2 степенями свободы.

Из таблицы распределения Стьюдента с n - 2 степенями свободы по заданному уровню значимости выбирается значение как критическая точка, соответствующая двусторонней области.

Тогда:

1) Если , то гипотезу следует отклонить и, следовательно, признать коэффициент b статистически значимым,

2) Если , то гипотезу следует принять и, следовательно, признать коэффициент b статистически незначимым.

 

Статистика при выполнении гипотезы распределена по закону Стьюдента с n - 2 степенями свободы.

Из таблицы распределения Стьюдента с n - 2 степенями свободы по заданному уровню значимости выбирается значение как критическая точка, соответствующая двусторонней области.

Тогда:

1) Если , то гипотезу следует отклонить и, следовательно, признать коэффициент a статистически значимым,

2) Если , то гипотезу следует принять и, следовательно, признать коэффициент a статистически незначимым.

 

Статистика при выполнении гипотезы (т.е. при отсутствии корреляционной связи, здесь — генеральный коэффициент корреляции) распределена по закону Стьюдента с n - 2 степенями свободы.

Из таблицы распределения Стьюдента с n - 2 степенями свободы по заданному уровню значимости выбирается значение как критическая точка, соответствующая двусторонней области.

Тогда:

1) Если , то гипотезу следует отклонить и, следовательно, признать коэффициент статистически значимым,

2) Если , то гипотезу следует принять и, следовательно, признать коэффициент статистически незначимым.

 

Проверка значимости коэффициента b одновременно является проверкой значимости парной линейной регрессии в целом. Еще один способ проверки значимости парной линейной регрессии основан на коэффициенте детерминации R2 и статистике, распределенной по закону Фишера с числом степеней свободы числителя равном 1 и числом степеней свободы знаменателя равном n - 2.

 

Табличные значения определяются с помощью функции TINV/СТЬЮДРАСПОБР. – вычисляет верхнее критическое значение распределения Стьюдента с степенями свободы, соответствующее заданному уровню значимости .

 

Аргументы этой функции:

Вероятность — уровень значимости , можно принять равным 0,05 (т.е. 5%);

Степени_свободы — число степеней свободы, для парной линейной регрессии равно , где — число наблюдений.

 

13. Проверьте значимость полученного уравнения регрессии в целом по критерию Фишера.

 

Если выполнены предположения регрессионного анализа, то при выполнении гипотезы (что означает отсутствие взаимосвязи между x и y, а так же статистическую незначимость построенной парной регрессии) статистика распределена по закону Фишера с числом степеней свободы числителя равном 1 и числом степеней свободы знаменателя равном n - 2.

По таблице распределения Фишера-Снедекора при заданном уровне значимости определяется значение как критическая точка

при числе степеней свободы числителя равном 1 и числе степеней

свободы знаменателя равном n - 2.

Тогда:

1) Если , то гипотезу следует отклонить и, следовательно, признать построенное уравнение линейной регрессии статистически значимым,

2) Если , то гипотезу следует принять и, следовательно, признать построенное уравнение статистически незначимым.

 

Значение можно определить с помощью функции FINV /FРАСПОБР. Аргументы этой функции:

 

Вероятность — уровень значимости , можно принять равным 0,05 (т.е. 5%);

Степени_свободы1 число степеней свободы числителя, равно 1 (т.к. один фактор);

Степени_свободы2 число степеней свободы знаменателя, для парной регрессии равно , где — число наблюдений.

 

14. Вычислите доверительные интервалы параметров линейной регрессии.

 

Доверительные интервалы для параметров a и b с заданным уровнем доверия, в качестве которого на практике обычно выбирают вероятность 0,95 (соответствующую уровню значимости 0.05 или 5%).

 

 

– стандартная ошибка коэффициента регрессии ;

– критическое значение для заданного уровня значимости и заданного числа степеней свободы n - 2, определенное по таблицам распределения Стьюдента

;

– стандартная ошибка коэффициента регрессии .

 

15. Постройте прогноз среднего значения показателя и точечный прогноз значения при значении в 3 раза больше, чем среднее значение .

 

Точечный прогноз значения показателя согласно линейной парной регрессии для вычисляется по формуле

Интервальный прогноз (доверительный интервал прогноза) вычисляется аналогично доверительному интервалу параметров регрессии.

 

По таблицам распределения Стьюдента с n - 2 степенями свободы определяется – критическое значение для заданного уровня значимости и числа степеней свободы n - 2, тогда

 

 

есть доверительный интервал прогноза индивидуального значения

показателя в точке с заданным уровнем доверия

 

 

16. Вычислите стандартные ошибки прогноза функции регрессии и индивидуального значения и доверительные интервалы полученных прогнозов.

 

Стандартная ошибка индивидуального прогноза определяется по формуле:

 

 

Очевидно, что чем дальше от , тем шире доверительный интервал прогноза, или, другими словами, тем выше погрешность прогноза.

 

 

17. Получите результаты регрессионного анализа с помощью Пакета Анализ данных (Данные/Анализ данных … Регрессия | Tools/Data Analysis …Regression).

В диалоговом окне этой процедуры поля Входной интервал y, Входной интервал x, Константа имеют тот же смысл, что и для функции LINEST/ ЛИНЕЙН.

 

В поле Метки поставьте флажок, если первая строка в указанном диапазоне данных содержит названия столбцов.

Поставьте флажок в полях Остатки, График остатков, График подбора для того, чтобы получить соответствующую дополнительную информацию.

 

В результате выполнения процедуры Регрессия появляются три таблицы

- регрессионная статистика;

- дисперсионный анализ;

- таблица, содержащая коэффициенты регрессии, стандартные шибки, t - статистики и границы доверительных интервалов.

 

 

Множественный R – множественный коэффициент корреляции

– выборочный коэффициент корреляции между фактическими и расчетными значениями зависимой переменной.

В случае парной линейной регрессии этот коэффициент совпадает с выборочным коэффициентом корреляции

()

 

, - регрессионные остатки;

 

- среднее результативного признака.

 

R-квадрат – коэффициент детерминации (квадрат множественного коэффициента корреляции) ();

 

Нормированный R-квадрат – (скорректированный коэффициент детерминации)

(у Мхитаряна: )

 

m – число факторов (для парной регрессии – один фактор, одна независимая переменная x, m = 1)

 

Стандартная ошибка – (выборочное стандартное отклонение остатков)

 

 

p – число параметров (для парной регрессии – параметры a и b, p = m + 1)

 

 

 

– стандартная ошибка коэффициента регрессии ;

 

Наблюденияn объем выборки.

 

 

 

SSрег – сумма квадратов отклонений расчетных значений от выборочного среднего , обусловленная регрессией , SSрег = 93584,5.

 

 

SSост – сумма квадратов остатков

SSост = 10370,1

 

 

SSобщ – общая сумма квадратов отклонений фактических значений от выборочного среднего , SSобщ =103955.

 

Эти суммы связаны равенством , действительно 93584,5 + 10370,1 = 103955

 

 

MSрег – средний квадрат регрессии?????? (оценка дисперсии регрессии)

MSрег = 93584,5

 

m – число факторов (для парной регрессии – один фактор, одна независимая переменная x, m = 1)

p – число параметров (для парной регрессии – параметры a и b, p = m + 1)

 

 

MSост – средний квадрат остатков MSост =370,36 (оценка дисперсии остатов)

 

 

F - статистика, служит для проверки значимость полученного уравнения регрессии в целом по критерию Фишера.

 

, F = 252,685

Значимость F

 

 

df – число степеней свободы,

 

df общ = n – 1 – число степеней свободы суммы SSобщ

 

df рег = p – 1 – число степеней свободы суммы SSрег

df ост = n – p – число степеней свободы суммы SSост

df общ = df рег + df ост

 

Коэффициенты уравнения регрессии a = 171,49316b = 22,344279 Стандартная ошибка определения коэффициентов ma = 15,81614505 mb =1,40564775 t - статистика ta = 10,8372 tb = 15,8961 Вероятность ошибки

 

 

 

 

Нижние 95% – нижняя граница доверительного интервала с доверительной вероятностью 0,95,

 

Верхние 95% – верхняя граница доверительного интервала с доверительной вероятностью 0,95,

 


<== предыдущая | следующая ==>
 | Введение 5

Date: 2015-07-11; view: 404; Нарушение авторских прав; Помощь в написании работы --> СЮДА...



mydocx.ru - 2015-2024 year. (0.007 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию