![]() Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
![]() Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
![]() |
Ошибки возникающие при регрессионном анализе
Регрессионный анализ – это раздел математической статистики, изучающий зависимость между случайными величинами с помощью уравнений регрессии (функций регрессии). теоретически возможны две регрессии: одна единственная для генеральной совокупности и вторая, зависящая от выборки. Последнюю регрессию называют выборочной, или эмпирической функцией регрессии, а ее график в системе координат Следует заметить, что при положительном наклоне генеральной регрессии наклон выборочной линии регрессии может оказаться для некоторых выборок отрицательным или отсутствовать. Однако это не будет свидетельствовать об отсутствии или отрицательной связи исследуемых переменных. Для того, чтобы убедиться, что получена качественная связь показателей экономического процесса, необходимо помимо оценки коэффициентов регрессии находить их стандартные отклонения и t -статистики. С помощью их можно судить о статистической значимости построенной математической модели. Для получения оценок При использовании метода наименьших квадратов необходимо, чтобы выполнялись следующие требования (условия Гаусса–Маркова) по отношению к случайным теоретическим ошибкам: 1) значения переменной 2) математическое ожидание ошибки 3) дисперсия ошибки 4) ошибка 5) значения ошибок
то есть для них характерна некоррелированность. Условие 3 известно как свойство гомоскедастичности. Невыполнение этого условия приводит к свойству гетероскедастичности. Известно, что если условия 1–5 выполняются, то оценки Во-первых, оценки являются несмещенными, то есть математическое ожидание оценки каждого параметра равно его истинному значению: Во-вторых, оценки состоятельны, так как дисперсия оценок параметров при увеличении числа опытных данных в методе наименьших квадратов стремится к нулю. Другими словами, если число опытов достаточно велико, то практически В-третьих, оценки эффективны, то есть они имеют наименьшую дисперсию по сравнению с любыми другими оценками данного параметра. Перечисленные свойства не зависят от вида распределения случайной ошибки, тем не менее обычно предполагается, что они имеют нормальный закон распределения. Эта предпосылка позволяет проводить проверку статистической значимости оценок метода наименьших квадратов и определения для них доверительных интервалов. При ее выполнении оценки МНК имеют минимальную дисперсию не только среди линейных, но и среди несмещенных оценок. Если требования 3 и 4 не выполнены, то есть дисперсия теоретических ошибок непостоянна или их значения связаны друг с другом, то свойства несмещенности и состоятельности сохраняются, но свойство эффективности отсутствует. Наиболее важным является выполнение требования 5, которое в случае его невыполнения приводит к нарушению свойства несмещенности. Поскольку данные о случайных теоретических отклонениях от линейной зависимости обычно отсутствуют, то для исследования статистического качества оцененного уравнения регрессии необходимо провести следующие проверки: – статистической значимости каждого коэффициента уравнения регрессии; – общего качества уравнения регрессии; – свойств данных, выполнение которых предполагалось при оценивании уравнения регрессии. 29.Прямая лин.регрессия (парная лин.регр) - это причинная модель статист. лин.связи м/у двумя колич-ными переменными х и у, предст-ная уравнением y = a + bx, где х – незав.переменная, y –зависимая.Коэф-т регрессии- b и свободный член ур-ния регрессии- a вычисляются по формулам:b = rxySy/Sx; a = y - bx, Пусть Будем рассм. парную связь в кот.: 30.Анализ коэф.корелляции и детерминации. После того как найдена ф-я регрессии производится оценка значимости как ур-я регрессии так и так коэф. Оценка значимости ур-я регрессии в целом производ.с помощью Fкр Фишера. Провести с помощью коэф. корелляции.- Коэф.корел. - показатель тесноты связи (лин.) м/у результативн. признаком и фактором. Согласно опред.корел.,он для генеральн.совокупности их двух случ.велечин - Коэф.детерминации -характериз.долю (разброс) дисперсии результатив. признака ^yi, кот.объясняется лин.регрессией. М/у коэф.коррел.и детермин. для лин.ф-ии существ.связь.Можно показать: r = r2 xy (коэф.детермин.=коэф.корелл.в кв.)
31.Дисперсионный анализ лин. регрессии. Основной целью дисперсионного анализа является исследование значимости различия между средними. Центральное место в дисп.анализе занимает разложение общей суммы кв.отклонений результирующего показателя у от его сред.зн-я у (с чертой) на две части: объясненную и остаточную.
Непосредственному определению коэффициента детерминации предшествует анализ дисперсии. Центральное место в нем занимает разложение общей суммы квадратов отклонений результирующего показателя у от его среднего значения
Тогда Таким образом, условно все факторы, определяющие изменение результирующего показателя, разделены на две группы: изучаемый фактор x и прочие факторы. Если изучаемый фактор x не оказывает влияния, то линия регрессии параллельна оси В этом случае влияние оказывают другие факторы, и, следовательно, вся дисперсия результативного признака обусловлена другими факторами. Если другие факторы не оказывают влияние на результат Таким образом, если сумма 33.Оценка существ-ти пар-ров лен. рег-ии. Параметры линейной регрессии (коэффициент регрессии При этом оценки тем надежней, чем меньше их разброс, то есть дисперсия: В математической статистике доказано, что
Здесь Статистическая значимость оцененного коэффициента регрессии Таким образом, величина стандартной ошибки совместно с t -распределением Стьюдента при Для t -статистики проверяется нулевая гипотеза Следует заметить, что значение t -критерия Стьюдента можно вычислить также, извлекая корень из F -критерия, т. к. 34.Оценка значимости линейной регрессии. Осущ-ся с помощью F-критерия Фишера,котор. сопоставляет факторную(объясненную) и остаточную дисперсии в расчете на одну степень свободы.Для вычисления F- критерия Фишера используется разложение общей суммы квадратов отклонений Сравнение 2-х сумм квадратов отклонения позвол.вып-ть оценку значимости ур-я рег-ии.Устан-м число степеней своб. для кажд. суммы квадратов отклонений При этом число степеней свободы-число единиц совокупности выборки и число определяемых констант.Для общей суммы
Приведен. соотнош. дают возмож. исп-ть их для оценки стат. значим-ти ур-я рег-ии., кот. вкл. след. этапы: (для оцен. знач. выдвиг. след. гипотезы) 1)
35.Прогноз по линейн. ур. рег-ии. Точечный расчет результир-й переем-й
получ. форм. для стандарт. ошиб. результир. переем-й По мере удалания от 36.Оценка пар-в Нелин. рег. В этом случ. Нелин. ф-я м.б. исп-на, как линейная,как многочлен, коэф-т L (a,b,c)зависит от 3 перем-х т L (a,b,c)= Сумма отклон. опытного и теоретич. д.б. миним-й. Находим производные, затем используем метод Крамера. 37.Оценка параметров показат. регресс. Для ее построен. (нахождения а и b)необх. в нач. произвести линеаризацию, а именно перейти от веществ. чисел xi и yi к их логарифмам.
А=lna, B=lnb, Примен. мет. наим. квадр. к ф-ии (**)
38.Оценка парам-в степенной рег-ии.
А=lna, примен. мет. наим. квадр. Найдя а и b окончательно запис-ся степенная ф-ия рег-ии. 39.Индекс детерминации нелин. рег. Нелин. рег. хар-ся индексом корреляции
Величина дан. показателя нах-ся в пределах 0<=
40,Индекс корреляц нелин.регрессии.
Sост^2= Sу^2 = 0<=Rxy<=1, чем ближе к 1, тем теснее связь между функцией и аргументом, тем более надежное уравнение регрессии. 41. Кривые Филипса - равносторонняя гипербола, характеризующая нелинейную зависимость междунормой безработици х и процентом прироста з/п у: у=а+b/х 42, Кривая Эйнгеля. Нем.статистик сформулир. В 1857г. закономерность, согласно кот. С ростом дохода доля его, расходуемая на непродовольственные товары, будет возрастать. Это увеличение имеет предел, поскольку сумма двух долей не может быть больше 100%, т.е. на отдельные непродовольств.товары этот предел может харак-ся величиной параметра а для уравнения вида: у=а-b/х. 43. Средняя ошибка аппроксим. Фактическое значение результативного признака отличается от теоретического, рассчитанного по уравнению регрессии. Чем меньше это отличие, тем ближе теоретическое значение приближается к опытным данным, тем лучше качество математической модели регрессии для данной выборки. Поскольку как опытные данные, так и теоретические могут быть величинами как положительными, так и отрицательными, то при сравнении разности между ними Обычно, особенно в экономике, относительную ошибку аппроксимации выражают в %:
Кроме локальной характеристики аппроксимации результирующего показателя в эконометрике вводится глобальная характеристика качества аппроксимации, под которой понимается средняя ошибка аппроксимации. Если обозначить через A i точечную (локальную) ошибку аппроксимации:
то интегральная характеристика аппроксимации А и среднее значение
Date: 2015-09-18; view: 3091; Нарушение авторских прав |