Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
|
Множественная регрессия
Пример 2. Руководство ОАО «Железные дороги» вынуждено периодически повышать цены на свои услуги. То, что повышение цен явно негативным образом влияет на число пассажиров, пользующихся услугами железной дороги, можно понять, проанализировав, в частности, данные табл. 8. Т а б л и ц а 8
Показатели, характеризующие деятельность ОАО «Железные дороги»
Руководство планирует в следующем периоде поднять цены на билеты для пассажиров поезда Воронеж – Москва. В этой связи было решено поручить студенту экономического факультета, проходящему практику в отделе экономического анализа управления железной дороги, известным ему методом спрогнозировать среднемесячное число пассажиров поезда при условии, что билет на этот поезд будет стоить 690 руб. Студент-практикант решил применить к имеющимся данным регрессионный анализ и, воспользовавшись его результатами, получить требуемую прогнозную оценку. Решение с помощью MS Excel 1. Ввод исходных данных. 2. Подготовка данных для расчета оценок коэффициентов линейной регрессии и оформление их в виде табл. 9. Т а б л и ц а 9
Промежуточные расчеты оценок коэффициентов регрессионного уравнения
3. Расчет оценок коэффициентов регрессии , . Таким образом, построенная модель может быть записана в виде . Коэффициент этой модели показывает, что в среднем увеличение стоимости проезда на 1 руб. приводит к уменьшению числа пассажиров на 6 человек. 4. Расчет коэффициентов корреляции и детерминации ; ; ; . Коэффициент корреляции достаточно высокий, что свидетельствует о существенной зависимости среднемесячного числа пассажиров от стоимости проезда. Коэффициент детерминации также достаточно высокий, он показывает, что число пассажиров объясняется стоимостью проезда на 89%. 5. Расчет дисперсионного отношения Фишера . Сравнение расчетного значения F -критерия с табличным для 5%-го уровня значимости (см. Приложение) позволяет сделать вывод об адекватности построенной модели. 6. Расчет стандартных ошибок по формулам, в которых используется средняя квадратическая ошибка , вычисленная в соответствии с данными табл. 10. , .
Т а б л и ц а 10
Промежуточные расчеты стандартных ошибок
7. Расчет t -статистик Стьюдента , . Сравнение расчетных значений с табличным (см. Приложение) подтверждает значимость коэффициентов регрессии. 8. Расчет доверительных границ для коэффициентов регрессии , , ; ; ; . 9. Построение линейного уравнения регрессии и расчет всех его характеристик с помощью пакета «Анализ данных» Excel (см. Вывод итогов 3)
10. Получение прогнозной оценки числа пассажиров . 11. Расчет доверительных границ прогнозной оценки , . Пример 3. Экономисту-аналитику одной крупной компании было поручено указать обоснованный размер заработной платы руководителя будущего филиала этой компании. Ожидаемый объем среднемесячных продаж филиала составит 6500 тыс. у.е. Сотрудник, который, как планируется, должен занять пост руководителя, имеет законченное высшее образование, а срок работы в должности директора другого филиала компании – 3 года. С целью решения поставленной задачи экономист-аналитик решил сначала изучить опыт других компаний, собрав сведения, представленные в табл. 11, в которой за обозначена среднемесячная заработная плата руководителей, у.е.; за – образование (0 – нет высшего образование, 1 – незаконченное высшее, 2 – высшее); за – срок работы в должности руководителя, лет; за – годовой объем продаж компании, тыс. у.е. Т а б л и ц а 11 Данные о 30 российских компаниях
Постройте модель множественной регрессии, отражающую зависимость среднемесячной зарплаты от указанных факторов, и оцените ее качество. Используя построенную модель, осуществите прогнозный расчет заработной платы руководителя будущего филиала компании. Решение с помощью табличного процессора Excel 1. Ввод исходных данных с включением дополнительной переменной , принимающей единственное значение, равное 1. 2. Расчет коэффициентов регрессии с использованием матричных функций Excel: ТРАНСП, МУМНОЖ, МОБР. ; ; .
Таким образом, построенная модель имеет следующий вид: . 3. Расчет стандартных ошибок коэффициентов регрессии 3.1. Проведение промежуточных расчетов, требуемых для расчета остаточной дисперсии, и оформление их в виде табл. 12. Т а б л и ц а 12 Промежуточные расчеты остаточной дисперсии
3.2. Получение стандартных ошибок ; ; ; . 4. Расчет t -статистик ; ; ; . Сравнение полученных t -статистик с табличным значением (см. Приложение) подтверждает значимость таких коэффициентов регрессии, как , , , и незначимость коэффициента . 5. Вычисление множественного коэффициента корреляции. 5.1. Проведение промежуточных расчетов и оформление их в виде табл. 13. Т а б л и ц а 13
Промежуточные расчеты множественного коэффициента корреляции
5.2. Расчет множественного коэффициента корреляции . Множественный коэффициент корреляции достаточно высокий, что свидетельствует о существенной зависимости величины заработной платы от включенных в модель факторов. 6. Расчет бета-коэффициентов ; ; . Полученные значения бета-коэффициенты позволяют проранжировать факторы по степени их влияния на моделируемый показатель следующим образом: 1) стаж работы в должности руководителя (в большей степени влияющий фактор); 2) годовой объем продаж компании; 3) образование (в меньшей степени влияющий фактор). 7. Вычисление парных коэффициентов корреляции. 7.1. Проведение промежуточных расчетов и оформление результатов расчетов в виде табл. 14. Т а б л и ц а 14
Промежуточные расчеты парных коэффициентов корреляции
Окончание табл. 14
7.2. Расчет парных коэффициентов корреляции ; ; . 8. Вычисление дисперсионного отношения Фишера . Сравнение расчетного значения F -критерия с табличным для 5%-го уровня значимости (см. Приложение) позволяет сделать вывод об адекватности построенной модели. 9. Построение с помощью «Пакета анализа» линейного регрессионного уравнения (см. Вывод итогов 4).
10. Использование построенной модели в прогнозных целях у.е. Решение с помощью системы STATISTICA 1. Ввод исходных данных (без включения дополнительной переменной). 2. Вызов модуля «Множественная регрессия» (Статистика / Множественная регрессия, см. рис. 2).
Рис. 2. Меню Статистика
3. Выбор переменных для анализа (Multiple Linear regressions / Variables / OK / Select dependent and independent variable lists / OK, см. рис. 3).
Рис. 3. Выбор переменных для анализа (dependent var. – зависимая переменная; independent variable list – независимые переменные)
После нажатия кнопки «ОК» появится окно, представленное на рис. 4. В нем использованы следующие обозначения: Multiple R – множественный R (множественный коэффициент корреляции); R? – R-квадрат (множественный коэффициент детерминации); adjusted R? – скорректированный R-квадрат; F – F-критерий (дисперсионное отношение Фишера); p – значимость F; df – число степеней свободы числителя (в данном случае – 3) и знаменателя (в данном случае – 26); Standard error of estimate – стандартная ошибка; Intercept – свободный члена (); Std. Error – стандартная ошибка коэффициента ; далее показана t-статистика и p-значение, позволяющие определить степень статистической значимости . Под чертой приводятся значения бета-коэффициентов. Красный шрифт свидетельствует об их значимости.
Рис. 4. Вкладка Multiple Regression Results (Результаты множественного регрессионного анализа)
4. Переход на вкладку Summary: Regression results (Результаты быстрого регрессионного анализа, см. рис. 8). На ней представлены: бета-коэффициенты (Beta), стандартные ошибки бета-коэффициентов (Std. Err. of Beta), оценки коэффициентов регрессионного уравнения b (B), стандартные ошибки оценок коэффициентов b (Std. Err. of B), t -статистики Стьюдента (t (15)), p -значения (p-level). Красный шрифтом свидетельствует о значимости коэффициентов регрессии. Рис. 5. Вкладка Regression Summary for Dependent Variable: Y (Результаты регрессионного анализа для переменной Y) 5. Переход на вкладку Advanced / Descriptive statistics / Correlations (Расширенный анализ / Описательные статистики / Корреляция, см. рис. 6– 8). В результате появится матрица корреляций между переменными модели.
Рис. 6. Вкладка Advanced (Расширенный анализ)
Рис. 7. Вкладка Review Descriptive Statistics (Просмотр описательных статистик) Рис. 8. Матрица корреляций
6. Переход на вкладку Summary: Predicted & Residual Values (Предсказанные значения и остатки, см. рис. 9). Здесь использованы следующие обозначения: Observed Value – наблюдаемые (фактические) значения, Predicted Value – предсказанные (расчетные) значения, Residual – остатки; Minimum – минимальное значение, Maximum – максимальное значение, Mean – среднее, Median – медиана. Графическое отображение фактических и расчетных значений можно получить, выполнив следующий пункт.
Рис. 9. Вкладка Predicted & Residual Values (Предсказанные значения и остатки)
7. Переход на вкладку Scatterplots (Графики, см. рис. 10), выбор Predected vs. Observed (Предсказанные и фактические значения, см. рис. 11).
Пример 4. Известно, что стоимость выпуска газеты в значительной степени определяется величиной типографских расходов. Для того чтобы иметь возможность воздействовать на эту стоимость, издатели наиболее популярных газет решили изучить факторы, определяющие сумму годовых затрат на печать газет, и оценить степень их влияния. С этой целью для 20 городов России были собраны данные о годовых расходах на печать (, млн. руб.), объемах розничной продажи газет в городе (млн. руб.) и количества семей в городе (в тысячах). Заметим, что для факторов были взяты их логарифмы ( и , соответственно) с целью уменьшения разброса данных, а, следовательно, и упрощения их обработки. Все эти данные представлены в табл. 15. Постройте модель множественной регрессии, отражающую зависимость среднегодовых расходов на издание газеты от соответствующих факторов.
Рис. 10. Вкладка Scatterplots (Графики) Рис. 11. Предсказанные и фактические значения зависимой переменной Y Т а б л и ц а 15
Решение с помощью табличного процессора Excel 1. Ввод исходных данных. 2. Построение регрессионного уравнения с использованием «Пакета анализа» (см. Вывод итогов 5) и анализ полученных результатов.
Анализ Вывода итогов 5 свидетельствует о том, что полученные стандартные ошибки значительно больше самих расчетных коэффициентов. Коэффициенты при факторах и незначимы, так как для них P-значениябольше 0,05. В то же время сравнение расчетного значения -критерия с табличным (2, 17) = 3,59 позволяет сделать вывод об адекватности рассматриваемой модели. Коэффициенты корреляции говорят о существенной взаимосвязи моделируемого показателя с факторами (см. табл. 26, полученную в результате использования функции КОРРЕЛ). Одной из причин противоречивости результатов модели является тесная взаимосвязь между факторами. Все эти факты говорят о том, что изучаемая модель требует более детального анализа. Т а б л и ц а 16 Корреляционная матрица
3. Проверка условия невырожденности матрицы . 3.1. Формирование матрицы с помощью функций ТРАНСП и МУМНОЖ . 3.2. Вычисление определителя матрицы с помощью функции МОПРЕД 0,0633. Близость определителя к нулю, а также проведенный выше анализ позволяют сделать вывод о наличии частичной мультиколлинеарности. 4. Устранение эффекта мультиколлинеарности с помощью ридж-оценивания. 4.1. Включение в модель дополнительной переменной , принимающей единственное значение, равное 1. 4.2. Расчет коэффициентов регрессии с использованием матричных функций Excel. 4.2.1. Формирование матрицы, обратной к матрице системы нормальных уравнений с помощью функций ТРАНСП, МУМНОЖ и МОБР при . ; ; ; . 4.2.2. Получение вектора оценок коэффициентов регрессии путем умножения обратной матрицы на матрицы и при различных значениях . Оформление результатов виде табл. 17. Т а б л и ц а 17
Оценки коэффициентов регрессии при разных значениях
5. Расчет стандартных ошибок коэффициентов регрессии. 5.1. Вычисление остаточной дисперсии при различных значениях и оформление результатов расчетов в виде табл. 18. Т а б л и ц а 18
Окончание табл. 18
5.2. Получение стандартных ошибок в виде корня квадратного из произведения диагональных элементов обратной матрицы на остаточную дисперсию при различных значениях . Оформление результатов расчетов в виде табл. 19. Т а б л и ц а 19
Стандартные ошибки коэффициентов регрессии при разных значениях
Таким образом, наименьшая стандартная ошибка получена при .Следовательно, построенная модель может быть записана в виде . 6. Проверка значимости полученных коэффициентов регрессии ; ; . Сравнение расчетных значений t -статистик с табличным свидетельствует о значимости включенных в модель факторов и . Таким образом, построенную модель можно использовать для целей анализа и прогнозирования. Задание 2. Начальник отдела маркетинга кинотеатра «Отражение» поручил своим сотрудникам провести исследование, в результате которого необходимо: 1) выявить фактор, в наибольшей степени влияющий на среднее число зрителей за первые три дня проката фильма; 2) построить прогнозную модель в виде линейной функции; 3) с помощью построенной модели получить прогнозные оценки среднего числа зрителей на первые три дня проката следующих двух фильмов. Специалисты отдела маркетинга экспертным путем в качестве фактора, в наибольшей степени влияющего на посещение киносеансов, установили расходы на рекламу фильма, (см. табл. 20). Выполните 2-е и 3-е задание начальника отдела маркетинга. Т а б л и ц а 20 Показатели, характеризующие деятельность кинотеатра «Отражение»
Задание 3. Предприниматель желает сдать в аренду на один год принадлежащий ему отель*** «Блаженство жизни» (80 комнат), расположенный в престижной курортной зоне, обладающий собственным пляжем, общая площадь территории отеля составляет 3,42 кв.м. Для того чтобы определить величину платы, которую он сможет установить за аренду своего отеля, предприниматель решил проанализировать ситуацию на соответствующей рыночной нише. Изучение объявлений, размещенных в газетах владельцами трехзвездных отелей, позволило ему сформировать небольшую базу данных, представленную в виде табл. 21. Т а б л и ц а 21 Данные о трехзвездных отелях
Окончание табл. 21
На основе данных этой базы предприниматель решил построить модель множественной регрессии, отражающую зависимость величины годовой арендной платы от числа комнат, престижности района расположения отеля (1 – престижный район, 0 – нет), наличия у отеля собственного пляжа (1 – есть собственный пляж, 0 – нет), а также общей площади территории, принадлежащей отелю, и с помощью построенной модели определить примерный размер платы, которую он может получать за предоставление в аренду своего отеля. На данный момент выбор предпринимателя колеблется между 162 тыс. руб. и 165 тыс. руб. Определите наиболее приемлемый размер арендной платы. Зад Date: 2016-02-19; view: 1170; Нарушение авторских прав |