Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать неотразимый комплимент Как противостоять манипуляциям мужчин? Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?

Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Множественный регрессионный анализ





Условия проведения МРА:

1) Многомерность

2) Достаточность (выборка 1/5, например одна зависимая переменная и к ней 4 независимых, тогда выборка - 20)

3) Качественная однородность

4) Отсутствие мультиколлинеарности (отсутствие корреляционной связи между независимыми переменными)

5) интервальный уровень измерения данных

6) нормальность распределения.

Также необходимо учитывать:

1. эффект существенной многомерности (не произвольный набор переменных, а взаимодополняющих)

2. использование «обучения» в математических моделях

3. оптимизировать формулировку задач многомерного статистического анализа

4. избегать чрезмерно сложной функции

5. искать компромисс между сложностью и точностью модели

6. искать модель наиболее устойчивую к варьированию выборки

Модель множественной регрессии практически идентична модели парной регрессии; разница лишь в том, что в линейную функцию последовательно включаются несколько независимых переменных: Если независимых переменных больше двух, мы не имеем возможности получить визуальное представление об их связи, в этом плане множественная регрессия менее ≪наглядна≫, нежели парная. При наличии двух независимых переменных данные бывает полезно отобразить на трехмерной диаграмме рассеяния. В профессиональных статистических пакетах программ (например, Statistica) существует опция вращения трехмерной диаграммы, позволяющая хорошо визуально представить структуру данных. При работе с множественной регрессией, в отличие от парной, необходимо определять алгоритм анализа. Стандартный алгоритм включает в итоговую регрессионную модель все имеющиеся предикторы. Пошаговый алгоритм предполагает последовательное включение (исключение) независимых переменных, исходя из их объяснительного ≪веса≫. Пошаговый метод хорош, когда имеется много независимых переменных; он ≪очищает≫ модель от откровенно слабых предикторов, делая ее более компактной и лаконичной.

Дополнительная полезная статистика в анализе соотношения исходных и предсказанных значений зависимой переменной — расстояние Махаланобиса и расстояние Кука. Первое — мера уникальности случая (показывает, насколько сочетание значений всех независимых переменных для данного случая отклоняется от среднего значения по всем независимым переменным одновременно). Второе — мера влиятельности случая. Разные наблюдения по-разному влияют на наклон линии регрессии, и с помощью расстояния Кука можно сопоставлять их по этому показателю. Это бывает полезно при чистке выбросов (выброс можно представить как чрезмерно влиятельный случай).



В статистике множественной регрессии существует специальный бета-коэффициент (В), вычисляемый отдельно для каждой независимой переменной для сравнения предсказательных возможностей переменных. Он представляет собой частный (вычисленный после учета влияния всех других предикторов) коэффициент корреляции фактора и отклика и показывает независимый вклад фактора в предсказание значений отклика. В парном регрессионном анализе бета-коэффициент по понятным причинам равен коэффициенту парной корреляции между зависимой и независимой переменной.

 

47. Многомерное шкалирование: понятие, виды, этапы, условия проведения, интерпретация результатов.

МШ – статистический вид анализа, представляющих данные в виде совокупности точек в пространстве. Данные наблюдений, имеющие различную степень связи в этой совокупности, изображаются в виде точек, разделенных расстояниями, соответствующими их коэффициентам связи.

МШ представляет сложные данные в визуальной форме, что облегчает их восприятие и интерпретацию по сравнению с табличной формой.

Неметрическое МШ представляет данные, которые просто определённым образом упорядочены, и используют этот порядок для нанесения координат каждой точки. Могут использоваться любые совокупности данных, содержащие меры сходства или различия.

Существует 3 разновидности МШ: метрическое, неметрическое и индивидуальное. Метрическое и неметрическое МШ различаются по уровню измерения исходных данных. Метрическое шкалирование требует метрических данных (получаемых в результате использования абсолютных шкал), а следовательно, непригодно для больше части получаемых исследователем первичных эмпирических данных. Неметрическое шкалирование накладывает гораздо меньше ограничения и позволяет использовать данные более низкого уровня измерения ( порядковых шкал). Впервые разделения на метрическое и неметрическое шкалирование, как и сами термины, были введены Кумбсом. Метрическое МШ при построении функции учитывает числовые отношения между объектами, а неметрическое – их порядок. Модель индивидуальных различий применялась вначале для изучения степени отличия оценок стимулов у различных людей, отсюда и происходит название.

Развитие классических моделей метрического и неметрического МШ относится к 1950-1960м годам (Торгерстон, Шепард, Крускал). В конце 1960х Мак Ги разработал модель реплицирующего МШ, с помощью которого стала возможным одновременно анализировать более одной матрицы сходств различных объектов. В 1970-е годы (Кэрролл, Чанг) появилась новая модель многомерного шкалирования ( другое название – взвешенная модель МШ). В отечественной науке сложились две школы: московская (Г. Сатаров, А. Терехина) и ленинградская (В. Перекрест).



Задачи: выявить структуру исследуемого множества объектов, найти скрытые группы на основе исходных качеств объекта, оценить степень сходства или различия между парами объектов. Мы задаем только параметры объекта.

Этапы:

Формулирование проблемы

Получение исходных данных (в виде таблицы объект-признак)

Выбор метода многомерного шкалирования

Выбор конкретного метода многомерного шкалирования зависит от того, какие именно данные — о восприятиях или о предпочтениях, подлежат шкалированию, или необходимо проанализировать оба их вида. Природа исходных данных — определяющий фактор. Неметрические методы ММШ (nonmetric MDS) предполагают, что исходные данные будут порядковыми, но в ходе анализа они преобразуются в метрические.

Принятие решения о количестве размерностей

Цель многомерного шкалирования — получить пространственную карту с наименьшим количеством размерностей, которая наилучшим образом подходит для анализа исходных данных. Однако пространственные карты рассчитывают таким образом, что соответствие модели исходным данным увеличивается с ростом количества размерностей пространства. Поэтому следует идти на компромисс. Для определения того, насколько принятое в рамках ММШ решение соответствует точному отображению исходных данных, обычно используют показатель стресса. Он является мерой соответствия подогнанной модели исходным данным: чем выше значение стресса, тем ниже качество подгонки модели. Для определения количества размерностей пространства нужно руководствоваться следующими принципами.

5) Обозначение размерности и интерпретация конфигурации точек на карте

Как только пространственная карта создана, необходимо дать название соответствующим размерностям (осям координат на пространственной карте) и интерпретировать конфигурацию точек на карте. Исследователь самостоятельно принимает решение об обозначении размерности, руководствуясь своим опытом.

6) Оценка надежности и достоверности

Существует более 20 компьютерных программ, выполняющих процедуру многомерного шкалирования. Для решения политологических задач наиболее удобными считаются SPSS и Statistica. ( В SPSS Исходные данные для МШ предаставляются в виде матрицы «объект-признак». Для МШ переменные должны быть измерены с помощью метрической, интервальной или порядковой шкалы, а когда мы имеем дело с номинальными шкалами, необходимо перекодировать их в биноминальные (дихотомические), где интересующее исследователя свойство кодируется как 1, а все прочие как 0).

Интерпретация результатов МШ

МШ позволяет решить 2 задачи: получить интегративную оценку исследуемой характеристики объектов и определить, не навязывая собственного мнения испытуемым, какими же признаками они руководствовались в процессе оценивания. Именно поэтому интерпретация результатов сводится к двум процедурам. Во-первых, объясняется объединение объектов в группы ( интерпретируются скопления точек в геометрическом пространстве). Во-вторых, по крайним вертикально и горизонтально расположенным точкам даются названия шкалам, которые фактически обозначают обнаруженные скрытые критерии оценки объектов респондентами. Одно из существенных достоинств МШ заключается в возможности представления полученных результатов в удобном для интерпретации графическом виде. Близость точек говорит о сходстве объектов, значительное расстояние между ними – о существенных отличиях.

 

Ниже перечислены основные статистики, связанные с многомерным шкалированием.

Оценка сходства (similarityjudgments). Рейтинги всех возможных пар объектов, отражающие их сходство по шкале Лайксрта.

Ранги предпочтений (preference rankings), Ранги объектов в порядке их уменьшения (от большего к меньшему). Обычно эти данные получают при опросе респондентов.

Стресс (stress). Мера соответствия подогнанной модели исходным данным: чем выше значение стресса, тем ниже качество подгонки модели.

R-квадрат (R-square). R-квадрат— это квадрат коэффициента корреляции, который показывает долю дисперсии оптимально отображенных данных, которые могут быть учтены ММШ. Мера соответствия подогнанной модели исходным данным.

Пространственная карта (spatial map). Воспринимаемые взаимосвязи между объектами, представленные в виде геометрических связей между точками в многомерном пространстве.

Координаты (coordinates). Указывают расположение объектов на пространственной карте.

Развертка (unfolding). Представление исследуемых объектов и респондентов в виде точек в одном и том же пространстве.








Date: 2015-08-15; view: 222; Нарушение авторских прав

mydocx.ru - 2015-2018 year. (0.007 sec.) - Пожаловаться на публикацию