Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать неотразимый комплимент Как противостоять манипуляциям мужчин? Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?

Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Статистика хи-квадрат



Обязательной процедурой с точки зрения современных стандартов аналитики являются оценка плотности связи между переменными, осуществляемая с помощью корреляционного анализа, и предшествующая ей процедура оценки критерия хи-квадрата по Пирсону.

Эту процедуру считают необязательной в трех следующих случаях (хотя ее выполнить можно):

· при оценке плотности связи переменных в таблице размерностью 2x2

· при проведении процедуры ранговой корреляции для двух переменных, построенных на основе порядковых шкал

· при оценке степени синхронности процессов в двух динамических рядах

Корреляционному анализу обычно предшествует стадия расчета статистики х2 (chi square test). Она может быть применена по отношению к любому типу рядов и позволяет проверить нулевую гипотезу (Нд) о наличии связи между двумя рядами признаков. Статистика х2 не дает никакой информации о характере связи между признаками и степени ее плотности.

Она отвечает только на один вопрос — есть ли связь между признаками или она отсутствует. Тем не менее чем больше показатель статистики хи-квадрат между признаками, тем теснее связь между ними.

Условия проведения расчета статистики хи-квадрат, обеспечивающие ее универсальность, очень мягкие, нежесткие.

1. Расчет статистики можно выполнять на переменных, измеренных с помощью как абсолютных метрических, интервальных, порядковых, так и номинальных шкал.

2. Переменные могут быть как дискретными, так и непрерывными.

3. Предварительного исследования характера распределения изучаемых признаков не требуется.

Критерий статистики хи-квадрат является непараметрическим, так как он не требует проверки нормальности распределения, которому подчинялась бы выборка.

Алгоритм:

1. составляют таблицу с данными опроса

2. формулируют нулевую и альтернативную гипотезы. Нулевая гипотеза (HQ) — утверждение, отрицающее зависимость между рядами переменных. Доказательство ее ложности свидетельствует о том, что связь между переменными существует. Для нашего случая — «электоральная активность мужчин и женщин совпадает». Альтернативная гипотеза (HJ — гипотеза о наличии связи между признаками. Для нашего случая — «уровень электоральной активности мужчин и женщин различается».



3. Затем (третий шаг) строят дополнительную таблицу ожидаемой (теоретической)

частоты. Для заполнения ее ячеек произведение соответствующих маргинальных частот (значения соответствующих маргинальных — итоговых — строки и столбца) делят на общее число респондентов

4. Величину х2 вычисляют (четвертый шаг) по формуле -где п. — значения переменных в ячейках таблицы реального распределения; п. — значения переменных в таблице вероятностного распределения.

5. Далее (пятый шаг) полученное значение необходимо сравнить с табличным критическим значением х 2 (табл. 40). Для этого нам необходимо определить так называемые степени свободы (df): d f— (r - 1 ) ( с - 1),

где r и с — количество категорий в колонке (column) и строке (row) (без учета

маргинальных значений).

 

Другая необходимая величина — уровень статистической значимости. Он показывает, насколько вероятна связь, зафиксированная между двумя признаками в выборке, т.е. этот показатель оценивает вероятность того, что при отборе других наблюдений из генеральной совокупности мы получим аналогичный результат. Уровень значимости определяет вероятность отклонения исследуемого показателя от его ожидаемого значения, при котором исследователь должен отвергнуть выдвинутую гипотезу. Для исследователя очень важно, чтобы эта величина — уровень значимости — была крайне мала.

Это расчетная величина, но мы принимаем ее за константу. В социальных и политических исследованиях эту величину (а) принимают равной 0,05, реже — 0,01 (для регрессионного, дискриминантного и некоторых других видов анализа). Показатель а = 0,05 означает, что не чаще, чем в пяти случаях из ста, мы получим иной результат, чем при выполненном расчете. В пакете SPSS показатель уровня значимости рассчитывается автоматически, на него обязательно нужно обращать внимание.

 

При интерпретации используем следующее правило: если расчетное значение статистики хи-квадрат оказалось больше вероятностного, то нулевую гипотезу отвергают и считают справедливым предположение о наличии связей между признаками. Если расчетное значение оказалось меньше вероятностного, то считают доказанной нулевую гипотезу.

Мы ничего на основании полученного значения статистики х2 не можем сказать о плотности связи анализируемых переменных. Для решения такой задачи необходимо обратиться к коэффициентам корреляционной связи.

Надежность полученных результатов проведения теста х2 определяется рядом условий.

Во-первых, нежелательно, чтобы у каждой из переменных, включенных в анализ, число градаций превышало четыре (если число значений у переменных больше четырех, значительно снижаются возможности для интерпретации и надежность вывода).

Во-вторых, выборка (число наблюдений) не должна быть слишком мала. Это означает, что наполнение ячеек в анализируемой таблице не должно быть меньше 10, согласно В. А. Ядову — менее пяти, т.е. он указывает на более мягкие требования, так как в противном случае нельзя будет анализировать стандартизованные остатки (в таблице реальных наблюдений вообще не должно быть пустых ячеек). Кроме того, выборка признается «маленькой», если для большого числа ячеек таблицы сопряженности ожидаемые частоты < 5. Возможный вариант решения проблемы — предварительное объединение некоторых ячеек. Если это не удается сделать, то можно использовать и нескорректированный критерий, но трактовать результат с известной степенью осторожности. Но выборка не должна быть и слишком большой. Методические эксперименты показывают, что статистика хи-квадрат очень чувствительна к количеству наблюдений, так как расчетное х2 растет с той же скоростью, что и объем выборки. Например, при удвоении объема выборки во столько же раз возрастет и значение х2- В случае если выборка большая (массовый опрос, выборка около 1000 респондентов), для получения более точного результата допустимо рассчитывать этот показатель в относительных частотах (в процентах).



В-третьих, отклонения ожидаемых частот в таблице вероятностного распределения ответов от реальных наблюдений в исходной анализируемой таблице менее чем на пять единиц (< 5) должны встречаться не более чем в 20% полей таблицы.

В-четвертых, суммы по строкам и столбцам всегда должны быть больше нуля, величина уровня значимости для расчета критерия хи- квадрат не должна превышать 0,05 (а в идеале — < 0,001).

 

 








Date: 2015-08-15; view: 193; Нарушение авторских прав

mydocx.ru - 2015-2018 year. (0.005 sec.) - Пожаловаться на публикацию