Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
|
Непосредственная ¾ опосредованная связь
По таблице 3.4.1 коэффициент Юла показывает скорее на статистическую независимость, чем на статистическую зависимость, так как Q1 = 0,14. Социологу может показаться сей статистический факт странным, так как не согласуется с его содержательными гипотезами. Например, из предыдущих исследований могло быть известно, что студенты-политологи в основном удовлетворены учебой. Сомнения социолога будут вполне оправданы, ибо отсутствие непосредственной корреляционной связи еще не говорит об отсутствии связи вообще. Связь между двумя свойствами может быть опосредована третьим свойством. Маленькое значение коэффициента может быть обусловлено тем, что характер связи между «быть политологом» и «быть удовлетворенным учебой» различен, например, для юношей и девушек. Таблица 3.4.2 ¾ таблица сопряженности между свойствами «быть политологом» и «иметь четвертую степень удовлетворенности учебой» для девушек, а таблица 3.4.3 соответственно для юношей. Проверьте: сумма частот в ячейках вида (i,j) в этих двух таблицах равна частоте, соответствующей аналогичной ячейке таблицы 3.4.1.
Таблица 3.4.2
Таблица сопряженности для девушек
Таблица 3.4.3 Таблица сопряженности для юношей Подсчитаем коэффициент Юла для девушек (Qf) и для юношей (Qm). Первый будет равен примерно 0,9, а второй равен ¾ 0,7.
Во-первых, нетрудно заметить, что в том и другом случае скорее наблюдается статистическая зависимость, чем независимость. Во-вторых, в самом деле характер связи для наших подвыборок действительно различен. Для девушек получен следующий результат: либо почти все будущие политологи удовлетворены, либо не политологи по удовлетворенности относятся к «остальным». Для юношей совершенно другой результат, а именно: либо почти все политологи по удовлетворенности «остальные», либо «не политологи» удовлетворены учебой. По этой причине значение коэффициента Юла, полученное без учета пола студента, и показало отсутствие связи. Такая ситуация для социолога может быть обозначена как ложное отсутствие корреляционной связи, проистекающее из существования опосредованной связи, характер которой диаметрально противоположный на отдельных группах объектов. Этот пример показывает, что конкретные значения коэффициентов интерпретировать необходимо очень осторожно. Графически этот случай иллюстрирует граф, изображенный на рис.3.4.2. Связь между признаками 1 и 6 не наблюдается. В то же время наблюдается связь между признаками 1 и 5, а также между признаками 5 и 6. Другая ситуация ложных корреляционных связей является более очевидной. Это когда большое значение коэффициента обусловлено не сильной связью между свойствами, а тем, что существование каждого из этих свойств обусловлено одной и той же причиной. Подозрение вызывает треугольник на том же рис. 3.4.2. Интерпретация больших и маленьких значений коэффициентов требует при анализе особого внимания. Этот вывод относится в равной мере ко всем коэффициентам, с которыми работает социолог. Переходим к рассмотрению коэффициентов для случая таблиц сопряженности вида (r*s). Вернемся к нашей таблице 3.3.1, где r = 6, a s = 5. Прежде всего следует отметить, что в соответствие каждой ячейке можно поставить как прямую детерминацию (от профессии к удовлетворенности) с интенсивностью (процент по строке) и емкостью (процент по столбцу), так и обратную (от удовлетворенности к профессии). Дальнейший анализ таблицы проводится по совокупности этих характеристик. Для выделения сильных локальных связей обычно задаются ограничения на значения интенсивности и емкости. По сути, речь идет о ранжировании всех локальных связей. В этом случае не ставится вопрос о взаимосвязи феноменов «будущая профессия» и «удовлетворенность учебой», а ищутся как бы цепочки детерминации, что в дальнейшем может быть использовано для формирования гипотез о факторных синдромах и причинно-следственных отношениях. Напомним, что восходящая стратегия анализа и служит для формирования новых гипотез в исследовании. Упомянутый выше «язык» анализа локальных связей ¾ язык детерминации ¾ достаточно легко переводится и на многомерный случай. Однако к работе [13] следует обращаться, имея определенный уровень математической подготовки. Меры связи, основанные на c2 (хи-квадрат) Представим себе, как будет выглядеть наша таблица сопряженности в ситуации статистической независимости между феноменами «будущая профессия» и «удовлетворенность учебой». Нетрудно вспомнить, что при статистической независимости, например, для частоты в ячейке (1,4) выполняется соотношение:
Если теперь записать это в общем виде, т. е. для любой ячейки (i j), то в случае статистической независимости будет верно соотношение:
Эту частоту, для ее отличия от реальной, можно назвать теоретической и обозначить через .В таблице 3.4.4 приведены наши реальные частоты, взятые из таблицы 3.3.1, и теоретические. Первые из них — в верхнем левом углу ячейки, а вторые — в нижнем правом углу ячейки. Таблица 3.4.4 Таблица сопряженности: реальные и теоретические частоты
Является естественным для определения отклонения от статистической независимости воспользоваться разностью между реальными частотами и теоретическими (для случая статистической независимости), т.е. разностью вида Как и в случае введения формулы для вычисления дисперсии, нам нужны абсолютные значения этой разности, поэтому возводим ее в квадрат. Этот квадрат делим на теоретическую частоту, т. е. как бы нормируем. Тем самым достигается независимость от объема ячейки. Все ячейки становятся равноправными независимо от их объема. Затем суммируем все эти отклонения по всем 30-ти ячейкам таблицы и получаем величину называемую хи-квадрат. Она выглядит следующим образом:
Для нашего примера эта величина вычисляется как сумма тридцати членов:
Эта величина, эта статистика знаменита тем, что имеет закон распределения, который называется законом распределения хи-квадрат. Поэтому с ее помощью решается много различных задач, проверяются различные статистические гипотезы. Нас пока интересует только аспект использования величины хи-квадрат для конструирования мер связи. Самой этой величиной как мерой связи неудобно пользоваться, ибо ее значение может быть каким угодно большим и зависит от размера таблицы сопряженности. Различие в коэффициентах, основанных на хи-квадрат, заключается в определенном нормировании величины хи-квадрат. Одним из часто используемых коэффициентов является коэффициент взаимной сопряженности Пирсона. Он имеет следующий вид: где N ¾ общее число объектов. В нашем случае объекты ¾ студенты-гуманитарии. Раньше их число мы обозначали через n00, которое было равно 1000. Для наших целей так было удобнее, а в данном случае нет никакой необходимости ни в двойных индексах, ни в индексах вообще. Если значение коэффициента получится близким к нулю или равным нулю, то это означает статистическую независимость признаков. Случай близости значения к единице будет говорить о статистической зависимости. Значение коэффициента ни при каких условиях не достигает единицы, но для социолога это не имеет никакого принципиального значения. Для нашей таблицы сопряженности c2 =125,6, а значение С = 0,33. Опять-таки возникает вопрос о значимости отличия такого значения от нуля. Date: 2015-09-24; view: 618; Нарушение авторских прав |