![]() Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
![]() Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
![]() |
Обоснование задачи сравнения распределений признака
Распределения могут различаться по средним, дисперсиям, асимметрии, эксцессу и по сочетаниям этих параметров. Рассмотрим несколько примеров. На Рис. 4.1 представлены два распределения признака. Распределение 1 характеризуется меньшим диапазоном вариативности и меньшей дисперсией, чем распределение 2. В распределении 1 чаще встречаются значения признака, близкие к средней, а в распределении 2 чаще встречаются более высокие и более низкие, чем средняя, значения признака. Именно такое соотношение может наблюдаться в распределении фенотипических признаков у мужчин (кривая 2) и женщин (кривая 1). Фенотипическая дисперсия мужского пола должна быть больше, чем женского (Геодакян В.А., 1974; 1993). Мужчины - это авангардная часть популяции, ответственная за поиск новых форм приспособления, поэтому у них чаще встречаются редкие крайние значения различных фенотипических признаков. Эти отклонения, по мнению В.А. Геодакя- на, носят "футуристический” характер, это “пробы”, включающие как будущие возможные пути эволюции, так и ошибки (Геодакян В.А., 1974, с. 381). В то же время женская часть популяции ответственна за сохранение уже накопленных изменений, поэтому у них чаще встречаются средние значения фенотипических признаков. Анализ реально получаемых в исследованиях распределений может позволить нам подтвердить или опровергнуть данные теоретические предположения. На Рис. 4.2 представлены два распределения, различающиеся по знаку асимметрии: распределение 1 характеризуется положительной асимметрией (левосторонней), а распределение 2 -» отрицательной (правосторонней). Данные кривые могут отражать распределение времени решения простой задачи (кривая 1) и трудной задачи (кривая 2). Простую задачу большинство испытуемых решают быстро, поэтому большая часть значений группируется слева. В то же время сама простота задачи может привести к тому, что некоторые испытуемые будут думать над нею очень, очень долго, дольше даже, чем над сложной. Трудную задачу большинство испытуемых решают в тенденции дольше, чем простую, но в то же время почти всегда находятся люди, которые решают ее мгновенно. Если мы докажем, что распределения статистически достоверно различаются, это может стать основой для построения классификаций задач и типологий испытуемых. Например, мы можем выявлять испытуемых со стандартным соотношением признаков: простую задачу они решают быстро, а трудную - медленно, — и испытуемых с нестандартным соотношением: простую задачу решают медленно, а трудную - бы стро и т.п. Далее мы можем сравнить выявленные группы испытуемых по показателям мотивации достижения, так как изве'стно, что лица с преобладанием стремления к успеху предпочитают задачи средней трудности, где вероятность успеха примерно 0.5, а лица с преобладанием стремления избегать неудачи предпочитают либо очень легкие, либо, наоборот, очень трудные задачи (McClelland D.C., Winter D.G., 1969). Таким образом, и здесь сопоставление форм распределения может дать начало научному поиску. Часто нам бывает полезно также сопоставить полученное эмпирическое распределение с теоретическим распределением. Например, для того, чтобы доказать, что оно подчиняется или, наоборот, не подчиняется нормальному закону распределения. Это лучше делать с помощью машинных программ обработки данных, особенно при больших объемах выборок. Подробные программы машинной обработки можно найти, например, в руководстве Э.В. Ивантер и А.В. Коросова (1992). В практических целях эмпирические распределения должны проверяться на “нормальность” в тех случаях, когда мы намерены использовать параметрические методы и критерии. В данном руководстве это относится лишь к методам дисперсионного анализа, поэтому способы проверки совпадения эмпирического распределения с нормальным описаны в Главе 7, посвященной однофакторному дисперсионному анализу. Традиционные для отечественной математической статистики критерии определения расхождения или согласия распределений - это метод yf К. Пирсона и критерий X, Колмогорова-Смирнова. Оба эти метода требуют тщательной группировки данных и довольно сложных вычислений. Кроме того, возможности этих критериев в полной мере проявляются на больших выборках (п>30). Тем не менее они могут оказаться столь незаменимыми, что исследователю придется пренебречь экономией времени и усилий. Например, они незаменимы в следующих двух случаях: 1.44. в задачах, требующих доказательства неслучайности предпочтений в выборе из нескольких альтернатив; 1.45. в задачах, требующих обнаружения точки максимального расхождения между двумя распределениями, которая затем используется для перегруппировки данных с целью применения критерия ф* (углового преобразования Фишера). Рассмотрим вначале традиционные методы определения расхождения распределений, а затем возможности использования критерия ф* Фишера.
18. X2 критерия Пирсона
Назначения критерия Критерий X2 применяется в двух целях; 1.46. для сопоставления эмпирическою распределения признака с теоретическим - равномерным, нормальным или каким-то иным, 1.47. для сопоставления двух, трех или более эмпирических распределений одного и того же признака* Описание критерия Критерий X2 отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях Преимущество метода состоит в том, что он позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований (см. п 1 2) В самом простом случае альтернативного распределения “да - нет”, “допустил брак - не допустил брака”, “решил задачу - не решил задачу” и т п мы уже можем применить критерий X2- Допустим, некий наблюдатель фиксирует количество пешеходов, выбравших правую или левую из двух симметричных дорожек на пути из точки А в точку Б (см Рис 4 3). [1] На самом деле области применения критерия у} многообразны (см, например: Суходольский Г В, 1972, с 295), но в данном руководстве мы ограничиваемся только этими двумя, наиболее часто встречающимися на практике, целями При сопоставлении эмпирического распределения с теоретическим мы определяем степень расхождения между эмпирическими и теоретическими частотами. При сопоставлении двух эмпирических распределений мы определяем степень расхождения между эмпирическими частотами и теоретическими частотами, которые наблюдались бы в случае совпадения двух этих эмпирических распределений. Формулы расчета теоретических частот будут специально даны для каждого варианта сопоставлений. Чем больше расхождение между двумя сопоставляемыми распределениями, тем больше эмпирическое значение у}. Г ипотезы Возможны несколько вариантов гипотез, в зависимости от задач, которые мы перед собой ставим. Первый вариант: Hq: Полученное эмпирическое распределение признака не отличается от теоретического (например, равномерного) распределения. Нр Полученное эмпирическое распределение признака отличается от теоретического распределения. Второй вариант: Hq: Эмпирическое распределение 1 не отличается от эмпирического распределения 2. Hj: Эмпирическое распределение 1 отличается от эмпирического распределения 2. Третий вариант: Но: Эмпирические распределения 1, 2, 3,... не различаются между собой. Нр Эмпирические распределения 1, 2, 3,... различаются между собой. Критерий X2 позволяет проверить все три варианта гипотез. Графическое представление критерия Проиллюстрируем пример с выбором правой или левой дорожек на пути из точки А в точку Б. На Рис. 4.4 частота выбора левой дорожки представлена левым столбиком, а частота выбора правой дорожки - правым столбиком гистограммы.^ На оси ординат отмеряются относительные частоты выбора, то есть частоты выбора той или иной дорожки, отнесенные к общему количеству наблюдений. Для левой до Ограничения критерия 1.48. Объем выборки должен быть достаточно большим п> 30. При п<30 критерий X2 Дает весьма приближенные значения. Точность критерия повышается при больших п. 1.49. Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5: f>5. Это означает, что если число разрядов задано заранее и не может быть изменено, то мы не можем применять метод у}, не накопив определенного минимального числа наблюдений. Если, например, мы хотим проверить паши предположения о том, что частота обращений в телефонную службу Доверия неравномерно распределяются по 7 дням недели, то нам потребуется 5-7=35 обращений. Таким образом, если количество разрядов (k) задано заранее, как в данном случае, минимальное число наблюдений (nmm) определяется по формуле: nmm-k-5. У Выбранные разряды должны “вычерпывать” все распределение, то есть охватывать весь диапазон вариативности признаков. При этом группировка на разряды должна быть одинаковой во всех сопоставляемых распределениях. 10. Необходимо вносить “поправку на непрерывность” при сопоставлении распределений признаков, которые принимают всего 2 значения. При внесении поправки значение X уменьшается (см. Пример с поправкой на непрерывность). 11. Разряды должны быть неперекрещивающимися: если наблюдение отнесено к одному разряду, то оно уже не может бьпь отнесено ни к какому другому разряду. Сумма наблюдений по разрядам всегда должна быть равна общему количеству наблюдений. Правомерен вопрос о том, что считать числом наблюдений - количество выборов, реакций, действий или количество испытуемых, которые совершают выбор, проявляют реакции или производят действия. Если испытуемый проявляет несколько реакций, и все они регистрируются, то количество испытуемых не будет совпадать с количеством реакций Мы можем просуммировать реакции каждого испытуемого, как, например, это делается в методике Хекхаузена для исследования мотивации достижения или в Тесте фрустрационной толерантности С Розенцвейга, и сравнивать распределения индивидуальных сумм реакций в нескольких выборках. Расчет критерия у} 1.50. Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты (первый столбец). 1.51. Рядом с каждой эмпирической частотой записать теоретическую частоту (второй столбец). 1.52. Подсчитать разности между эмпирической и теоретической частотой по каждому разряду (строке) и записать их в третий столбец. 1.53. Определить число степеней свободы по формуле: V=k~\ где k - количество разрядов признака. Если V=l, внести поправку на "непрерывность”. 1.54. Возвести в квадрат полученные разности и занести их в четвертый столбец. 1.55. Разделить полученные квадраты разностей на теоретическую частоту и записать результаты в пятый столбец. 1.56. Просуммировать значения пятого столбца. Полученную сумму обозначить как Х2ЭМп- _ 1.57. Определить по Табл. IX Приложения 1 критические значения для данного числа степеней свободы V. Если Х2эмп меньше критического значения, расхождения между распределениями статистически недостоверны. Если хЛмп равно критическому значению или превышает его, расхождения между распределениями статистически достоверны.
Date: 2016-02-19; view: 570; Нарушение авторских прав |