Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
|
Меры центральной тенденции. (мода, медиана, среднее. Свойства среднего)
К описательным статистикам обычно относят числовые характеристики распределения измеренного на выборке признака. Основное назначение каждой из первичных описательных статистик - замена множества значений признака, измеренного на выборке, одним числом (например, средним значением как мерой центральной тенденции). Компактное описание группы при помощи первичных статистик позволяет интерпретировать результаты измерений,в частности, путем сравнения первичных статистик разных групп. Мера центральной тенденции - это число, характеризующее выборку по уровню выраженностиизмеренного признака. Существуют три способа определения «центральной тенденции», каждому из которых соответствует своя мера: мода, медиана и выборочное среднее. Наиболее просто получаемой мерой центральной тенденции является мода. Мода - это такое значение из множества измерений, которое встречается наиболее часто. Моде,или модальному интервалу признака, соответствует наибольший подъем (вершина) графикараспределения частот. Если график распределения частот имеет одну вершину, то такоераспределение называется унимодальным. ПРИМЕР - когда два соседних значения встречаются одинаково часто и чаще, чем любое другое значение, мода есть среднее этих двух значений.Распределение может иметь и не одну моду. Когда все значения встречаются одинаково часто,принято считать, что такое распределение не имеет моды. Если распределение имеет несколько мод, то говорят, что оно мультимодально или многомодально (имеет два или более «пика»). Мультимодальность распределения дает важнуюинформацию о природе исследуемой переменной. ПРИМЕР - в социологических опросах, если переменная представляет собой предпочтение илиотношение к чему-то, то мультимодальность может означать, что существуют несколько определенно различных мнений.__ Мультимодальность также служит индикатором того, что выборка не является однородной и наблюдения, возможно, порождены двумя или более «наложенными» распределениями. Медиана - это такое значение признака, которое делит упорядоченное (ранжированное) множество данных пополам так, что одна половина всех значений оказывается меньше медианы, а другая - больше. Таким образом, первым шагом при определении медианы являетсяупорядочивание (ранжирование) всех значений по возрастанию или убыванию. Далее медианаопределяется следующим образом: - если данные содержат нечетное число значений (8, 9, 10, 13, 15), то медиана есть центральное значение; - если данные содержат четное число значений (5, 8, 9, 11), то медиана есть точка, лежащая посередине между двумя центральными значениями. Среднее (выборочное среднее, среднее арифметическое) - определяется как сумма всехзначений измеренного признака, деленная на количество суммированных значений. Среднее множества данных предполагает в основном арифметические операции. На величинусреднего влияют значения всех результатов.Каждая мера центральной тенденции обладает характеристиками, которые делают ее ценной вопределенных условиях. Для номинальных данных, разумеется, единственной подходящей мерой центральной тенденции является мода, или модальная категория - та градация номинальной переменной,которая встречается наиболее часто. Для порядковых и метрических переменных, распределение которых унимодальное и симметричное, мода, медиана и среднее совпадают. Чем больше отклонение от симметричности, тем больше расхождение между значениями этих мер центральной тенденции.По этому расхождению можно судить о том, насколько симметрично или асимметрично распределение.Однако использование среднего ограничивается тем, что на его величину влияет каждоеотдельное значение. Таким образом, среднее значение весьма чувствительно к «выбросам» - экстремально малым или большим значениям переменной. 5. Меры изменчивости: дисперсия, стандартное отклонение, асимметрия, эксцесс. Дисперсия выборки, или выборочная дисперсия (термин впервые введен Фишером), мера изменчивости для метрических данных, пропорциональная сумме квадратов отклонений измеренных значений от их арифметического среднего. Чем больше изменчивость в данных, тем больше отклонения значений от среднего, тем больше величина дисперсии. Мерой изменчивости, тесно связанной с дисперсией, является стандартное отклонение. Стандартное отклонение (сигма, среднеквадратическое отклонение) – положительное значение квадратного корня из дисперсии. Использование сигмы необходимо при составлениитаблиц средних для ваших приложений или для таблиц непосредственно находящихся в «теле» диплома, диссертации или статьи. Так как использование только среднего значения некорректно, то принято обозначать так: 5.62±1.97, где 5.62 – среднее, а 1.97 – стандартное отклонение от среднего или сигма. Одно из наиболее важных свойств распределения частот - степень асимметрии. Практически точно симметричные полигоны частот и гистограммы почти никогда не встречаются. Степень асимметрии распределения частот для выборки называется просто его асимметрией. Асимметрия, или коэффициент асимметрии, является мерой несимметричности распределения, степень отклонения графика распределения частот от симметричного вида относительно среднего значения. Если этот коэффициент значительно отличается от 0, распределение является асимметричным (то есть несимметричным). Для симметричного распределения асимметрия равна 0. Если чаще встречаются значения меньше среднего, то говорят о левосторонней, или положительной асимметрии (Ас > 0). Если же чаще встречаются значения больше среднего, то асимметрия - правосторонняя, или отрицательная (Ас<0). Чем больше отклонение от нуля, тем больше асимметрия. Иногда важно получить представление о том, являются ли полигон частот или гистограмма островершинными или плоскими. Для этого используют эксцесс. Эксцесс, или коэффициент эксцесса, измеряет остроту пика распределения, мера плосковершинности или остроконечности графика распределения измеренного признака. Островершинное распределение характеризуется положительным эксцессом (Ех> 0), а плосковершинное - отрицательным I.・英<d(-3 < Ех< 0). «Средневершинное» (нормальное) распределение имеет нулевой эксцесс (Ех = 0).
Date: 2016-02-19; view: 3052; Нарушение авторских прав |