Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Структурные характеристики распределения: квантили распределения и мода





К структурным характеристикам ряда распределения относят квантили распределения (медиану, квартили, децили и др.) и моду.

Квантили распределения представляют собой обобщающие показатели, характеризующие структуру распределения признака в совокупности.

Квантиль распределения – это значение признака, занимающее определенное место в упорядоченной по данному признаку совокупности.

Виды квантилей:

1) медиана (Ме) - значение признака, приходящееся на середину упорядоченной совокупности,

2) квартили ( Q1/4, Q2/4=Ме, Q3/4) – значения признака, делящие упорядоченную совокупность на 4 равные (по числу единиц) части,

3) децили (Q0,1,Q0,2,…,Q0,9) – значения признака, делящие упорядоченную совокупность на 10 равных частей,

4) перцентили (Q0,01,Q0,02,…,Q0,99) - значения признака, делящие упорядоченную совокупность на 100 равных частей.

Например, по данным о 12 предприятий розничной торговли требуется определить медиану и квартили для признака х – объем продаж за период, тыс. усл. ден. ед.

Упорядочим совокупность по х (табл. 3.4). В совокупности 12 единиц. Середина приходится на 6 и 7 элементы, значения признака у которых 31 и 32 соответственно. Медианой будет среднее из значений этих элементов:

Таблица 3.4

Определение медианы и квартилей по несгруппированным данным

Х                        

Q1/4 Q2/4=Ме Q3/4

Первый квартиль отделяет первую четверть элементов совокупности (т.е. 3 единицы). Его значение будет равно среднему из значений признака у 3-его и 4-ого элементов, т.е.

Третий квартиль отделяет последнюю четверть элементов совокупности. Его значение будет равно среднему из значений признака у 9-го и 10-го элементов, т.е.

Если данные сгруппированы, то значение квантиля определяется по накопленным частотам. При этом определяется номер группы, которая содержит i -ый квантиль, как номер первой группы от начала ряда, в которой сумма накопленных частот равна или превышает N·i, где i - индекс квантиля.

Если ряд интервальный, то значение квантиля уточняется по формуле:

где Xqi - нижняя граница интервала, в котором находится i - ый квантиль;

- величина интервала, в котором находится i - ый квантиль;

F (-1) – сумма накопленных частот интервалов, предшествующих интервалу, в котором находится i - ый квантиль;

Nqi – частота интервала, в котором находится i - ый квантиль.

 

 

Пусть, требуется определить медиану и квартили распределения признака х – объем продаж по данным равноинтервальной группировки (табл. 3.5).

Таблица 3.5

Определение медианы и квартилей по сгруппированным данным

№ группы j Объем продаж за период (хн j; х вj) Количество предприятий (частота) Nj Накопленная частота Fj (сравнивается с N∙0,5 = 6)
  [26; 30)   3 ≥ 6 (ЛОЖЬ)
  [30; 34) Ме, Мо   9 ≥ 6 (ИСТИНА)
  [34; 38)    
ИТОГО    

Определим номер группы, содержащей Ме. Это будет 2-ая группа, т.к. накопленная частота в этой группе равна 9, что больше N ·0,5=12·0,5=6.

Теперь уточним значение Ме по формуле для определения квантилей в интервальном ряду:

Значение медианы можно определить графически по кумуляте. Для этого максимальную ординату кумуляты делят пополам. И через полученное значение проводят линию параллельную горизонтальной оси. Абсцисса точки пересечения этой линии и кумуляты дает значение медианы, совпадет со значением, полученным при расчете по сгрупированным данным.

Наиболее распространенным видом квантилей является медиана. Медиана не требует знания всех индивидуальных значений признака. Она не чувствительна к крайним значениям признака, которые могут резко отличаться от основной массы его значений. Поэтому медиану используют как наиболее надежный показатель типичного значения признака в неоднородной совокупности (включающей резкие отклонения от ).

Медиана находит практическое применение также вследствие особого математического свойства - свойства минимальности. Согласно данному свойству сумма абсолютных отклонений чисел ряда от медианы есть величина наименьшая:

.

Мода (Мо) – наиболее часто встречающееся значение признака в совокупности.

Для дискретного ряда мода – это значение признака, которому соответствует наибольшая частота (частость) распределения.

Для интервального ряда – это значение признака, которому соответствует наибольшая плотность распределения. Если ряд равноинтервальный, то значение моды можно определить по частотам (частостям): их соотношение будет таким же, что и плотностей распределения. Кроме того, значение моды в случае равноинтервального ряда можно уточнить по формуле:


где XMo - нижняя граница интервала, в котором находится мода;

- величина модального интервала;

NMо, NMо-1, NMо+1 – частоты, соответственно, модального, предшествующего и последующего интервалов.

Пусть, требуется определить моду для распределения признака объем продаж, используя данные равноинтервальной группировки (табл. 3.5).

Модальным будет 2-ой интервал [30 –34], т.к. в этом интервале наибольшая частота (NMо =6). Приближенное значение Мо определим по формуле: Мо =30+4(6-3)/(6-3+6-3)=32 (усл.ден.ед.).

Значение моды можно определить графически по гистограмме. При этом соединяют вершины самого высокого (модального) столбца с соседними вершинами так, чтобы полученные отрезки пересекались и лежали внутри данного столбца. Если соседний столбец отсутствует, вершину соединяют с противоположным основанием. Абсцисса точки пересечения дает значение моды, совпадающее со значением, полученным при расчете по сгруппированным данным.

Если все значения вариационного ряда имеют одинаковую частоту, то говорят, что этот вариационный ряд не имеет моды. Если две не соседних варианты имеют одинаковую доминирующую частоту, то такой вариационный ряд называют бимодальным; если таких вариант больше двух, то ряд – полимодальный.

Мода также как и медиана не требует знания всех индивидуальных значений признака и поэтому может быть использована в качестве наиболее типичного значения признака в неоднородной совокупности.

Вариационный анализ. Показатели вариации

Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Однако два распределения, имеющие одинаковую среднюю арифметическую, могут значительно отличаться друг от друга по степени рассеяния (вариации) признака. Если индивидуальные значения признака ряда мало отличаются друг от друга (рис. 3.1 А), то средняя арифметическая будет достаточно надежной показательной характеристикой типичного уровня в данной совокупности. Если же ряд распределения характеризуется значительным рассеиванием индивидуальных значений признака (рис. 3.2 Б), то средняя арифметическая будет ненадежной характеристикой типичного уровня этой совокупности и ее практическое применение будет ограничено.

А) ······´····· Х

Б) · · · · · · ´ · · · · · Х

Рис. 3.1. Распределения с малой (А) и большой (Б)

вариацией.

Вариационный размах, дисперсия, коэффициент вариации. Свойства и методы расчета показателей вариации

Для измерения рассеяния (вариации) признака применяются различные абсолютные и относительные показатели вариации.

К абсолютным показателям вариации относятся:

- Размах вариации, R - разность между максимальным и минимальным значениями признака в совокупности:

Среднее по совокупности отклонение индивидуального значения признака от его среднего уровня измеряют два следующих показателя вариации: среднее линейное и среднее квадратическое отклонение.

- Среднее линейное отклонение, d - представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариант от их средней арифметической (при этом всегда полагают, что среднюю вычитают из варианты). Для несгруппированных и сгруппированных данных, соответственно:


, ,

где N – объем совокупности;

k - число групп;

fj – частота/частость в j – ой группе.

Математические свойства модулей плохие, поэтому часто на практике применяют другой показатель среднего отклонения от средней - среднеее квадратическое отклонение.

- Среднее квадратическое отклонение, s - представляет собой среднюю квадратическую из отклонений отдельных вариант от их средней арифметической. Для несгруппированных и сгруппированных данных, соответственно:

, .

- Дисперсия, s2 - это квадрат среднего квадратического отклонения. Она представляет собой средний квадрат отклонений вариант от их средней величины. Она может быть также вычислена, как разность среднего квадрата значения признака и квадрата среднего арифметического значения признака:

.

Среднее квадратическое отклонение наряду с дисперсией входят в большинство теорем теории вероятности и математической статистики, что обусловливает их широкое применение на практике. Кроме того, дисперсия может быть разложена на составные части, позволяющие оценить влияние различных факторов, обусловливающих вариацию признака.

Теорема (правило) о разложении дисперсии при группировании. Пусть при группировке совокупности по некоторому признаку Х было образовано k однородных групп. Согласно теореме общая дисперсия признака Х (по совокупности в целом) может быть разложена на две составные части: 1) межгрупповую и 2) остаточную (среднюю из внутригрупповых) дисперсии:

Общая дисперсия рассчитывается по формуле простой дисперсии и показывает величину вариации признака, обусловленную всеми факторами, влияющими на данный признак.

Межгрупповая дисперсия, - характеризует ту часть общей вариации признака, которая обусловлена делением совокупности на группы. Если деление совокупности на группы обусловлено факторами, влияющими на интересующий нас признак, то данную дисперсию называют еще факторной дисперсией. Межгрупповая дисперсия равна среднему взвешенному квадрату отклонений групповых (частных) средних от общей средней :

,

где Nj - численность единиц в j - ой группе.

Средняя из внутригрупповых (или остаточная) дисперсия, - характеризует остаточную вариацию, несвязанную с группированием. То есть, характеризует вариацию признака, обусловленную прочими факторами, не связанными с делением совокупности на группы. Вычисляется она как средняя взвешенная из внутригрупповых дисперсий:

,

где sj2 - дисперсия признака внутри j –ой группы.

Применение теоремы о разложении дисперсии.

1. Межгрупповую (или остаточную) дисперсию используют в качестве критерия группирования для группировок с одинаковым числом групп. Очевидно, что чем больше межгрупповая дисперсия d2, тем лучше проведена группировка (выделенные при группировки группы сильнее различаются между собой). Лучшей будет та группировка, у которой величина d2 больше (или e2 меньше).


2. Пользуясь теоремой сложения дисперсий, можно всегда по двум известным дисперсиям отыскать третью – неизвестную, а также судить о силе влияния группировочного признака.

В случае аналитической группировки, теорема о разложении дисперсии позволяет через межгрупповую дисперсию оценить влияние признака-фактора (х) на вариацию признака-результата (y) с помощью показателя – эмпирического корреляционного отношения (см. тему 4).

Основные вычислительные свойства дисперсии:

1. дисперсия постоянной величины равна 0;

2. если все варианты значений признака уменьшить на одно и то же число, то дисперсия не изменится;

3. если все варианты значений признака уменьшить в одно и то же число А раз (А-const), то дисперсия уменьшится в А2 раз.

Относительные показатели вариации применяют, если необходимо оценить интенсивность вариации, или сравнить вариацию признака в различных совокупностях, или сравнить вариацию различных признаков. Показатель относительной вариации рассчитывается как отношение абсолютного показателя вариации к среднему значению.

Самым распространенным относительным показателем рассеяния является коэффициент вариации. Он представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:

.

Коэффициент вариации используют также как характеристику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33%.

 







Date: 2015-05-19; view: 2766; Нарушение авторских прав



mydocx.ru - 2015-2024 year. (0.018 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию