![]() Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
![]() Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
![]() |
Раздел II. Расчет основных характеристик выборки
2.1. Характеристики, отражающие «центростремительные» тенденции.
Первая статистическая характеристика – это средняя арифметическая взвешенная, затем мода и медиана. Все характеристики рассчитываются по вариационному ряду. Приведем его несколько в ином виде.
Вариационный ряд по диаметру (частоты и частости). Таблица 3.
Формула для расчета средней арифметической взвешенной (1)
где: Другой расчет для определения средней основан на вероятностной природе выборки. Частости являются долями присутствия значений признака в общем объеме выборки, т.е. частями от общего объема, а значения отражают вероятность исхода испытания для значения признака (классовой варианты), связанного с этой частостью. Поскольку сумма частостей составляет полную группу событий, то среднее значение можно получить исходя из формулы (1)
Читается эта формула так: среднее значение случайной величины равно сумме произведений всех ее возможных значений на их вероятности. Модой (Mo) называют варианту, которая имеет наибольшую частоту. В нашем примере она равна 16. В случае равных интервалов ее значение определяют по классовой варианте. Однако, в силу того, что в границах модального интервала имеет место разброс значений признака, а также сама частота интервала случайна и связана с частотами соседних классов, точное значение Mo рассчитывают по формуле:
где: Xo – нижняя граница модального класса, K – величина интервала,
Медианой (Me) называют варианту, которая делит вариационный ряд на две части, равные по числу вариант. То есть в обе стороны от медианы находятся равные количества частот. Медиану вариационного ряда находят следующим образом:
где:
Отношение между средней арифметической, модой и медианой выражается формулой: (4)
(5)
Эти формулы справедливы для достаточно симметричных вариационных рядов. Необходимым условием симметричности ВР является равенство: (6)
Нарушение приведенных соотношений свидетельствует о неравномерном распределении частот ВР относительно Для распределений с правосторонней асимметрией справедливо неравенство:
2.2. Характеристики изменчивости признака.
При построении ВР была использована разность между максимальной и минимальной величинами признака ( Следующей рассчитываемой в работе характеристикой изменчивости является дисперсия. По определению – это средний квадрат отклонений от средней величины. Формула для ВР: (7)
где:
Если из значения дисперсии извлечь корень, то получается ещё одна характеристика изменчивости, которая называется средним квадратическим отклонением:
(8)
Дисперсию и, следовательно, среднеквадратическое отклонение можно вычислить также и по формуле: (9)
где:
Размерность среднеквадратического отклонения такая же, как в исходных данных.
Перечисленные характеристики изменчивости признака – величины именованные. Это не всегда удобно, особенно, когда нужно сравнивать выборки с различной размерностью признака. Поэтому используется относительный показатель изменчивости, который называется коэффициентом вариации: (10)
При величине коэффициента вариации примерно до 33% распределение можно считать достаточно однородным. Естественно, чем меньше V, тем совокупность однороднее. При V>50% использование этого коэффициента бессмысленно. Во всех случаях среднеквадратическое отклонение является более надежной оценкой изменчивости. Еще один показатель изменчивости ряда распределения, тоже относительный, - нормированное отклонение: (11) Нормированное отклонение производит оценку отклонения любой варианты от среднего значения ряда в размерности 𝔖. С помощью нормированного отклонения можно оценить положение каждой варианты в ряду распределения. Действительно, из формулы следует, что каждая варианта (xi) связана с определенным значением t, которое указывает ее положение в ВР и на кривой распределения. В нашем примере, если пересчитать значения классовых интервалов в долях 𝔖, получим следующие t-распределение.
Таблица 4. t -распределение диаметров по эмпирическим данным.
Это распределение показывает, что деревья с диаметром
2.3. Оценка формы эмпирического распределения.
Выборки, особенно малочисленные (<30ед.), как правило, по форме кривой распределения значительно отличаются от теоретической кривой нормального распределения. Несимметричность эмпирического распределения можно оценить по характеру распределения частот в классах ВР. Графически она видна по форме полигона и гистограммы распределений. Количественная ее мера рассчитывается через специальные характеристики: асимметрия и эксцесс. Асимметрия рассчитывается по формуле: (12)
Если коэффициент равен нулю – ряд симметричен. Отрицательное значение As указывает не левостороннюю асимметрию, когда относительно модального класса левая часть кривой больше вытянута чем правая. Наоборот, когда более вытянута правая часть кривой распределения, говорят о правосторонней асимметрии. Коэффициент асимметрии не имеет ни верхней, ни нижней границы. Однако, на практике для умеренно асимметричных рядов он редко бывает больше единицы. Коэффициент эксцесса характеризует форму вершины эмпирического распределения, он рассчитывается по формуле: (13)
Положительное значение коэффициента эксцесса указывает на островершинность распределения. В этом случае классы с большими частотами группируются вокруг модального класса. Такого рода эксцесс называется положительным, а его коэффициент имеет знак «+». Положительный эксцесс не ограничен верхним пределом, но степень его соответствия нормальному распределению будет показана ниже. Отрицательное значение эксцесса указывает на плосковершинность распределения, имеет отрицательное значение, предельная величина которого равна – 2. В заключение раздела приведем сводную таблицу, по которой удобно рассчитывать почти все приведенные выше статистические характеристики выборочной совокупности.
Таблица 14. Сводная таблица расчетов основных характеристик вариационного ряда.
По данным колонок 6, 7, 8 рассчитывают соответственно дисперсию (𝔖2), асимметрию (As) и эксцесс (E) по формулам, приведенным в разделе.
В такой же последовательности строят ВР по высоте.
Таблица 2. Вариационный ряд по высоте.
2.4. Ошибки выборочных характеристик и оценка параметров генеральной совокупности.
Рассчитанные в предыдущем разделе характеристики выборочной совокупности называются точечными. Это название используется для разделения оценок выборочной и генеральной совокупностей. Точечная оценка (характеристика) выборки ( Для интервальной оценки параметров генеральной совокупности необходим предварительный расчет ошибок характеристик выборочной совокупности. Эти ошибки называются ошибками выборочности, чем подчеркивается зависимость их величин от размера выборки. Зависимость – обратная: чем больше объем выборки, тем меньше ее ошибка относительно величины аналогичного генерального параметра. Для средней арифметической выборки ошибка выборочности равна: (14) где:
Выборочная ошибка среднеквадратического отклонения, т.е. оценка аналогичного параметра генеральной совокупности рассчитывается по формуле: (15)
Ошибка коэффициента вариации
Ошибка асимметрии
Ошибка коэффициента эксцесс
Перечисленные ошибки зависят от объема совокупности, по которой они рассчитываются. Отсюда следует, что они обладают вероятностной природой. Значит, говорить о точности статистических оценок можно только с учетом вероятности распределения частот на графике-полигоне (гистограмме), строго говоря, на графике плотности распределения вероятности. Нормированная кривая распределения приведена на рисунке 5. Ось абсцисс представлена собственно тремя осями: первая – ось значений признака, вторая – ось значений признака, пересчитанных в 𝔖 - мах, третья – ось значений признака, пересчитанная в долях нормированных отклонениях. --граффик.
Ось Х соответствует значениям таблицы ВР. Особенностью нормального распределения является закономерность распределения частостей по диапазонам 𝔖 или t. Для нормального распределения всегда в диапазоне –𝔖 - +𝔖 лежит 68,3% вариант общего объёма значений признака, от –2𝔖 до 2𝔖- 95,5%, от -3𝔖 до 3𝔖 - 99,7% всех вариант совокупности.
Таким образом, единицу нормированного отклонения 𝔖, так же как и t, можно свзять с вероятностью значений признака. Это следует также из формулы нормированного отклонения, записанной в таком виде: (19)
После преобразования получим: (20)
Это и есть доверительный интервал, в котором будет находится значение средней величины любой выборки с вероятностью, определяемой величиной t. При t=1,00 мы будем иметь 68% вероятность, при t=1,96(2,0) – вероятность равна 95,5%, при t=3 диапазон возможных значений средней величины перекрывает 99,7% всех возможных значений. Это неравенство справедливо и в том случае, если речь идет о генеральной средней µ. Приведенные формулы касаются только одного параметра – среднего значения. Но вся логика оценки не меняется относительно других параметров генеральной совокупности, кроме, пожалуй, асимметрии и эксцесса. Дело в том, что значение генерального параметра для этих показателей известно – они равны нулю. Тогда формула этих показателей принимает несколько иной вид: (21)
(22)
Полученное значение t сравнивают с табличным (приложение №2). Если оно меньше табличного, нет оснований считать, что полученное значение коэффициента существенно отличается от генерального параметра. Наоборот, если t > табличного значения, значит различие рассчитанного на выборке параметра существенно отличается от параметра генеральной совокупности, а следовательно обусловлено неслучайными воздействиями. Результаты оценки параметров в генеральной совокупности нужно свести в таблицу вида:
Таблица 15. Интервальная оценка параметров генеральной совокупности.
Полученные результаты по интервальной оценке необходимо сопроводить соответствующими комментариями. Используемый в таблице 15 показатель точности рассчитывается по формуле
По величине этого показателя судят о степени отклонения выборочной характеристики от генерального параметра. Показатель точности считается приемлемым, если он лежит в пределах 5%.
4. Оценка соответствия эмпирического распределения теоретическому.
Оценка полученных рядов распределения по диаметру и по высоте с точки зрения их соответствия теоретическому распределению производится по так называемым критериям согласия. В контрольной работе используются два из них: критерий Колмогорова λ(лямбда) и критерий Пирсона Первый критерий относительно прост, не требует использования характеристик выборочной совокупности и поэтому называется непараметрическим.
Расчет теоретических частот нормального распределения Таблица 16.
(1) В формуле: k – величина интервала. ƒ(ί) – из колонки 5.
Критерий λ рассчитывается по формуле: (23)
где: D – максимальная разность между эмперическими и теоретическими накопленными частотами в ВР.
Таблица 17. Расчет критерия λ.
В шестой колонке находят класс, в котором разница между накопленными частотами максимальна. Подставляют его в формулу 23 и получают соответствующее значение λ. Разница между накопленными эмпирическими и теоретическими частотами оцениваются по трем уровням доверительной вероятности: Расхождение частот признаются случайными, а следовательно, соответствующим теоретической частоте, если значение λ не превосходит своего критического значения при принятом уровне доверительной вероятности (таблица №4 приложений). Критерий χ 2 аналогичен по структуре формуле дисперсии. То есть χ 2 – это относительная сумма квадратов отклонений эмпирических частот от теоретических: (24)
где:
Смысл оценки состоит в том, что чем в меньшей степени эмпирические частоты отклоняются от теоретических, тем с большей вероятностью можно говорить о степени соответствия эмпирического распределения теоретическому. Таблица 18. Date: 2015-10-19; view: 850; Нарушение авторских прав |