Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Параметры распределения





 

Важнейшая задача математической статистики, решение которой позволило бы, в принципе, решить и все остальные задачи - это нахождение функции распределения наблюдаемой величины.

Нормальное распределение полностью определяется двумя параметрами (среднее и дисперсия). Если же нет уверенности в том, что генеральное распределение нормально, или же если такая уверенность есть, но нужно проконтролировать среднее или дисперсию, прибегают к дополнительным параметрам.

Первая группа параметров, непосредственно обобщающая понятие дисперсии – это моменты. Моментом непрерывной случайной величины ξ с плотностью распределения f(x) называется величина

Число k называется порядком момента; оно может принимать любое целое положительное значение. Нетрудно проверить, что момент первого порядка равен нулю, момент второго порядка есть дисперсия. Если дисперсия дает лишь общую оценку рассеяния значений случайной величины, то моменты дают уже более детальные сведения – они характеризуют крутизну, степень симметричности графика плотности распределения и т.п.

Для выборки с элементами х1, х2,…, хn моменты определяются формулой

­­­

 

моменты являются общими (интегральными) характеристиками распределения. Вторая группа параметров характеризует отдельные значения функции распределения. К ним в первую очередь относятся квантили.

Квантилем ξр распределения случайной величины ξ с функцией распределения F(x) называется решение уравнения

 

F(ξр)= р.

Иными словами, квантиль есть такое значение случайной величины ξ, что Р (ξ < ξр) = р.

Вероятность р, задаваемая в процентах, дает название соответствующему квантилю; например, ξ0,3 называется 30%-ным квантилем.

Квантили стандартного нормального распределения (т.е. распределения с параметрами а = 0, σ = 1) обозначаются через up; их легко найти непосредственно из таблиц. Квантиль vp общего нормального распределения с параметрами а и σ выражается через квантиль up стандартного распределения по формуле

 

υp = a + σ up (1)

 

Понятие квантиля используется не только для нормального, но и для большинства встречающихся распределений. Если известны два квантиля, ξр и ξq, то

 

;

 

На этом равенстве и основывается использование квантилей.

Некоторые часто встречающиеся квантили носят специальные названия. Так, квантили ξ1/4 и ξ3/4 называют квартилями, квантили ξ0,1, ξ0,2, …, ξ0,9децилями, квантили ξ0,01, ξ0,02, …, ξ0,99процентилями.

Наиболее важное значение имеет квантиль ξ1/2, называемый медианой распределения. Если изобразить график плотности распределения (рис.1.), то вертикальная прямая, проходящая через медиану, рассечет пополам площадь между графиком плотности и осью абсцисс (одна из таких половин на рис.1. заштрихована); площадь каждой половины равна ½.

 

 

Отметим, что медиана может не совпадать с математиче­ским ожиданием распределения. Если же распределение симметрично, то ξ1/2 = M ξ. Выше уже упоминалось, что распределение случайных ошибок симметрично. Поэтому при отсутствии систематических и грубых ошибок в качестве истинного результата можно брать как математическое ожидание, так и медиану распределения.

Квантили ξ р и ξ1-p называются симметричными. Для симметричного относительно нуля распределения всегда ξр=— ξ1-р.

Для конечнозначных и дискретных величин (а значит, и для выборок) понятие квантиля используется редко. Чаще других используется выборочная медиана, т. е. такое значе­ние, для которого эмпирическая функция распределения Fn(x) = ½. В силу ступенчатости графика Fn(x) подобных значений бесчисленное множество, поэтому понятие выбо­рочной медианы несколько уточняют. А именно, нужно все элементы выборки расположить в возрастающем по­рядке и в качестве медианы взять средний из них (т. е. такой, слева и справа от которого расположено одинако­вое число элементов). Если выборка имеет четный объем, то у нее два средних элемента и нужно брать их полусумму.

Выборочная медиана является состоятельной и несме­щенной оценкой генерального среднего, поэтому ее, так же как и выборочное среднее, можно брать в качестве прибли­жения к истинному результату. Помимо простоты вычисле­ния, у медианы есть еще одно преимущество перед выбороч­ным средним: при достаточно большом объеме выборки ее распределение как случайной величины близко к нор­мальному, независимо от того, какое распределение имеет генеральная совокупность. Эти преимущества, правда, пор­тит малая по сравнению с выборочным средним эффектив­ность медианы — ее дисперсия в полтора с лишним раза больше дисперсии среднего. Поэтому медиану редко ис­пользуют при обработке нормально распределенной сово­купности.

Третья группа параметров определяется только для вы­борок и служит главным образом для проверки однородности испытаний. Сюда относятся такие парамет­ры, как размах (или амплитуда) выборки — разность между наибольшим и наименьшим элементами выборки; наиболь­шее абсолютное отклонение, т. е. наибольшая по абсолют­ной величине разность между элементами и средним выбор­ки. Если в выборке многие элементы повторяются, то ис­пользуют понятие моды — элемента с наибольшим числом повторений.

Определенные в этом пункте параметры используются в различных разделах статистического анализа. Отметим еще одну их сторону, не менее важную, по крайней мере, для обработки наблюдений. Каждая серия наблюдений над одним объектом связана с очень большим цифровым материа­лом, куда относятся данные всех параллельных, контроль­ных наблюдений и т. д.; иными словами, эта серия несет в себе большое количество информации. И вся эта информа­ция существенна для оценки полученных результатов. Особенно важна такая информация, если сопоставляются и анализируются результаты, полученные в различных лабораториях, различными исследователями. Эти резуль­таты найдены на разных установках, с различной тщатель­ностью — не зная всех деталей, провести надежный анализ невозможно.

С результатами других исследователей экспериментатор знакомится главным образом по публикациям. Каких-нибудь 50-100 лет назад экспериментаторов было немного, и они могли в публикациях подробно описывать все прибо­ры, методику, качество работы. Однако со временем число публикаций настолько возросло (подсчитано, что этот рост имеет экспоненциальный характер), что их размеры при­шлось резко сокращать; этот процесс продолжается и сей­час. Нет возможности опубликовывать не только описа­ния, но даже все цифровые данные, полученные при наблюдениях. Все настоятельней стала необходимость сверты­вать информацию, причем для свертывания нужны такие показатели, которые самым наглядным и компактным об­разом характеризовали бы не только результаты, но и ка­чество исследования.

Наилучшим в этом отношении показателем является дис­персия (или среднее квадратичное отклонение), которую и нужно обязательно указывать наряду с результатами исследования. Простое сравнение дисперсий позволяет находить лучший метод исследования, выделять в изучае­мом процессе наиболее сильно действующие факторы, выяснять неслучайность тех или иных событий и многое другое.

Если есть возможность, желательно указывать и неко­торые другие параметры, что еще лучше охарактеризует полученный результат. Особенно важны такие сведения, если распределение генеральной совокупности не является нормальным.

 

Date: 2015-05-19; view: 1025; Нарушение авторских прав; Помощь в написании работы --> СЮДА...



mydocx.ru - 2015-2024 year. (0.007 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию