Полезное:
Как сделать разговор полезным и приятным
Как сделать объемную звезду своими руками
Как сделать то, что делать не хочется?
Как сделать погремушку
Как сделать так чтобы женщины сами знакомились с вами
Как сделать идею коммерческой
Как сделать хорошую растяжку ног?
Как сделать наш разум здоровым?
Как сделать, чтобы люди обманывали меньше
Вопрос 4. Как сделать так, чтобы вас уважали и ценили?
Как сделать лучше себе и другим людям
Как сделать свидание интересным?
Категории:
АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника
|
Лекция 9 Элементы математической статистики
(Раздел 6) План лекции Генеральная совокупность и выборка. Сущность выборочного метода. Дискретные и интервальные вариационные ряды. Полигон и гистограмма. Числовые характеристики выборки. Понятие точечной оценки Точечная оценка для генеральной средней, генеральной дисперсии, генерального среднеквадратического отклонения. Понятие интервальной оценки. Надежность доверительного интервала. Интервальная оценка математического ожидания нормального распределения при известной дисперсии. Интервальная оценка математического ожидания нормального распределения при неизвестной дисперсии. Интервальная оценка математического ожидания нормального распределения при неизвестной дисперсии. Точечная оценка вероятности события. Интервальная оценка вероятности события. Математическая (или теоретическая) статистика опирается на методы и понятия теории вероятностей, но решает в каком-то смысле обратные задачи. В теории вероятностей рассматриваются случайные величины с заданным распределением или случайные эксперименты, свойства которых целиком известны. Предмет теории вероятностей – свойства и взаимосвязи этих величин (распределений). Но часто эксперимент представляет собой черный ящик, выдающий лишь некие результаты, по которым требуется сделать вывод о свойствах самого эксперимента. Наблюдатель имеет набор числовых (или их можно сделать числовыми) результатов, полученных повторением одного и того же случайного эксперимента в одинаковых условиях. При этом возникают, например, следующие вопросы: Если мы наблюдаем одну случайную величину – как по набору ее значений в нескольких опытах сделать как можно более точный вывод о ее распределении? Если мы наблюдаем одновременно проявление двух (или более) признаков, т.е. имеем набор значений нескольких случайных величин — что можно сказать об их зависимости? Есть она или нет? А если есть, то какова эта зависимость? Часто бывает возможно высказать некие предположения о распределении, спрятанном в “черном ящике”, или о его свойствах. В этом случае по опытным данным требуется подтвердить или опровергнуть эти предположения (“гипотезы”). При этом надо помнить, что ответ “да” или “нет” может быть дан лишь с определенной степенью достоверности, и чем дольше мы можем продолжать эксперимент, тем точнее могут быть выводы. Наиболее благоприятной для исследования оказывается ситуация, когда можно уверенно утверждать о некоторых свойствах наблюдаемого эксперимента – например, о наличии функциональной зависимости между наблюдаемыми величинами, о нормальности распределения, о его симметричности, о наличии у распределения плотности или о его дискретном характере, и т.д. Итак, о (математической) статистике имеет смысл вспоминать, если · имеется случайный эксперимент, свойства которого частично или полностью неизвестны, · мы умеем воспроизводить этот эксперимент в одних и тех же условиях некоторое (а лучше – какое угодно) число раз. Примером такой серии экспериментов может служить социологический опрос, набор экономических показателей или, наконец, последовательность гербов и решек при тысячекратном подбрасывании монеты. Математической статистикой называется раздел прикладной математики, изучающий методы сбора, обработки и анализа экспериментальных данных. Предметом исследования в математической статистике является совокупность объектов, однородных относительно некоторых признаков. Например, мальчики 10 лет г. Уссурийска; пловцы-мастера спорта России. Совокупность из всех объектов, объединенных этими признаками, называется генеральной. Задачей исследования является изучение признаков генеральной совокупности, которые определяются влиянием некоторых случайных факторов. Например, изучение физической подготовленности мальчиков 10 лет г. Уссурийска. Для решения задач исследования проводится эксперимент (измерение, тестирование, анкетирование), в результате которого получают значение некоторой случайной величины (результаты тестирования, количество баллов). Если в эксперименте участвуют все объекты генеральной совокупности, то такое обследование называют сплошным. На практике обычно применяют выборочный метод, который заключается в том, что из генеральной совокупности случайным образом извлекают n элементов. Эти элементы называются выборочной совокупностью или выборкой. Количество элементов в выборке называется ее объемом. Исследователь изучает и анализирует выборочную совокупность и на основании полученных показателей делает вывод о параметрах генеральной совокупности. Допустим, из генеральной совокупности извлечена выборка объемом n, измерена некоторая величина Х, в результате чего получен ряд значений х1, х2,... хn. Этот ряд называется простым статистическим рядом. Полученная в результате статистического наблюдения выборка из n значений (вариант) изучаемого количественного признака X образует вариационный ряд. Ранжированный вариационный ряд получают, расположив варианты xj, где Изучаемый признак X может быть дискретным, то есть его значения отличаются на конечную, заранее известную величину (год рождения, тарифный разряд, число людей), или непрерывным, то есть его значения отличаются на сколь угодно малую величину (время, вес, объем, стоимость). Частотой mi в случае дискретного признака X называют число одинаковых вариант xi, содержащихся в выборке. В ранжированном вариационном ряду одинаковые варианты очевидно расположены подряд:
Вариационный ряд для дискретного признака X принято наглядно и компактно представлять в виде таблицы, в первой строке которой указаны k различных значений xi изучаемого признака, а во второй строке – соответствующие этим значениям частоты mi, где Переход от исходного вариационного ряда дискретного признака X к соответствующему статистическому распределению поясним на простом примере: - вариационный ряд, полученный в результате статистического наблюдения (единицы измерения опускаем) – 7, 17, 14, 17, 10, 7, 7, 14, 7, 14; - ранжированный вариационный ряд – xj: - соответствующее статистическое распределение (
Статистическое распределение для непрерывного признака X принято представлять интервальным рядом – таблицей, в первой строке которой указаны k интервалов значений изучаемого признака X вида(xi –1 – xi ), а во второй строке – соответствующие этим интервалам частоты mi , где Для непрерывного признака X частота mi – число различных xj, попавших в соответствующий интервал: xj Î[ xi– 1 ; xi ):
Переход от исходного вариационного ряда непрерывного признака X к соответствующему статистическому распределению поясним на простом примере: - вариационный ряд, полученный в результате статистического наблюдения (единицы измерения опускаем) –3,14; 1,41; 2,87; 3,62; 2,71; 3,95; - ранжированный вариационный ряд – - соответствующее статистическое распределение (
Если число различных значений дискретного признака очень велико, то для удобства дальнейших вычислений и наглядности статистическое распределение такого дискретного признака также может быть представлено в виде интервального ряда. Вместо частот mi во второй строке могут быть указаны относительные частоты
Далее показаны четыре возможных формы представления статистических распределений с соответствующими краткими названиями:
Если в статистическом распределении вместо частот (относительных частот) указать накопленные частоты (относительные накопленные частоты), то такой ряд распределения называют кумулятивным. Накопленной частотой называется число значений признака Х, меньших заданного значения x: H (x) = m (Х < x), то есть, число вариант xj в выборке, отвечающих условию xj < x. Переход от дискретного ряда частот к кумулятивному ряду – дискретному ряду накопленных частот задается соотношениями:
или в табличной форме:
Переход от интервального ряда частот к кумулятивному ряду – интервальному ряду накопленных частот задается соотношениями:
или в табличной форме:
Накопленной относительной частотой (накопленной частостью) называется отношение числа значений признака Х, меньших заданного значения x, к объему выборки n: По аналогии с теоретической функцией распределения генеральной совокупности Из теоремы Бернулли следует, что
поэтому эмпирическую функцию распределения можно использовать для оценки теоретической функции распределения генеральной совокупности. Дискретный ряд накопленных относительных частот может быть получен двумя равноправными способами: 1) переход от дискретного ряда частостей к кумулятивному ряду – дискретному ряду накопленных частостей задается соотношениями:
или в табличной форме:
2) переход от дискретного ряда накопленных частот к дискретному ряду накопленных частостей задается соотношением:
Интервальный ряд накопленных относительных частот может быть получен двумя равноправными способами: 1) переход от интервального ряда частостей к кумулятивному ряду – интервальному ряду накопленных частостей задается соотношениями:
или в табличной форме:
2) переход от интервального ряда накопленных частот к интервальному ряду накопленных частостей задается соотношением:
Для наглядности принято использовать следующие формы графического представления статистических распределений: · дискретный ряд изображают в виде полигона. Полигон частот – ломаная линия, отрезки которой соединяют точки с координатами ( · интервальный ряд изображают в виде гистограммы. Гистограмма частот есть ступенчатая фигура, состоящая из прямоугольников, основания которых – интервалы длиной Площадь гистограммы есть сумма площадей ее прямоугольников:
таким образом, площадь гистограммы частот В теории вероятностей гистограмме относительных частот соответствует график плотности распределения вероятностей · кумулятивные ряды графически изображают в виде кумуляты. Для ее построения на оси абсцисс откладывают варианты признака или интервалы, а на оси ординат – накопленные частоты Н ( Замечание 1. Если в статистическом исследовании исходным является статистическое распределение в виде интервального ряда (сгруппированные данные), а исходный вариационный ряд недоступен, то точное расположение отдельных вариант, попавших в каждый из интервалов неизвестно. Только выбирая в качестве аргумента эмпирической функции распределения правую границу интервала (xi –1 –xi), мы уверены, что все варианты, попавшие в этот интервал, будут учтены (просуммированы) в значении накопленной частоты (накопленной относительной частоты), соответствующей этому интервалу. Поэтому в случае интервального ряда значения Замечание 2. В случае дискретного ряда использовать кумуляту для изображения Пример 1. Имеется распределение 80 предприятий по числу работающих на них (чел.):
Решение. Признак Х – число работающих (чел.) на предприятии. В данной задаче признак Х является дискретным. Поскольку различных значений признака сравнительно немного – k = 7, применять интервальный ряд для представления статистического распределения нецелесообразно (в прикладной статистике в подобных задачах часто используют именно интервальный ряд). Ряд распределения – дискретный. Построим полигон распределения частот
Пример 2. Дано распределение 100 рабочих по затратам времени на обработку одной детали (мин):
Решение. Признак Х – затраты времени на обработку одной детали (мин). Признак Х – непрерывный, ряд распределения – интервальный. Построим гистограмму частот, предварительно определив
Пример 3. В распределении, данном в примере 1, найти накопленные частоты H ( Решение. Используем: H (x 1) = 0, H (xi) = H (xi –1) + mi –1 (i= 2,3,¼, k+ 1, k = 7).
На рис. 3 показана кумулята распределения предприятий по числу работающих (чел.).
Пример 4. В распределении, данном в примере 2, составить эмпирическую функцию распределения и построить кумуляту относительных частот. Решение. Используем: H (x 0) = 0, H (xi) = H (xi –1) + mi (i= 1,2,¼, k, k = 6).
Построим кумуляту распределения
Для описания основных свойств статистических распределений чаще всего используют выборочные характеристики следующих двух видов: 1) средние;
2) характеристики вариации (рассеяния).
Замечание. Если исходный вариационный ряд недоступен, приведенные выше формулы вычисления выборочных характеристик, применимые только к дискретному ряду, могут быть использованы для приближенного вычисления выборочных характеристик непрерывного признака, представленного интервальным рядом. Для этого предварительно каждый интервал xi –1 –xi заменяется его серединой Пример 5. Найти числовые характеристики распределения предприятий по числу работающих (пример 1). Решение. Признак Х – число работающих (чел.) на предприятии. Для расчета характеристик данного распределения удобнее использовать таблицу:
Легко убедиться, что в случае дискретного признака Х в ранжированном вариационном ряду xj = xi при Н (хi) + 1 £ j £ Н (хi +1). Для рассматриваемого примера: xj = 450 при 12£ j £ 41. Объем выборки n = 80 – число четное. Пусть n = 2 j, тогда j = 40. Поэтому:
Частота достигает максимума: mi = m max = 30 при xi = 450, поэтому: х мо = 450 (чел.). Очевидно х мo= х ме¹ R = х max – х min = 750 – 150 = 600 (чел.). Дисперсию рассчитываем двумя способами. 1) 2)
На практике считают, что если Пример 6. Найти числовые характеристики распределения затрат времени на обработку одной детали (пример 2). Решение. Признак Х – затраты времени на обработку одной детали (мин) – непрерывный. Распределение задано интервальным рядом. Характеристики такого ряда находят по тем же формулам, что и для дискретного ряда, предварительно заменив интервальный ряд дискретным. Для этого каждый интервал xi –1 –xi заменяется его серединой
Легко убедиться, что в случае дискретного признака Х в ранжированном вариационном ряду xj = Объем выборки n = 100 – число четное. Пусть n = 2 j, тогда j = 50. Поэтому:
Частота достигает максимума: mi = m max = 40 при xi = 29, поэтому: х мо = 29 (мин). Очевидно х мo = х ме ¹ R = х max – х min = 34 – 22 = 12 (мин). Дисперсию рассчитываем двумя способами. 1) 2)
Date: 2016-07-18; view: 589; Нарушение авторских прав |