Проверка статистических гипотез

⇐ ПредыдущаяСтр 3 из 4Следующая ⇒

Из принципа практической достоверности, изложенного в предыдущем пункте, немедленно вытекает принцип практической невозможности: события с очень малыми вероятностями можно в практических приложениях считать невозможными.

В качестве примера использования этого принципа напомним правило трех сигм.

Вероятность того, что абсолютное отклонение нормально распределенной случайной величины превзойдет ее стандарт σ не более, чем в три раза, равна 0,9973. Значит, вероятность отклонения, большего 3 σ, равна 0,0027. С практической точки зрения столь малой вероятностью можно пренебречь, что и приводит к правилу трех сигм.

Принципы практической достоверности и практической невозможности представляют собой, в сущности, одно и то же утверждение, примененное к противоположным событиям. Поэтому, вместо того чтобы говорить о практической достоверности некоторой доверительной оценки, можно говорить о практической невозможности отклонений, превышающих эту оценку. Если для нормально распределенной случайной величины в качестве доверительной вероятности взять 95%, то соответствующей доверительной оценкой абсолютного отклонения будет неравенство

Δξ ≤ 1,960.

Отклонения, большие чем 1,96 σ, нужно теперь считать практически невозможными. Разумеется, такая оценка более «рискована», чем правило трех сигм, поэтому ею можно пользоваться лишь при малом числе предстоящих испытаний (чаще всего при одном испытании).

Допустим теперь, что отклонения Δξ, большие, чем некоторое доверительное число, признаны нами практически невозможными. Этот вывод был, очевидно, сделан на основании некоторого теоретического распределения, которое, по тем или иным соображениям, мы считаем распределением величины ξ. Производя наблюдение, мы получим реальное значение отклонения Δξ. И может оказаться, что это реальное значение превосходит доверительную оценку. Теперь сделаем из этого вывод.

Первое, что может прийти на ум — это влияние случая. Ведь доверительная оценка не является абсолютно достоверной; возможно, здесь в первом же испытании сыграла роль та ничтожно малая (но существующая!) вероятность, которой мы пренебрегли в доверительной оценке. Однако при таком допущении пришлось бы отказаться от принципа практической достоверности, который уже в течение многих столетий надежно проверен человеческой практикой.

Поэтому более естественным будет второе предположение: несоответствие принятого нами теоретического распределения реальному распределению величины ξ. Это несоответствие может быть коренным (не тот тип распределения) или может быть связано с неправильным определением параметров распределения. Таким образом, принцип практической невозможности удается использовать в этом примере как один из критериев проверки гипотезы о распределении величины ξ.

Принцип практической невозможности может быть использован в самых различных задачах, где возникает необходимость проверять, случайно или неслучайно появилось то или иное событие. При этом всякий раз практическая невозможность события полностью отвергает случайность его появления, заставляя пересмотреть исходные предпосылки вычисления вероятности.

Эти рассуждения ясно вырисовывают разницу использования теории вероятностей для изучения предстоящих или уже осуществившихся событий. По отношению к предстоящим событиям главное – это надежное предвидение, поэтому здесь мы интересуемся лишь событиями с большими вероятностями. Из осуществившихся же событий нас интересуют в первую очередь события с малой вероятностью. Чем меньше расчетная вероятность уже осуществившегося события, тем больше его «неслучайность» и тем важнее эту «неслучайность» раскрыть. Событие как бы сильнее приковывает к себе внимание наблюдателя, становится для него более значимым.

Использование принципа практической невозможности для доказательства неслучайного появления события с малой вероятностью называется принципом значимости. Наибольшее значение вероятности, несовместимой со случайностью события, называется уровнем значимости. Иными словами, уровень значимости есть максимум таких вероятностей, при которых события можно считать практически невозможными. Но событие, противоположное практически невозможному, является практически достоверным. Поэтому принятые нами уровень значимости и уровень достоверности должны в сумме давать единицу.

Теперь можно дать более строгое определение значимости событий. Событие А называется значимым, если его вероятность Р(А) меньше, чем принятый уровень значимости. Чем выше уровень значимости, тем он «жестче», ибо тем большее число событий нельзя рассматривать как случайные. Уровень значимости — это как бы величина ячеек «сита», сквозь которое отсеиваются неслучайные события. Наиболее употребительны уровни значимости 0,05; 0,02; 0,01; реже 0,10 или 0,001. Чтобы лучше «почувствовать» уровень значимости, можно пользоваться аналогией между вероятностью и частотой, считая, что уровень значимости, выраженный в процентах, показывает, сколько раз в ста испытаниях мы рискуем ошибиться, объявив изучаемое событие неслучайным. Так, наиболее употребительный в данной книге 5%-ный уровень значимости допускает ошибку в пяти случаях из ста. Поскольку каждую проверку гипотезы можно считать одним испытанием, то такой уровень вполне допустим при единичных проверках.

Чаще всего принцип значимости применяется для проверки так называемых статистических гипотез. Эти гипотезы имеют самые различные формулировки, но, в конечном счете, являются гипотезами о распределении той или иной случайной величины. Проверка каждой такой гипотезы осуществляется следующим образом.

Выбирается уровень значимости р, ему соответствует доверительная вероятность 1 – р. По этой вероятности, используя гипотезу о распределении величины ξ, находят квантильные доверительные границы, как правило симметричные, т.е. ξ _р/2 и ξ _{1– р/2}. Числа ξ _р/2 и ξ _{1– р/2} называются критическими значениями гипотезы; значения х, меньшие, чем ξ _р/2, и большие, чем ξ _{1– р/2}, образуют критическую область гипотезы (рис. 3). Для многих широко используемых на практике распределений составлены таблицы критических значений при различных уровнях значимости.

Следующим этапом находят реальное значение ξ _о изучаемой случайной величины (обычно его вычисляют по выборке). Если найденное значение ξ _о попадает в критическую область, то, по нашей гипотезе оно является практически невозможным. Но так как оно все-таки появилось, то должна быть отвергнута гипотеза. Если же ξ _о попадает между ξ _р/2 и ξ _{1– р/2}, то гипотеза вполне допускает такое значение в качестве случайного (на данном уровне значимости); поэтому нет никаких оснований ее отвергать.

Мы видим, что первое суждение (гипотеза неверна) гораздо более категорично, чем второе (гипотеза не отвергается, но и не утверждается, что она верна). И это не удивительно — в обоих случаях для проверки гипотезы используется лишь одно значение ξ _о. Но если для опровержения гипотезы достаточно одного противоречащего примера, то доказать правильность гипотезы нельзя даже с помощью тысячи подтверждающих примеров — опровергающим может оказаться еще не найденный нами тысяча первый. Конечно, и подтверждающие примеры не бесполезны для научного познания, ибо каждый такой пример есть испытание, увеличивающее вероятность того, что гипотеза правильна.

Принимая решение по результатам проверки, мы можем допустить ошибку. Возможные ошибки различаются по своему характеру. Ошибка первого рода состоит в том, что отвергается гипотеза, которая на самом деле верна. Вероятность такой ошибки не выше уровня значимости, следовательно, достаточно мала. Ошибка второго рода состоит в том, что гипотеза принимается, а на самом деле она не верна. Вероятность ошибки второго рода зависит от характера проверяемой гипотезы, от способа проверки и от многих других причин, что сильно усложняет ее оценку. Ясно только, что эта вероятность тем меньше, чем «жестче» принятый уровень значимости, ибо при этом увеличивается число отвергаемых гипотез.

Одну и ту же статистическую гипотезу можно исследовать с помощью различных случайных величин. Каждый такой способ исследования называется критерием значимости. Для проверки гипотезы стараются из всех возможных критериев выбрать тот, у которого при заданном уровне значимости меньше вероятность ошибки второго рода.

⇐ Предыдущая 1 234 Следующая ⇒

Date: 2015-05-19; view: 960; Нарушение авторских прав

mydocx.ru - 2015-2026 year. (1.615 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию