Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Для випадку з відомим СКВ генеральних сукупностей





Відомі σx і σy величин X і Y. Висуваємо гіпотезу H0: vх=vy при альтернативній H1: vх ≠ vy. Необхідно визначити, чи істотна розбіж­ність між середніми і , отриманими відповідно з вибірки обся­гом п1 для випадкової величини Хі обсягом п2 для випадкової вели­чини Y.

Позначимо

Розглянемо різницю и як параметр Z, тобто у вигляді нормованої різниці

де а при висунутій гіпотезі

Величини Хі Y — незалежні величини, для яких тому можна записати

(2.7)

Для перевірки правильності гіпотези використовують двобічну критичну область. З урахуванням виразу (16.1) значення статистич­ної характеристики

Значення z порівнюють із критичним значенням Якщо приймають гіпотезу Н0.

Для випадку з невідомими СКВ генеральних сукупностей. У цьому разі визначають емпіричне значення s і використовують статистичну характеристику

розподілену за законом Стьюдента.

Відомо, що для незалежних випадкових величин

За умови, що вибірки взято з однієї генеральної сукупності, тобто можна записати

або

(2.8)

Зважаючи на те, що вибірки взято з однієї генеральної сукупності, доцільно скористатися всіма наявними експериментальними даними, тобто розглядати вибірку обсягом п1 + п2. Це дає змогу підвищити статистичну надійність знайденої оцінки СКВ генеральної сукупності. Тоді

(2.9)

Виходячи з виразу для дисперсії, можна записати:

Аналогічно маємо:

Підставляють отримані значення сум у вираз (2.9) і дістають:

(2.10)

Підставляють вираз (2.10) у вираз (2.8) і отримують

(2.11)

З урахуванням виразу (2.11) розрахункове значення коефіцієнта Стьюдента буде

Для перевірки гіпотези необхідно знайти критичне значення ко­ефіцієнта Стьюдента tкр Для заданого рівня статистичної значущості α і кількості ступенів свободи п1 + п2.- 2. Якщо розрахункове зна­чення |tр| ≤ tкр, приймають нульову гіпотезу.

У випадку, коли вибірки взято не з однієї генеральної сукупності, тобто для визначення суттєвості розбіжності обчислених середніх і коефіцієнт Стьюдента обчислюють за формулою:

Обчислене значення порівнюють із критичним значенням коефіцієнта Стьюдента, яке залежно від α і кількості ступенів свободи обчислюють за формулою

де

Порівняння двох дисперсій. Другою важливою ознакою, за якою можуть порівнюватися дві сукупності, є дисперсії в кожній із них. Гіпотези про дисперсії відіграють важливу роль у техніці, оскільки са­ме дисперсія характеризує такі важливі конструкторські й технологічні показники, як точність приладу, похибку результату, точність техноло­гічного процесу тощо.

При спільній обробці результатів необхідно, насамперед, пере­конатися в тому, що умови проведення дослідів, при яких отримані результати, були однаковими. З цією метою можна використати оцінку розбіжності дисперсій.

F-критерій (розподіл Фішера). Припустимо, що задано дві генеральні сукупності X та Y з нормальним розподілом X N (µ1, σ1) і Y N (µ2, σ2). Із цих генеральних сукупностей зроблено незалежні вибірки з параметрами відповідно п1, , п2, . Потрібно при рівні значущості α перевірити гіпотезу при альтернативній гіпотезі.

Математик-статистик Р. Фішер установив, що відношення незсунених оцінок двох дисперсій підпорядковується закономірності, що залежить від кількості ступенів свободи цих дисперсій. Припускаючи, що , приймають як статистику величину F, котра задовольняє F-розподіл, для якого з кількістю ступенів свободи, що дорівнює п1 – 1 і п2 – 1 відповідно.

Критична область буде тільки правобічна і визначається умовою.

Значення знаходять із таблиць F-розподілу, яке залежить від трьох величин: рівня значущості α і двох чисел, якими виражаються ступені свободи . Таблиці складені окремо для кожного значення α (тривимірні таблиці). Задаючись рівнем статистичної значущості α, вибравши в таблиці колонку і рядок , на їх перетині знаходять критичне значення коефіцієнта .

Якщо можна стверджувати на підставі наявних експериментальних даних, що при рівні статистичної значущості а вибіркові дисперсії будуть однорідні.

Іноді перед обробкою даних необхідно переконатися в однорідності дисперсій, отриманих на підставі даних двох експериментальних ви­бірок. У цьому випадку також використовується критерій Фішера.

Відмінністю є те, що альтернативна гіпотеза . Для пе­ревірки гіпотези використовують двобічну критичну область (рис. 2.8), тобто передбачається, що ймовірність того, що розрахункове значення буде меншим за критичне значення або більшим за не перевищує значення


Оскільки в таблиці є тільки значення , то значення можна знайти безпосередньо з таблиць.

Рис. 2.8

 

Для визначення , яке відповідає умові , вводять коефіцієнт

Тоді

Останнє співвідношення показує, що можна знайти виходячи з умови . Надалі перевірка залишається такою самою, як і для однобічної критичної області, тобто нуль-гіпотеза, приймається в тому випадку, коли розрахункові значення містяться між критичними й .

Перевірка гіпотези про однорідність ряду дисперсій. (G- критерій). Якщо потрібно побудувати аналітичну залежність (аналітичну модель) на основі експериментальних даних, то на­самперед необхідно переконатися в однорідності вибіркових дис­персій. Для цього серед наявних вибіркових дисперсій вибирають максимальну, а потім розглядають відношення максимальної ди­сперсії до суми всіх вибіркових дисперсій. Для випадку, коли об­сяги вибірок однакові, тобто в кожній вибірці дисперсія обчис­лювалася на підставі однакової кількості даних m, застосовують G-критерій (критерій Кохрена). Статистика G вказує, яку частку має максимальна дисперсія в загальній дисперсії, і обчислюється за формулою:

де — дисперсія для кожної i-ї вибірки, і=1,

Висувають гіпотезу Н0: дисперсії однорідні. Для перевірки ну­льової гіпотези знайдене розрахункове значення Gр порівнюють із критичним значенням коефіцієнта Gкр, яке знаходять із таб­лиць критичних значень G-критерію на перетині стовпця та рядка для заданого рівня статистичної зна­чущості α.

Якщо на підставі наявних даних можна стверджувати, що вибіркові дисперсії будуть однорідні, тобто гіпотеза Н0 приймається.

Якщо гіпотеза про рівність дисперсій відхиляється, то збільшують обсяг вибірок і знову перевіряють гіпотезу. Якщо ж гіпотеза знову не підтверджується, такі вибіркові дані спільно обробляти не можна

 

Питання для самоперевірки

1. Що називається параметричним критерієм?

2. Записати критерій перевірки гіпотези про рівність двох серед­ніх із відомим СКВ.

3. Записати критерій перевірки гіпотези про рівність двох серед­ніх з невідомим СКВ.

4. За яким критерієм перевіряють гіпотези про рівність дисперсій двох вибірок?

5. Як перевіряють гіпотези про рівність дисперсій двох вибірок при правобічній критичній області?

6. Як перевіряють гіпотези про рівність дисперсій двох вибірок при двобічній критичній області?

7. За яким критерієм та як перевіряють гіпотези про рівність дис­персій кількох вибірок?

8. Як користуватися таблицями F-розподілу та G-розподілу?

 

 

2.4 Критерії згоди

 

Критерії згоди використовують для перевірки узгодженості на­явних експериментальних да­них з теоретичним законом, що припускається.

Розглянуті раніше методи пере­вірки гіпотез припускали, що фун­кціональна форма закону розподі­лу відома, й визначалися лише значення параметрів цього закону.

Однак у деяких випадках сам вид закону розподілу потребує статистичної перевірки. Раніше було розглянуто, як, зіставляючи ймовірності потрапляння значень в інтервали з відповідними частостями, отриманими зі спостережень, або проводячи графічне по­рівняння полігонів і гістограм із кривою розподілу, можна скласти первинне уявлення про близькість теоретичного та емпіричного розподілів.


Постає питання про критерії перевірки гіпотези про те, що вели­чина X відповідає конкретному закону розподілу зі щільністю ймо­вірності р(х).

Подібні критерії зазвичай називають критеріями згоди (відповідності). Вони грунтуються на виборі певної міри розбіжності між теоретичним та емпіричним розподілами. Якщо така міра розбіжності для розглянутого випадку перевищує встановлену межу, гіпотеза відхиляється й навпаки.

Таким чином, перевірити таку гіпотезу — означає переконатися в тому, що наявні дані справді взято з генеральної сукупності, яка має передбачуваний закон розподілу.

Розглянемо застосування одного з найбільш уживаних критеріїв χ2-критерію Пірсона.

Критерій χ2 припускає, що наявні експериментальні дані розбивають на l елементарних інтервалів, кожний з яких містить не менш ніж 8—10 значень. За відомим правилом будують гістограму, за видом якої, якщо немає додаткових джерел, можна зробити припущення про можливий закон розподілу. Підбирають закон розподілу, якому щонайбільше відповідають наявні дані.

Для кожного елементарного інтервалу можна визначити , — кількість значень, що потрапили в і- й інтервал, l = 1,...,l.

Висувають гіпотезу Н0: емпіричний розподіл належить до передбачуваного теоретичного. Для того щоб перевірити висунуту гіпотезу, необхідно оцінити розбіжності між емпіричною , і теоретичною тi кількістю потраплянь за елементарний інтервал за припущення, що випадкова величина X має передбачуваний закон розподілу.

Установлено, що величина

(2.12)

розподілена нормально з нульовим математичним сподіванням і одиничною дисперсією. Відомо, що сума квадратів нормованих но­рмально розподілених величин підпорядковується χ2-розподілу Пірсона:

Виходячи з виразу (2.12) можна обчислити розрахункове значення χ2

(2.13)

Вираз (2.13) використовують як статистику для перевірки гіпоте­зи про передбачуваний закон розподілу.

Для знаходження теоретичної кількості потраплянь ті розглянемо співвідношення і запишемо його як .

Відношення є частотою (частістю) потрапляння результатів у i -й елементарний інтервал. Відомо, що при збільшенні загальної кіль­кості спостережень п частота наближається до теоретичної ймовірності pі потрапляння випадкової величини в і-й елементарний інтервал при передбачуваному законі розподілу. Виходячи із цього, можна записати:

Пам'ятаючи про те, що границею, до якої прямуватиме при збільшенні п, є теоретичне значення ті кількості потраплянь в ін­тервал, можна записати ті = прі.

Таким чином, можна обчислити теоретичні значення ті, а потім знайти різницю —ті, що характеризує розбіжність кількості по­траплянь у кожний і- й інтервал.

Потрапляння результатів в і- й інтервал характеризується біноміальним законом розподілу, для якого


Для знаходження рі, необхідно користуватися співвідношенням

де хі й хі+1 — кінці інтервалу, а р(х) наприклад, для нормального за­кону має вигляд:

У випадку, коли Мх і σ невідомі, необхідно обчислити їхні оцінки і s на підставі дослідних даних і увести їх у вираз для за­кону розподілу. Так, для нормального закону оцінка щільності ймовірності

Оскільки на підставі тих самих експериментальних даних додатково обчислюють і s то втрачаються два ступе­ні свободи, тобто f=l-1-2.

Отримане значення порівнюють із критичним , узятим з таблиці χ2 — розподілу для обраного рівня статистичної значущос­ті α і кількості ступенів свободи f=l-3.

Якщо можна стверджувати, що з обраним рівнем стати­стичної значущості α приймається гіпотеза Н0, тобто наявні дані відповідають передбачуваному закону розподілу. Гіпотеза Н0 відхи­ляється при значеннях , більших за тому використовується тільки правобічна критична область (див. рис. 2.7, б).

Взагалі у практиці перевірки гіпотез про відповідність закону розподілу намагаються застосовувати два методи переві­рки, що підвищує вірогідність прийняття рішення. Особли­во це важливо, коли характерні риси закону розподілу пе­ребувають на його «хвостах», що не завжди можна виявити при малому обсязі випробувань.

Критерій ω2 (омега-квадрат). Критерій χ2, незважаючи на свою простоту, не завжди забезпечує надійну перевірку гіпотези про закон розподілу, оскільки частина вихідної інформації втрачається при здійсненні процедури групування даних.

Розглянемо критерій згоди при простій гіпотезі, що повністю фік­сує закон розподілу генеральної сукупності, з якої отримано вибірку. Цей критерій, що дістав назву ω2, на відміну від χ2 грунтується без­посередньо на спостережених (незгрупованих) значеннях величини X.

Нехай гіпотеза полягає в припущенні, що величина X розподіле­на відповідно до деякого неперервного закону розподілу з інтегра­льною функцією F(x), яка вважається відомою.

Розглянемо ряд вибіркових значень х12,...,хп випадкової вели­чини X. Позначимо пх – кількість значень, що перебуває ліворуч від вибраного значення. Тоді відношення і є емпіричною функцією розподілу. При великому обсязі вибірки емпірична функція розподілу Wn(х) є апроксимацією теоретичної функції розподілу F(x).

Різниця величин Wn(x) і F(x) може бути використана як міра розбіжності між вибірковими даними та передбачуваним законом розподілу генеральної сукупності. За міру цієї розбіжності беруть середній квадрат відхилень за всіма можливими значеннями аргументу:

де

З наявних вибіркових даних будується варіаційний ряд Теоретично рівність будь-яких двох членів у цьому ряді через неперервність функції F(х) практично неможлива, тобто має ймовірність, що дорівнює нулю. Вважаємо, що для х<x1 емпірична функція розподілу дорівнює нулю, а при х>хп, дорівнює одиниці. Відповідно до такого визначення функції Wn(x) маємо:

(2.14)

Емпірична функція стрибком змінює свої значення в точках x=xk на , зберігаючи це значення протягом усього інтервалу xk – xk+1 (рис. 2.9)

Рис. 2.9

 

Виходячи зі співвідношення (2.14), можна подати вираз для критерію ω2 у вигляді окремих доданків:

(2.15)

Розглянемо першу складову інтеграла (2.15):

(2.16)

Розглянемо другу складову інтеграла (2.15)

(2.17)

Розглянемо третю складову інтеграла (2.15):

(2.18)

Підставляючи доданки (2.16), (2.17), (2.18) у вираз (2.15), дістаємо:

Після спрощень останній вираз набирає вигляду:

(2.19)

Ця рівність показує, в який спосіб ω2 залежить від індивідуаль­них членів варіаційного ряду.

Точний розподіл ω2 дуже складний, але дослідження показують, що вже при n > 40 розподіл добутку 2 близький до деякого гранич­ного розподілу, для якого складено таблиці. Фрагмент такої таблиці наведено далі:

 

α 0.5 0.4 0.3 0.2 0.1
(nω2)кр 0.1184 0.1467 0.1843 0.2412 0.3473
α 0.05 0.03 0.02 0.01 0.001
(nω2)кр 0.4614 0.5489 0.6198 0.7435 1.6979

 

За таблицями визначають критичні значення для величини 2 при n > 40:

Якщо розрахункове значення критерію буде меншим від критич­ного, приймають гіпотезу про передбачуваний закон розподілу.

 

Питання для самоперевірки

1. Які критерії називаються критеріями згоди?

2. Як за критерієм χ2 перевіряють гіпотезу про закон розподілу?

3. Яка міра розбіжності між емпіричним та теоретичним розподі­лом застосовується для критерію χ2?

4. Яка величина підлягає розподілу χ2?

5. Як визначається кількість ступенів свободи для розподілу χ2?

6. Яка величина застосовується як статистика для перевірки гіпо­тези про закони розподілу?

7. Чому використовується тільки правобічна критична область?

8. Які характерні особливості має критерій ω2?

9. Яка міра розбіжності між емпіричним та теоретичним розподі­лом застосовується для критерію ω2?

10. Як знаходиться критичне значення для критерію ω2?

 

 

2.5 Непараметричні критерії

 

У непараметричних критеріях не робиться припущень щодо розподілу генеральної сукупно­сті. Вони застосовуються при будь-яких законах як для кількі­сних, так і якісних ознак.

В експериментальних дослід­женнях часто потрібно порівняти два паралельні ряди спостережень над об'єктами, що належать до рі­зних різновидів, типів, сортів.

При цьому виконують N дослідів при систематичній і планомір­ній зміні від досліду до досліду рівня якого-небудь фактора, розбіж­ність у дії якого на кожний із двох різновидів об'єктів мають з'ясувати. У кожному такому досліді над парою об'єктів, виконано­му, природно, у незмінних умовах, мають два значення порівнюва­ної ознаки двох об'єктів.

Непараметричні критерії використовуються для перевірки того, чи належать дві вибірки до тієї самої генеральної сукупності, тобто чи од­норідні ці вибірки (значення результатів випробувань мають однакові функції розподілів). Такі критерії грунтуються на вивченні послідовно­стей реалізацій випадкової величини. Відповідні обчислювальні проце­дури є ефективними навіть при обмежених обсягах вибірок.

Критерій Уїлкоксона (критерійсерій). Цей критерій дає змогу на основі наявних вибірок, використовуючи інтегральну функцію ймовірностей, перевірити гіпотезу про те, що дві вибірки мають однаковий закон розподілу.

Таким чином, гіпотеза Н0: FX (х)=FY(х) перевіряється за допомогою однієї вибірки (x1,..., хп1) з Х і однієї вибірки (у1,...,уп2) із Y. Щодо розподілів X і Y ніяких припущень не робиться.

Значення x1,..., хп1 та у1,...,уп2 oбох вибірок упорядковуються у спільний варіаційний ряд. Коли в цьому ряді елемент однієї вибірки більший від елемента іншої вибірки, говорять, що пари значень i, yj) утворюють інверсію.

Під інверсією розуміють перехід від елемента однієї вибірки до елемента іншої вибірки при послідовному просуванні вздовж варіа­ційного ряду, причому інверсія не передбачається для першого еле­мента варіаційного ряду. Як контрольна величина береться повна кі­лькість інверсій и.

Приклад. Для ряду перед у1 є тільки один елемент х, а отже, кількість інверсій дорівнює одиниці. Елементу у2 передує один елемент х, кількість інверсій також дорівнює одиниці. Елементу у3 передують два елементи першої групи, а отже, кількість інверсій дорівнює двом. Аналогічно для у4 і у5. Повна кількість інверсій и= 1+1+2+2+2 = 8.

Для перевірки нульової гіпотези можна застосовувати два способи.

1. Якщо гіпотеза правильна, обчислене значення и не повинне відхилятися від свого математичного сподівання:

(2.20)

де m і n – обсяги вибірок.

Від гіпотези відмовляються, якщо більше від певного критичного значення иα. Критичне значення иα беруть для заданого рівня значущості α з таблиці критичних значень Уїлкоксона.

2. У загальному випадку, а також у випадку великих m і п, для яких иα,не можна взяти з таблиці, справджується формула:

де z α — визначається з таблиць Лапласа.

Критерій знаків (медіанний критерій). Його використовують тільки в разі, коли вибірки Х та Y однакові за обсягом, тобто значення можна розглядати у вигляді масиву пар чисел (хі, уi), і = 1...n…

При застосуванні цього критерію будується спільний варіаційний ряд. Спочатку визначається медіана для цього ряду. Якщо кількість значень непарна, то як медіана використовується середній елемент. Якщо кількість парна, медіана перебуває між i обчислюється за формулою:

Після обчислення медіани визначається знак відхилення поточного значення хi, і = , від медіани. У такий спосіб одержують послідовність знаків, що розпадається на окремі серії — знаків одного виду, укладених між знаками іншого виду.

Приклад. +++---+----+++ -. Кількість серій r = 6.

За спеціальними таблицями для відомих значень кількості спо­стережень у вибірках N1 і N2 визначається для певного рівня статис­тичної значущості α і Якщо виконується спів­відношення

гіпотеза про належність вибірок до однієї генеральної сукупності, для якої FX(х) = FY(х), приймається, у протилежному разі — від­хиляється.

Критерій знаків набув поширення в дослідницьких роботах за­вдяки тому, що процедура його застосування винятково проста, ви­мірювання ознаки, що враховується, можуть виконуватися грубими засобами, тому що має значення лише знак різниці результатів вимі­рювань, а в основу критерію покладені прості положення, яких майже завжди дотримуються (наприклад, не припускають нормаль­ного розподілу досліджуваних величин).

 

Питання для самоперевірки

1. Які критерії називаються непараметричними?

2. Яка гіпотеза перевіряється за допомогою критерію Уїлкоксона?

3. Що таке інверсія і як вона визначається?

4. Як двома способами за допомогою критерію Уїлкоксона пере­вірити правильність гіпотези?

5. Як визначається критичне значення й критична область для критерію Уїлкоксона?

6. Що таке медіана? Як вона визначається для вибіркових значень?

7. Що таке серія знаків та як вона визначається?

8. Як визначаються критичне значення та критична область для критерію знаків?

 

 

2.6 Перевірка гіпотез відносно частки ознаки порівняння двох вибірок

 

Критерії цієї групи дають змогу використовувати частку ознак і приймати рішення про власти­вість генеральної сукупності та відповідність нормам.

Будемо розглядати задачі: по­рівняння частки ознаки з норма­тивним значенням (стандартом) та порівняння частки ознаки у двох сукупностях.

Порівняння частки ознаки з нормативним значенням. Нехай потрібно перевірити гіпотезу, що частка р деякої ознаки у генераль­ній сукупності дорівнює деякому нормативному значенню α, тобто висувається нуль-гіпотеза Н0: р = α при альтернативній гіпотезі Н1: р≠α. Для перевірки гіпотези Н0 застосовують двобічний критерій, оскільки порушення гіпотези Н0 може бути як у разі р > α, так і в ра­зі р < α. Як критерій застосовуємо статистику

де n — загальна кількість випробувань; m — кількість позитивних результатів, W — частота.

Ця статистика при будь-якому n розподілена за біноміальним (для вибірки з поверненням) або за гіпергеометричним (для вибірки без по­вернення) законом розподілу. Однак при достатньо великому n при розрахунках можна скористатися асимптотичними розподілами, най­частіше — нормальним.

Виходячи з нормального закону розподілу при заданому рівні значущості α значення z знаходять із таблиць нормального розподі­лу згідно з рівністю:

Узявши до уваги, що для біноміального закону а також, що q=1 -р і для розглянутого випадку вихідним припущен­ням p =α, дістанемо вираз

який надалі можна використати для знаходження надійних меж для W. Критичні точки в цьому випадку

Якщо вибіркова частість W буде в межах [W1, W2], гіпотеза H0 приймається.

У випадку, коли перевіряють альтернативну гіпотезу Н1: р>α, використовують однобічну критичну область із граничним значен­ням z згідно з рівнянням

Приклад. Перевіряється внесок деякого компонента до складу продукції.

1. Перевірити відповідність вкладу складової 10%-ному стандар­тному значенню, тобто перевірити гіпотезу H0: р = 0,1.

2. Перевірити, що наявність цього компонента у продукції не пе­ревищує 10%, тобто перевірити гіпотезу Н1: р>α.

Порівняння частки ознаки у двох сукупностях. Припустимо, що маємо m1/n1 та m2/n2 частки однієї ознаки у двох сукупностях з n1 та n2 одиниць. Висувається гіпотеза H0: розбіжність між m1/n1 та m2/n2 є ре­зультатом впливу випадкових факторів та обмеженого обсягу вибірок.

Розглянемо випадок великих вибірок. Якщо n1 та n2 більші за 30, то розподіл вибіркових частостей при виконанні припущення про нульову розбіжність буде близьким до нормального з параметрами

Для перевірки гіпотези застосовують статистику

Статистика W також може бути подана за допомогою нормально­го закону з параметрами

Для перевірки гіпотези H0 будемо використовувати двобічний критерій. Задаючись рівнем значущості α, знаходимо z згідно з рів­нянням

а потім визначимо критичні точки

де — оцінка p, яку отримують на підставі на­явних даних двох вибірок.

Якщо вибіркове значення W вміститься в інтервалі [Wкр1, Wкр2], то гіпотеза про несуттєвість розбіжності приймається.

Розглянемо випадок малих вибірок. Якщо n1 та n2 - малі числа, то використання нормального розподілу для статистики є хибним. У цьому випадку необхідно використовувати критерій χ2 за допомогою якого, як було показано раніше, при ідентифікації зако­нів розподілу можна визначити розбіжність між теоретичними і ви­бірковими частками.

Для розглянутого випадку χ2 обчислюється в такий спосіб. При­пустимо, що нас цікавить деяка ознака А. Беруть дві сукупності об­сягами n1 та n2 і результати для позитивних А і негативних нас­лідків заносять у табл. 2.1.

У таблиці 1, і 2 — кількість елементів у кожній вибірці, які це мають ознаки А. Виходячи з припущення, що вибірки взято з ті­єї самої генеральної сукупності з часткою ознаки р, можна визначити теоретичні частоти, які відповідають фактичним частотам pn1, (1-p)n1, pn2, (1-p)n2.

Таблиця 2.1

Сукупність Фактичні частоти Оцінки теоретичних частот
А Усього А
Вибірка 1 m1 n1 pn1 (1-p)n1
Вибірка 2 m2 n2 pn2 (1-p)n2
Усього m1+ m2 + n1+ n2 -- --

 

В останніх двох рядках табл. 19.1 наведені оцінки теоретичних частот, де замість р використовується = (m1, +m2)/(nІ + n2).

На підставі даних, наведених у табл. 19.1, можна обчислити χ2 за формулою:

де у знаменниках записано оцінки відповідних дисперсій.

Беручи до уваги, що між чотирма теоретичними частотами існує три незалежні співвідношення, у розподілі χ2 необхідно враховувати тільки один ступінь свободи.

Якщо нульова гіпотеза, відповідно до якої обидві сукупності є вибірками з однієї генеральної сукупності, правильна, то розбіжність між теоретичними та дослідними частотами можна віднести тільки на рахунок випадкового відбору. Тому, визначивши для рівня значущості α значення χ2, приймемо рішення про відхилення гіпотези H0, якщо , незначущість розбіжності при .

Приклад. Проводились випробування нового методу лікування. Одна група (експериментальна) — з 50 осіб (n1 = 50) лікувалася за новим методом, а друга («традиційна»), яка складалася з 30 осіб (n2 = 30), — за традиційним методом. Після завершення лікування у першій групі залишилося 9 хворих (m1=9), а в другій — 7 (m2=7). Необхідно перевірити суттєвість ефективності нового методу.

Обчислимо оцінку теоретичної частоти хворих після лікування:

Позначимо позитивний результат для хворого — «вилікувалися за зазначений період» як подію А, тоді — «залишилися хворими» буде . Вихідні дані та отримані результати наведено в табл. 2.2.

Таблиця 2.2

Групи, що обстежуються Результати досліджень Усього Теоретичні результати
А   А
Експериментальна          
«Традиційна»          
Усього:          

 

Розрахунок теоретичної кількості позитивних результатів будемо проводити відповідно за виразами та . Внесемо у табл. 19.2 оцінку теоретичної кількості А та . Виходячи з даних, наведених у табл. 19.2, обчислимо значення критерію:

Скориставшись таблицями розподілу χ2, для α= 0,05 та ступеня свободи f =1, знайдемо критичне значення χ2кр =3,8. Таким чином, , тобто робимо висновок, що розбіжність частки хворих, які залишилися в обох групах після закінчення терміну лікування, не значуща, а отже, новий метод лікування дає такий самий ефект, як і традиційний.

Порівняння двох залежних вибірок (парні зіставлення). У практиці статистичної перевірки гіпотез часто трапляються випадки, коли дві вибірки, які порівнюються, не можуть розглядатися як незалежні.

Приклад. Перевірка ефективності нової технології за результатами роботи тієї самої бригади до і після впровадження нової технології.

Приклад. Оцінка стану хворих до і після прийняття нових ліків. Проводячи реєстрацію по кожному об'єкту спостережень до нововведення — х і після нього —у, дістаємо два ряди спостережень:

 

x1 x2 xi xn
y1 y2 yi yn

 

Таким чином, ідеться про парні спостереження, тобто про n зв'язаних пар (хi, уi). Якщо досліджуваний фактор впливає тільки на одну з ознак х або у, то між цими парами спостережень фіксувати­меться суттєва розбіжність. Завдання полягає в тому, щоб визначи­ти, коли розбіжність між парами спостережень можна віднести на рахунок випадкових відхилень, а коли вона суттєва і її потрібно пов'язувати з впливом якогось фактору.

Нехай різниця між спостереженнями в кожній парі становить Тоді узагальненою величиною розбіжності пар спостережень може бути середня різниця

(2.21)

Чим менша різниця , тим більш правдоподібне припущення що­до несуттєвості розбіжності між рядами спостережень. Таким чином, перевірці підлягає гіпотеза H0: . Критерієм для перевірки може бути статистика

(2.22)

де

При нормальному розподілі різниць t -статистика має роз­поділ Стьюдента з кількістю ступенів свободи n - 1. Подальший ме­ханізм перевірки не відрізняється від перевірки розбіжності середніх.

Перевірку гіпотез широко використовують у дисперсійному аналізі та в теорії кореляції, де перевіряють гіпотези про значущість відповідних параметрів, наявність стохастичного зв'язку, суттєвість впливу випадкових величин тощо.

 

Питання для самоперевірки

1. Чому при порівнянні частки ознаки з нормативним значенням використовують двобічний критерій?

2. Коли застосовують критерій χ2 при порівнянні частки ознак у двох сукупностях?

3. Який критерій застосовують при порівнянні двох залежних ви­бірок?

4. Чому при порівнянні частки ознак у двох сукупностях потріб­но вводити чотири складові?

5. Як визначають оцінку теоретичної частки?

6. Коли застосовують парні спостереження?

 

Завдання планування експерименту

З постановкою і проведенням експериментів фактично пов’язана історія людства в цілому. Проте в більшос ті випадків ці роботи проводились хаотично на рівні інтуїції і попереднього досвіду, тому коефіцієнт корисної дії їх був досить низьким. Коли враховувати, що вартість одного досліду, як правило, висока, то не важко уявити, скільки коштувало людству проведення науково не спланованих експериментів. Особливо це важливо при дослідженні складних систем (а сучасні об’єкти практично всі є складними), поведінка яких залежить від великої кількості факторів.

Важливою умовою науково поставленого досліду є мінімізація загального числа дослідів (а значить, затрат матеріальних, трудових і часових), при цьому зменшення кількості дослідів не повинно суттєво відбитись на якості одержаної інформації.

При плануванні експерименту необхідно перш за все визначити мету експерименту і показники його якості, вказати характеристики плана і побудувати модель експерименту, вибрати критерії оптимальнос ті плану і встановити обмеження на показники якос ті дослідження. Організація і проведення експериментального дослідження потребує застосування особливих методів планування експерименту, тобто процедури вибору числа дослідів, необхідних і доступних для вирішення завдання з необхідною точністю і статистичною надійністю, умов постановки дослідів, методів математичної обробки результатів і методів теорії прийняття рішень.

Таким чином, після того як вибрана модель об’єкта і сформульована мета дослідження, треба спланувати експеримент, тобто: вибрати методи вимірювань і можливі типи засобів вимірювань; дати апріорну оцінку похибок вимірювань; сформулювати вимоги до метрологічних характерис тик засобів і умов вимірювань; вибрати засоби вимірювань відповідно до заданих вимог; вибрати параметри вимірювальної процедури; координати точок області експерименту, числа спостережень для кожної точки плану, моментів часу вимірювання, послідовності проходження точок плану; підготувати засоби вимірювання для проведення експерименту; забезпечити умови проведення експерименту. Експеримент необхідно реалізувати таким чином, щоб за мінімальною кількістю дослідів, варіюючи значення незалежних змінних за спеціально сформульованим правилом, побудувати математичну модель і знайти значення факторів, що забезпечують оптимальне функціонування системи. Простота і наявніс ть строгого математичного апарата, розробленого для моделі «чорний ящик», зумовили широке розповсюдження саме цього типу моделі.

Факторами називаються змінні величини, що приймають в деякий момент часу певне значення і відповідним чином діють на об’єкт. Факторами можуть бути як зовнішні для об’єкта впливи (температура., тиск, напруженіс ть магнітного і електричного полів, сила тяжіння, параметри джерела живлення та ін.), так і параметри самого об’єкта (опір, ємність та ін. параметри електричної схеми). Вибір факторів, параметрів оптимізації і моделей здійснюється з урахуваннями мети досліджень і умов для проведення експерименту. Кожний фактор може мати в досліді одне, або кілька значень, які називаються рівнями. Фіксований набір рівнів факторів визначає одне з можливих станів об’єкта, що досліджується, і відповідає визначеній точці багатомірного факторного простору.

Фактори можуть бути як кількісними, так і якісними.

Методика планування експерименту в більшості випадків потребує точної установки значень факторів, тому фактори повинні бути доступними вимірюванню з точністю на порядок вище, ніж точність вимірювання вихідної величини.

На різні набори рівнів система реагує по різному. Проте існує певний зв’язок між рівнями факторів і реакцією (відгуком) системи.

Вихідна величина в теорії планування експерименту залежно від завдань, що вирішуються, називається відгуком, функцією мети або параметром оптимізації. Серед множини вихідних величин дослідник повинен вміти виділити один параметр, який повинен допускати кількісну оцінку і для якого необхідно встановити функціональну залежність від рівнів факторів або який необхідно оптимізувати.








Date: 2015-09-19; view: 569; Нарушение авторских прав



mydocx.ru - 2015-2024 year. (0.106 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию