| Статистична перевірка гіпотез - Статистика |
|
|
|
| Статистика - Статистика - Герасименко С. С., Головач А. В., Єріна А. М. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
6.5. Статистична перевірка гіпотез
Статистична гіпотеза — це певне припущення щодо властивостей генеральної сукупності, яке можна перевірити, спираючись на результати вибіркового спостереження. Суть перевірки гіпотез полягає в тому, щоб визначити, узгоджуються чи ні результати вибірки з гіпотезою, випадковими чи невипадковими є розбіжності між гіпотезою і даними вибірки. Найчастіше гіпотеза, яку належить перевірити, формулюється як відсутність розбіжності (нульова розбіжність) між невідомим параметром генеральної сукупності G і заданою величиною А, а тому її позначають Н0. Зміст гіпотези записують після двокрапки, наприклад Н0: G = A. Кожній нульовій гіпотезі протиставляють альтернативну Нa. При формулюванні Нa враховується вагомість відхилень (G – A): для додатних відхилень Нa: G > А, для від’ємних — Нa: G < A, для тих і інших — Нa: G ¹ A. Якщо вибіркові дані cуперечать гіпотезі Н0, вона відхиляється, коли ці дані узгоджуються з гіпотезею Н0, вона не відхиляється. Спираючись на результати вибірки, статистична перевірка гіпотез неминуче пов’язана з ризиком прийняття помилкового рішення: ризик І — відхилення правильної нульової гіпотези, ризик ІІ — невідхилення нульової гіпотези, коли насправді правильною є альтернативна. Ці ризики конкуруючі, і зменшення ймовірності a одного зумовлює збільшення ймовірності b іншого. Оскільки уникнути ризиків неможливо, а наслідки їх, як правило, різновагомі, то в кожному конкретному дослідженні прагнуть мінімізувати той ризик, який пов’язаний з більшими втра-тами. Імовірності ризиків наведено в табл. 6.2. Таблиця 6.2ІМОВІРНІСТЬ РИЗИКІВ ПОМИЛКОВИХ РІШЕНЬ ПРИ ПЕРЕВІРЦІ ГІПОТЕЗ
Правило, за яким гіпотеза Н0 відхиляється або не відхиляється (приймається), називається статистичним критерієм. Математичною основою будь-якого критерію є статистична характеристика Z, значення якої визначається за даними вибірки, а закон розподілу відомий. Кожне значення характеристики Z має певну ймовірність F (Z). Якщо вибіркове значення Z малоймовірне, гіпотеза Н0 відхиляється. Межу малоймовірності Z називають рівнем істотності a. Очевидно, що a — це ймовірність ризику І, а тому залежно від змісту гіпотези Н0 і наслідків її відхилення рівень істотності визначають у кожному конкретному дослідженні. Зазвичай вибирають один із рівнів a, для яких табульовані значення статистичних характеристик критеріїв. Це a = 0,10; 0,05; 0,025; 0,01. Значення статистичної характеристики критерія Z1 – a поділяє множину вибіркових значень Z на дві частини: а) область допустимих значень і б) критичну область. Якщо вибіркове значення Z потрапляє у критичну область, гіпотеза Н0 відхиляється, якщо в область допустимих значень — не відхиляється. Саме тому значення Z1 – a називають критичним. Залежно від того, як сформульована альтернативна гіпотеза, критична область може бути односторонньою (ліво- чи правосторонньою) або двосторонньою (рис. 6.2). Рис. 6.2. Лівостороння та двостороння критичні області Порядок перевірки статистичних гіпотез розглянемо на прикладі співвідношення середніх двох сукупностей. Припустимо, ведеться вибірковий контроль тривалості служби деталей одного виду, виготовлених за різними технологіями. Контролю піддано 5 деталей, виготовлених за старою технологією, і 4 — за новою, тобто n1 = 5, n2 = 4. Вибіркові оцінки середніх і дисперсій відповідно становили: = 580 год при = 308; = 612 год при = 329. Різниця між середніми ( – ) = (612 – 580) = 32 год. Потрібно визначити, чи істотна ця різниця, тобто чи зумовлена вона відмінностями технологій, чи випадкова. Нульова гіпотеза формулюється на припущенні, що відхилення середніх випадкові Н0: . Альтернативна гіпотеза передбачає, що нова технологія збільшує тривалість служби деталі: На: . За такого формулювання Нa виконується одностороння (правостороння) перевірка. Статистичною характеристикою гіпотези Н0: є нормоване відхилення середніх , яке підпорядковане розподілу Стьюдента з числом ступенів свободи k = n1 + n2 – 2. У нашому прикладі k = 5 + 4 – 2 = 7; оцінка дисперсії розраховується як середня арифметична зважена з дисперсій, що характеризують варіацію тривалості служби деталей за кожною технологією ; значення t-критерію . Перевіримо гіпотезу Н0 проти Нa з рівнем істотності a = 0,05. За даними табл. 6.3 критичне значення t0,95 (7) = 1,89, що менше за фактичне (t = 2,37). Отже, нульова гіпотеза Н0: відхиляється, і з імовірністю 0,95 можна стверджувати, що нова технологія збільшує термін служби деталей. У разі двосторонньої перевірки гіпотези, коли Нa:, використовують критичне значення для , наприклад при a = 0,05 це буде t0,975 (k). Отже, статистична гіпотеза перевіряється в такій послідовності: а) формулюють нульову Н0 та альтернативну Нa гіпотези; б) вибирають статистичну характеристику Z, за значеннями якої перевіряють правильність гіпотези Н0; в) визначають рівень істотності a і відповідне йому критичне значення Z1 – a; залежно від формулювання гіпотез Н0 i Нa критична область може бути одно- або двосторонньою; г) за результатами вибірки розраховують фактичне (вибіркове) значення статистичної характеристики Z, яке порівнюють з критичним Z1 – a; якщо Z > Z1 – a, гіпотеза Н0 відхиляється, при Z < Z1 – a — не відхиляється. Таблиця 6.3ЗНАЧЕННЯ КВАНТИЛІВ t
Процедура перевірки гіпотез використовується при порівнянні вибіркових характеристик (середньої, частки, дисперсії) з відповідними нормативами, порівнянні характеристик двох вибіркових сукупностей, оцінюванні істотності розбіжностей двох розподілів, у дисперсійному та кореляційному аналізі. ЗАВДАННЯ ДЛЯ САМОКОНТРОЛЮ1. У чому суть вибіркового спостереження? Які його переваги порівняно з іншими видами спостереження? 2. Що означає репрезентативність вибірки? За яких умов вибірка буде репрезентативною? 3. Чому принцип випадковості добору є визначальним при формуванні вибіркової сукупності? Які способи добору забезпечують додержання цього принципу? 4. Чим відрізняється випадкова похибка репрезентативності від систематичної? Чи можна її уникнути? 5. Як визначити розмір похибки вибірки? Чим відрізняється гранична похибка вибірки від стандартної (середньої)? 6. З метою визначення затрат часу на виготовлення деталі проведено хронометраж роботи випадково дібраних 25 робітників. За даними вибірки середні затрати часу становили 15 хв при s = 2 хв. Обчисліть похибку вибірки для середніх затрат часу і визначіть: а) Як зміниться похибка вибірки, якщо обсяг вибіркової сукупності збільшиться в 2,25 раза? б) Як позначиться на похибці вибірки збільшення дисперсії в 1,6 раза? в) Як зміниться похибка вибірки, якщо зі збільшенням дисперсії в 1,21 раза обсяг вибіркової сукупності збільшиться в 2,25 раза? г) Як зміниться похибка вибірки, якщо виконати 19%-ний механічний добір? д) Як зміниться похибка вибірки, якщо виконати розшарований добір (виокремити групи за стажем роботи) і міжгрупова дисперсія витрат часу становитиме 36% загальної? 7. Хімічний аналіз 25 партій молока дав такі результати: а) середній показник кислотності (у градусах Тернера) — 20° при дисперсії 3,24; б) частка партій молока, що відповідають стандарту кислотності (не більш як 21°) — 80%. Визначіть похибки вибірки для середньої і частки з імовірністю 0,954; Скільки партій молока необхідно перевірити, щоб похибки вибірки для середньої і частки з тією самою ймовірністю зменшити вдвічі? 8. Урожайність нового сорту озимої пшениці, розміщеного на 10 дослідних ділянках, становила 47 ц/га при дисперсії 1,44. 1) Визначіть довірчий інтервал для середньої врожайності з імовірністю 0,95. 2) Чи узгоджуються вибіркові дані з припущенням, що врожайність нового сорту озимої пшениці не менша за 46 ц/га? 9. За даними 1%-ного вибіркового обстеження 100 домогосподарств маємо:
Із імовірністю 0,954 визначте відносні похибки вибірки для зазначених показників, порівняйте похибки та зробіть висновки щодо їх розміру. 10. Проектується обстеження посівів соняшнику з метою визначення втрат насіння через несвоєчасне збирання врожаю. Скільки необхідно обстежити пробних ділянок, щоб з імовірністю 0,954 відносна похибка середніх втрат з 1 га не перевищила 10% ? За даними минулорічних обстежень квадратичний коефіцієнт варіації втрат насіння становив 20%. 11. За даними пробного вибіркового обстеження роботи ковальсько-пресового обладнання (обсяг вибірки — 16) у першу зміну без простоїв працювало 80% машин. Яка має бути вибіркова сукупність, щоб похибка вибірки для частки працюючого без простоїв обладнання з імовірністю 0,954 не перевищила 5%? 12. Скільки треба опитати респондентів, оцінюючи якість готельного обслуговування (задовольняє / не задовольняє), щоб гранична похибка вибірки часток з імовірністю 0,954 не перевищила 5%? 13. Вивчається ефективність нової методики вивчення іноземних мов порівняно з традиційною. Сформулюйте нульову й альтернативну гіпотези. 14. Як перевірити справджуваність нульової гіпотези? Який рівень істотності доцільно використати? 15. Яка аналітична функція покладається на статистичний критерій? 16. Що таке критична область? Який висновок ви зробите, якщо статистична характеристика критерію потрапить у критичну область?
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Бібліотека онлайн Lection.com.ua створена для студентів та учнів, які прагнуть вчитися і пізнавати нове. Наша онлайн бібліотека підручників має близько 25 книг, ми намагаємося оновлювати нашу базу підручників кожен місяць. Сподіваємося наш сайт вам подобається. З повагою адміністрація.