ДСТУ ISO 2854:2008 Статистичне опрацювання даних. Методи оцінювання та перевірки гіпотез про середні значення і дисперсії (ISO 2854:1976, IDT)

Даний документ доступний у тарифі «ВСЕ ВРАХОВАНО»

У Вас є питання стосовно документа? Ми раді на них відповісти!Перелік безкоштовних документівПомітили помилку в документі або на сайті? Будь ласка, напишіть нам про це!Залишити заявку на документ

НАЦІОНАЛЬНИЙ СТАНДАРТ УКРАЇНИ

СТАТИСТИЧНЕ
ОПРАЦЮВАННЯ ДАНИХ
Методи оцінювання та перевірки гіпотез
про середні значення і дисперсії
(ISO 2854:1976, IDT)

ДСТУ ISO 2854:2008

 

 
 
Не є офіційним виданням.
Офіційне видання розповсюджує національний орган стандартизації
(ДП «УкрНДНЦ» http://uas.gov.ua)

ПЕРЕДМОВА

1 ВНЕСЕНО: Навчально-науковий центр «Фізико-хімічне матеріалознавство» Київського національного університету імені Тараса Шевченка та Національної академії наук України і Технічний комітет стандартизації «Застосування статистичних методів» (ТК 70)

ПЕРЕКЛАД І НАУКОВО-ТЕХНІЧНЕ РЕДАГУВАННЯ: О. Василик, канд. фіз.-мат. наук; Ю. Мішура, д-р фіз.-мат. наук., проф. (науковий керівник); Р. Ямненко, канд. фіз.-мат. наук

2 НАДАНО ЧИННОСТІ: наказ Держспоживстандарту України від 15 серпня 2008 р. № 289 з 2010-01-01

3 Стандарт відповідає ISO 2854:1976 Statistical interpretation of data — Techniques of estimation and tests relating to means and variances (Статистичний аналіз даних. Методи оцінювання та перевірки гіпотез про середні значення і дисперсії)

Ступінь відповідності — ідентичний (IDT)

Переклад з англійської (еn)

4 УВЕДЕНО ВПЕРШЕ

ЗМІСТ

Національний вступ

1 Сукупність необхідних обчислень

Загальні зауваги

2 Пояснювальні зауваги та приклади

Додаток А Порівняння парних спостережень за допомогою t-критерію Стьюдента

Додаток В Статистичні таблиці

Додаток НА Перелік познак

НАЦІОНАЛЬНИЙ ВСТУП

Цей стандарт є тотожний переклад ISO 2854:1976 Statistical interpretation of data — Techniques of estimation and tests relating to means and variances (Статистичне опрацювання даних. Методи оцінювання та перевірки гіпотез про середні значення і дисперсії).

Технічний комітет, відповідальний за цей стандарт, — ТК 70 «Застосування статистичних методів».

У стандарті зазначено вимоги, які відповідають чинному законодавству України.

До стандарту вміщено такі редакційні зміни:

— слова «цей міжнародний стандарт» і «цей документ» замінено на «цей стандарт»;

— структурні елементи цього стандарту: «Титульний аркуш», «Назву», «Передмову», «Національний вступ», першу сторінку та «Бібліографічні дані» — оформлено відповідно до вимог національної стандартизації України;

— у розділі 1 наведено «Національні пояснення» та «Національна примітка», виділені рамкою;

— долучено національний додаток НА (Перелік познак).

ISO 2602, ISO 3301 та ISO 3534-2, на які є посилання в цьому стандарті, прийнято в Україні як національні стандарти ДСТУ ISO 2602:2006 (ISO 2602:1980, IDT), ДСТУ ISO 3301:2006 (ISO 3301:1975, IDT), ДСТУ ISO 3534-2:2008 (ISO 3534-2:2006, IDT) відповідно.

ISO 5479, на який є посилання в цьому стандарті, на цей час не прийнято як національний стандарт в Україні, однак він на даний час чинний як міжнародний стандарт. Замість скасованого ISO 3207, на який є посилання в цьому стандарті, введено ISO 16269-6, який прийнято в Україні як національний стандарт ДСТУ ISO 16269-6:2008 (ISO 16269-6:2005, IDT).

НАЦІОНАЛЬНИЙ СТАНДАРТ УКРАЇНИ

СТАТИСТИЧНЕ ОПРАЦЮВАННЯ ДАНИХ
Методи оцінювання та перевірки гіпотез
про середні значення і дисперсії

СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ
Методы оценки и проверки гипотез
о средних значениях и дисперсиях

STATISTICAL INTERPRETATION OF DATA
Techniques of estimation and tests
relating to means and variances

Чинний від 2010-01-01

1 СУКУПНІСТЬ НЕОБХІДНИХ ОБЧИСЛЕНЬ

Загальні зауваги

1) У цьому стандарті описано методи, необхідні для

а) оцінювання середнього значення чи дисперсії генеральної сукупності;

b) перевіряння певних гіпотез щодо значень цих параметрів на основі вибіркових даних.

2) Наведені методи можна застосовувати тільки тоді, коли в кожній розглядуваній генеральній сукупності вибіркові елементи відбирають випадковим чином і вони є незалежними. У випадку скінченної генеральної сукупності елементи, відібрані випадковим чином, можна вважати незалежними, якщо розмір генеральної сукупності достатньо великий, або якщо частка відбору достатньо мала (наприклад, менша ніж 1/10).

3) Щодо кожної генеральної сукупності висувають припущення, що ймовірнісний розподіл досліджуваних змінних є нормальним. Однак за умови, що розмір вибірки не надто малий, описані методи придатні для більшості практичних застосувань навіть у випадку, коли розподіл досліджуваних змінних трохи відхиляється від нормального. Для таблиць А, В, С і D мінімальний розмір вибірки має становити приблизно від 5 до 10, а для всіх інших таблиць він має бути не меншим ніж 201).

4) Існує певна кількість методів, які дають можливість перевірити гіпотезу про нормальність. Це питання коротко розглянуто в прикладах з наступної частини, а також буде розглянуто в іншому документі.

Національна примітка

Див. ISO 5479.

Однак, ця гіпотеза може бути прийнятою на основі іншої інформації, ніж та, яку можна отримати за допомогою вибірки. У випадку, коли гіпотеза нормальності відхиляється, очевидний метод полягає у використанні непараметричних критеріїв або у використанні перетворень, які дають можливість отримати нормально розподілені генеральні сукупності, наприклад, 1/х, log(x + α), √(x + α). Але висновки, які можна зробити з використанням процедур, наведених у цьому стандарті, безпосередньо справедливі тільки для перетворених змінних, тому їх слід обережно застосовувати в разі переходу до початкових змінних. Наприклад, exp(mean log х) дорівнює середньому геометричному значень змінної х, а не середньому арифметичному.

Якщо потрібно оцінити середнє значення чи стандартний відхил змінної X, то незалежно від того, нормально розподілена генеральна сукупність, чи ні, незміщеними оцінками середнього значення m та дисперсії генеральної сукупності σ2 є вибіркове середнє x і вибіркова дисперсія s2 відповідно.

5) Бажано доповнювати статистичні операції всіма деталями, які стосуються джерела чи методу отримання спостережень і дають можливість зрозуміти, чому застосовують саме такі методи статистичного аналізу, зокрема наводити одиниці вимірювання чи найменші одиниці вимірювання, які мають практичне значення.

6) Не дозволено вилучати з вибірки будь-які спостереження чи виправляти явно сумнівні дані без обґрунтований, яке має базуватися на експериментальних, технічних або інших очевидних доказах; ці докази має бути чітко зазначено. У будь-якому випадку відкинуті чи виправлені дані та причини їх вилучення або виправлення обов’язково має бути згадано.

7) У задачах оцінювання довірчий рівень 1 - α дорівнює ймовірності того, що довірчий інтервал має істинне значення оцінюваного параметра. Найчастіше для нього використовують значення 0,95 та 0,99, тобто α = 0,05 та α = 0,01.

8) У задачах перевіряння гіпотез у випадку двобічної альтернативи рівень значущості — це ймовірність відхилу нульової гіпотези (гіпотези, яку перевіряють), якщо вона справедлива (ймовірність помилки першого роду); у випадку однобічної альтернативи рівень значущості — це максимальне значення цієї ймовірності (максимальне значення помилки першого роду). Зазвичай використовують значення α = 0,05 (один шанс із двадцяти) або α = 0,01 (один зі ста) згідно з тим, який рівень ризику готовий прийняти користувач. Оскільки можна відхилити гіпотезу, використовуючи значення рівня значущості α = 0,05 , але при цьому її не будуть відхиляти за рівня значущості α = 0,01, то зазвичай доцільно вживати вислів: «гіпотезу відхиляють на рівні 5%» або «на рівні 1%» відповідно. Варто звернути увагу на існування помилки другого роду. Ця помилка виникає у випадку, коли нульову гіпотезу приймають, якщо справедлива альтернатива. Терміни, які стосуються статистичних критеріїв (тестів), наведено в частині 2 ISO 3534 Statistics — Vocabulary.

НАЦІОНАЛЬНЕ ПОЯСНЕННЯ

ISO 3534 Статистика. Словник термінів і познаки.

9) Обчислення можна значною мірою зменшити, якщо змінити початок координат і/чи одиниці вимірювання змінних. У випадку згрупованих даних можна застосовувати формули, наведені в ISO 2602 Statistical interpretation of test results — Estimation of the mean — Confidence interval.

НАЦІОНАЛЬНЕ ПОЯСНЕННЯ

ISO 2602 Статистичний аналіз даних. Оцінювання середнього значення. Довірчий інтервал.

10) Методи, наведені в таблицях С та С', пов’язані з порівнянням двох середніх значень. У них припускають, що відповідні вибірки незалежні. Під час досліджування певних проблем може виявитись корисним спарувати ці спостереження (наприклад, у випадку порівняння двох методів або двох інструментів). Статистичне оброблення спарованих даних розглянуто в ISO 3301 Statistical interpretation of data — Comparison of two means in the case of paired observations, але й у додатку А наведено приклад аналізу парних спостережень. У ньому формально використано дані з таблиці А.

НАЦІОНАЛЬНЕ ПОЯСНЕННЯ

ISO 3301 Статистичне опрацювання даних. Порівняння двох середніх значень, отриманих у випадку парних спостережень.

11) Символи та їхні визначення, використовувані в цьому стандарті, узгоджено з ISO 3207 Statistical interpretation of data. Determination of statistical tolerance interval.

НАЦІОНАЛЬНЕ ПОЯСНЕННЯ

ISO 3207 Статистичне опрацювання даних. Визначення статистичного допустимого інтервалу.

Повна версія документа доступна в тарифі «ВСЕ ВРАХОВАНО».

Увійти в Особистий кабінет Детальніше про тарифи

БУДСТАНДАРТ Online