За допомогою t-критерію Стьюдента можна визначити, чи є статистично значущі відмінності між наборами даних. T-тест в Excel - це T-тест з двома зразками, що порівнює середні значення двох зразків. У цій статті пояснюється, що означає статистична значимість, і показано, як виконати T-тест в Excel.
Інструкції в цій статті належать до Excel 2019, 2016, 2013, 2010, 2007; Excel для Office 365 і Excel Online.
Що таке статистична значимість?
Уявіть, що ви хочете знати, яка з двох кісток дасть кращий результат. Ви кидаєте перший кубик і отримуєте 2; ви кидаєте другий кубик і отримуєте 6. Це говорить вам, що другий кубик зазвичай дає вищі оцінки? Якщо ви відповіли «Звичайно, ні», то у вас вже є певне розуміння статистичної значущості. Ви розумієте, що різниця була пов'язана з випадковою зміною рахунку, кожен раз, коли кидали кубик. Оскільки зразок був дуже маленьким (тільки один рулон), він не показав нічого суттєвого.
Тепер уявіть, що ви кидаєте кожен кубик 6 разів:
- Перші кубики кидають 3, 6, 6, 4, 3, 3; Середнє = 4,17
- Другий кидає кубики 5, 6, 2, 5, 2, 4; Середня = 4,00
Чи означає це, що перший кубик дає більше очок, ніж другий? Можливо ні. Невелика вибірка з відносно невеликою різницею між середніми значеннями робить ймовірним, що різниця все ж зумовлена випадковими відхиленнями. У міру того як ми збільшуємо кількість кидків кісток, стає важко дати здоровий глузд відповісти на питання - чи є різниця між оцінками результатом випадкового відхилення або один з них насправді з більшою ймовірністю дає більш високі оцінки, ніж інший?
Значимість - це ймовірність того, що спостерігається різниця між зразками обумовлена випадковими коливаннями. Значення часто називають альфа-рівнем або просто «лід». Рівень достовірності, або просто «с», - це ймовірність того, що різниця між вибірками не обумовлена вперше випадковою зміною; іншими словами, є різниця між основними групами населення. Отже: c = 1 — α
Ми можемо встановити «порожній» на будь-якому бажаному рівні, щоб відчувати себе впевнено, що довели свою значимість. Дуже часто використовується - 5% (95% достовірності), але якщо ми хочемо бути дійсно впевненими в тому, що будь-які відмінності не викликані випадковими коливаннями, ми можемо застосувати більш високий рівень достовірності, використовуючи - 1% або навіть - 0,1%.
Різні статистичні тести використовуються для розрахунку значущості в різних ситуаціях. T-тести використовуються, щоб визначити, чи відрізняються середні значення двох груп населення, і F-тести використовуються, щоб визначити, чи відрізняються відмінності.
Навіщо перевіряти статистичну значимість?
Порівнюючи різні речі, ми повинні використовувати тестування значущості, щоб визначити, чи краще одне, ніж інше. Це стосується багатьох полів, наприклад:
- У бізнесі люди повинні порівнювати різні продукти і методи маркетингу.
- У спорті люди повинні порівнювати різне обладнання, техніки і конкурентів.
- У розробці люди повинні порівнювати різні проекти і налаштування параметрів.
Якщо ви хочете перевірити, чи працює щось краще, ніж будь-що, в будь-якій області вам необхідно перевірити статистичну значимість.
Що таке T-розподіл студента?
T-розподіл Стьюдента аналогічно нормальному (або гаусівському) розподілу. Це обидва розподілення у формі дзвону, більшість результатів яких близько до середнього, але деякі рідкісні події досить далекі від середнього значення в обох напрямках, які називаються хвостами розподілу.
Точна форма розподілу Стьюдента залежить від розміру вибірки. Для зразків понад 30 це дуже схоже на нормальний розподіл. У міру того як розмір вибірки зменшується, хвости стають більше, що відображає збільшену невизначеність, що виникає в результаті висновку на основі невеликої вибірки.
Як зробити T-тест в Excel
Перш ніж ви зможете застосувати T-тест, щоб визначити, чи є статистично значуща різниця між середніми значеннями двох зразків, ви повинні спочатку виконати F-тест. Це пов'язано з тим, що для T-тесту виконуються різні обчислення залежно від того, чи є суттєва різниця між відхиленнями.
Для виконання цього аналізу вам знадобиться надбудова Пакет інструментів аналізу.
Перевірка та завантаження надбудови Toolpak для аналізу
Щоб перевірити та активувати пакет інструментів аналізу, виконайте наступні дії:
- Виберіть вкладку «Файл» > «Параметри».
- У діалоговому вікні «Параметри» виберіть «Налаштування» на вкладках з лівого боку.
- У нижній частині вікна виберіть «Керування», що розкривається, і виберіть «Параметри Excel». Виберіть Go.
- Переконайтеся, що позначено пункт Пакетом інструментів аналізу, а потім оберіть OK.
- Пакет інструментів аналізу тепер активний, і ви готові застосувати F-тести і T-тести.
Виконання F-тесту і T-тесту в Excel
- Введіть два набори даних в електронну таблицю. В даному випадку ми розглядаємо продажі двох продуктів протягом тижня. Середньодобове значення продажів для кожного продукту також розраховується разом зі стандартним відхиленням.
- Виберіть вкладку «Дані» > «Аналіз даних».
- Виберіть F-Test Two-Sample для відхилень зі списку, потім натисніть «OK».
F-тест дуже чутливий до ненормальності. Тому може бути безпечніше використовувати тест Уелча, але це складніше в Excel.
- Виберіть діапазон змінної 1 і діапазон змінної 2; встановити альфа (0,05 дає 95% впевненості); виберіть комірку для верхнього лівого кута виводу,