Тест Тьюки - это метод, который направлен на сравнение индивидуальных средних значений дисперсионного анализа нескольких образцов, подвергнутых разной обработке.
Тест, представленный в 1949 году Джоном У. Тьюки, позволяет нам различить, значительно ли отличаются полученные результаты. Он также известен как тест достоверно значимой разницы Тьюки (тест Тьюки HSD).
Рисунок 1. Тест Тьюки позволяет нам определить, имеют ли различия в результатах между тремя или более различными видами лечения, примененными к трем или более группам с одинаковыми характеристиками, значительно и действительно разные средние значения.
В экспериментах, в которых сравниваются три или более различных обработки, применяемых к одному и тому же количеству образцов, необходимо различать, существенно ли отличаются результаты или нет.
Говорят, что эксперимент сбалансирован, если размер всех статистических выборок одинаков для каждого лечения. Если размер образцов различается для каждого лечения, проводится несбалансированный эксперимент.
Иногда одного дисперсионного анализа (ANOVA) недостаточно, чтобы знать, удовлетворяют ли они при сравнении различных обработок (или экспериментов), примененных к нескольким образцам, нулевой гипотезе (Ho: «все обработки равны») или, наоборот, соответствует альтернативной гипотезе (Ха: «по крайней мере, один из вариантов лечения отличается»).
Тест Тьюки не уникален, существует еще много тестов для сравнения выборочных средних, но это один из самых известных и применяемых.
Компаратор Тьюки и таблица
При применении этого теста вычисляется значение w, называемое компаратором Тьюки, определение которого выглядит следующим образом:
w = q √ (MSE / r)
Где коэффициент q получается из таблицы (таблица Тьюки), которая состоит из строк значений q для различного количества обработок или экспериментов. В столбцах указано значение коэффициента q для разных степеней свободы. Обычно доступные таблицы имеют относительную значимость 0,05 и 0,01.
В этой формуле в квадратном корне появляется коэффициент MSE (средний квадрат ошибки), деленный на r, что указывает на количество повторений. MSE - это число, которое обычно получают из дисперсионного анализа (ANOVA).
Когда разница между двумя средними значениями превышает значение w (компаратор Тьюки), делается вывод, что это разные средние значения, но если разница меньше числа Тьюки, то это две выборки со статистически идентичным средним значением. .
Число w также известно как число HSD (честно значимая разница).
Это единое сравнительное число может быть применено, если количество образцов, применяемых для испытания каждой обработки, одинаково для каждого из них.
Несбалансированные эксперименты
Если по какой-то причине размер образцов различается для каждого сравниваемого лечения, то описанная выше процедура немного отличается и называется тестом Тьюки-Крамера.
Теперь для каждой пары процедур i, j получается номер компаратора w:
w (i, j) = q √ (½ MSE / (ri + rj))
В этой формуле коэффициент q получается из таблицы Тьюки. Этот коэффициент q зависит от количества обработок и степени свободы ошибки. r i - количество повторений в лечении i, а r j - количество повторений в лечении j.
Пример случая
Заводчик кроликов хочет провести надежное статистическое исследование, которое подскажет ему, какая из четырех марок кормов для откорма кроликов является наиболее эффективной. Для исследования он сформировал четыре группы из шести полуторамесячных кроликов, у которых до этого были одинаковые условия кормления.
Причины заключались в том, что в группах А1 и А4 смерть произошла по причинам, не связанным с едой, поскольку один из кроликов был укушен насекомым, а в другом случае смерть, несомненно, была причиной врожденного порока. Итак, группы неуравновешены, и тогда необходимо применить тест Тьюки-Крамера.
Упражнение решено
Чтобы не затягивать вычисления слишком долго, в качестве решенного упражнения будет взят случай сбалансированного эксперимента. В качестве данных будут приняты следующие данные:
В этом случае есть четыре группы, соответствующие четырем различным методам лечения. Однако мы наблюдаем, что все группы имеют одинаковое количество данных, так что это сбалансированный случай.
Для выполнения анализа ANOVA использовался инструмент, включенный в электронную таблицу Libreoffice. В другие электронные таблицы, такие как Excel, встроен этот инструмент для анализа данных. Ниже представлена сводная таблица, полученная после проведения дисперсионного анализа (ANOVA):
Из дисперсионного анализа у нас также есть значение P, которое для примера составляет 2,24E-6, что значительно ниже уровня значимости 0,05, что напрямую ведет к отклонению нулевой гипотезы: все методы лечения равны.
То есть среди обработок некоторые имеют разные средние значения, но необходимо знать, какие из них статистически значимо и честно отличаются (HSD), используя тест Тьюки.
Чтобы найти число wo, также известное как число HSD, нам нужно найти средний квадрат ошибки MSE. Анализ ANOVA показывает, что сумма квадратов внутри групп SS = 0,2; а количество степеней свободы внутри групп df = 16, используя эти данные, мы можем найти MSE:
MSE = SS / df = 0,2 / 16 = 0,0125
Также требуется найти коэффициент Тьюки q, используя таблицу. В столбце 4, который соответствует 4 сравниваемым группам или обработкам, и в строке 16 производится поиск, поскольку анализ ANOVA дал 16 степеней свободы внутри групп. Это приводит нас к значению q, равному: q = 4,33, что соответствует 0,05 значимости или 95% надежности. Наконец, значение «честно значимой разницы» найдено:
w = HSD = q √ (MSE / r) = 4,33 √ (0,0125 / 5) = 0,2165
Чтобы узнать, какие группы или методы лечения действительно разные, вам необходимо знать средние значения для каждого лечения:
Также необходимо знать разницу между средними значениями пар обработок, которые показаны в следующей таблице:
Сделан вывод, что лучшими методами лечения с точки зрения максимального результата являются Т1 или Т3, которые безразличны со статистической точки зрения. Чтобы выбрать между T1 и T3, нужно искать другие факторы вне представленного здесь анализа. Например, цена, наличие и т. Д.
Ссылки
- Кокран Уильям и Кокс Гертруда. 1974. Опытные образцы. Обмолот. Мексика. Третий выпуск. 661с.
- Снедекор, Г. В. и Кокран, В. Г. 1980. Статистические методы. Седьмое издание, штат Айова, издательство Государственного университета Айовы. 507p.
- Сталь, RGD и Торри, Дж. Х. 1980. Принципы и процедуры статистики: биометрический подход (2-е изд.). Макгроу-Хилл, Нью-Йорк. 629p.
- Tukey, JW 1949. Сравнение индивидуальных средних в дисперсионном анализе. Биометрия, 5: 99-114.
- Wikipedia. Тест Тьюки. Получено с: en.wikipedia.com