Критерии математической статистики обработки данных

Q - критерий Разенбаума

Назначение критерия

Критерий используется дам оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. В каждой из выборок должно быть не менее 11 испытуемых.

Ограничения критерия Q

1. В каждой из сопоставляемых выборок должно быть не менее 11 наблюдений. При этом объемы выборок должны примерно совпадать. Е.В. Гублером указываются следующие правила:

а) если в обеих выборках меньше 50 наблюдений, то абсолютная величина разности между n1 и n2 не должна быть больше 10 наблюдений;

б) если в каждой из выборок больше 51 наблюдений, но меньше 100, то абсолютная величина разности между n1 и n2 не должна быть больше 20 наблюдений;

в) если в каждой из выборок больше 100 наблюдений, то допускается, чтобы одна из выборок была больше другой не более чем в 1,5-2 раза (Гублер Е.В., 1978, С. 75).

2. Диапазоны разброса значений в двух выборках должны не совпадать между собой, в противном случае применение критерия бессмысленно. Между тем, возможны случаи, когда диапазоны разброса значений совпадают, но, вследствие разносторонней асимметрии двух распределений, различия в средних величинах признаков существенны.

АЛГОРИТМ

подсчета критерия Q Розенбаума

1. Проверить, выполняются ли ограничения: n1, n2 ≥ 11, n1 ≈ n2

2. Упорядочить значения отдельно в каждой выборке по степени возрастания признака. Считать выборкой 1 ту выборку, значения в которой предположительно выше, а выборкой 2 - ту, где значения предположительно ниже.

3. Определить самое высокое (максимальное) значение в выборке 2.

4. Подсчитать количество значений в выборке 1, которые выше максимального значения в выборке 2. Обозначить полученную величину как S1.

5. Определить самое низкое (минимальное) значение в выборке I.

6. Подсчитать количество значений в выборке 2, которые ниже минималь­ного значения выборки 1. Обозначить полученную величину как S2.

7. Подсчитать эмпирическое значение Q по формуле: Q = S1 + S2.

8. По таблице определить критические значения Q для данных n1 и n2. Ес­ли Q равно Q 0,05 или превышает его, Н0 отвергается.

При n1, n2 > 26 сопоставить полученное эмпирическое значение с Q кр =8 (p<0,05) и Q кр = 10 (p≤0,01).

Если Q эмп превышает или по крайней мере равняется

Q кр =8 , Н0 отвергается.

U- критерий Манна-Уитни

Назначение критерия

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n1, n2 ≥3 или n1, n2 ≥ 5 и является более мощным, чем критерий Розенбаума,

Ограничения критерия U

1. В каждой выборке должно быть не менее 3 наблюдений: n1, n2 ≥ 3 , допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

2. В каждой выборке должно быть не более 60 наблюдений: n1, n2 ≤60. Однако уже при n1, n2 ≥ 20 ранжирование становится достаточно трудоемким.

На наш взгляд, в случае, если n1, n2 ≥ 20, лучше использовать другой критерий, а именно угловое преобразование Фишера в комбинации с критерием λ, позволяющим выявить критическую точку, в которой накапливаются максимальные различия между двумя сопоставляемыми выборками.

Правила ранжирования

1.Меньшему значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1.

Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений. Например, если п=7, то наибольшее значение получит ранг 7, за возможным исключением для тех случаев, которые предусмотрены правилом 2.

2.В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они подучили бы, если бы не были равны.

Например, 3 наименьших значения равны 10 секундам.

Если бы мы измеряли время более точно, то эти значения могли бы различаться и составили бы, скажем,, 10,2 сек., 10,7 сек. В этом случае они получили бы ранги, соответственно, 1, 2 и 3. Но поскольку полученные нами значения равны, каждое из них получает средний ранг:

1+2+3 = 6 = 2

3 3

Допустим, следующие 2 значения равны 12 сек. Они должны были бы получить ранги 4 и 5, но, поскольку они равны, то получат средний ранг:

4+5 = 4,5

3. Общая сумма рангов должна совпадать с расчетной, которая определяется по формуле:

Σ (R1)= N-(N+1)

Где N- общее количество ранжируемых наблюдений (значений).

Несовпадение реальной и расчетной сумм рангов будет свидетельство­вать об ошибке, допущенной яри начислении рангов или их суммирования. Прежде чем продолжить работу, необходимо найти и устранить ее.

При подсчете критерия U легче всего сразу приучить себя действовать по строгому алгоритму.

АЛГОРИТМ