Меню
Бесплатно
Главная  /  Яблоки  /  Зависимость критерия колмогорова от размера выборки. Критерий согласия колмогорова-смирнова - способ оценки распределения совокупности. Для чего используется критерий Колмогорова-Смирнова

Зависимость критерия колмогорова от размера выборки. Критерий согласия колмогорова-смирнова - способ оценки распределения совокупности. Для чего используется критерий Колмогорова-Смирнова

​ Критерий Колмогорова-Смирнова – непараметрический критерий согласия, в классическом понимании предназначен для проверки простых гипотез о принадлежности анализируемой выборки некоторому известному закону распределения. Наиболее известно применение данного критерия для проверки исследуемых совокупностей на нормальность распределения .

1. История разработки критерия Колмогорова-Смирнова

Критерий Колмогорова-Смирнова был разработан советскими математиками Андреем Николаевичем Колмогоровым и Николаем Васильевичем Смирновым .
Колмогоров А.Н. (1903-1987) - Герой Социалистического Труда, профессор Московского государственного университета, академик АН СССР - крупнейший математик XX века, является одним из основоположников современной теории вероятности.
Смирнов Н.В. (1900-1966)- член-корреспондент АН СССР, один из создателей непараметрических методов математической статистики и теории предельных распределений порядковых статистик.

Впоследствии критерий согласия Колмогорова-Смирнова был доработан с целью применения для проверки совокупностей на нормальность распределения американским статистиком, профессором Университета Джорджа Вашингтона Хьюбертом Лиллиефорсом (Hubert Whitman Lilliefors, 1928-2008). Профессор Лиллиефорс являлся одним из пионеров применения компьютерной техники в статистических расчётах.

Хьюберт Лиллиефорс

2. Для чего используется критерий Колмогорова-Смирнова?

Данный критерий позволяет оценить существенность различий между распределениями двух выборок, в том числе возможно его применение для оценки соответствия распределения исследуемой выборки закону нормального распределения.

3. В каких случаях можно использовать критерий Колмогорова-Смирнова?

Критерий Колмогорова-Смирнова предназначен для проверки совокупностей данных, измеренных в количественной шкале .

Для большей достоверности полученных данных объемы рассматриваемых выборок должен быть достаточно большими: n ≥ 50. При размерах оцениваемой совокупности от 25 до 50 элементов, целесообразно применение поправки Большева.

4. Как рассчитать критерий Колмогорова-Смирнова?

Критерий Колмогорова-Смирнова рассчитывается при помощи специальных статистических программ. В основе лежит статистика вида:

где sup S - точная верхняя грань множества S, F n - функция распределения исследуемой совокупности, F(x) - функция нормального распределения

Выводимые значения вероятности основаны на предположении, что среднее и стандартное отклонение нормального распределения известны априори и не оцениваются из данных.

Однако на практике обычно параметры вычисляются непосредственно из данных. В этом случае критерий нормальности включает сложную гипотезу ("насколько вероятно получить D статистику данной или большей значимости, зависящей от среднего и стандартного отклонения, вычисленных из данных"), и приводятся вероятности Лиллиефорса (Lilliefors, 1967).

5. Как интерпретировать значение критерия Колмогорова-Смирнова?

Если D статистика Колмогорова-Смирнова значима, то гипотеза о том, что соответствующее распределение нормально, должна быть отвергнута.

Описание критерия

Классический критерий Колмогорова (иногда говорят Колмогорова-Смирнова) предназначен для проверки простых гипотез о принадлежности анализируемой выборки некоторому полностью известному закону распределения.

Пусть - выборка независимых одинаково распределённых случайных величин, - эмпирическая функция распределения , - некоторая "истинная" функция распределения с известными параметрами. Статистика критерия определяется выражением:

Обозначим через гипотезу о том, что выборка подчиняется распределению . Тогда по теореме Колмогорова при справедливости проверяемой гипотезы:

0:%20%5Cquad%20%5Clim_%7Bn%20%5Cto%20%5Cinfty%7DP(%5Csqrt%7Bn%7D%20D_n%20%5Cleq%20t)=K(t)=%5Csum_%7Bj=-%5Cinfty%7D%5E%7B+%5Cinfty%7D(-1)%5Ej%20%5Cmathrm%7Be%7D%5E%7B-2j%5E2t%5E2%7D." alt="\forall t>0: \quad \lim_{n \to \infty}P(\sqrt{n} D_n \leq t)=K(t)=\sum_{j=-\infty}^{+\infty}(-1)^j \mathrm{e}^{-2j^2t^2}.">

Гипотеза отвергается, если статистика превышает квантиль распределения заданного уровня значимости , и принимается в противном случае.

Примечание: В критерии Колмогорова целесообразно использовать статистику с поправкой Большева: . Распределение этой статистики при справедливости проверяемой гипотезы быстро сходится к распределению Колмогорова и при 25%20" alt=" n>25 "> зависимостью от объема выборки можно пренебречь.

Использование критерия для проверки нормальности

В данном случае критерий Колмогорова используется для проверки гипотезы о принадлежности наблюдаемой выборки нормальному закону, параметры которого оцениваются по этой самой выборке методом максимального правдоподобия. То есть, проверяется сложная гипотеза и в качестве оценок параметров нормального закона используются выборочные оценки среднего и дисперсии.

В этом случае (Lilliefors) использовались модифицированные статистики вида:

.

Критические значения для статистики приведены в следующей таблице (Lilliefors):

0,15 0,10 0,05 0,03 0,01
0,775 0,819 0,895 0,955 1,035

Проверка сложных гипотез

При проверке сложных гипотез, когда по выборке оцениваются параметры закона, с которым проверяется согласие, непараметрические критерии согласия теряют свойство свободы от распределения (Kac, Kiefer, Wolfowitz). При проверке сложных гипотез условные распределения статистик непараметрических критериев согласия (и критерия Колмогорова) зависят от ряда факторов: от вида наблюдаемого закона, соответствующего справедливой проверяемой гипотезе; от типа оцениваемого параметра и числа оцениваемых параметров; в некоторых случаях от конкретного значения параметра (например, в случае семейств гамма- и бета-распределений); от метода оценивания параметров.

Различия в предельных распределениях той же самой статистики при проверке простых и сложных гипотез настолько существенны, что пренебрегать этим ни коем случае нельзя.

О применении критерия Колмогорова для проверки различных сложных гипотез см. на сайте Новосибирского государственного технического университета:

  • Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход: монография. – Новосибирск: Изд-во НГТУ, 2011. – 888 с. (главы 3 и 4)
  • Модели распределений статистик непараметрических критериев согласия при проверке сложных гипотез с использованием оценок максимального правдоподобия. Ч.I // Измерительная техника. 2009. № 6. – С.3-11.
  • Модели распределений статистик непараметрических критериев согласия при проверке сложных гипотез с использованием оценок максимального правдоподобия. Ч.II // Измерительная техника. 2009. № 8. – С.17-26.

Литература

  1. Kolmogoroff A.N. Sulla determinazione empirica di una legge di distribuzione // Giornale dell` Istituto Italiano degly Attuari. 1933. – Vol. 4. – № 1. – P. 83-91.
  2. Большев Л.Н., Смирнов Н.В. Таблицы математической статитики. М.: Наука, 1983.
  3. Lilliefors H.W. On the Kolmogorov-Smirnov test for normality with mean and variance unknown // J. Am. Statist. Assoc., 1967. V.62. – P.399-402.
  4. Kac M., Kiefer J., Wolfowitz J. On Tests of Normality and Other Tests of Goodness of Fit Based on Distance Methods // Ann. Math. Stat., 1955. V.26. – P.189-211.
  5. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть II. Непараметрические критерии. – М.: Изд-во стандартов. 2002. – 64 с.

Ранее рассматривались гипотезы, в которых закон распределения генеральной совокупности предполагался известным. Теперь займемся проверкой гипотез о предполагаемом законе неизвестного распределения, то есть будем проверять нулевую гипотезу о том, что генеральная совокупность распределена по некоторому известному закону. Обычно статистические критерии для проверки таких гипотез называются критериями согласия.

Критерием согласия называется критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Это численная мера расхождения между эмпирическим и теоретическим распределением.

Основная задача. Дано эмпирическое распределение (выборка). Сделать предположение (выдвинуть гипотезу) о виде теоретического распределения и проверить выдвинутую гипотезу на заданном уровне значимости α.

Решение основной задачи состоит из двух частей:

1. Выдвижение гипотезы.

2. Проверка гипотезы на заданном уровне значимости.

Рассмотрим подробно эти части.

1. Выбор гипотезы о виде теоретического распределения удобно делать с помощью полигонов или гистограмм частот. Сравнивают эмпирический полигон (или гистограмму) с известными законами распределения и выбирают наиболее подходящий.

Приведём графики важнейших законов распределения:

Примеры эмпирических законов распределения приведены на рисунках:



В случае (а) выдвигается гипотеза о нормальном распределении, в случае (б) - гипотеза о равномерном распределении, в случае (в) - гипотеза о распределении Пуассона.

Основанием для выдвижения гипотезы о теоретическом распределении могут быть теоретические предпосылки о характере изменения признака. Например, выполнение условий теоремы Ляпунова позволяет сделать гипотезу о нормальном распределении. Равенство средней и дисперсии наводит на гипотезу о распределении Пуассона.

На практике чаще всего приходится встречаться с нормальным распределением, поэтому в наших задачах требуется проверить только гипотезу о нормальном распределении.

Проверка гипотезы о теоретическом распределении отвечает на вопрос: можно ли считать расхождение между предполагаемыми теоретическим и эмпирическим распределениями случайным, несущественным, объясняемым случайностью попадания в выборку тех или иных объектов, или же это расхождение говорит о существенном расхождении между распределениями. Для проверки существуют различные методы (критерии согласия) - c 2 (хи-квадрат), Колмогорова, Романовского и др.

Критерий Пирсона.

Достоинством критерия Пирсона является его универсальность: с его помощью можно проверять гипотезы о различных законах распределения.

1. Проверка гипотезы о нормальном распределении. Пусть получена выборка достаточно большого объема п с большим количеством различных значений вариант. Для удобства ее обработки разделим интервал от наименьшего до наибольшего из значений вариант на s равных частей и будем считать, что значения вариант, попавших в каждый интервал, приближенно равны числу, задающему середину интервала. Подсчитав число вариант, попавших в каждый интервал, составим так называемую сгруппированную выборку:

варианты………..х 1 х 2 … х s

частоты………….п 1 п 2 … п s ,

где х i – значения середин интервалов, а п i – число вариант, попавших в i -й интервал (эмпирические частоты). По полученным данным можно вычислить выборочное среднее и выборочное среднее квадратическое отклонение σ В . Проверим предположение, что генеральная совокупность распределена по нормальному закону с параметрами M (X ) = , D (X ) = . Тогда можно найти количество чисел из выборки объема п , которое должно оказаться в каждом интервале при этом предположении (то есть теоретические частоты). Для этого по таблице значений функции Лапласа найдем вероятность попадания в i -й интервал:

,

где а i и b i - границы i -го интервала. Умножив полученные вероятности на объем выборки п, найдем теоретические частоты: п i =n·p i .Наша цель – сравнить эмпирические и теоретические частоты, которые, конечно, отличаются друг от друга, и выяснить, являются ли эти различия несущественными, не опровергающими гипотезу о нормальном распределении исследуемой случайной величины, или они настолько велики, что противоречат этой гипотезе. Для этого используется критерий в виде случайной величины

. (7)

Смысл ее очевиден: суммируются части, которые квадраты отклонений эмпирических частот от теоретических составляют от соответствующих теоретических частот. Можно доказать, что вне зависимости от реального закона распределения генеральной совокупности закон распределения случайной величины (7) при стремится к закону распределения с числом степеней свободы k = s – 1 – r , где r – число параметров предполагаемого распределения, оцененных по данным выборки. Нормальное распределение характеризуется двумя параметрами, поэтому k = s – 3. Для выбранного критерия строится правосторонняя критическая область, определяемая условием

(8)

где α – уровень значимости. Следовательно, критическая область задается неравенством а область принятия гипотезы - .

Итак, для проверки нулевой гипотезы Н 0: генеральная совокупность распределена нормально – нужно вычислить по выборке наблюдаемое значение критерия:

, (7`)

а по таблице критических точек распределения χ 2 найти критическую точку , используя известные значения α и k = s – 3. Если - нулевую гипотезу принимают, при ее отвергают.

Пример. Результаты исследования спроса на товар представлены в таблице:

Выдвинуть гипотезу о виде распределения и проверить её на уровне значимости a=0,01.

I. Выдвижение гипотезы.

Для указания вида эмпирического распределения построим гистограмму


120 160 180 200 220 280

По виду гистограммы можно сделать предположение о нормальном законе распределения изучаемого признака в генеральной совокупности.

II. Проверим выдвинутую гипотезу о нормальном распределении, используя критерий согласия Пирсона.

1. Вычисляем , s В.В качестве вариант возьмём среднее арифметическое концов интервалов:

2. Найдём интервалы (Z i ; Z i+1): ; .

За левый конец первого интервала примем (-¥), а за правый конец последнего интервала - (+¥). Результаты представлены в табл. 4.

3. Найдем теоретические вероятности Р i и теоретические частоты (см. табл. 4).

Таблица 4

i Граница интервалов Ф(Z i) Ф(Z i+1) P i = Ф(Z i+1)-Ф(Z i)
x i x i+1 Z i Z i+1
-1,14 -0,5 -0,3729 0,1271 6,36
-1,14 -0,52 -0,3729 -0,1985 0,1744 8,72
-0,52 0,11 -0,1985 0,0438 0,2423 12,12
0,11 0,73 0,0438 0,2673 0,2235 11,18
0,73 0,2673 0,5 0,2327 11,64

4. Сравним эмпирические и теоретические частоты. Для этого:

а) вычислим наблюдаемое значение критерия Пирсона.

Вычисления представлены в табл.5.

Таблица 5

i
6,36 -1,36 1,8496 0,291
8,72 1,28 1,6384 0,188
12,12 1,88 3,5344 0,292
11,18 0,82 0,6724 0,060
11,64 -2,64 6,9696 0,599
S

б) по таблице критических точек распределения c 2 при заданном уровне значимости a=0,01 и числе степеней свободы k=m–3=5–3=2 находим критическую точку ; имеем .

Сравниваем c . . Следовательно, нет оснований отвергать гипотезу о нормальном законе распределения изучаемого признака генеральной совокупности. Т.е. расхождение между эмпирическими и теоретическими частотами незначимо (случайно). ◄

Замечание. Интервалы, содержащие малочисленные эмпирические частоты (n i <5), следует объединить, а частоты этих интервалов сложить. Если производилось объединение интервалов, то при определении числа степеней свободы по формуле K=m-3 следует в качестве m принять число оставшихся после объединения интервалов.

2. Проверка гипотезы о равномерном распределении . При использовании критерия Пирсона для проверки гипотезы о равномерном распределении генеральной совокупности с предполагаемой плотностью вероятности

необходимо, вычислив по имеющейся выборке значение , оценить параметры а и b по формулам:

где а* и b* - оценки а и b . Действительно, для равномерного распределения М (Х ) = , , откуда можно получить систему для определения а* и b *: , решением которой являются выражения (9).

Затем, предполагая, что , можно найти теоретические частоты по формулам

Здесь s – число интервалов, на которые разбита выборка.

Наблюдаемое значение критерия Пирсона вычисляется по формуле (7`), а критическое – по таблице с учетом того, что число степеней свободы k = s – 3. После этого границы критической области определяются так же, как и для проверки гипотезы о нормальном распределении.

3. Проверка гипотезы о показательном распределении. В этом случае, разбив имеющуюся выборку на равные по длине интервалы, рассмотрим последовательность вариант , равноотстоящих друг от друга (считаем, что все варианты, попавшие в i – й интервал, принимают значение, совпадающее с его серединой), и соответствующих им частот n i (число вариант выборки, попавших в i – й интервал). Вычислим по этим данным и примем в качестве оценки параметра λ величину . Тогда теоретические частоты вычисляются по формуле

Затем сравниваются наблюдаемое и критическое значение критерия Пирсона с учетом того, что число степеней свободы k = s – 2.

Пример . Для выборки, интервальный статистический ряд которой имеет вид

проверить при уровне значимости α = 0,05 гипотезу о.

Вопрос 3

λ - критерий Колмогорова-Смирнова

Назначение критерия

Критерий λ предназначен для сопоставления двух распределений:

а) эмпирического с теоретическим , например, равномерным или нормальным;

б) одного эмпирического распределения с другим эмпирическим распределением.

Критерий позволяет найти точку, в которой сумма накопленных расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения.

Описание критерия

Если в методе χ 2 мы сопоставляли частоты двух распределений отдельно по каждому разряду, то здесь мы сопоставляем сначала часто­ты по первому разряду, потом по сумме первого и второго разрядов, потом по сумме первого, второго и третьего разрядов и т. д. Таким образом, мы сопоставляем всякий раз накопленные к данному разряду частоты.

Если различия между двумя распределениями существенны, то в какой-то момент разность накопленных частот достигнет критического значения, и мы сможем признать различия статистически достоверны­ми. В формулу критерия λ включается эта разность. Чем больше эмпи­рическое значение λ , тем более существенны различия.

Гипотезы -

Н 0: Различия между двумя распределениями недостоверны (судя по точке максимального накопленного расхождения между ними).

H 1: Различия между двумя распределениями достоверны (судя по точке максимального накопленного расхождения между ними).

Графическое представление критерия

Рассмотрим для иллюстрации распределение желтого (№4) цвета в 8-цветном тесте М. Люшера. Если бы испытуемые случайным обра­зом выбирали цвета, то желтый цвет, так же, как и все остальные, равновероятно мог бы занимать любую из 8-и позиции выбора. На практике, однако, большинство испытуемых помещают этот цвет, "цвет ожидания и надежды" на одну из первых позиций ряда.

На Рис. 4.9 столбиками представлены относительные частоты 8 попадания желтого цвета сначала на 1-ю позицию (первый левый стол­бик), затем на 1-ю и 2-ю позицию (второй столбик), затем на 1-ю, 2-ю и 3-ю позиции и т. д. Мы видим, что высота столбиков постоянно воз­растает, так как они отражают относительные частоты, накопленные к данной позиции. Например, столбик на 3-й позиции имеет высоту 0,51. Это означает, что на первые три позиции желтый цвет помещают 51% испытуемых.

8 Относительная частота, или частость, - это частота, отнесенная к общему коли­честву наблюдении; в данном случае это частота попадания желтого цвета на дан­ную позицию, отнесенная к количеству испытуемых. Например, частота попадания желтого цвета на 1-ю позицию ƒ=24; количество испытуемых n=102; относительная частота ƒ*=ƒ/n=О,235.

Прерывистой линией на Рис. 4.9 соединены точки, отражающие накопленные частоты, которые наблюдались бы, если бы желтый цвет с равной вероятностью попадал на каждую из 8-и позиций. Сплошными линиями обозначены расхождения между эмпирическими и теоретически­ми относительными частотами. Эти расхождения обозначаются как d .

Рис 4.9 . Сопоставления в критерии λ: стрелками отмечены расхождения между эмпирическими и теоретическими накоплениями относительными частотами по каждому разряду

Максимальное расхождение на Рис. 4.9 обозначено как d max Именно эта, третья позиция цвета, и является переломной точкой, опре­деляющей, достоверно ли отличается данное эмпирическое распределе­ние от равномерного. Мы проверим это при рассмотрении Примера 1.

Ограничения критерия λ

1. Критерии требует, чтобы выборка была достаточно большой. При сопоставлении двух эмпирических распределений необходимо, что­бы n 1,2 > 50. Сопоставление эмпирического распределения с теоре­тическим иногда допускается при n> 5 (Ван дер Варден Б.Л., 1960; Гублер Е.В., 1978).

2. Разряды должны быть упорядочены по нарастанию или убыванию какого-либо признака. Они обязательно должны отражать какое-то однонаправленное его изменение. Например, мы можем за разряды принять дни недели, 1-й, 2-й, 3-й месяцы после прохождения курса терапии, повышение температуры тела, усиление чувства недостаточ­ности и т. д. В то же время, если мы возьмем разряды, которые случайно оказались выстроенными в данную последовательность, то и накопление частот будет отражать лишь этот элемент случайного соседства разрядов. Например, если шесть стимульных картин в ме­тодике Хекхаузена разным испытуемым предъявляются в разном порядке, мы не вправе говорить о накоплении реакций при переходе от картины №1 стандартного набора к картине №2 и т. д. Мы не можем говорить об однонаправленном изменении признака при со­поставлении категорий "очередность рождения", "национальность", "специфика полученного образования" и т.п. Эти данные представ­ляют собой номинативные шкалы: в них нет никакого однозначного однонаправленного изменения признака.

Итак, мы не можем накапливать частоты по разрядам, которые отличаются лишь качественно и не представляют собой шкалы порядка. Во всех тех случаях, когда разряды представляют собой не упо­рядоченные по возрастанию или убыванию какого-либо признака кате­гории, нам следует применять метод χ 2 .

Пример 1: Сопоставление эмпирического распределения с теоретическим

Ввыборке здоровых лиц мужского пола, студентов технических и военно-технических вузов в возрасте от 19-ти до 22 лет, средний воз­раст 20 лет, проводился тест Люшера в 8-цветном варианте. Установ­лено, что желтый цвет предпочитается испытуемыми чаще, чем отверга­ется (Табл. 4.16). Можно ли утверждать, что распределение желтого цвета по 8-и позициям у здоровых испытуемых отличается от равно­мерного распределения?

Таблица 4.16

Эмпирические частоты попадания желтого цвета на каждую из 8 позиций (n=102)

Позиции желтого цвета

Эмпирические частоты

Сформулируем гипотезы.

H 0: Эмпирическое распределение желтого цвета по восьми позициям не отличается от равномерного распределения.

H 1: Эмпирическое распределение желтого цвета по восьми позициям отличается от равномерного распределения.

Теперь приступим к расчетам, постепенно заполняя результатами таблицу расчета критерия λ. Все операции лучше прослеживать по Табл. 4.17, тогда они будут более понятными.

Занесем в таблицу наименования (номера) разрядов и соответст­вующие им эмпирические частоты (первый столбец Табл. 4.17).

Затем рассчитаем эмпирические частости ƒ* по формуле:

ƒ* j = ƒ*/ n

где f j - частота попадания желтого цвета на данную позицию; n- общее количество наблюдений;

j - номер позиции по порядку.

Запишем результаты во второй столбец (см. Табл. 4.17).

Теперь нам нужно подсчитать накопленные эмпирические часто­сти ∑ƒ*. Для этого будем суммировать эмпирические частости ƒ*. На­пример, для 1-го разряда накопленная эмпирическая частость будет равняться эмпирической частости 1-го разряда, Eƒ* 1 =0,235 9 .

Для 2-го разряда накопленная эмпирическая частость будет пред­ставлять собой сумму эмпирических частостей 1-го и 2-го разрядов:

Eƒ* 1+2 =O,235+0,147=0,382

Для 3-го разряда накопленная эмпирическая частость будет пред­ставлять собой сумму эмпирических частостей 1-го, 2-го и 3-го разрядов:

Eƒ* 1+2+3 =0,235+0,147+0,128=0,510

Мы видим, что можно упростить задачу, суммируя накопленную эмпирическую частость предыдущего разряда с эмпирической частостью данного разряда, например, для 4-го разряда:

Eƒ* 1+2+3+4 =0,510+0,078=О,588

Запишем результаты этой работы в третий столбец.

Теперь нам необходимо сопоставить накопленные эмпирические частости с накопленными теоретическими частостями. Для 1-го разряда теоретическая частость определяется по формуле:

f * теор = 1/k

9 Все формулы приведены для дискретных признаков, которые могут быть выра­жены целыми числами, например: порядковый номер, количество испытуемых, ко­личественный состав группы и т.п.

где k - количество разрядов (в данном случае - позиций цвета).

Для рассматриваемого примера:

f * теор =1/8=0,125

Эта теоретическая частость относится ко всем 8-и разрядам. Действительно, вероятность попадания желтого (или любого другого) цвета на каждую из 8-и позиций при случайном выборе составляет 1/8, т.е. 0,125.

Накопленные теоретические частости для каждого разряда определяем суммированием.

Для 1-го разряда накопленная теоретическая частость равна теоретической частости попадания в разряд:

f * т1 =0,125

Для 2-го разряда накопленная теоретическая частость представ­ляет собой сумму теоретических частостей 1-го и 2-го разрядов:

f * т1+2 =0,125+0,125=0,250

Для 3-го разряда накопленная теоретическая частость представ­ляет собой сумму накопленной к предыдущему разряду теоретической частости с теоретической частостью данного разряда:

f * т1+2+3 =0,250+0,125=0,375

Можно определить теоретические накопленные частости и путем умножения:

S f * т j = f * теор * j

где f * теор - теоретическая частость;

j - порядковый номер разряда.

Занесем рассчитанные накопленные теоретические частости в четвертый столбец таблицы (Табл. 4.17).

Теперь нам осталось вычислить разности между эмпирическими и теоретическими накопленными частостями (столбцы 3-й и 4-й). В пя­тый столбец записываются абсолютные величины этих разностей, обо­значаемые как d .

Определим по столбцу 5, какая из абсолютных величин разности является наибольшей. Она будет называться d max . В данном случае d max =0,135.

Теперь нам нужно обратиться к Табл. X Приложения 1 для оп­ределения критических значений d max при n=102.

Таблица 4.17

Расчет критерия при сопоставлении распределения выборов желтого цвета с равномерным распределением (n=102)

Позиция желтого цвета

Эмпирическая частота

Эмпирическая частость

Накопленная эмпирическая частость

Накопленная теоретическая частость

Разность

Для данного случая, следовательно,

Очевидно, что чем больше различаются распределения, тем больше и различия в накопленных частостях. Поэтому нам не составит труда распределить зоны значимости и незначимое™ по соответствую­щей оси:

d эмп - d кр

Ответ: Но отвергается при р=0,05. Распределение желтого цве­та по восьми позициям отличается от равномерного распределения. Представим все выполненные действия в виде алгоритма

АЛГОРИТМ 14

Расчет абсолютной величины разности d между эмпирическим и равномерным распределениями

1. Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты (первый столбец).

ƒ* эмп = ƒ эмп / n

где ƒ эмп - эмпирическая частота по данному разряду;

п - общее количество наблюдений.

Занести результаты во второй столбец.

f * j =∑ f * j -1 + f * j

где f * j -1

j - порядковый номер разряда;

f* j:- эмпирическая частость данного j-ro разряда.

Занести результаты в третий столбец таблицы.

f j =∑ f j -1 + f j

где =∑ f j -1 - теоретическая частость, накопленная на предыдущих разрядах;

j - порядковый номер разряда;

ƒ* т j: - теоретическая частость данного разряда. Занести результаты в третий столбец таблицы.

5.Вычислить разности между эмпирическими и теоретическими нако­пленными частостями по каждому разряду (между значениями 3-го и 4-го столбцов).

6.Записать в пятый столбец абсолютные величины полученных раз­ностей, без их знака. Обозначить их как d .

7. Определить по пятому столбцу наибольшую абсолютную величину разности - d max .

8. По Табл. X Приложения 1 определить или рассчитать критические значения d max для данного количества наблюдений n .

Если d max равно критическому значению d или превышает его, различия между распределениями достоверны.

Пример 2: сопоставление двух эмпирических распределений

Интересно сопоставить данные, полученные в предыдущем при­мере, с данными обследования X. Кларом 800 испытуемых (Klar H., 1974, р. 67). X. Кларом было показано, что желтый цвет является единственным цветом, распределение которого по 8 позициям не отли­чается от равномерного. Для сопоставлений им использовался метод χ 2 . Полученные им эмпирические частоты представлены в Табл. 4.18.

Таблица 4.18

Эмпирические частоты попадания желтого цвета на каждую из 8 пози­ций в исследовании X. Клара (по: Klar H., 1974) (п=800)

Разряды-позиции желтого цвета

Эмпирические частоты

Сформулируем гипотезы.

Н 0: Эмпирические распределения желтого цвета по 8 позициям в отечественной выборке и выборке X. Клара не различаются.

H 1: Эмпирические распределения желтого цвета по 8 позициям в отечественной выборке и выборке X. Клара отличаются друг от друга.

Поскольку в данном случае мы будем сопоставлять накопленные эмпирические частости по каждому разряду, теоретические частости нас не интересуют.

Все расчеты будем проводить в таблице по алгоритму 15.

АЛГОРИТМ 15

Расчет критерия λ при сопоставления двух эмпирических распределений

1.Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты, полученные в распределении 1 (первый столбец) и в распределении 2 (второй столбец).

ƒ* э =ƒ э / n 1

где ƒ э

n 1 [ - количество наблюдений в выборке.

Занести эмпирические частости распределения 1 в третей столбец.

ƒ* э =ƒ э / n 2

где ƒ э - эмпирическая частота в данном разряде;

n 2 - количество наблюдений во 2-й выборке.

Занести эмпирические частости распределения 2 в четвертый столбец таблицы.

∑ƒ* j =∑ƒ* j -1 +ƒ* j

где ∑ƒ* j -1 - частость, накопленная на предыдущих разрядах;

j - порядковый номер разряда;

ƒ* j -1 - частости данного разряда.

Полученные результаты записать в пятый столбец.

7.Определить по седьмому столбцу наибольшую абсолютную величину разности

где n 1 - количество наблюдений в первой выборке;

n 2 - количество наблюдении во второй выборке.

9. По Табл. XI Приложения 1 определить, какому уровню статистической зна­чимости соответствует полученное значение λ.

Если λ эмп > 1,36, различия между распределениями достоверны.

Последовательность выборок может быть выбрана произвольно, так как расхождения между ними оцениваются по абсолютной величине разностей. В нашем случае первой будем считать отечественную выбор­ку, второй - выборку Клара.

Таблица 4.19

Расчет критерия при сопоставлении эмпирических распределений

желтого цвета в отечественной выборке (n1=102)

и выборке Клара (п2 =: 800)

Позиция желтого цвета

Эмпирические частоты

Эмпирические частости

Накоплены эмпирические частности

Разность

∑ƒ* 1 -∑ƒ* 2

∑ƒ* 1

∑ƒ* 2

Максимальная разность между накопленными эмпирическими частостями составляет 0,118 и падает на второй разряд.

В соответствии с пунктом 8 алгоритма 15 подсчитаем значение λ:

По Табл. XI Приложения 1 определяем уровень статистической
значимости полученного значения: р=0,16:

Построим для наглядности ось значимости.

На оси указаны критические значения λ соответствующие приня­тым уровням значимости: λ 0,05 =1,36, λ 0,01 =1,63.

Зона значимости простирается вправо, от 1,63 и далее, а зона незначимости – влево, от 1,36 к меньшим значениям.

λ эмп < λ кр

Ответ: Но принимается. Эмпирические распределения желтого цвета по 8 позициям в отечественной выборке и выборке X. Клара совпадают. Таким образом, распределения желтого цвета в двух выбор­ках не различаются, но в то же время они по-разному соотносятся с равномерным распределением: у Клара отличий от равномерного рас­пределения не обнаружено, а 8 отечественной выборке различия обна­ружены (р<0,05). Возможно, картину могло бы прояснить применение другого метода?

Е.В. Гублер (1978) предложил сочетать использование критерия λ с критерием φ* (угловое преобразование Фишера).

Об этих возможностях сочетания методов λ и φ* мы поговорим в следующей лекции.

.5. Алгоритм выбора критерия для сравнения распределений

По опыту хождения на защиты курсовых и дипломных работ по психологии подметил ряд распространённых и коварных ошибок в работах. Задумал черкнуть текст, предостерегающий от таких ошибок. Буду благодарен, если специалисты по статистике проверят.

Чтобы не вываливать сразу много, пока первые пять пунктов.


1. Если по критерию Колмогорова-Смирнова получилось p-значение больше 0,05 (или 0,1) – распределение нормально, можно делать параметрические методы.

Критерий Колмогорова-Смирнова оценивает значимость различий между формой двух распределений. При проверке нормальности (на самом деле, это лишь частный случай применения K-S теста) речь идёт об обнаружении значимых отличий между формой Вашего распределения и моделью нормального. То есть p-значение больше 0,05 (и т.п.) следует понимать как «Я не нашёл различий между Вашим распределением и нормальным (значимых различий на этом уровне)».

А не найти различия можно просто потому, что на руках слишком мало данных для обнаружения. Точно так же, как следователь не может найти преступника при малом количестве улик. Это ещё не значит, что дело чисто.

Так вот, Колмогоров-Смирнов – весьма требовательный к объёму данных критерий, который начинает адекватно работать на выборке в районе 80. Чем меньше выборка – тем труднее ему углядеть что-нибудь. На выборках в 20-40 человек, которые часто бывают в студенческих работах, критерий Колмогорова-Смирнова практически всегда будет заявлять «Я не смог увидеть никаких различий», каким бы перекошенным не являлось Ваше распределение.

Прикиньте теперь весь ужас ситуации, когда студент перво-наперво сделал Колмогорова-Смирнова на малом количестве респондентов, радостно заключил о нормальности и пошёл напропалую пользоваться параметрическими методами? Это ведь ставит под сомнение АБСОЛЮТНО ВСЁ, что он потом получил в работе.

При выборке в несколько десятков (но ощутимо меньше 80) следует говорить лишь об условной нормальности данных, которая оценивается через величины ассиметрии и эксцесса по сравнению с их стандартными ошибками. Если же выборка составляет эдак 20 – здесь просто нет и не может быть нормальности. Никогда. Сразу обращайтесь к непараметрической статистике.

2. Если общая выборка исследования дала нормальное распределение, то дальше можно сравнивать что угодно с чем угодно при помощи параметрических методов.

Необходимость нормального распределения для параметрических методов связана с их опорой на средние значения (и другие параметры распределения). Когда в какой-то группе нет нормального распределения – среднее может быть бессмысленным (среднее чисел 9, 10, 11 и 130 равно 40 – результат не похож ни на одно из усредняемых чисел). А когда нормальность есть – среднее заведомо получится осмысленным.

Соответственно, ПРИ СРАВНЕНИИ ДВУХ групп через средние значения, нужно иметь ДВА осмысленных средних значения. При сравнении трёх – три, и так далее. Нормальное распределение на общей выборке Вам нужно только в том случае, если Вы делаете какие-то выводы об этой общей выборке. А сколько потом групп Вы изучаете параметрическими методами – столько у Вас и должно быть (условно) нормальных распределений.

3. Если получилось нормальное распределение, можно делать дисперсионный анализ.

Дисперсионный анализ как раз-таки мало уязвим к ненормальным распределениям (кроме некоторых частных случаев). Проверка подвыборок на нормальность желательна, но от нарушений нормальности ничего страшного, скорее всего, не случится.

Однако дисперсионный анализ предъявляет ещё два особых требования к данным. Во-первых, не должно быть значимых различий во внутригрупповых дисперсиях (проверяются тестом Ливеня) – это таит серьёзную угрозу, если Ваши группы заметно отличаются по размеру. Во-вторых и в-главных, факторы для многофакторного дисперсионного анализа должны быть независимы друг от друга. Не нарушайте этого условия, не используйте в качестве факторов связанные показатели! Тогда адекватное решение задачи достигается только структурным моделированием, а не дисперсионным анализом.

Чтобы облегчить себе жизнь, для многофакторного дисперсионного анализа лучше всего сразу набирать равномерный комплекс. Равномерный комплекс – это когда на все возможные сочетания факторов приходится одинаковое количество наблюдений (типа: 16 молодых женщин-узбечек, 16 молодых женщин-татарок, 16 молодых женщин-русских, 16 молодых мужчин-узбеков, 16 молодых мужчин-татар, 16 молодых мужчин-русских, 16 пожилых женщин-узбечек, 16 пожилых женщин-татарок, 16 пожилых женщин-русских, 16 пожилых мужчин-узбеков, 16 пожилых мужчин-татар, 16 пожилых мужчин-русских).

5.Корреляционный анализ позволяет выявить взаимосвязь.

Слово «взаимосвязь» регулярно появляется в работах, организация которых не позволяет найти причин и следствий. Студенты обычно в курсе, что корреляция не означает «влияния», это слово они предусмотрительно и заменяют «взаимосвязью».

Задумайтесь уже просто над звучанием слова. Взаимная связь. То есть связь в обе стороны. Если А взаимосвязано с Б – значит, через А происходит какое-то воздействие на Б и одновременно через Б – какое-то воздействие на А. Как Вы думаете, если корреляция не способна подтвердить влияние даже в одну сторону, может ли она подтвердить влияние в обе стороны?

Корреляция показывает НЕ ВЗАИМО-, А ПРОСТО СВЯЗЬ. Вовсе не обязательно двустороннюю. Связь может быть строго односторонней: только X влияет на Y безо всякого обратного воздействия. Или наоборот: только Y влияет на X. Связь может быть действительно взаимной. Она вообще может быть только опосредованной каким-то третьим Z, когда X и Y непосредственно друг на друга не действуют. В учебнике Майерса рассказывается, что высота надгробий высоко коррелирует с количеством прожитых лет, поскольку чем дольше прожил человек, тем больше он разбогател и тем более роскошный памятник закажут его родственники (это касается западных стран, конечно). Корреляция показывает какую-то связь, сама по себе не различая случаев одностороннего влияния, двустороннего влияния, опосредованного влияния. И говорить о «взаимосвязи», имея на руках только корреляцию, не более обоснованно, чем о «влиянии».

На этапе описания статистики ошибка – чисто языковая и легко исправимая. Проблемы возникают, когда на стадии интерпретации человек полагает, что доказал именно взаимосвязь и начинает рассуждать о взаимных отношениях X и Y.