Квартет Энскомба

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Квартет Энскомба — четыре набора числовых данных, у которых простые статистические свойства идентичны, но их графики существенно отличаются. Каждый набор состоит из 11 пар чисел. Квартет был составлен в 1973 году английским математиком Ф. Дж. Энскомбом[англ.] для иллюстрации важности применения графиков для статистического анализа и влияния выбросов значений на свойства всего набора данных.

Все наборы обладают такими свойствами:

Характеристика Значение
Среднее значение переменной 9.0
Дисперсия переменной 10,0
Среднее значение переменной 7,5
Дисперсия переменной 3,75
Корреляция между переменными и 0,816
Прямая линейной регрессии
Коэффициент детерминации линейной регрессии 0,67

Сами последовательности приведены ниже. Значение одинаковы для первых трёх последовательностей.

Четыре набора данных имеют идентичные статистические характеристики, но их графики существенно различаются.
Квартет Энскомба
I II III IV
x y x y x y x y
10,0 8,04 10,0 9,14 10,0 7,46 8,0 6,58
8,0 6,95 8,0 8,14 8,0 6,77 8,0 5,76
13,0 7,58 13,0 8,74 13,0 12,74 8,0 7,71
9,0 8,81 9,0 8,77 9,0 7,11 8,0 8,84
11,0 8,33 11,0 9,26 11,0 7,81 8,0 8,47
14,0 9,96 14,0 8,10 14,0 8,84 8,0 7,04
6,0 7,24 6,0 6,13 6,0 6,08 8,0 5,25
4,0 4,26 4,0 3,10 4,0 5,39 19,0 12,50
12,0 10,84 12,0 9,13 12,0 8,15 8,0 5,56
7,0 4,82 7,0 7,26 7,0 6,42 8,0 7,91
5,0 5,68 5,0 4,74 5,0 5,73 8,0 6,89