Квартет Энскомба. Почему важно визуализировать данные?

Введение

«Графика раскрывает данные. Действительно, графика может быть более точной и показательной, чем обычные статистические вычисления.», 
– Эдвард Тафте (1983). The Visual Display of Quantitative Information

Визуализация данных помогает раскрывать данные, позволяет легко видеть тенденции и закономерности, которые обычно было бы довольно трудно найти. Иногда, графики могут быть точнее, чем некоторые статистические вычисления.

Визуализация данных — это в представление необработанных данных в визуальном формате: как гистограмма, тепловая матрица, диаграмма рассеяния, пузырьковая диаграмма, ящик с усами, ROC-кривая и тд.

Важно отметить, что в данном случае мы будем говорить не о декоративных элементах визуализации, а о том, как визуализация отражает большие объёмы информации с учетом возможных взаимосвязей.

Подход, при котором визуализация используется для изучения данных называется разведочным анализом данных. Можно сказать, что это один из этапов подготовки данных к анализу.

Квартет Энскомба

Существует набор данных — квартет AnsCombe (Энскомба), его особенность в том, что у четырех наборов данных внутри одинаковые описательные статистики (до второго знака после запятой): среднее, стандартное отклонение и коэффициент корреляции.

Описательные статистики квартета Энскомба

Но если эти 4 набора данных визуализировать, то становится понятно, что они достаточно разные внутри.

Визуализация квартета Энскомба

И как после этого пропускать этап разведочного анализа данных?

Каждый набор состоит из 11 пар чисел. Квартет был составлен в 1973 году английским математиком Ф. Дж. Энскомбом.

x1 y1 x2 y2 x3 y3 x4 y4
10,0 8,04 10,0 9,14 10,0 7,46 8,0 6,58
8,0 6,95 8,0 8,14 8,0 6,77 8,0 5,76
13,0 7,58 13,0 8,74 13,0 12,74 8,0 7,71
9,0 8,81 9,0 8,77 9,0 7,11 8,0 8,84
11,0 8,33 11,0 9,26 11,0 7,81 8,0 8,47
14,0 9,96 14,0 8,10 14,0 8,84 8,0 7,04
6,0 7,24 6,0 6,13 6,0 6,08 8,0 5,25
4,0 4,26 4,0 3,10 4,0 5,39 19,0 12,50
12,0 10,84 12,0 9,13 12,0 8,15 8,0 5,56
7,0 4,82 7,0 7,26 7,0 6,42 8,0 7,91
5,0 5,68 5,0 4,74 5,0 5,73 8,0 6,89

Графики - это важно и нужно, а не просто «для красоты». При правильном подходе графики помогают видеть более масштабную картину, а также отмечать необычные закономерности.

Заказать разведочный анализ данных

У нас Вы можете заказать разведочный анализ данных и не только.

Мы оказываем помощь в статистических расчетах для научных статей, диссертаций или маркетинговых исследований.

Свяжитесь с нами одним из удобных способов, чтобы обсудить детали:

WhatsApp: +7 (919) 882-93-67

Telegram: birdyx_ru

E-mail: mail@birdyx.ru

  1. Подберем корректные методы обработки и анализа данных
  2. Преобразуем данные в удобный для анализа вид
  3. Проведем необходимые вычисления
  4. Опишем и оформим результаты: выводы, таблицы, графики.

Проведем быстрый и качественный статистический анализ данных!

Мы растем, развиваемся, постоянно работаем над автоматизацией аналитических процессов, чтобы предоставлять Вам качественную аналитику оперативно и по доступной цене.