Максим Зеленский "Азбука визуализации Power BI"

Книга будет полезна тем, кто уже работает с Microsoft Power BI, а также всем, кто хочет повысить свою визуальную грамотность. Power BI остается самым легким в освоении и бесплатным BI-инструментом, и продолжает работать на территории РФ. А если вы работаете с другими системами или создаете свои продукты на основе данных, то эта книга поможет вам глубоко понять анатомию диаграмм, и какие требования к ними предъявлять “изнутри”. Мы написали эту книгу для всех, кто работает с отчетами – с финансовыми и маркетинговыми данными, о сотрудниках и проектах и с любой другой информацией. х. Вам не обязательно запоминать все технические нюансы, вы можете в любой момент открыть нужную главу и проверить по чек-листу все пункты настройки для конкретной диаграммы.

date_range Год издания :

foundation Издательство :Автор

person Автор :

workspaces ISBN :

child_care Возрастное ограничение : 12

update Дата обновления : 08.10.2024


Рисунок 2–3. Корректная столбчатая диаграмма (слева) и перегруженный вариант (справа).

Мы можем частично решить эту проблему, предоставив больше места для диаграммы, но длинные названия подкатегорий все равно останутся под наклоном, а часть из них будет отображаться не полностью (рисунок 2–4).

Рисунок 2–4. Растянутая столбчатая диаграмма: подписи под углом сложно читать.

Это говорит о том, что нужно использовать другую визуализацию – линейчатую диаграмму. В ней нам нужно “перевернуть” пропорции: столбцы были вытянуты по ширине, а теперь, чтобы поместились все горизонтальные полосы, нужно больше места по вертикали (рисунок 2–5). В этом варианте все подписи отображаются полностью, по горизонтали и достаточно крупно, в этом ключевое преимущество линейчатой диаграммы.

Рисунок 2–5. Корректная альтернатива столбчатой диаграмме с длинными наименованиями категорий – линейчатая диаграмма.

С точки зрения сторителлинга мы могли бы сказать, что нужно сфокусировать внимание на самых значимых товарах. На фоне сотен тысяч значения в диапазоне 10–30 тыс. не видны и их можно было бы сгруппировать в отдельную категорию Прочее. Тогда, получив порядка 10 категорий, мы бы поместили их на столбчатой диаграмме. Но данные на дашборде динамические, и мы не можем зафиксировать топ-10 с ограничением по значению, ведь при фильтрации разница в 10–20 тыс. может оказаться значимой.

Длина подписей категорий и размер диаграммы

Название категории может состоять из одного или нескольких слов. Power BI может переносить его по словам, но это будет зависеть от самого длинного из них. На рисунке 2–6 это слово hydropack. Если для его горизонтального отображения не хватает места, то все подписи по оси Х окажутся под наклоном (рисунок 2–6 слева). Чтобы текст аккуратно расположился в две строки как на рисунке 2–6 (справа) достаточно увеличить ширину области диаграммы на 20–30 %.

Рис 2–6. Варианты отображения подписей категорий: некорректный под наклоном (слева) и корректный по горизонтали с переносом по словам (справа).

Но что делать, если у нас нет дополнительного пространства? Тогда уже для 7–8 категорий мы будем использовать линейчатую диаграмму. Еще одно ее преимущество – она весьма компактная, и даже если мы почти вдвое сократим ее размер, то метки данных и подписи категории все равно будут хорошо видны (рисунок 2–7). При этом для малых значений в диапазоне 10–30 тыс. ничего существенно не изменилось – они как были тонкими полосками, так и остались.

Рис 2–7. Столбчатая диаграмма с подписями под наклоном (слева) и более компактная линейчатая диаграмма (справа).

В целом эта граница перехода между горизонтальным и вертикальным расположением столбцов находится в районе 10-ти категорий. Но в зависимости от длины подписей и размера диаграммы она может быть сдвинута как в меньшую, так и в большую сторону: для 7–8 категорий с развернутыми названиями вам нужно будет использовать линейчатую диаграмму, а для 11–12 категорий с короткими подписями оставить столбчатую.

Динамика

Чтобы показать, как менялся один показатель с течением времени, чаще всего используют линейный график. Он знаком нам со школы. Основная его идея заключается в том, что мы чертим горизонтальную ось времени (ось Х), которое движется слева направо, из прошлого в будущее, а по вертикали откладываем ось значений (ось Y). Для каждого периода на оси Х мы строим точку и соединяем их линиями, которые в итоге показывают нам тренд: растет показатель, падает или имеет сезонные пики и колебания.

С этой же целью мы можем использовать столбцы – они также покажут нам временную динамику. Возникает вопрос, что же выбрать: линию графика или столбцы? Подход здесь аналогичный рейтингу. Если у нас немного показателей, то хорошо будут смотреться столбцы. Например, данные за несколько лет или кварталов (рисунок 2–8 слева). А если на временной шкале много отрезков (по всем дням месяца, или неделям года), то следует выбирать график. Это может быть просто линия (рисунок 2–8 справа) или диаграмма с заливкой области.

Рис 2–8. Квартальная динамика продаж на столбчатой диаграмме (слева) и ежедневная динамика продаж на линейном графике (справа)

Существует пограничный интервал – 12 месяцев года. Для него подходят и столбцы, и линия (рисунок 2–9). Здесь нет проблемы с длинными подписями категорий. В отличие от рейтинга подписи временных интервалов более лаконичные: числовой формат даты, сокращенные названия месяцев и дней недели.

Рисунок 2–9. Два возможных способа отображения динамики продаж за 12 месяцев.

Поэтому на нашем компасе стоит граница в 12 периодов. Если их больше, например динамика за 2 года, то однозначно стоит строить линейный график – на нем проще увидеть тренд (рисунок 2-10 справа). А вот большое число столбцов выглядит перегружено (рисунок 2-10 слева).

Рисунок 2-10. Динамика с большим количеством периодов: некорректная столбчатая диаграмма (слева) и корректная линейная (справа).

Если же данные сгруппированы по кварталам или годам, то линия из нескольких точек наоборот будет смотреться невнятно. Для убедительной линии тренда недостаточно данных (рисунок 2-11 слева), а вот столбцы четко показывают поквартальное изменение выручки (рисунок 2-11 справа).

Рисунок 2-11. Динамика с малым количеством периодов: некорректный линейный график (слева) и корректный вариант столбчатой диаграммы (справа).

Структура

Структура показывает какие сегменты и категории вносят наибольший вклад в общий результат. Для визуализации таких данных обычно используется круг, разделенный на секторы – круговая диаграмма. Кольцевая диаграмма имеет точно такой же смысл, строится точно по таким же параметрам и отличается только наличием пустого пространства внутри. На рисунке 2-12 вы видите структуру продаж по каналам. Обе диаграммы выглядят просто и понятно.

Рисунок 2-12. Структура продаж по каналам дистрибьюции: слева – круговая диаграмма, справа – кольцевая.

В чем между ними разница? Исследованиями подтверждено, что воспринимаются они одинаково. Наш глаз оценивает размер внешней дуги: четверть, треть, половина и так далее. Мы опрашивали своих студентов и клиентов, какой вариант им больше нравится. Одни говорят, что кольцо (пончик) выглядит как-то свежее, интереснее, потому что круговая диаграмма уже просто надоела. А кому-то, наоборот, круг кажется понятнее. Вы можете выбирать на свой вкус. Мы же предпочитаем классические круговые (пироговые) диаграммы, потому что они используют всю площадь фигуры для визуализации.

Диаграммы на рисунке 2-12 смотрятся хорошо, потому что на них всего 5 каналов продаж, точнее даже так: 4 основных, а все остальные более мелкие сгруппированы в Прочее. Оба вида диаграмм наглядно показывают данные в диапазоне 5–7 категорий. Если же категорий будет порядка 10 или даже больше, то обе диаграммы будут смотреться перегружено (рисунок 2-13).

Рисунок 2-13. Перегруженные круговые диаграммы.

Но в аналитических проектах редко когда удается ограничиться 5–7 категориями, но структуру как-то показывать нужно. Из-за этого у круговых диаграмм сложилась “плохая репутация” – их используют для 10 или 15 категорий, которые отображаются тонкими трудно отличимыми друг от друга секторами, а их подписи накладываются друг на друга. Поэтому на нашем компасе для круговых диаграмм установлен в 6 категорий. Напомним, что это средняя граница, и в зависимости от диапазона данных и размера диаграммы, она может понятно отобразить и 7–8 категорий.

Что же делать для 6 и более категорий? В качестве альтернативы круговым диаграммам мы можем использовать относительно новую диаграмму – тримап. Идея ее аналогична, но на секторы мы нарезаем не круг, а прямоугольник. Благодаря тому, что мы заполняем данными всю прямоугольную область диаграммы, на него помещается 10–12 элементов (рисунок 2-14).

Рисунок 2-14. Альтернатива круговым диаграммам – тримап.

Прямоугольная форма также дает нам больше гибкости, чем круг. В зависимости от свободного места на дашборде, мы можем его растянуть по горизонтали или по вертикали. Оптимальные пропорции секторов Power BI подбирает автоматически. Но тримап тоже имеет ограничения. На компасе мы поставили отметку в 12 категорий. В качестве исключения их может поместиться и 13–14, но при 15–20 элементах точно будет сложно что-то разглядеть, кроме самых крупных 5–7 категорий. На рисунке 2-15 изображена структура продаж по регионам: вы видите что большая половина приходится на первые 5 регионов, а дальше все превращается в множество маленьких цветных прямоугольников, на которые не помещаюся подписи категорий, а где-то даже метки данных.

Рисунок 2-15. Перегруженный категориями тримап.

Получается, что для представления структуры нет универсального решения. Для большого количества категорий можем рекомендовать следующие варианты:

1. Если можно сгруппировать все, что не входит в топ-5 в категорию Прочее – стройте круговую диаграмму;

2. Если можно сгруппировать все, что не входит в топ-10 в категорию Прочее – стройте тримап;

3. Если сгруппировать категории нельзя, а показать важно все, то ваш вариант – таблица с условным форматированием. Подробно рассмотрим его в главе 7.

Все книги на сайте предоставены для ознакомления и защищены авторским правом