Меню
Главная
Авторизация/Регистрация
 
Главная arrow Математика, химия, физика arrow БИЗНЕС-СТАТИСТИКА
Посмотреть оригинал

Визуализация данных. Графические методы представления данных

Наглядное представление данных помогает как в экспресс-анализе, так и при разработке планов стратегического развития.

Графический метод — метод условных изображений статистических данных с помощью геометрических фигур, линий, точек и разнообразных символических образов.

Главное достоинство статистических графиков — наглядность. При правильном построении графиков статистические показатели привлекают к себе внимание, становятся более понятными, выразительными, лаконичными, запоминающимися. Графики прочно вошли в практическую работу статистиков и стали незаменимым средством обобщения статистических данных, подведения итогов исследований и выявления связи между явлениями. Поэтому необходимо уметь строить и «читать» статистические графики.

Для построения графика необходимо определить, с какой целью он составляется, и тщательно изучить исходный материал. Но главное условие — это владение методологией графических изображений. Любой статистический график должен иметь следующие элементы: графический образ; поле графика; пространственные ориентиры, масштабные ориентиры; экспликации графика.

Графический образ — это символические знаки, с помощью которых изображаются статистические данные: линии, точки, плоские геометрические фигуры (прямоугольники, квадраты, круги и т.д.).

В качестве графического образа выступают и объемные фигуры. Иногда в графиках используются и не геометрические фигуры, а силуэты или изображения предметов.

Одни и те же статистические данные можно представить с помощью различных графических образов. Поэтому важен правильный подбор графического образа. Он должен доходчиво отображать изучаемые показатели и соответствовать основному предназначению графика.

Полем графика является место, на котором он выполняется. Поле графика характеризуется его форматом (размерами и пропорциями сторон). Размер поля графика зависит от его назначения. Стороны поля статистического графика обычно находятся в определенной пропорции. Принято считать, что наиболее оптимальным для зрительного восприятия является график, выполненный на поле прямоугольной формы с соотношением сторон от 1:1,3 до 1:1,5, что соответствует правилу «золотого сечения». Иногда используется поле графика с равными сторонами, т.е. в виде квадрата.

Построение графика — это творческий процесс, включающий некоторый поиск пропорций, образов. Лишь после составления и сравнения нескольких черновых вариантов можно определить правильную композицию графика, установить масштабы и расположение знаков на поле графика.

Пространственные ориентиры графика задаются в виде системы координатных сеток. Система координат необходима для размещения геометрических знаков в поле графика. Наиболее распространенной является система прямоугольных координат. Для построения статистических графиков используется обычно только первый и изредка первый и четвертый квадраты. В практике графического изображения применяются также полярные координаты.

Масштабные ориентиры статистического графика определяются масштабом и системой масштабных шкал. Масштаб статистического графика — это мера перевода числовой величины в графическую.

Масштабной шкалой называется линия, отдельные точки которой могут быть прочитаны как определенные числа. Шкала имеет большое значение в графике и включает три элемента: линию (или носитель шкалы); определенное число помеченных черточками точек, которые расположены на носителе шкалы в определенном порядке, цифровое обозначение чисел, соответствующих отдельным помеченным точкам.

В статистике широко используются следующие графические изображения: диаграммы и статистические карты (картограммы).

Диаграммы — наиболее распространенный способ графических изображений. Это графики количественных отношений. Виды и способы их построения разнообразны. Диаграммы используются для наглядного сравнения с прошлым периодом, с другим объектом, с нормативом, с плановым заданием.

Статистические карты (картограммы) — графики количественного распределения по конкретной территории. По своей основной характеристике этот вид графиков близок к диаграммам и специфичен лишь в том отношении, что представляют собой условные изображения статистических данных на контурной географической карте.

Картограммы применяются в пространственной экономике. В бизнес-статистике они важны при решении логистических задач: выявлении сети поставщиков и потребителей, оптимизации поставок и т.п. Густота тона или штриховки соответствует количественному значению показателя для той или иной территории.

В зависимости от характера решаемых задач выделяют диаграммы сравнения, структурные диаграммы и диаграммы динамики; диаграммы распределения — гистограмма, полигон, кумулята, огива.

Наиболее распространенным видом диаграмм сравнения являются столбиковые диаграммы (bar chart) — графическое изображение статистических показателей в виде столбиков-прямоугольников (см. рис. 2.5). Такие диаграммы широко используются для наглядного сравнения во времени и пространстве, а также для изображения структуры объекта. Столбики могут иметь горизонтальное расположение {tape chart).

При построении столбиковых диаграмм необходимо начертить систему прямоугольных координат, в которой расположатся столбики. Столбиковые диаграммы можно применять для сравнения нескольких показателей.

Широко применяются структурные диаграммы {structure chart). Основное назначение структурных диаграмм заключается в наглядном отражении структуры явления, характеристике удельных весов отдельных частей изучаемого явления, выявлении структурных сдвигов.

Рис. 2.8. Динамика выручки организации «Вертолеты России» за 2008—2015 гг.

При построении структуры в качестве графического образа применяются прямоугольники (столбиковые и полосовые диаграммы ), окружности, построение секторных диаграмм (pie chart) (рис. 2.9)).

Следует различать два вида применения окружностей. В одном случае — для сравнения площади одного круга с другим. Такого рода диаграмма называется круговой. В другом случае круг используется для сравнения площади отдельных секторов друг с другом. Такая диаграмма именуется секторной.

Рис. 2.9. Диаграмма структуры активов магазина «Лента» в 2016 г.

Для изображения изменений во времени строятся диаграммы динамики. Они могут быть столбиковыми или линейными. Для построения линейных графиков применяют систему прямоугольных координат. По оси абсцисс показывается время (годы, месяцы и т.д.), а по оси ординат — значения показателя. Особое внимание следует обратить на выбор масштаба, так как от этого зависит корректность графика. Обеспечение пропорциональности между осями координат необходимо потому, что нарушение равновесия между осями координат приведет к искажению изображения динамики. Искажения достигаются, как правило, изменением масштаба по осям абсцисс и ординат. Таким образом, можно представить (визуально) рост, близкий к нулю, в ярко выраженный устойчивый тренд. В качестве примера такого рода в книге Дарелла Хаффа «Как лгать при помощи статистики» приводится пример изображения роста правительственных субсидий, приведенный в одном из объявлений. Рост составил лишь 4%, но визуально он выглядел почти как 400% за счет увеличения масштаба по оси ординат. Нередко на одном линейном графике показываются несколько кривых, которые дают сравнительную характеристику динамики различных показателей или одного и того же показателя.

Для визуализации в настоящее время существует множество качественных ресурсов и инструментов создания графиков и диаграмм.

Программный продукт Aristochart позволяет строить двухмерные линейные статичные графики (пространственные данные, т.е. «cross-section data»). Программа предполагает набор возможностей по дизайну, изменению меток, других элементов графика и его адаптации.

Простой векторный редактор Diagram Designer предназначен для создания диаграмм, графиков и слайд-шоу. Эта программа позволяет использовать шаблоны, может автоматически проверять правописание и выстраивать графики для несложных математических уравнений. Создавая диаграммы и графики в этой программе можно использовать множество графических элементов — геометрические примитивы, линии, надписи, цветные заливки, соединительные стрелки и т.д.

Graph — программа для построения графиков, редактирования их внешнего вида и изменения данных. В программе Graph доступно быстрое построение сложных синусоидов, логарифмических кривых и графиков с большим количеством входных параметров. Данные для работы можно импортировать из редактора Excel.

JSXGraph — библиотека, разработанная в Байройтском Университете, используемая для отображения геометрических чертежей в веббраузере.

jFreeChart — бесплатная библиотека с открытым кодом, позволяющая создавать графики для приложений. Программа поддерживает широкий спектр типов диаграмм и многие типы выходных форматов.

В Microsoft Excel и Visio имеются также средства для создания высокохудожественных графиков и диаграмм, с помощью которых можно представить зависимости и тенденции.

Поскольку не всегда графические изображения читают специалисты в той или иной области, часто прибегают к инфографике — визуальному отображению данных, содержащему небольшую по объему, но значимую и правильно оформленную информацию. Данное направление очень востребовано в бизнесе. Инструменты инфографики соревнуются друг с другом, акцентируя свои преимущества.

Приведем характеристики ряда программных продуктов.

FusionCharts Suite XT предоставит вам более 90 видов диаграмм и манометров, 965 карт на основе данных, а также дэшборды и демо для бизнеса. FusionCharts также содержит JavaScript API, который упрощает интеграцию с любыми приложениями. Диаграммы, карты и дэшборды высоко интерактивны, легко адаптируемы и работают на всех устройствах и платформах.

Рис. 2.10. Пример графических изображений в FusionCharts Suite XT.

Частота обращений по месяцам года

Raw — продукт в открытом доступе, обладающий возможностями адаптации, бесплатный для загрузки и модифицирования, позволяет пользователям создавать визуальный контент на основе векторов. Данные можно безопасно загрузить из приложения на компьютер, сохранить в формате SVG или PNG.

WolframAlpha, созданный как «база знаний и набор вычислительных алгоритмов», хорош в умном отображении графиков по запросам данных без необходимости применения какой-либо конфигурации. Если используются данные, находящиеся в публичном доступе, инструмент поможет создавать виджеты, делая процесс визуализации данных очень простым.

Можно зарегистрироваться на Wolfram Education и получить доступ к тестовым версиям интерактивных учебников. В них встроены динамические модели графиков с возможностью ввода любых параметров и математические головоломки для решения на скорость. Также доступна возможность загрузки множества типов файлов и данных для автоматического анализа, включая первичные табличные данные, изображения, аудио, XML, а также десятки специализированных научных, медицинских и математических форматов. Среди других функциональных возможностей — наличие расширенной клавиатуры, интерактивность с CDF (формат вычисляемых документов), загрузка данных, и возможность индивидуальной настройки и сохранения графических и табличных результатов (рис. 2.11).

Поскольку этой программой можно пользоваться в онлайн-режиме, в отличие от остальных, требуемых скачивания, это позволяет чаще пользоваться ею.

Рис. 2.11. Пример графического изображения в WolframAlpha

В приложении Tableau есть несколько бесплатных инструментов визуализации данных. Tableau не является веб-приложением, так что желающим придется устанавливать программу на компьютер. Как только она будет установлена, можно загружать таблицы и данные из любых CSV-файлов и создавать различные интерактивные визуализации, включая тепловые карты, отражающие активность действий в разных областях поля, диаграммы Венна для представления связей, столбчатые диаграммы, графики и другие схемы.

В экономической статистике популярным является software JMP. Данное программное обеспечение послужит оптимальным инструментом анализа визуализации данных.

На сегодня существует множество инструментов для анализа данных и визуализации результатов, некоторые из них позволяют применять довольно широкий спектр статистических методов, не имея никакого опыта программирования (например, SPSS). Также весьма распространен для анализа данных язык программирования Python. Но самым популярным является очень простой и интуитивно понятный язык программирования R. Изучение азов работы в R значительно упростит и ускорит решение задач.

Работа в R дает ценный опыт и помогает при изучении более сложных языков программирования. В R тысячи пакетов и библиотек, предоставляющих возможность применять, пожалуй, любые статистические методы. Реализовать регрессионный анализ со случайными эффектами в R позволит специальная библиотека lme4. С помощью языка Python, например, это сделать значительно сложнее. В R множество библиотек, предназначенных для решения весьма узкоспециализированных задач из различных научных областей. Например, bioconductor предоставляет инструменты для анализа данных в биоинформатике. Библиотека grt поможет обрабатывать экспериментальные данные в области вычислительных моделей в когнитивных исследованиях.

Также R позволяет быстро решать широчайший спектр задач в интерактивном режиме. Графические возможности R весьма богаты: так, в R существуют пакеты lattice и ggplot2, возможности которых даже шире, чем у graphics. В них используется другая идеология построения графиков.

В последнее время все большую популярность приобретает инструмент инфографики. В частности, в бизнесе широко используется диаграмма Ганта — инструмент планирования, широко используемый в управлении проектами для визуализации графика работ. Слева по вертикальной оси располагается перечень задач, а сверху по горизонтали — временная шкала. Каждая задача представлена полосой, положение и длина которой отражают даты начала и завершения, а также длительность работ. По сути, диаграмма Ганта позволяет наглядно показать, что должно быть сделано (задачи) и когда (временная шкала).

Поэтому диаграмма Ганта состоит из полос, ориентированных вдоль оси времени. На диаграмме могут быть отмечены совокупные задачи, проценты завершения, указатели последовательности и зависимости работ, метки ключевых моментов (вехи), метка текущего момента времени «Сегодня» и др. Ключевым понятием диаграммы Ганта является «веха» — метка значимого момента в ходе выполнения работ, общая граница двух или более задач. Вехи позволяют наглядно отобразить необходимость синхронизации, последовательности в выполнении различных работ. Вехи, как и другие границы на диаграмме, не являются календарными датами. Сдвиг вехи приводит к сдвигу всего проекта, поэтому диаграмма Ганта не является, строго говоря, графиком работ. Кроме того, диаграмма Ганта не отображает значимости или ресурсоемкое™ работ, не отображает сущности работ (области действия). Для крупных проектов диаграмма Ганта становится чрезмерно тяжеловесной и теряет наглядность.

Указанные выше недостатки и ограничения серьезно ограничивают область применения диаграммы. Тем не менее в настоящее время диаграмма Ганта является стандартным инструментом в теории и практике управления проектами при отображении структуры работ по проекту (рис. 2.12).

Рис. 2.12. Пример Диаграммы Ганта

Диаграмма Ганта дает организации три главных плюса:

1) визуализацию, которая упрощает восприятие и оценку хода рабочих процессов; основные задачи проекта и ход их решения становятся видны, как на ладони, что позволяет своевременно корректировать план действий;

2) возможность оценить последовательность и сроки решения задач, а также сроки проекта в целом, что позволяет сравнить реальный и запланированный графики реализации процесса;

3) повысить эффективность организации управления проектом за счет возможности в любой момент провести анализ текущего состояния выполнения проекта.

С появлением разнообразных инструментов визуализации данных расширился круг направлений их использования.

Таким образом, визуализация — мощный инструмент донесения смысла до конечного потребителя, помощник в восприятии и анализе данных. Но, как и все инструменты, графический метод нужно применять в свое время и в своем месте.

 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 
Популярные страницы