Анализ данных

Анализ данных начинается с перевода «сырых» данных в осмысленную информацию, их введение в компьютер, проверки на предмет ошибок, кодирования, представления в матричной форме (табулирования). Все это называется преобразованием исходных данных.

Далее проводится статистический анализ, т. е. определяются средние величины, частоты, корреляционные и регрессионные соотношения, осуществляется анализ трендов.

Преобразование данных

После сбора данных необходимо их преобразовать, т.е. привести к более сжатому виду, удобному для анализа и обладающему достаточной для заказчика информацией. Обычно закодированные исходные данные представляются в виде матрицы (осуществляется табулирование), столбцы которой содержат ответы на различные вопросы анкеты, а ряды — респондентов или изучаемые ситуации. Преобразование данных заключается в описании данных матрицы на языке ограниченного числа мер, характеризующих собранные данные. Табулирование помогает исследователю понять, что означают собранные данные. Одновременный анализ двух и более категорий опрашиваемых называется перекрестной табуляцией.

Исследователь, осуществляя преобразование, старается найти зависимости среди собранных данных и в то же время достигнуть наиболее высокого уровня обобщения.

Выделяют, по крайней мере, следующие четыре функции преобразования данных: обобщение, определение концепции (концептуализация), перевод результатов статистического анализа на понятный для менеджера язык (коммуникация), определение степени соответствия полученных результатов всей совокупности (экстраполяция).

Из-за неспособности человека анализировать большие массивы информации, необходимо исходные собранные данные представить в удобном для осмысления виде, т. е. их необходимо обобщить, выразить через ограниченное число понятных параметров (обобщение).

Большинство статистических мер основано на конкретных предположениях, которые определяют базу анализа собранных данных.

Концептуализация направлена на оценку результатов обобщения. Например, слабый разброс оценок вырабатывает у исследователя одно суждение (концепцию), сильный — другое (см. ниже про корреляцию).

Коммуникация предполагает при интерпретации полученных результатов использование понятных для заказчика категорий. Например, если для него понятна такая статистическая мера как «мода», то она используется при представлении полученных результатов, если нет, то результаты описываются на общепринятом языке.

Экстраполяция в данном случае предполагает определение, в какой степени данные выборки можно обобщить на всю совокупность (см. ниже).

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >