Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow ВВЕДЕНИЕ В АНАЛИЗ ДАННЫХ
Посмотреть оригинал

КОРРЕЛЯЦИЯ И СУММАРИЗАЦИЯ ДЛЯ МНОГОМЕРНЫХ ДАННЫХ

В данной главе рассматриваются примеры изучения взаимосвязей и суммаризации многомерных данных, как эго было представлено в гл. 1. Приводятся и довольно подробно рассматриваются два наиболее популярных метода — наивный Байесовский классификатор (коррелирование признаков) и метод /С-средних для кластерного анализа (суммаризация данных). Описывается метод аномальных паттернов, позволяющий автоматизировать выбор числа и начальных центров для метода К-средних.

В результате изучения данной главы студент будет:

знать

  • • понятия, связанные с Бэйесовым подходом к анализу данных: теорема Бэйеса, априорная и апостериорная вероятности;
  • • понятие о задаче классификации (распознавания) объектов и наивном Байесовском классификаторе применительно к данным с бинарными признаками;
  • • понятие «мешок слов» и его применение для оценки параметров наивного Байесовского классификатора;
  • • понятия, связанные с оценкой качества классификации: четырех клеточная таблица, точность, полнота и пр.;
  • • основные цели и способы центрирования и нормализации данных;
  • • метод /С-средних кластерного анализа;
  • • критерий метода /С-средних и интерпретацию метода /С-средних как метода чередующейся минимизации критерия;
  • • достоинства и недостатки метода /С-средних;
  • • способы интерпретации результатов применения метода /С-средних;
  • • метод аномального кластера и его критерий;
  • • использование метода аномального кластера для выбора числа кластеров и их начальных центров;

уметь

  • • рассчитать и применить наивный Байесовский классификатор для данных с бинарными признаками;
  • • вычислять оценки качества классификаторов;
  • • центрировать и нормализовать многомерные данные;
  • • применить метод /С-средних для кластерного анализа;
  • • применить метод аномального кластера для инициализации метода /С-средних;

владеть навыками

  • • использования МатЛаба или другой вычислительной среды для расчета и применения наивного Байесовского классификатора для данных с бинарными признаками;
  • • использования МатЛаба или другой вычислительной среды для вычисления оценок качества классификаторов;
  • • использования МатЛаба или другой вычислительной среды для центрирования и нормализации многомерных данных;
  • • использования МатЛаба или другой вычислительной среды для применения метода /С-средних для кластерного анализа данных;
  • • использования МатЛаба или другой вычислительной среды для применения интеллектуальной версии метода К-средних на основе инициализации с помощью итеративного применения метода аномального кластера.
 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы