Хранилища данных

Специфика КИС проявляется, в первую очередь, благодаря новой форме организации внутримашинной информационной базы, представляющей совокупность взаимосвязанных компонентов (рис. 8.2):

Новая форма организации внутримашинной информационной базы

Рис. 8.2. Новая форма организации внутримашинной информационной базы

  • o операционная БД - служит для обеспечения работы функциональных модулей ERP-системы, составляет основу OLTP-системы обработки данных КИС;
  • o специализированные ХД (Data Warehouse - DW), основа OLAP-систем обработки данных для различных функциональных компонентов КИС.

Операционные БД КИС обеспечивают хранение данных большого объема и сложной логической структуры, находятся под управлением мощных СУБД, как правило, реляционного типа (ORACLE, MS SQL Server, Informix, DB/2 и др.). Такие БД используются в составе многоуровневой клиент-серверной архитектуры КИС; они могут размещаться на одном или нескольких серверах БД. Как правило, БД отделены от программ функциональных модулей, использующих эти данные. Интерфейс пользователя (формы, отчеты, запросы и т.п.) находится на рабочей станции или специализированном сервере.

Основными проблемами ведения операционных БД КИС являются:

  • o обеспечение необходимого уровня производительности КИС (измеряется количеством транзакций в единицу времени) для реализации регламентированных приложений КИС;
  • o соответствие требованиям приложений по составу, структуре, объемам данных, времени получения и качеству выходной информации;
  • o обеспечение надежного хранения данных (периодическое архивирование БД, восстановление БД после сбоев из страховых копий, ведение журнала транзакций для их "отката" и т.п.).

Операционную БД вместе с внешними информационными источниками следует рассматривать как "сырье" для создания предметноориентированных, интегрированных, неизменяемых по структуре хронологических данных - ХД, анализируемых в системах поддержки принятия решений. Витрина (киоск) - подмножество ХД, обеспечивает необходимую производительность получения и анализа данных для конечных пользователей и защиту от несанкционированного доступа.

По определению Б. Инмона, хранилище данных - это предметно-ориентированный, интегрированный, неизменяемый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений. Как правило, ХД ориентированы на решение определенных задач анализа и представления данных. В ХД имеются три категории данных:

  • o метаданные (сведения об источнике, методах сбора информации);
  • o детальные;
  • o агрегированные (сводные).

Программное обеспечение ХД обеспечивает: загрузку, форматирование, анализ и реструктуризацию данных; управление доступом к ним; построение витрин данных.

Хранилища данных являются одним из крупнейших источников информации для современных аналитиков. Но оценке "Gartner", хранилища в ближайшей перспективе останутся одними из ключевых компонентов ИТ-инфраструктуры предприятий. Аналитики выделили ряд наиболее значимых тенденций на рынке хранилищ на ближайшую перспективу.

Консалтинговая компания "Gartner" выделила следующие ключевые тенденции на рынке хранилищ данных за период 2011-2012 гг.:

  • o рост производительности и оптимизация хранения данных за счет сжатия и стратегий размещения используемых данных;
  • o специализированное оборудование ХД;
  • o интенсивный РОС (proof of concept - проверка концепций), выбор поставщиков СУБД для хранилища;
  • o администрирование разнородных рабочих нагрузок (массовая/ пакетная нагрузка, основная отчетность, базовая оперативная аналитическая обработка - О LAP, нагрузка в реальном времени/ продолжительные нагрузки, интеллектуальный анализ данных и операционный бизнес-анализ);
  • o анимация витрин данных для оптимизации ХД;
  • o новый класс поколоночных (column-based) СУБД для витрин данных и СУБД с технологией "In-memory" для повышения скорости ответов на запросы и фиксацию данных;
  • o хранилище как услуга и "облако": программное обеспечение как услуга (SaaS) и внешнее (аутсорсинговое) ХД;
  • o СУБД "Open Source" ("свободные СУБД") для развертывания хранилищ.
 
< Пред   СОДЕРЖАНИЕ     След >