База данных.

База данных составляет ключевое понятие технологии БД и стержневой объект управления в системах баз данных. Определение базы данных в качестве разделяемого информационного ресурса компьютеризированных технологий требует уточнения самих понятий данные и информация. Иногда база данных трактуется в качестве "подобия электронной картотеки", "хранилища для некоторого набора занесенных в компьютер файлов данных", подразумевая под термином файл "абстрактный набор данных, не обязательно совпадающий с физическим дисковым файлом". Очевидно, что при таком взгляде данные и информация рассматриваются в качестве синонимов. Как следствие, истинным становится утверждение о том, что в этом случае любые данные, извлеченные любым способом из БД, являются информацией.

Классическое определение "база данных это — данные и связи между ними" представляется более точным и уместным с учетом высказанных выше соображений. Тогда данные, извлеченные из БД на основе установленных связей, являются информацией. В противном случае извлеченные из БД данные требуют интерпретации. Безусловно, хранящиеся в БД фрагменты связанных данных также соответствуют понятию информации. Вне связей данные являются информацией только в том случае, если они типизированы, или классифицированы, и известна примененная классификационная схема. С учетом применения реляционного подхода связи между данными можно разделить на связи совместности (совместность атрибутивных значений табличного определения прикладного объекта) и связи соответствия (совместность атрибутивных значений межтабличного определения прикладного объекта).

Таким образом, в дальнейшем под термином база данных будем понимать совокупность связанных данных, с одной стороны, являющихся информацией, и с другой стороны, составляющих основу для получения информации, как произвольных комбинаций

Полная технологическая схема реализация БДМ

Рис. 5.6. Полная технологическая схема реализация БДМ

хранящихся связанных данных. Тогда данные БД и информация по определению оказываются синонимами.

Методы и средства определения и манипулирования БД. В технологии БД определены две основные группы механизмов определения и манипулирования БД.

К первой группе относится совокупность методов и средств определения связанных данных, включающая формальное описание структур данных, а также администрирование БД. Методы и средства определения данных реализуют ту или иную степень информативности хранящихся в базе данных в зависимости от возможностей и ограничений принятой модели данных. Определение данных выполняется статически, поскольку информативные связи между данными сохраняются и заносятся в БД наряду с собственно данными. На начальных этапах развития технологии БД именно разработка мощного языка определения данных (ЯОД) составляла главное направление развития. Хорошо известна многолетняя деятельность рабочей группы CODASYL [2] по созданию развитого ЯОД. Однако вывести языки определения данных на уровень общих языков программирования не удалось по целому ряду причин [3].

Вторую группу составляют методы и средства манипулирования данными, реализующие информативное связывание данных в динамике, в процессе доступа в БД. На начальных этапах языки манипулирования данными (ЯМД) сводились к определению простого C^LL-интерфейса, однако на рубеже 80-х годов тенденция развития ЯМД практически перекрыла направление разработки ЯОД. Благодаря широкому применению реляционной модели языки манипулирования смогли пройти путь становления до уровня общих языков программирования. Наиболее известным представителем семейства ЯМД на сегодняшний день является язык SQL (Structured Query Language) [2], составляющий основу и являющийся сам международным стандартом ЯМД.

У многих пользователей зачастую складывается впечатление, что независимо от типа спроектированной БД посредством языка SQL можно получить доступ к любой информации на основе хранящихся данных в БД. На самом деле это далеко не так. Язык SQL действительно обеспечивает произвольный доступ к таблицам БД в любых сочетаниях и комбинациях. Но получение информации из БД при этом ограничивается возможностями связей между данными, хранящимися в БД. При отсутствии этих связей обычной практикой является встраивание обработки связей между данными в программный код приложений. Тогда можно выделить два основных компонента манипулирования БД:

  • — собственно язык манипулирования как инструмент;
  • процедуры связывания данных и управления извлечением информации из БД, реализованные средствами ЯМД.

Для реляционного подхода наиболее распространен процедурный способ управления извлечением информации из БД. При этом возможны три основных метода реализации этого способа:

  • 1) модули связывания и манипулирования данными встраиваются в приложения путем программирования в профессиональных средах (MS Visual Studio, С+ + Builder, Dlphx)
  • 2) модули связывания и манипулирования разрабатываются на языках SgL-cepвepe и хранятся непосредственно в серверной БД, становясь также разделяемыми информационными ресурсами;
  • 3) модули связывания и манипулирования оформляются в виде системных динамических загружаемых библиотек DLL, формируя таким образом доступ в БД в виде системного fVindows- ресурса.

Построение модулей связывания и манипулирования БД в виде разделяемых информационных ресурсов в среде SQL-cеpверов или в видео системных DLL-библиотек существенно приближает совокупное содержание таких БД к классическому определению. Характерно, что получаемая таким образом реализация БД по полной технологической схеме рис. 5.6 остается в границах реляционного подхода.

Разновидности систем баз данных. В зависимости от способов определения и манипулирования связанными данными системы БД можно разделить на следующие основные разновидности.

Системы с файловыми базами данных в качестве БД используют простые структурированные файлы в форматах Ьс1 и др., а все информативные связи определяются и обрабатываются в приложениях, использующих такие БД. Эффективность организации структурированных файлов обычно повышается путем построения индексов и других систем указателей, что, вообще говоря, характерно при создании картотек. Индексируются, как правило, ключевые поля структур с целью убыстрения доступа (за счет сортировки индексов), обеспечения уникальности значений полей, запрета на существование неопределенных значений и т. п. К числу наиболее существенных недостатков систем файловых БД (только в смысле их использования) можно отнести полную зависимость от приложений. Доступ к информации файловых БД возможен только посредством содержащего программные связи приложения. Очевидно, что как разделяемый информационный ресурс файловые БД могут существовать только в симбиозе с обеспечивающими связывание данных приложениями. Программная реализация связей на серверах или в виде йЬЬ-библиотек естественно придает файловым БД совершенно новое качество реально разделяемого информационного ресурса.

К противоположной разновидности относятся такие системы БД, в которых все связи между данными определены как данные и хранятся в БД. Такие системы можно назвать системами с предметными базами данных. Суть названия предметная БД заключается в достижении полной независимости предметных баз данных от приложений. Предметные БД являются полноценными, самостоятельными ресурсами компьютеризированных технологий, что составляет главное преимущество их применения. В тоже время, полное определение всех связей между данными порождает существенную сложность проектирования таких БД.

Промежуточные варианты организации баз данных, при которых связи распределяются между приложениями и БД, определяют разновидность систем с прикладными базами данных. Суть названия отражает слабо или сильно выраженную ориентацию организации прикладной БД на потребности использующих ее приложений. Очевидно, что как компромиссный вариант, прикладные БД могут выступать в качестве оптимизируемого информационного ресурса компьютеризированных технологий. Прикладные базы данных находят широкое применение при моделировании на ЭВМ конкретных систем 3.

 
< Пред   СОДЕРЖАНИЕ     След >