Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Базы данных

Введение в теорию баз данных

Основные понятия

Исторически сложились два основных направления использования вычислительной техники, первое из которых связано с проведением сложных преобразований над относительно небольшими объемами данных с простой структурой. Здесь компьютеры позволили быстрее проводить расчеты по вычислительно сложным алгоритмам. Подобные задачи дали толчок к созданию первых ЭВМ, их актуальность не снижается и сейчас.

Другое направление связано с созданием информационных систем. В них необходимо не только обрабатывать, но и хранить большие объемы данных со сложной внутренней структурой, обеспечивать быстрый поиск нужной информации. Создание подобных систем стало возможным после появления надежных, емких и быстродействующих устройств энергонезависимой памяти: в первую очередь речь идет о накопителях на жестких магнитных дисках. Классическим примером систем подобного типа являются системы резервирования железнодорожных и авиационных билетов. Последовательность операций, выполняемых при каждом заказе, относительно проста, но для корректного функционирования всей системы необходимо хранить и постоянно актуализировать большие объемы данных, выполнять в них поиск и т.п.

Автоматизированная информационная система – это функционирующий на основе ЭВМ комплекс, обеспечивающий сбор, хранение, актуализацию и обработку информации в целях поддержки какого-либо вида деятельности, т.е. автоматизированная ИС разрабатывается для определенной предметной области.

Предметная область – часть реального мира, подлежащая изучению с целью организации управления и, в конечном счете, автоматизации. Создавая ИС, мы, в некотором смысле, формируем информационную модель, позволяющую описать значимые характеристики реальных объектов и их взаимосвязи.

Автоматизированная ИС может функционировать самостоятельно или служить компонентом более сложной системы, например автоматизированной системы управления предприятием. По типу хранимой и обрабатываемой информации выделяют два больших класса автоматизированных информационных систем – документальные и фактографические.

Документальные системы служат для работы с текстами на естественном языке – статьями, научными отчетами, текстами законодательных актов и т.д. Наиболее распространенным видом документальных систем являются информационно-поисковые системы, предназначенные для накопления и поиска документов на естественном языке. Их иногда еще называют полнотекстовыми базами данных.

Документы, хранящиеся в подобных системах, составляют поисковый массив документов системы. Для каждого документа формируется поисковый образ – некое формальное описание документа в терминах языка системы, которое отражает его содержание. Например, поисковый образ может быть сформирован указанием набора ключевых слов. Запрос пользователя представляется в виде поискового образа запроса, который сопоставляется с поисковыми образами хранимых документов. Отобранные в результате документы называются релевантными запросу.

Фактографические системы составляют другой большой класс автоматизированных информационных систем. Они оперируют фактическими данными, представленными в виде специальным образом организованных совокупностей записей. Именно им и посвящена основная часть данного курса, так как именно в фактографических системах в полной мере используются методы и инструменты теории БД. Фактографические системы, создаваемые средствами технологии БД, часто называют банками данных (см. определение ниже).

Иногда в дополнение к выделенным двум классам вводят понятие лексикографических баз данных и информационных систем, относя к ним различного рода словари и классификаторы.

В отечественных нормативных документах в сфере разработки БД даются следующие определения.

Банк данных [1, 2] – это система специальным образом организованных данных (баз данных), программных, технических, языковых, организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных.

В англоязычной литературе понятие, по сути близкое к банку данных, обозначается термином система баз данных (англ. database system).

База данных – именованная совокупность данных, отражающая состояние объектов и их отношений в заданной предметной области.

Базу данных можно рассматривать как электронную картотеку, хранилище для некоторого набора занесенных в компьютер данных. Выполняют следующие операции над БД:

  • • добавить новые данные в БД;
  • • изменить существующие данные;
  • • удалить данные из БД;
  • • найти данные в БД и т.д.

Базы данных организуются на основе различных моделей данных. Пример фрагмента БД реляционного типа представлен в табл. 1.1. Данные в этом случае организуются в виде реляционных таблиц, строки таблиц называют записями, а столбцы – полями или атрибутами. Принципиально важной особенностью БД является то, что они содержат дополнительную служебную информацию о своей структуре, иначе говоря, являются самодокументируемыми.

Таблица 1.1

Фрагмент реляционной БД

StudID

FIO

Group

123

Иванов И.И.

382

124

Петров П.П.

382

 
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы