Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информатика для гуманитариев

СИСТЕМЫ УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ

Изучив материал данной главы, студент должен:

знать

  • • назначение и сферы использования баз данных в филологии;
  • • виды организации данных и их различие;
  • • способы взаимодействия пользователя с базами данных;
  • • наиболее часто используемые типы баз данных;

уметь

  • • управлять различными наборами данных;
  • • использовать существующую модель базы данных для хранения собственных данных;
  • • выполнять ввод, поиск, вывод требуемых данных в системе управления базами данных;

владеть

  • • пониманием проблем, стоящих перед филологами в области организации данных, и путей их решения;
  • • представлением об организации взаимодействия с базами данных.

Введение: зачем нужны базы данных в лингвистике и какие задачи они должны решать

Филология располагает огромным количеством данных. Поскольку предметом изучения филологии является описание и анализ языка, можно считать ее областью исследований сотни высказываний (устных и письменных), произведенных миллиардами людей за несколько тысячелетий. Эти высказывания произведены на тысячах языков, каждый из которых содержит сотни тысяч слов, каждое из которых может употребляться в десятках словоформ и значений. Результаты лингвистического анализа выявляют большое разнообразие правил кодирования на всех уровнях – звуки, слова, фразы, тексты. Эти правила исчисляются тысячами для каждого языка. Изучаются многие факторы языковых вариаций, в том числе географические, гендерные, социальные, патологические и ситуационные, что добавляет к этому богатству объекты исследования.

Задачи баз данных

Учитывая этот огромный объем данных, не удивительно, что многие филологи пытаются использовать технические средства для управления данными. Базы данных содержат наборы данных в области фонетики, фонологии, морфологии, синтаксиса, исторической лингвистики и диалектологии, также в областях прикладной лингвистики, таких как лексикография и обучение языкам с помощью компьютера. Они служат не только в качестве хранилищ для больших объемов данных, но и облегчают доступ к ним.

Технически база данных определяется как любой структурированный набор данных. Старомодная картотека, например картотека библиотечного каталога, представляет собой базу данных. Карточки организованы на регулярной основе, каждая содержит имя автора, название книги, год и место издания, и указатель на место хранения книги. В наши дни термин "база данных" (БД), как правило, относится к цифровой базе данных; но хотя цифровые базы данных имеют огромные преимущества по сравнению с картотеками, сущность базы данных нс изменилась, она по-прежнему является структурированным представлением хранимого содержимого. Кроме того, БД должна обеспечивать единство данных и исключать избыточность. Исключение избыточных или дублированных данных уменьшает возможность их несогласованности. Например, если требуется записать финитный глагол (в главном предложении) в базе данных предложений, не лучшим решением будет его прямая запись, например "работает", предпочтительным решением является запись индекса при инфинитиве ("работать", 3 л. 1 ч, н. вр.).

Модель базы данных

Почти все компьютерные приложения выполняют управление данными некоторого вида. Программа текстового редактора читает файл документа, представляет его пользователю для редактирования и записывает отредактированную версию; компьютерная игра показывает последовательность закодированных образов и записывает достигнутый игроком результат в файл и т.д. Этот подход, называется моделью на основе файлов. Он имеет серьезные недостатки для сложных, информационно емких приложений, которые должны обрабатывать большие объемы информации гораздо более сложными методами. В этом случае модель на основе файлов приводит к дублированию программирования, ошибкам и несовместимости на всех уровнях. Программные приложения должны понимать формат файлов, обеспечивать одновременный доступ к одним и тем же данным, и так или иначе предотвращать несанкционированное получение доступа к данным.

Модель базы данных делегирует работу по хранению и управлению данными специализированной структуре, называемой "Система управления базами данных" (СУБД). Вместо того чтобы непосредственно обращаться к диску, приложения запрашивают данные из СУБД или отправляют в нее данные для хранения. Все сложные вопросы хранения, поиска, обновления и даже доступа к данным могут быть решены только один раз на уровне СУБД.

СУБД может функционировать локально, на вашем компьютере, или как удаленный сервис, вызываемый через подключение к Интернету. Внешние приложения запрашивают данные из СУБД (подав соответствующий запрос, описывающий, какие данные требуются) или передают данные в СУБД для хранения в базе данных. СУБД должна с высокой производительностью решать все задачи обработки данных (обработка одновременных запросов, управление доступом и т.д.). Но решение этих задач выполняется в одном модуле, который запрограммирован опытными специалистами, прошел многократные проверки, постоянно поддерживается и обновляется. СУБД использует очень общую модель организации данных, которая затем может быть настроена в соответствии с потребностями каждого проекта. Лингвист может приобрести такую СУБД (возможно, Access или MySQL) и использовать ее для создания и использования базы данных с учетом специфики своих потребностей.

 
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы