Фактор контента при разработке и внедрении СУЗ/СМЗ

Средства организации контента в управлении знаниями

Как отмечалось в предыдущей главе, технология и контент представляют в менеджменте знаний, по сути, единое целое и редко существуют друг без друга. В настоящем учебнике при выделении этих аспектов в две различные темы не ставится задача разделить их, а скорее показывается необходимость уделить им достаточно внимания. Рассмотрим элемент "Контент" из матрицы менеджмента знаний (табл. 9.1).

Таблица 9.1. Состояния элемента "Контент" в матрице менеджмента знаний

Несистемный

С отдельными взаимосвязями

Сетевой

Адаптивный

Контент

Беспорядочный и неструктурированный

Легкий доступ к информации

Системы управления документооборотом и записями

Децентрализованные (действующие без команды) и обученные авторы интранет-ресурсов

Ad hoc (ситуативность) поиска: каждый раз заново

Ad hoc (ситуативное) сравнение знаний

Независимые и локальные области хранения информации

Некоторая часть контента доступна в интранете

Интегрированный доступ к контенту с поставщиками и подрядчиками

Сравним, как и в предыдущих элементах, несистемный и адаптивный уровни. Фактор контента взаимосвязан с технологическим фактором примерно так же, как фактор "Люди" с фактором "Процессы". И если в технологическом факторе наблюдается развитие менеджмента знаний через интеграцию и открытость, то и в аспекте контента получается похожая картина. Если на нижних уровнях имеется несвязанный и неструктурированный контент с затрудненным поиском, то на более высоких уровнях – контент увязан с помощью единой концептуальной основы, удобен для поиска и постоянно подпитывается изнутри – авторами интранет-ресурсов – и извне – поставщиками, подрядчиками, клиентами.

Тем самым наиболее важный вопрос для данной темы: что позволяет контенту, прежде всего непосредственно формализованным знаниям, превратиться в гибкую, адаптивную, само- развивающуюся систему? При этом речь идет о новых факторах, еще не рассматривавшихся выше.

Технологии сохранения формализованных знаний в первую очередь направлены на обеспечение эффективного извлечения хранимой информации, что достигается путем ее классификации, снабжения метаданными, тегами, аннотациями.

Метаданные – это "данные о данных", т.е. описательная информация о составе информации, отраженной в данных, структуре (формате) данных, их представлении, месте хранения и других признаках описания. Состав метаданных определяется требованиями среды (пользователей и систем), исходя из потребности в корректном обращении с данными (поиск, перемещение, архивация, считывание и др.).

При заполнении метаданных документа, как и при аннотировании, происходит частичное сохранение контекста применения информации, отраженной в документе. Так, при монтаже пожарного крана "ПК-232" на несущую стену информация, извлеченная из документа с аннотацией "Монтаж кранов серии ПК" или документа, описанного набором метаданных, представленным в табл. 9.2, с высокой вероятностью будет интерпретирована слесарем как знание. Это связано с тем, что приведенные описания достаточно четко сохраняют контекст, который совпадает с контекстом решаемой задачи.

Таблица 9.2. Набор метаданных документа

Свойство

Значение

Тип данных

Документ Microsoft Word

Вид документа

Инструкция

Вид работ

Монтаж категории В (сложно)

Объекты работ

Пожарный кран, бокс пожарного крана, рукав пожарного крана

Особенно широко термин метаданные стал использоваться в последние годы в связи с развитием электронных систем хранения, поскольку метаданные стали важнейшим средством обеспечения навигации, поиска и возможности информационного обмена. Однако до настоящего времени значение этого термина до конца четко не определено. Наиболее размыты границы между метаданными и коммуникативными (обменными) форматами[1].

Существуют различные категории метаданных, например:

  • – описательные метаданные (descriptive metadata), в том числе библиографические;
  • – метаданные о структурах и форматах (structural metadata);
  • – административные метаданные (administrative metadata), содержащие данные для управления доступом;
  • – идентификационные метаданные (identifier metadata), которые однозначно идентифицируют объекты внешнего мира, и т.п.

Помимо сказанного, метаданные подразделяются на машиночитаемые метаданные (Machine-Readable Metadata), предназначенные для автоматического решения задач определенного класса, и человекочитаемые метаданные (Human-Readable Metadata), предназначенные для задач, которые решаются с участием человека.

Что касается человекочитаемых метаданных, то в качестве них удобно использовать имя файла, построенное по четким правилам. Например, имя может начинаться с даты создания или актуализации версии документа в формате "ГГГГ-ММ-ДД", благодаря чему неактуальные, устаревшие файлы можно исключить из объектов внимания с первого взгляда. Далее может указываться тип документа из согласованного перечня, например "инструкция", "договор", "спецификация" и т.п. В завершение указывается наиболее существенный атрибут документа: наименование контрагента, узел или изделие. Так, инструкция, метаданные которой были приведены выше, могла быть сохранена под именем: "2011-04-30_инструкция_монтаж_ПК-232.dосх".

Схемы организации метаданных могут рассматриваться в трех взаимосвязанных аспектах: семантическом, синтаксическом и структурном. Различие между данными и метаданными часто условно и зависит от контекста. Например, реферат с точки зрения терминологии электронных библиотек относится к метаданным, хотя в электронном каталоге или реферативной БД его содержание рассматривается как данные. Существуют различные концепции, стандарты и системы представления метаданных. С 1999 г. работает международная организация стандартизации метаданных – "Форум разработчиков схем метаданных" – SCHEMAS.

Аннотации – предшественники машиночитаемых метаданных, которые наравне с библиотечной классификацией уже более 50 лет используются в библиотечном деле. Хорошо известны аннотации – резюме книги в объеме около 250 знаков, отображаемые на первой странице. Аннотации более актуальны для емких информационных массивов, т.е. скорее для книг, чем для рабочих документов. При поиске, например, какой-либо исторической информации, недостаточно знания ключевых слов, относящихся к эпохе, месту или историческому персонажу. Необходимо понять, затрагивается ли в книге интересующий нас аспект, например развитие торговых связей Великого Новгорода в XII–XIII вв. Даже если метаданные отражают причастность документа к сущностям "Великий Новгород", "XII век", "торговля", это не означает, что нужный нам аспект освещен в документе достаточно подробно и его внимательное изучение целесообразно. Поэтому поиск по аннотациям продолжается до тех пор, пока ее часть не совпадет в высокой степени с интересующим нас вопросом.

Тег (от англ. tag – ярлык) – жаргонное название дескриптора, метки как ключевого слова, идентификатор для категоризации, описания, поиска данных и задания внутренней структуры. Теги, в отличие от метаданных, не резюмируют сохраняемые знания, а лишь дают о них некоторые намеки, которые могут оказаться полезными в будущем. Если метаданные отражают наиболее существенные, на первый взгляд, признаки сохраняемой информации, то теги содержат те особенности, которые могут не являться столь значимыми в момент сохранения, но окажутся значимыми позже. Например, для сохраняемой инструкции по монтажу пожарного крана тегами могут быть Fireguard (производитель оборудования), коммуникации (часть инфраструктуры, к которой принадлежит монтируемый кран), безопасность (направление деятельности организации, выступающее заказчиком монтажа) и др. В будущем запросы по любому из данных слов позволят выстроить более емкую и подробную картину. Теги выступают в роли мостиков для построения ассоциативных, косвенных связей между элементами знаний, позволяют поддерживать весь имеющийся в организации контент формализованных знаний в гибком, адаптивном состоянии.

Таким образом, аннотации, теги и метаданные, которыми снабжены формализованные знания, обеспечивают возможность навигации даже в очень обширном массиве формализованных знаний. Но на следующем уровне возникает вопрос: а могут ли сами метаданные и/или другие атрибуты быть организованы как единое пространство?

  • [1] Воройский Ф. С. Аналитическая обработка документов для обеспечения научных исследований и разработок [Электронный ресурс]. URL: gpntb.ru/win/inter-events/crimea2005/disk/84.pdf
 
< Пред   СОДЕРЖАНИЕ     След >