Технологии отбора и оценки источников информации, необходимой для создания знания

Структура и технологии доступа к мировым информационным ресурсам построены так, что основной объем информации пользователи получают по предварительной подписке. В данном подразделе рассматриваются технологии отбора периоди- юз ческих изданий и технологии отбора баз данных по критериям их значимости.

Необходимо отметить, что у российского потребителя информации имеется искаженное представление о роли периодических изданий в бизнесе. Такое представление сформировалось в условиях плановой экономики, когда периодические издания использовались в основном учеными и специ- алистами-отраслевиками. В условиях рыночных отношений коренным образом изменились как содержание, так и направленность этих изданий. В современных периодических изданиях широко освещаются сведения о предприятиях, производителях товаров и услуг, производимых товарах, новейших технологиях, регулярно публикуются обзоры о состоянии различных рынков, широко представлена реклама. Периодические издания выходят регулярно, запаздывание информации незначительное и вполне удовлетворяет потребителя. Российские периодические издания по своему характеру и качеству приближаются к уровню журналов, которые широко используются предпринимателями ведущих стран мира в различных отраслях.

Представляет интерес методика отбора зарубежных периодических изданий по критерию ценности, разработанная и применяемая специалистами ВИНИТИ[1]. За основу этой методики принята система оценок, опирающаяся на информацию об использовании данных изданий различными информационными центрами для предоставления потребителям и подготовки вторичных изданий. Для получения такой оценки применяется справочник Ulrich's Periodicals Directory. Справочник выпускается фирмой Bowker и издается с 1932 г. На 2010 г. в нем содержалась информация более чем о 300 тыс. сериальных и периодических изданий. В справочник включены следующие основные данные:

  • — сведения, характеризующие периодическое издание: название, история его изменения, ISNN, страна, первый год издания, язык, тираж, цена, характер издания, издатель, наличие нетрадиционных форм издания, тематика в соответствии с предметными рубриками по рубрикатору Ulrich's и классификацией УДК, аннотация к изданию, наличие рецензирования;
  • — информация о включении периодического издания в обработку для подготовки конкретных информационных продуктов (вторичных изданий) и в фонды крупнейших служб доставки документов; информация о распространителях издания — подписных агентствах и вендорах (англ, vendor — продавец, торговец — юридическое или физическое лицо, являющееся поставщиком товаров и услуг).

За ранг журнала в методике принимается суммарный показатель количества реферативных изданий, обрабатывающих обследуемый журнал, а также служб доставки документов, включающих журнал в свои фонды. Эти данные, по мнению автора методики, характеризуют степень признания журнала в мировом сообществе.

Помимо ранга журнала другими важными показателями, выбранными в методике для рассмотрения и статистической обработки, являются сведения:

  • — о научности издания;
  • — рецензировании статей до их опубликования;
  • — наличии других форм издания, кроме печатной.

В библиотеках и информационных центрах в качестве показателя ценности журнала часто применяется показатель «импект-фактор», определяемый как отношение числа библиографических ссылок на статьи, опубликованные в данном журнале за предшествующие два года, к суммарному числу статей, опубликованных в нем за то же время. Разработчики описанной выше методики рекомендуют использовать общепринятую оценку журналов импект-фактор как проверяющую методику, но не как основной показатель ценности журналов.

Рассмотрим подход для определения агентств-поставщиков, с которыми необходимо подписать контракт на поставку информации на постоянной основе на доступ к профессиональным базам.

Двухтомный справочник по профессиональным базам Gale Directory of Databases является наиболее авторитетным и полным изданием в этой области. Предлагаемая нами методика выбора агентств-поставщиков использует информацию данного справочника. Методика предполагает выполнение следующих этапов.

  • 1. На первом этапе отбор баз осуществляется по предметному указателю. Используя предметный указатель (Subject Index) и географический указатель агентств-поставщиков и генераторов (Geographic Index), находим входные номера баз данных
  • (уникальные номера данного справочника) агентств, находящихся в выбранном нами регионе мира, базы которых содержат нужную нам информацию.
  • 2. На втором этапе рассматриваются описания баз и отбираются те из них, которые соответствуют требованиям компании. По отобранным базам фиксируются генераторы, поставляющие указанные базы, и по описаниям генераторов находятся поставщики, продающие информацию из этих баз.
  • 3. В случае если возможны варианты различных агентств- поставщиков, удовлетворяющих требованиям компании, осуществляется выбор варианта с минимальной стоимостью.

К наиболее важным показателям, используемым при оценке информации, следует отнести своевременность получения необходимой информации, ее достоверность и стоимость. Запаздывание информации складывается из двух составляющих: 1) при ее отражении в информационной системе; 2) при передаче ее из информационной системы пользователю. За первую составляющую отвечает агентство-генератор. Как правило, в информационных системах (профессиональных базах данных) можно найти время, когда по данному объекту были внесены последние изменения в хранимые по этому объекту сведения.

Допустимое время запаздывания задается в договоре на поставку информации между поставщиком и генератором. Поставщик в этом договоре старается учитывать потребности пользователей, которым он собирается поставлять эту информацию.

В деловых ресурсах Интернета практически невозможно установить, когда последний раз обновлялся сайт. Необходимо учитывать, что значительное запаздывание обусловлено тем, что поисковые системы просматривают сайты, причем не все, не чаще, чем раз в две недели. Задержка при передаче информации, как правило, незначительна, так как при передаче используются телесети и задержкой при передаче обычно пренебрегают.

Оценка достоверности информации в информатике является одной из самых сложных проблем. В философии термин «достоверность» употребляется в качестве характеристики знания как обоснованного, доказательного, бесспорного и как синоним истины. В экспериментальных исследованиях достоверными называют события, суждения, подтвержденные специальными экспериментами.

В информатике оценка достоверности — это процесс установления степени соответствия сведений об объекте в информационной системе реальному состоянию объекта.

Процесс оценки достоверности информации — это сложный аналитический процесс, зависящий от многих факторов. Невозможно дать какую-то единую схему, которую можно применять в любых случаях. Однако следует рассмотреть некоторые типичные случаи и выявить факторы, которые влияют на оценку достоверности.

В первую очередь это знания человека, производящего оценку достоверности информации. Оценивающий информацию должен знать процесс поступления информации к нему от первичного источника. В любом случае должна проводиться оценка надежности этого первичного источника. Кроме первичного источника в цепи формирования информации могут быть одно или несколько звеньев, которые корректируют полученную от первичного источника информацию и могут вносить свои искажения.

К каждому виду информации при оценке достоверности должен быть свой подход.

Достоверность одного вида информации не меняется с течением времени. Примером такого вида информации может служить, например, год регистрации компании. Достоверность другого вида информации зависит от времени. Примером является адрес проживания лица или юридический адрес организации. Широкое распространение в России получили бизнес-справочники — регистры предприятий. Наряду с другими признаками в этих справочниках имеется юридический адрес предприятия. При оценке достоверности значения данного признака необходимо учитывать, что издаются эти справочники раз в год и на сбор информации и издание справочника также требуется время. При этом происходит старение информации и снижается ее достоверность.

В каждом конкретном случае методы оценки достоверности будут уникальны, что затрудняет создание общих универсальных методов. Анализ опубликованных по данному вопросу материалов показывает, что предлагаются определенные подходы, принципы оценки достоверности, рекомендации, которые необходимо учитывать. Рассмотрим некоторые наиболее часто используемые подходы:

  • — сопоставление с описаниями рассматриваемого объекта, представленными другими источниками. В качестве примера можно рассмотреть информацию о компаниях разных стран, хранящуюся в агентстве Lexis/Nexis. В этом информационном агентстве имеется 100 баз, содержащих сведения о различных компаниях мира, поставляемых различными агентствами- генераторами. Получив сведения по определенной компании, можно сопоставить эти сведения с информацией, представленной другими источниками. В случае ошибки или умышленного искажения информации этот факт будет выявлен;
  • — сопоставление с допустимыми диапазонами изменения значений свойств объектов. По ряду значений свойств объектов существуют границы возможных изменений этих значений. Выход значения за границу свидетельствует о возможной ошибке;
  • — учет рейтинга источника. При оценке достоверности информации предпочтение отдается информации, поступившей от источника с наибольшим рейтингом, более высоким авторитетом среди других источников;
  • — знание человеком, оценивающим достоверность информации, системы контроля за достоверностью информации у источника. Примером могут служить ассоциации независимых аудиторов, существующие в отдельных странах. У таких ассоциаций имеется своя система контроля качества проводимого аудита. Пользователи обычно отдают предпочтения аудиторам, являющимся членамами подобной ассоциации;
  • — достоверность информации повышается, если имеется экспериментальная проверка представляемых данных.

Необходимо отличать признаки объекта, значения которых изменяются во времени. Если признак лица «дата рождения» не изменяется во времени, то признак «место жительства» будет терять свою достоверность со временем. При поступлении в вуз вы заполнили анкету и указали место жительства. Если в информационной системе не осуществляется слежение за значением этого признака, то запрос через три года о месте жительства студента может дать неверный ответ.

Перечисленные подходы к оценке достоверности говорят о том, что в них оценивается не сама достоверность, а определяется, какая информация из какого-либо набора более достоверна, чем другая. По существу, специалист, оценивающий информацию, определяет на основе дополнительной информации, какой информации по признаку достоверности следует отдать предпочтение.

  • [1] См.: Кириллова О. В. Периодические издания для бизнеса в традиционной и электронной форме. Актуальные проблемы Европы. Информационноеобеспечение бизнеса: опыт Западной Европы и США : сб. науч. трудов РАНИНИОН. М., 2004. С. 61—74.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >