Средства доступа к маркетинговым информационным ресурсам сети Интернет. Поисковые машины. Документальный и фактографический сетевой поиск

Доступ к сетевым ИР возможен в двух режимах — on-line и off-line:

  • 1) в режиме on-line работа в сети осуществляется в реальном масштабе времени, т. е. информация по запросу пользователя выдается ему немедленно, в электронном виде. Если от получателя информации требуется немедленная реакция на нее, то доступ on-line носит интерактивный характер;
  • 2) в режиме off-line осуществляется отложенный доступ к найденной информации, т. е. между запросом и получением информации имеется определенный перерыв во времени. Обычно в этом режиме ИР предоставляются либо в печатном виде (на бумажных носителях), либо на машинных носителях (DVD, flash-картах и др.), что позволяет накапливать данные для последующего анализа и принятия решений.

С точки зрения средств доступа к ИР выделяют четыре категории ИР (рис. 4.3):

  • — веб-страницы, веб-сайты;
  • — электронная почта, форумы, конференции;
  • — файлы;
  • — базы данных.
Категории сетевых информационных ресурсов и средства доступа к ним

Рис. 4.3. Категории сетевых информационных ресурсов и средства доступа к ним

Следует различать понятия Интернет и WWW — Всемирная Паутина. Если Интернет — это объединение компьютеров по всему миру посредством разрозненных сетей, то WWW (Всемирная Паутина) — это множество связанных документов, хранящихся на различных компьютерах, подключенных к Интернету. Эти документы связаны ссылками. Отдельный документ, называемый веб-страницей, — это гипертекстовый документ. Некоторая совокупность таких страниц создает вебсайт.

Если сайт ориентирован на российского пользователя, то он размещается на сервере одного из российских провайдеров, при ориентации на международный рынок — на сервере тех провайдеров, которые обслуживают соответствующий регион.

Для обращении к Web-сайтам могут быть использованы три способа доступа:

  • — веб-каталоги и справочники;
  • — адреса и ссылки;
  • — предметный указатель.
  • 1. В поисковых системах, реализующих поиск по каталогам и справочникам, используется иерархическая (древовидная) организация информации, структурированная по темам. При поиске информации пользователь (маркетолог) просматривает, начиная с верхнего уровня, тематические рубрики каталога, и, выбирая нужную ветвь, последовательно переходит на подрубрики. Тем самым поле поиска постепенно сужается, пока на некотором уровне не будет найден список искомых сайтов.

Кроме каталогов общего назначения в Сети много специализированных каталогов (по определенным темам).

Среди иностранных каталогов можно выделить каталог Yahoo (www. yahoo.com), который имеет 14 разделов и 25 тыс. рубрик. Российские ИР по деловой информации, бизнес-ресурсам по рынку товаров и услуг, оказанию аналитических и консультационных услуг каталогизированы, например, в НТЦ «Информрегистр» (www.inforeg.ru), ООО «Международное бюро информатизации и телекоммуникаций» (www.mbt.ru).

2. Наиболее простой способ поиска — указание адреса нужных страниц (IP-адреса) или передвижение по ссылкам на них (рис. 4.4). Ссылки в Интернете называются гиперссылками, так как они уводят за пределы данной страницы.

С помощью гиперссылок можно искать документы только лишь близкие по смыслу текущему документу.

Доступ к интересующим страницам осуществляется с помощью браузеров — программ просмотра сети (например, Microsoft Internet Explorer, Mozilla, Opera).

3. Предметный указатель-индекс представляет собой алфавитный список важных терминов (ключевых слов) с адресами всех страниц, на которых эти слова встречаются. Именно этот способ стал основным при построении поисковых машин.

Поисковая машина — это программа, функционирование которой включает два независимых базовых процесса:

1) специальная программа «робот-паук» периодически производит анализ вновь появившихся ресурсов Интернета, их индексирование (автоматическое построение и обновление предметного указателя- индекса) и создает собственные индексные базы данных;

Фрагмент гипертекста пользуется протокол SMTP (Simple Mail Transfer Protocol), для приема — РОР-протокол (Post Office Protocol), который контролирует право забирать почту

Рис. 4.4. Фрагмент гипертекста пользуется протокол SMTP (Simple Mail Transfer Protocol), для приема — РОР-протокол (Post Office Protocol), который контролирует право забирать почту.

Элементы поисковой машины

Рис. 4.5. Элементы поисковой машины

Доступ к файлам. Файлы распространяются в виде коробочных программных продуктов (диск с руководством, лицензия). Они бывают условно-бесплатными программными продуктами, поставляемыми с ознакомительными целями (через какое-то время они выключаются), и бесплатными (вместе с Windows бесплатно поставляется Internet Explorer).

В Интернете на серверах файловых архивов хранятся сотни миллионов файлов различных типов (файлы с программным обеспечением, файлы нормативных и регламентных документов, графические и звуковые файлы и т. д.). Это очень удобно для маркетинговых служб, так как многие необходимые маркетологам файлы можно непосредственно «скачать» из Интернета.

Для этих целей используется специальный протокол передачи файлов FTP (File Transfer Protocol), который позволяет не только загружать файлы с удаленных серверов на локальный компьютер, но и наоборот, производить передачу файлов с локального компьютера на удаленный сервер. Адрес для обращения к нужному файлу включает в себя способ доступа к файлу и имя сервера Интернета, на котором находится файл (например, адрес ftp://eict.ru/file.exe отсылает к программному файлу file.exe, хранящемуся на сервере ftp.eict.ru).

Многие серверы FTP-архивов (www.freeware.ru, www.freesoft.ru, www.download.ru и др.) позволяют осуществлять доступ к архивным файлам из универсального браузера, включающего в себя специальные программы доступа — менеджеры загрузки файлов (в частности, такой доступ возможен из браузера Microsoft Internet Explorer).

Для компьютеризации маркетинга особый интерес представляют размещаемые на серверах файлы с программным обеспечением (file, ехе), которые находятся в свободном доступе или же являются условно- бесплатными (в том смысле, что программы поставляются бесплатно лишь с ознакомительной целью и через определенное время при отсутствии оплаты становятся недоступными). В обоих случаях, скачивая с сервера программные файлы, пользователь не нарушает закон об авторских правах на программные продукты. Таким образом, использование FTP-архивов с программными файлами — один из возможных путей формирования программного обеспечения маркетинговых компьютерных систем.

4. Доступ к профессиональным БД сети Интернет осуществляется с помощью процедур поиска информации.

Базы данных делятся на фактографические, где информация структурирована и хранится обычно в виде таблиц, и полнотекстовые, хранящие неструктурированные тексты (например, текст на данной странице книги). Поиск ИР в этих двух видах баз данных выполняется разными методами.

В полнотекстовых базах данных используется документальный поиск, основанный на распознавании совпадения набора слов- дескрипторов, составляющих поисковое описание запроса пользователя (ПОЗ), со словами-дескрипторами, входящими в поисковые описания документов (ПОД), хранящихся в сети. Для составления ПОЗ и ПОД пользуются специальными информационно-поисковыми языками.

Результатом документального поиска МИ является получение нескольких (иногда очень многих) приблизительных ответов на информационный запрос. Объясняется это тем, что в ПОЗ могут входить такие ключевые слова, которые имеются в ПОД самых разных документов сети, включая те, которые к запросу пользователя не имеют никакого отношения. Это ведет к тому, что наряду с требуемой информацией пользователю поставляется и ненужная.

Варианты результатов поиска иллюстрирует рис. 4.6, где круговое изображение отвечает множеству документов с ПОД или ПОЗ.

Варианты результатов документального поиска

Рис. 4.6. Варианты результатов документального поиска

Поиск требуемой информации, указанной в ПОЗ, может завершиться успешно в случае, если во множестве документов ПОД имеются все документы, указанные в ПОЗ (рис. 4.6, а). На рис. 4.6, б представлена ситуация с частичным совпадением множества документов ПОЗ с множеством документов ПОД. Рис. 4.6, в отображает неуспешный результат поиска — полное несовпадение множеств документов ПОЗ и ПОД, т. е. не найден ни один требуемый документ.

Документальный поиск используется в сети Интернет, корпоративных электронных хранилищах текстовой информации, библиотечных, патентных, юридических и других информационно-поисковых системах.

В отличие от документального (приблизительного), фактографический поиск в структурированных БД является точным. Он осуществляется по заданным ключам, под которыми понимается признак, характеризующий одну или несколько сторон искомого объекта (процесса, явления). В качестве ключа поиска выбирается тот признак, который позволяет однозначно выделить в таблице строку с искомой информацией. Например, в приведенном ниже фрагменте справочника поставщиков (табл. 4.1) ключом служит Код поставщика, который позволяет отыскать в таблице все записи о данном поставщике.

Таблица 4.1

Фрагмент фактографической БД «Поставка товара»

Код поставщика

Код товара

Сумма поставки, млн руб.

100

2000

5

101

2000

3

101

2020

4

Если сумму необходимо определить не только по поставщикам, но и по видам товара, то ключ должен быть составнъш и включать два признака: Код поставщика и Код товара.

Процедуры фактографического поиска реализованы в разных БД по-разному и зависят от используемого метода поиска и структуры данных в БД. Как правило, процедуре поиска предшествует процедура сортировки строк таблицы по ключевому признаку.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >