Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информатика и информационные технологии

Информационный поиск в Интернете

Информационный поиск – последовательность операций, направленных па предоставление информации заинтересованным лицам. Поиск выполняется в четыре этапа:

  • 1) определение информационной потребности и держателя информационного массива;
  • 2) формулировка запроса;
  • 3) извлечение информации из информационного массива;
  • 4) ознакомление с полученной информацией и оценка результатов поиска.

Информационный поиск в совокупности информационных ресурсов, массивов документов, базах данных, знаний реализуется с помощью автоматизированных информационно-поисковых систем.

Поисковые сайты

Интернет – первый и единственный информационный объект, в котором потенциально возможен поиск по всему объему информации, накопленному человечеством на данный момент. Информация в гипертекстовом представлении растет на несколько миллионов веб-страниц в день. В принципе возможен глобальный поиск, но от 30 до 70% информации, размещенной в Интернете, и целые ресурсы закрыты для поисковых систем парольным входом (конфиденциальные) или динамически порождаются сервером только на основании запроса. Однако даже при этих ограничениях поиск очень эффективен.

В обычной библиотеке информационный массив подразумевает наличие классификации и специализации знаний по областям. В Интернете нет глобального каталога всех ресурсов и главного редактора, часть информации имеет низкое качество.

Поэтому там легко потратить время впустую. Однако есть средства и методы вести эффективный поиск.

Существуют два основных метода открытия ресурса информации в Интернете:

  • а) последовательный переход от сайта к сайту по гиперссылкам, которые, по вашему мнению, могут привести к необходимой информации, и их просмотр;
  • б) поиск.

К основным средствам поиска информации в Интернете относятся (табл. 9.1);

  • • поисковые и метапоисковые системы (поиск конкретных документов);
  • • индексированные каталоги (поиск тематических сайтов но структуре рубрик);
  • • адреса популярных поисковых систем и каталогов сети Интернет;
  • • рейтинги (топы) наиболее посещаемых ресурсов;
  • • тематические списки ссылок (тематические порталы- указатели);
  • • сетевые энциклопедии и справочники с определениями понятий и справочными данными.

Таблица 9.1

Поисковые сайты

Яндекс (yandex.ru)

Поисковая система и каталог

Рамблер (rambler.ru)

Поисковая система и каталог Тор 100

Google (Гугль) (google.ru)

Международная поисковая система и каталог

Mail.ru

Поисковая система и каталог

Bing! (bing.com)

Поисковая система

Nigma (nigmaru)

Метапоисковая система

Поисковая система в Интернете – специальный вебсайт, на котором можно сделать запрос и получить ссылки на документы и сайты, соответствующие запросу. В состав поисковой системы может входить несколько мощных серверов (в системе Google – более 10 000 компьютеров).

Интерфейс поисковой страницы обеспечивает возможность формулировать в строке текстовый запрос, посылать ех о, просматривать полученный в ответ список ссылок и переходить по их адресам.

Программное обеспечение поисковой системы состоит из трех компонентов: поисковый робот, индекс системы, классификатор.

Поисковый робот – программа-анализатор, непрерывно посещающая веб-адреса в Интернете ("ползает, как паук по паутине"); просматривает и исследует содержание документов, индексирует слова из текста и заносит в базу данных (обновляет ее).

База данных индексов – создаваемая по результатам поиска таблица: "слово – адрес документа, где слово встречается". Поисковый робот периодически обновляет базу данных, находя новые материалы, убирая неработающие ссылки.

Когда посетитель делает запрос, поиск адресов ведется не в Интернете, а в заготовленной базе данных сервера.

Классификатор – программа, которая: а) обрабатывает запрос пользователя; б) находит и извлекает с помощью индекса слов из базы данных ссылки, отвечающие критериям запроса; в) выводит список ссылок на найденные документы в порядке убывания релевантности (определяет их соответствие, "вес", значимость и выполняет сортировку), сверху списка самые подходящие адреса.

Особо мощные поисковые системы учитывают популярность сайта по числу посещений и ссылок на него с других сайтов, оценивают страницы по числу других связанных важных страниц. Алгоритмы ранжирования (оценивания) важности могут отличаться, сайт может занимать 5-е место по одним рейтингам и 30-е – по другим.

Поисковые системы в списке ссылок могут предложить не только прямой переход к документу и его сайту, но и текст с выделением слов, заявленных в запросе, а также сохраненную копию основного текста документа из своего архива (без рисунков и гиперссылок, иногда без форматирования). Сохраненная в архиве поисковой системы копия удобна тем, что загружается быстрее, можно получить документ, недоступный на исходном сервере, или преобразование формата doc, pdf в формат HTML.

Метапоисковая система – система поиска, не имеющая собственной базы данных, но обладающая программными возможностями запрашивать данные у нескольких других поисковых сайтов, анализировать полученное, следуя собственному алгоритму обработки, предоставлять сводный результат[1].

Некоторые каталоги содержатся в поисковых системах и позволяют поиск и по ключевым словам, и по иерархическому дереву разделов. Если же необходимо найти конкретный документ, то каталог малоэффективен. Иногда часть приводимых в тематических коллекциях ссылок не работает.

Полезно обращаться к топам (tops) – спискам наиболее посещаемых сайтов по конкретной тематике. Высокая посещаемость сайта свидетельствует о качественном содержании, сервисе.

Крупные поисковые системы и каталоги ресурсов Интернета стали порталами – предлагают разнообразную информацию, новости, дополнительные услуги: бесплатную электронную почту, место для размещения веб-страниц, поддерживают форумы.

Поисковые системы Интернета на первых позициях списка ресурсов, предлагаемых по запросу посетителя, размещают так называемые оплаченные и "управляемые результаты" и коммерческую рекламу товаров и услуг различных компаний, искусственно повышая их рейтинг. Рекламодатели покупают право контекстной рекламы на конкретные темы запросов. Оплаченные ссылки не обязательно отличаются оформлением от обычных результатов поиска.

  • [1] Метаданные – данные о данных: каталога, справочники, реестры, базы метаданных, содержащие сведения о составе данных, содержании, статусе, происхождении, местонахождении, качестве, форматах и формах представления, условиях доступа. Метаинформация – описание информации, информация об информации.
 
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы