Системы поиска информации в Интернете.

Системы поиска информации в Интернете.

Поиско́вая систе́ма (англ. search engine) — это компьютерная система, предназначенная для поиска информации. Одно из наиболее известных применений поисковых систем — веб-сервисы для поиска текстовой или графической информации во Всемирной паутине. Существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, информацию в группах новостей Usenet.

Для поиска информации с помощью поисковой системы пользователь формулирует поисковый запрос. Работа поисковой системы заключается в том, чтобы по запросу пользователя найти документы, содержащие либо указанные ключевые слова, либо слова, как-либо связанные с ключевыми словами. При этом поисковая система генерирует страницу результатов поиска. Такая поисковая выдача может содержать различные типы результатов, например: веб-страницы, изображения, аудиофайлы. Некоторые поисковые системы также извлекают информацию из подходящих баз данных и каталогов ресурсов в Интернете.

Поисковая система тем лучше, чем больше документов, релевантных запросу пользователя, она будет возвращать. Релевантность – это соответствие запросам.

Релевантный — способный служить для точного определения чего-либо, в данном случае – ответ должен быть наиболее точен, заданному вопросу.

В архитектуру поисковой системы обычно входят:

  • Поисковый робот, собирающий информацию с сайтов сети Интернет или из других документов. Поисковые системы работают, храня информацию о многих веб-страницах, которые они получают из HTML страниц. Поисковый робот проходит по всем ссылкам, найденным на странице, и выделяет их.
  • Индексатор, обеспечивающий быстрый поиск по накопленной информацию. Данные о веб-страницах хранятся в индексной базе данных для использования в последующих запросах.

· Поисковик, принимающий пользовательские запросы, обрабатывающий их при помощи индекса и возвращающий результаты поиска. На сегодняшний день Google это первая по популярности поисковая система в мировом Интернете (но не в России, у нас она уступает поисковой системе Yandex)..

Поисковые системы можно разбить на два типа:

Предметные каталоги, формируемые специалистами-редакторами.

Автоматические индексы, формируемые специальными компьютерными программами, без участия людей.

Системы, основанные на предметных каталогах используют базы данных, формируемые специалистами-редакторами, которые отбирают информацию, устанавливают связи для баз данных, организуют и снабжают данные в разных поисковых категориях перекрестными ссылками.

Системы, использующие автоматические индексы называются поисковыми машинами. Это автоматическая система, которая хранит информацию обо всех известных ей страницах и выдает по запросу адреса тех из них, где встречаются введенные пользователем ключевые слова.