• Продвижение бизнеса

    Рост прибыльности Вашего бизнеса за счёт охвата большей аудитории. Увеличение стабильности бизнеса.

    Читать далее
  • Поисковая оптимизация

    Продвижение Вашего сайта в популярных поисковых системах. Рост числа клиентов и информированности.

    Читать далее
  • Управление контентом

    Подбор информационных материалов, размещение статей о продуктах и услугах. Регулярное обновление материалов.

    Читать далее
  • Разработка
    Веб сайтов

    Разработка дизайна и логики сайтов любой сложности. Запуск и продвижение интернет-магазинов.

    Читать далее
  • Оптимизация
    сайта

    Оптимизация содержимого сайта с точки зрения удобства пользователей. Оптимизация для поисковых систем.

    Читать далее
Начало » Статьи » Принципы, по которым работают поисковые системы

Принципы, по которым работают поисковые системы

Любая поисковая система имеет набор следующих компонентов:

  • База данных (Database) – хранилище всех страниц, которые скачали и обработали.
  • Веб-сервер (Web server) – отвечает за правильное взаимодействие, которое происходит у пользователя с элементами поисковой системы.
  • Краулер, его еще называют «путешествующий» паук (Crawler) – это программа в автоматическом режиме проверяет имеющиеся на странице ссылки, а затем проходит по ним.
  • Паук (Spider) – программа, которая напоминает браузер, считывающий интернет-страницы.
  • Индексатор (Indexer) – эта программа проводит анализ веб-страниц, которые скачали пауки.
  • Система выдачи результатов (Search engine results engine) – ее используют, чтобы извлечь результаты поиска из основной базы данных.

Необходимо выяснить стоимость, потому что реализация поисковой системы может не совпадать с блочной структурой, которая приведена выше, например, связку из краулера, индексатора и паука можно реализовать как один программный блок. Этот блок будет скачивать страницы, производить ее анализ, а затем по ссылкам на этой странице станет искать дополнительные интернет-ресурсы.

База данных или Database – хранилище всей информации, которую скачивает и анализирует поисковая система. Иногда базу данных называют индексом поисковой системы.

Паук или Crawler. Во время работы он выделяет все ссылки, которые имеются на интернет-странице. Его основная задача – это определение ссылки, по которой будет сделан переход и сбор новых документов, которые еще не находятся в базе данных поисковой системы. Разрешение на переход происходит благодаря заранее составленному списку адресов или за счет ссылок, которые присутствуют на анализируемой странице.

Web server. На сервере чаще всего существует html-страница, у которой есть поле ввода, его используют для поиска каких-нибудь терминов и ключевых слов. Также, веб-сервер выдает пользователю результаты поиска и представляет их в виде html-страницы.

Паук или Spider. Основная цель программы – скачивание интернет-страниц. Она работает на основе тех же принципов, что и браузеры, только в отличие от них, паук напрямую работает с кодом html и не отображает информацию в том виде, к которому привыкли пользователи.

Индексатор или Indexer. Анализирует страницы, разбивает ее на блоки и элементы. Во время работы происходит выделение различных элементов и проводится их детальный анализ. Элементами выступают html-теги, заголовки, текст, структурные и стилевые особенности и многое другое.

Система выдачи результатов или Search Engine Results Engine. Этот блок выбирает страницы из базы поисковой системы. Данный компонент поисковой системы можно назвать одним из ключевых. Его функция в определении того, какие страницы соответствуют тем критериям, которые задал пользователь, а также он определяет порядок их выведения. Чтобы был сделан анализ запроса и произведен поиск нужных страниц в базе данных, а также вывод полученной информации, применяются особые базовые алгоритмы ранжирования поисковой системы.