Найти тему

Работа поисковых машин. Как работает поиск?!

Понимание работы поиска, залог хороших органических позиций сайта. Поисковые системы помогают упорядочить хаос. Из большого количества сайтов, поисковый алгоритм выдает только те, что вы ищете.

Алгоритм поиска информации в интернете, очень похож на поиск главы в книге. Используются те же элементы, что и в книге.

Оглавление.

В интернете существую каталоги. Там сайты интернета разложены по рубрикам. Пользователь может просматривать оглавление каталога по рубрикам. Просмотреть сайты, которые относятся к рубрике и выбрать нужный. Ранее, в середине 90-ых, самый популярный каталог назывался Yahoo!.

Ссылки.

Если проводить аналогию с книгами, то мы помним, что в тексте бывает написано "подробнее об этом читайте на странице 100", В интернете данные отсылки превратились в автоматический процесс, и называется гипертекстовыми ссылками. Вы просто делаете клик, и вас перенаправляет на другую страницу. Гиперссылки- это основной принцип интернета.

Индексы.

Простыми словами, есть ключевые фразы, и информация о том, на каких страницах используются эти слова. Процесс образования данной информации, называется индексация сайта. Когда пользователь вводит поисковый запрос , он обращается индексу. Индекс- список всех ключевых слов интернета, с указанием того, на каких страницах сайтов в Интернете они встречаются.

Как работает поиск.

Поисковая машина — это программа, которая составляет и хранит индекс Интернета, а также находит в нём заданные ключевые слова. Для этого программа составляет так называемый поисковый индекс.

Посмотрим на этапы составления поискового индекса.

1) Сбор адресов страниц в Интернете

Страниц в интернете много, для начала разработчики поисковика загружают немного страниц в ручную, например взяв их из каталога. Далее поисковый робот находит гиперссылки на другие сайты, добавляя их в свой первоначальный список. Со временем количество сайтов очень быстро увеличивается, сейчас поисковики индексируют сотни миллиардов веб-страниц. В индексацию можно попасть автоматически либо использовать ручное добавление, в средстве регистрации новых веб-страниц.

2) Выкачивание страниц.

Что бы поработать с текстом веб-страниц, поисковик должен получить доступ. Выкачивание занимается поисковый робот. Он выкачивает огромное количество данных и передает на индексацию индексному роботу.

3) Индексирование

Чтобы составить индекс, робот должен выбрать все слова из всех выкачанных текстов веб-страниц и расположить их в алфавитном порядке, вместе с номерами страниц и разной служебной информацией о каждой странице. Далее напишу статью, где расскажу более подробно.

4) Поиск

И финал. Пользователь вводит запрос в поиск, поисковик обращается к индексу, и находит заданное слово. Поисковик видит номера страниц,и выводит список пользователю (список сайтов). Если в запросе несколько слов, то поисковик сравнивает списки страниц по каждому слову, и если одни и те же страницы появляется на каждом слове, он добавляет их в выдачу.

Тут изложена сама суть работы, есть много нюансов, которые попробую раскрыть далее. Разработчики так же добавляют все новые возможности для роботов, для более релевантной выдачи. Хотелось бы сказать что я обладаю информацией, но как автор- я дилетант. Если будут вопросы, задавайте. Возможно мой труд будет кому то полезен. Если не трудно - подпишись. Гарантирую обучающий контент.