Понимание работы поиска, залог хороших органических позиций сайта. Поисковые системы помогают упорядочить хаос. Из большого количества сайтов, поисковый алгоритм выдает только те, что вы ищете.
Алгоритм поиска информации в интернете, очень похож на поиск главы в книге. Используются те же элементы, что и в книге.
Оглавление.
В интернете существую каталоги. Там сайты интернета разложены по рубрикам. Пользователь может просматривать оглавление каталога по рубрикам. Просмотреть сайты, которые относятся к рубрике и выбрать нужный. Ранее, в середине 90-ых, самый популярный каталог назывался Yahoo!.
Ссылки.
Если проводить аналогию с книгами, то мы помним, что в тексте бывает написано "подробнее об этом читайте на странице 100", В интернете данные отсылки превратились в автоматический процесс, и называется гипертекстовыми ссылками. Вы просто делаете клик, и вас перенаправляет на другую страницу. Гиперссылки- это основной принцип интернета.
Индексы.
Простыми словами, есть ключевые фразы, и информация о том, на каких страницах используются эти слова. Процесс образования данной информации, называется индексация сайта. Когда пользователь вводит поисковый запрос , он обращается индексу. Индекс- список всех ключевых слов интернета, с указанием того, на каких страницах сайтов в Интернете они встречаются.
Как работает поиск.
Поисковая машина — это программа, которая составляет и хранит индекс Интернета, а также находит в нём заданные ключевые слова. Для этого программа составляет так называемый поисковый индекс.
Посмотрим на этапы составления поискового индекса.
1) Сбор адресов страниц в Интернете
Страниц в интернете много, для начала разработчики поисковика загружают немного страниц в ручную, например взяв их из каталога. Далее поисковый робот находит гиперссылки на другие сайты, добавляя их в свой первоначальный список. Со временем количество сайтов очень быстро увеличивается, сейчас поисковики индексируют сотни миллиардов веб-страниц. В индексацию можно попасть автоматически либо использовать ручное добавление, в средстве регистрации новых веб-страниц.
2) Выкачивание страниц.
Что бы поработать с текстом веб-страниц, поисковик должен получить доступ. Выкачивание занимается поисковый робот. Он выкачивает огромное количество данных и передает на индексацию индексному роботу.
3) Индексирование
Чтобы составить индекс, робот должен выбрать все слова из всех выкачанных текстов веб-страниц и расположить их в алфавитном порядке, вместе с номерами страниц и разной служебной информацией о каждой странице. Далее напишу статью, где расскажу более подробно.
4) Поиск
И финал. Пользователь вводит запрос в поиск, поисковик обращается к индексу, и находит заданное слово. Поисковик видит номера страниц,и выводит список пользователю (список сайтов). Если в запросе несколько слов, то поисковик сравнивает списки страниц по каждому слову, и если одни и те же страницы появляется на каждом слове, он добавляет их в выдачу.
Тут изложена сама суть работы, есть много нюансов, которые попробую раскрыть далее. Разработчики так же добавляют все новые возможности для роботов, для более релевантной выдачи. Хотелось бы сказать что я обладаю информацией, но как автор- я дилетант. Если будут вопросы, задавайте. Возможно мой труд будет кому то полезен. Если не трудно - подпишись. Гарантирую обучающий контент.