Найти в Дзене
Герман Геншин

Google разрушил поиск: как исчезновение Googlewhacks превратило интернет-сёрфинг в настоящее испытание

Оглавление

Google давно стал именем нарицательным для интернет-поиска — конкурентов у него просто нет. Но тот факт, что он монополист, ещё не делает его удобным. Наоборот: качество поиска у Google с годами только падает, и я помню точный момент, когда всё пошло не так.

Раньше Google честно искал по вашим словам, а не пытался угадать мысли

Когда-то Google работал просто и понятно: вбиваешь запрос — и поисковик выдаёт только то, что реально содержится в твоих словах. Всё без сюрпризов: ищешь что-то конкретное — это и находишь.

-2

Это называли лексическим поиском: никакого гадания, никаких домыслов — только точные совпадения слов. Введёшь «Эверест высота» — и получишь только те страницы, где есть оба этих слова, без фантазий на тему, «что вы, наверное, имели в виду».

Почти на любой странице о высоте Эвереста будут встречаться и «Эверест», и «высота» — так что лексический поиск неизменно давал релевантные результаты. Иногда, конечно, находились совпадения не по теме, но по крайней мере слова запроса там точно были.

Именно благодаря прежнему поиску появились Googlewhacks — редкая магия интернета

Вот такая «простота» Google в прошлом позволяла играть в легендарную игру — искать Googlewhacks. Это когда набираешь любые два английских слова из словаря (без кавычек), и поисковик находит ровно одну-единственную страницу во всём интернете, где они встречаются вместе. Охота за такими парами превращалась в настоящий квест — и могла затянуть на целую ночь!

-3

Примеры были громкие: «ambidextrous scallywags», «squirreling dervishes», «fetishized armadillo». Стоило кто-то поделиться редкой находкой — и магия тут же исчезала: как только о ней знали ещё где-то, появлялся второй результат, и пара переставала быть уникальной.

Британский комик Дэйв Горман даже написал книгу и устроил настоящее шоу, посвящённое Googlewhacks. Он решил составить цепочку из десяти уникальных переходов: каждый новый владелец сайта искал свой Googlewhack. Ради этого Горман прокатился по США, Европе, Австралии и Китаю, встречался с владельцами страниц и всё больше погружался в этот сумасшедший марафон. Если вы это пропустили — очень советую прочитать Dave Gorman's Googlewhack Adventure!

Настоящий конец Googlewhacks начался с обновления алгоритмов поиска

Чем больше людей играло, тем труднее было отыскать по-настоящему уникальный Googlewhack: стоило кому-то рассказать о своей находке — и та переставала быть уникальной. Но фатальный удар игре нанёс не рост популярности, а пересмотр подхода Google к поиску.

Вместо лексического поиска Google внедрил так называемый семантический: теперь поисковик не просто сверяет слова, а пытается угадать, что вы хотели сказать. Всё началось в 2012 году с запуска Knowledge Graph — огромной базы связей между понятиями, а не только словами.

Когда запускался Knowledge Graph, Google хвастался: по запросу «taj mahal» можно получить не только страницы с этими словами, но и результаты, связанные с памятником архитектуры или одноимённым музыкантом — поисковик понимает смысл, а не только буквы.

-4

В 2013 году Google реализовал алгоритм Hummingbird, который стал всерьёз анализировать естественный язык и ловить ваш посыл — а не просто искать совпадение запроса по буквам.

Вот тут сказке про Googlewhack и пришёл конец. Теперь если ввести какую-то редкую пару слов, Google не ищет их вместе, а пытается «додумать», что за смысл они вместе несут. Запрашиваешь «fetishized armadillo» — а результат уже совсем не тот, никакой магии Googlewhack больше не получится.

Чем дальше, тем хуже: Google всё чаще ошибается с результатами поиска

Google уверял нас, что переход к поиску по смыслу сделает выдачу более полезной. На практике всё наоборот: найти что-то конкретное стало настоящим квестом, даже самые простые запросы частенько вызывают недоумение и раздражение у пользователей. Если вы хотя бы изредка пользуетесь Google, то знаете, о чём речь.

Проблема в том, что алгоритмы слишком рьяно «додумывают» за меня, чего я хочу — и смело переделывают даже мой точный запрос.

Иногда это остаётся незаметным, а иногда выглядит просто абсурдно. Недавно я встретил в мемах шведское слово «solidaritetsersättning» и решил узнать его значение. Забиваю его в Google — а поисковик меня «исправляет»: вместо перевода всего слова он ищет по частям «solidaritet» и «ersättning», ещё и вверху страницы пишет: «Это результаты по запросу solidaritet ersattning».

-5

Аккуратно: Google Translate честно переводит «solidaritet» как «солидарность», а «ersättning» — как «замещение». Но целиком «solidaritetsersättning» — это «солидарная выплата». В результате поисковик полностью проигнорировал мой реальный запрос, и это происходит сплошь и рядом.

Думаете, кавычки спасут? Тщетно! Я специально вставлял «solidaritetsersättning» в кавычки ради точного совпадения, но Google всё равно упрямо разбивал слово и выдавал результаты для отдельных частей — ни один из них мне не подошёл.

Как же не хватает тех времен, когда Google не "исправлял" людей, а работал для них!

Бесит до слёз: Google просто игнорирует важные части твоих запросов и показывает что угодно, только не нужную информацию. Все эти результаты с перечёркнутым словом под сниппетом — признак того, что слово выбросили, и в выдаче снова каша. Неудивительно, что найти что-то конкретное становится всё сложнее.

Иногда я становлюсь настоящим параноиком. Почему Google с каждым годом ищет всё хуже? Может, дело не только в законе Мёрфи, что всё хорошее в технологиях рано или поздно ломается?

-6

Если Google на самом деле незаметно «редактирует» наши запросы, что мешает ему крутить их так, чтобы зарабатывать больше на рекламе? Ведь рекламодатели платят за конкретные слова, и одни запросы стоят гораздо дороже других. Вдруг Google меняет смысл не ради пользователей (пользы от этого, честно говоря, не видно), а ради прибыли?

Подчеркну: это всего лишь мои мысли, и я не претендую на истину. Возможно, дело вообще в том, что интернет стал слишком огромным и алгоритмы просто не справляются. Или инженеры пошли не тем путём. Ответ знает только сам Google.

По старой памяти мы часто идеализируем прошлое, но с Google ситуация проста: когда-то он действительно работал лучше. Мечты о смысле обернулись потерей точности: теперь всё ушло так далеко, что найти нужное стало почти невозможно. Вернуться обратно к тем простым временам уже, похоже, не выйдет — остаётся только вспоминать золотую эпоху, когда Googlewhack был не мифом, а настоящим приключением для каждого любознательного.

Если вам понравилась эта статья, подпишитесь, чтобы не пропустить еще много полезных статей!

Премиум подписка - это доступ к эксклюзивным материалам, чтение канала без рекламы, возможность предлагать темы для статей и даже заказывать индивидуальные обзоры/исследования по своим запросам!Подробнее о том, какие преимущества вы получите с премиум подпиской, можно узнать здесь

Также подписывайтесь на нас в: