Google давно стал именем нарицательным для интернет-поиска — конкурентов у него просто нет. Но тот факт, что он монополист, ещё не делает его удобным. Наоборот: качество поиска у Google с годами только падает, и я помню точный момент, когда всё пошло не так.
Раньше Google честно искал по вашим словам, а не пытался угадать мысли
Когда-то Google работал просто и понятно: вбиваешь запрос — и поисковик выдаёт только то, что реально содержится в твоих словах. Всё без сюрпризов: ищешь что-то конкретное — это и находишь.
Это называли лексическим поиском: никакого гадания, никаких домыслов — только точные совпадения слов. Введёшь «Эверест высота» — и получишь только те страницы, где есть оба этих слова, без фантазий на тему, «что вы, наверное, имели в виду».
Почти на любой странице о высоте Эвереста будут встречаться и «Эверест», и «высота» — так что лексический поиск неизменно давал релевантные результаты. Иногда, конечно, находились совпадения не по теме, но по крайней мере слова запроса там точно были.
Именно благодаря прежнему поиску появились Googlewhacks — редкая магия интернета
Вот такая «простота» Google в прошлом позволяла играть в легендарную игру — искать Googlewhacks. Это когда набираешь любые два английских слова из словаря (без кавычек), и поисковик находит ровно одну-единственную страницу во всём интернете, где они встречаются вместе. Охота за такими парами превращалась в настоящий квест — и могла затянуть на целую ночь!
Примеры были громкие: «ambidextrous scallywags», «squirreling dervishes», «fetishized armadillo». Стоило кто-то поделиться редкой находкой — и магия тут же исчезала: как только о ней знали ещё где-то, появлялся второй результат, и пара переставала быть уникальной.
Британский комик Дэйв Горман даже написал книгу и устроил настоящее шоу, посвящённое Googlewhacks. Он решил составить цепочку из десяти уникальных переходов: каждый новый владелец сайта искал свой Googlewhack. Ради этого Горман прокатился по США, Европе, Австралии и Китаю, встречался с владельцами страниц и всё больше погружался в этот сумасшедший марафон. Если вы это пропустили — очень советую прочитать Dave Gorman's Googlewhack Adventure!
Настоящий конец Googlewhacks начался с обновления алгоритмов поиска
Чем больше людей играло, тем труднее было отыскать по-настоящему уникальный Googlewhack: стоило кому-то рассказать о своей находке — и та переставала быть уникальной. Но фатальный удар игре нанёс не рост популярности, а пересмотр подхода Google к поиску.
Вместо лексического поиска Google внедрил так называемый семантический: теперь поисковик не просто сверяет слова, а пытается угадать, что вы хотели сказать. Всё началось в 2012 году с запуска Knowledge Graph — огромной базы связей между понятиями, а не только словами.
Когда запускался Knowledge Graph, Google хвастался: по запросу «taj mahal» можно получить не только страницы с этими словами, но и результаты, связанные с памятником архитектуры или одноимённым музыкантом — поисковик понимает смысл, а не только буквы.
В 2013 году Google реализовал алгоритм Hummingbird, который стал всерьёз анализировать естественный язык и ловить ваш посыл — а не просто искать совпадение запроса по буквам.
Вот тут сказке про Googlewhack и пришёл конец. Теперь если ввести какую-то редкую пару слов, Google не ищет их вместе, а пытается «додумать», что за смысл они вместе несут. Запрашиваешь «fetishized armadillo» — а результат уже совсем не тот, никакой магии Googlewhack больше не получится.
Чем дальше, тем хуже: Google всё чаще ошибается с результатами поиска
Google уверял нас, что переход к поиску по смыслу сделает выдачу более полезной. На практике всё наоборот: найти что-то конкретное стало настоящим квестом, даже самые простые запросы частенько вызывают недоумение и раздражение у пользователей. Если вы хотя бы изредка пользуетесь Google, то знаете, о чём речь.
Проблема в том, что алгоритмы слишком рьяно «додумывают» за меня, чего я хочу — и смело переделывают даже мой точный запрос.
Иногда это остаётся незаметным, а иногда выглядит просто абсурдно. Недавно я встретил в мемах шведское слово «solidaritetsersättning» и решил узнать его значение. Забиваю его в Google — а поисковик меня «исправляет»: вместо перевода всего слова он ищет по частям «solidaritet» и «ersättning», ещё и вверху страницы пишет: «Это результаты по запросу solidaritet ersattning».
Аккуратно: Google Translate честно переводит «solidaritet» как «солидарность», а «ersättning» — как «замещение». Но целиком «solidaritetsersättning» — это «солидарная выплата». В результате поисковик полностью проигнорировал мой реальный запрос, и это происходит сплошь и рядом.
Думаете, кавычки спасут? Тщетно! Я специально вставлял «solidaritetsersättning» в кавычки ради точного совпадения, но Google всё равно упрямо разбивал слово и выдавал результаты для отдельных частей — ни один из них мне не подошёл.
Как же не хватает тех времен, когда Google не "исправлял" людей, а работал для них!
Бесит до слёз: Google просто игнорирует важные части твоих запросов и показывает что угодно, только не нужную информацию. Все эти результаты с перечёркнутым словом под сниппетом — признак того, что слово выбросили, и в выдаче снова каша. Неудивительно, что найти что-то конкретное становится всё сложнее.
Иногда я становлюсь настоящим параноиком. Почему Google с каждым годом ищет всё хуже? Может, дело не только в законе Мёрфи, что всё хорошее в технологиях рано или поздно ломается?
Если Google на самом деле незаметно «редактирует» наши запросы, что мешает ему крутить их так, чтобы зарабатывать больше на рекламе? Ведь рекламодатели платят за конкретные слова, и одни запросы стоят гораздо дороже других. Вдруг Google меняет смысл не ради пользователей (пользы от этого, честно говоря, не видно), а ради прибыли?
Подчеркну: это всего лишь мои мысли, и я не претендую на истину. Возможно, дело вообще в том, что интернет стал слишком огромным и алгоритмы просто не справляются. Или инженеры пошли не тем путём. Ответ знает только сам Google.
По старой памяти мы часто идеализируем прошлое, но с Google ситуация проста: когда-то он действительно работал лучше. Мечты о смысле обернулись потерей точности: теперь всё ушло так далеко, что найти нужное стало почти невозможно. Вернуться обратно к тем простым временам уже, похоже, не выйдет — остаётся только вспоминать золотую эпоху, когда Googlewhack был не мифом, а настоящим приключением для каждого любознательного.
Если вам понравилась эта статья, подпишитесь, чтобы не пропустить еще много полезных статей!
Премиум подписка - это доступ к эксклюзивным материалам, чтение канала без рекламы, возможность предлагать темы для статей и даже заказывать индивидуальные обзоры/исследования по своим запросам!Подробнее о том, какие преимущества вы получите с премиум подпиской, можно узнать здесь
Также подписывайтесь на нас в:
- Telegram: https://t.me/gergenshin
- Youtube: https://www.youtube.com/@gergenshin
- Яндекс Дзен: https://dzen.ru/gergen
- Официальный сайт: https://www-genshin.ru