Найти тему
Вибгедо

Хочешь узнать, как устроены алгоритмы Яндекса – поработай на Толоке

Блогеры любят писать про Толоку. У сожалению, только самые очевидные вещи. То, что там можно заработать. Но я хотел написать в первую очередь не про заработок, а про то, что Толока дает понимание того, что «думает» Яндекс. Кому это надо? Естественно, всем, кто создает контент. Если вы блогер или специалист по SEO, и посмотрите задания на Толоке. Вскоре вы найдете ответы на многие вопросы, которые остались открытыми после безрезультатного поиска в интернете.

Сейчас поясню. Например, актуальньнейший вопрос – как взять чужую картинку и отредактировать, чтобы поисковики не поняли, что картинка не ваша? Идем на Толоку. Первое же в списке задание (вверху расположены более выгодное) – это отличить дубликаты картинок. А вот что есть дубликаты – на это есть правила, которые необходимо прочитать перед выполнением задания и выполнить тестовый цикл. Тут мы, например, узнаем, что картинки с текстом, такие как, демотиваторы, или с дорисованными усами - дублями не считаются. А вот если добавить логотип или водяной знак – то это дубли. И не все очевидно. Например, в правилах фигурирует такое описание, как большой/небольшой поворот изображения или значимая/незначимая часть изображения. Или два фото почти одинаковых предмета с одного ракурса, которые только отличаются каким-нибудь пятнышком - это дубли или нет? Вот по описанию вроде не дубли, поскольку фото разные, с другой стороны, пятнышко может быть совсем не большое. Т.е. некоторые вещи понимаются интуитивно и могут в понимании разных людей отличаться. Система следит за исполнителем, иногда подкладывая картинки, заранее оцененные модератором, чтобы тот не жульничал, но понятно, что неоднозначные ситуации возможны.

-2

За выполнения такого задания пользователь в среднем получает около доллара в час, в одни дни больше, другие меньше. Я ради интереса доллар за час тоже накликал.

Другое задание – распределять картинки на 3 категории по качеству. И здесь я провалился на тестовом задании, потому что допустил много ошибок. А зачем мне знать про качество картинок? Наверное, затем, что если Яндекс распределяет картинки по качеству, то, наверное, это влияет на продвижение. Значит, полезно знать, как сделать картинку , которую он будет продвигать лучше.

Подобных заданий очень много. Некоторые касаются сравнения текста. Кое-где просят исполнить или сфотографировать жест. Есть задания выйти на улицу и что-то найти и сфотографировать в вашем городе, если он интересен Яндексу. Были задания по поводу поиска нарушений в блогах Яндекс Дзен, но теперь нет, потому как Дзен ушел из Яндекса.

Наверное, некоторые из вас задались вопросом: а зачем все это Яндексу? Поясняю. Нет, вовсе не люди определяют где дубликат, а где нет. Люди нужны для того, чтобы тренировать нейросеть. Нейросеть берет за основу то, как люди делают выбор, и старается выделить признаки, чтобы повторить выбор по примеру. Т.е. самообучается. В минимальном случае для обучения нейросети ей необходимо скормить десятки тысяч примеров, но чем больше, тем точнее нейросеть будет работать. Поясню, что нейросеть – это вовсе не какое-то образование из мозговых клеток живых существ. Просто так называется программа, которая по структуре имеет схожесть с работой нейронов, так что пугаться слова не нужно.