Google на днях представила новый алгоритм машинного обучения GIST, который помогает обучать модели быстрее и эффективнее, не используя весь массив данных. Алгоритм решает проблему в два этапа: Чтобы это делалось быстро и эффективно, GIST пробует разные уровни порогов разнообразия и находит лучший баланс между разнообразием и полезностью с помощью данного алгоритма. Сам процесс отбора очень быстрый по сравнению с самим обучением моделей, что делает его практичным даже для огромных наборов данных. К чему я это пишу? К тому, что описанный алгоритм как нельзя лучше ложится на принципы веб-поиска. GIST идеально ложится на реальные SEO-задачи, особенно сейчас, когда поиск и AI-ответы всё больше зависят от качества, а не количества данных. Поисковая система решает ту же самую задачу, что и GIST в ML: Из огромного массива похожих сущностей выбрать небольшое подмножество, которое даст максимальный эффект. Сущности могут быть: ключевые запросы, страницы, тексты, интенты, анкоры, доноры ссылок,
GIST — новый этап интеллектуальной выборки данных и его применение в поиске .
31 января31 янв
3 мин