🚀Прорыв от Google: активное обучение с экономией данных на 10 000× при дообучении LLM
🚀Прорыв от Google: активное обучение с экономией данных на 10 000× при дообучении LLM Google разработала масштабируемый процесс *active learning*, который позволяет в десятки тысяч раз сократить объём размеченных данных, необходимых для тонкой настройки больших языковых моделей на сложных задачах — например, при модерации рекламного контента. 🟢 Как работает метод: 1. Стартовая модель (LLM-0) получает промпт и автоматически размечает огромный массив данных. 2. Кластеризация выявляет примеры, где модель путается (наиболее спорные и ценные для обучения)...
💬 Reddit стал крупнейшим источником данных для ИИ
💬 Reddit стал крупнейшим источником данных для ИИ Платформа — один из лучших модерируемых форумов в мире с огромным объёмом содержательных обсуждений. Интересно, что Google начал давать Reddit гораздо больше видимости — кажется, почти любой поисковый запрос теперь ведёт на Reddit...