Сотрудники лаборатории машинного обучения и семантического анализа Института искусственного интеллекта МГУ при поддержке портала eLibrary создали нейросеть для получения эмбеддингов научных текстов на русском языке SciRus-tiny. С ее помощью можно решать множество прикладных задач — от поиска и классификации и заканчивая извлечением научных терминов, сообщает пресс-служба МГУ.
«Модель показывает высокие значения метрик, имея при этом небольшое количество параметров, а значит, гораздо меньшие требования к вычислительным ресурсам, – прокомментировал руководитель междисциплинарной группы проекта академик Алексей Хохлов. – Данное свойство делает SciRus-tiny эффективной моделью для использования в условиях высокой нагрузки. Разработанная нейросеть ляжет в основу поисково-рекомендательной системы для ученых, тестирование которой начнется уже в начале следующего года».
Опубликованная модель – лишь первая в планируемой линейке. Разработка подобных нейросетей будет продолжена.