Команда Google Brain представила общественности алгоритм SummAE AI, предназначенный для резюмирования текста. Однако он не просто делает выборку предложений заданного фрагмента, составляя краткое резюме, но и перефразирует его «своими словами».
Система SummAE работает без контроля человека либо при минимальном его участии. Она состоит из шумоподавляющего автокодировщика (кодирует предложения и абзацы целевого текста) и декодера. При обучении SummAE использовались 98 тысяч текстовых фрагментов, а также тысяча валидационных и тестовых примеров. Обучение выполнялось на датасете ROCStories, для оценки качества аннотаций нейросети использовались метрики ROUGE.
Исходный код алгоритма SummAE вместе с доступными конфигурациями есть на GitHub.
Загляните за горизонт событий вместе с OTUS! Записывайтесь на наши курсы:
ПОСМОТРЕТЬ ПРОГРАММЫ