Google DeepMind выпустил большой набор данных для изучения языка жестов

Исследовательская группа Google DeepMind выпустила новый большой набор данных для машинного обучения - YouTube-SL-25, который содержит более 3,2 часов видео на языке жестов и охватывает более 25 языков мира. Этот проект может помочь решить проблему нехватки данных для разработки алгоритмов распознавания жестов и автоматического перевода. Команда использовала несколько шагов для создания этого набора данных. Сначала автоматически выбирались подходящие видеоролики на YouTube, после чего они вручную сортировались и отклонялись для улучшения качества. В результате было собрано около 81 тысячи видеороликов, которые затем были сокращены до 39 тысяч, общей продолжительностью более 3,2 тысячи часов. Каждое видео снабжено подробной аннотацией. Этот набор данных может быть полезен разработчикам систем, способных распознавать жесты и переводить их на другие языки. До сих пор такие системы испытывали трудности из-за ограниченности доступных данных. YouTube-ASL, еще один набор данных от Google, также содержит данные по американскому языку жестов, но его объем намного меньше и он не охватывает такой широкий языковой диапазон, как YouTube-SL-25. YouTube-SL-25 содержит большое количество данных для различных языков, включая американский язык жестов (asl), русский, датский, эстонский и швейцарский диалект итальянского.Регионы России
Эта новость в СМИ