Найти тему

Видеобаза для распознавания чайной церемонии

Группа китайских айтишников создала базу данных для распознавания действий, определяющих чайные церемонии. Они используют этот термин для описания атрибутированного чаепития в китайском стиле — ну, почему бы и нет. База состоит из 2745 видеоклипов с действиями, производимыми во время приготовления и подачи зеленого чая, черного чая и улуна специалистами разного уровня подготовки. Все эти клипы аннотированны и могут быть использованы в системах, завязанных на анализ видеоконтента.

www.ncbi.nlm.nih.gov
www.ncbi.nlm.nih.gov

База чайных видеоданных называется FineTea, находится в открытом доступе и весит 18 гигабайт. Мечта фидошника… В статье, описывающей базу данных, разработчики отмечают, среди прочего, что специфической сложностью чайной церемонии с их распознавательской точки зрения является большое количество манипуляций руками, очень похожих друг на дружку, но при этом разных.

Разработчики FineTea свели все действия, происходящие во время приготовления и подачи чая, в 9 основных классов и 31 подкласс. Девять основных действий это промывание посуды, переворачивание посуды, насыпание заварки, подача чая гостю, разливание чая, демонстрация чая, заливание горячей воды, заваривание чая и перемешивание чая. Ну а 31 поддействие — это применение девяти основных действий к конкретным чаям и конкретной посуде.

Все эти действия и поддействия разработчики FineTea свели в одну схему, которая, на мой взгляд, представляет как минимум презентационный интерес и в отрыве от базы видеоданных. Эту схему можно перевести на русский, распечатать и на стену повесить в качестве учебного пособия или атрибута собственной чайной солидности.

www.ncbi.nlm.nih.gov
www.ncbi.nlm.nih.gov

Там, кстати, в сопутствующей базе данных статье, приведена таблица сравнения аналогичных баз с указанием количество роликов, которые необходимы для уверенного распознавания разных действий. Для чайной церемонии, повторюсь, это 2745 роликов. Для распознавания игры в настольный теннис достаточно всего 1154 роликов. А для распознавания соревнований по прыжкам в воду нужно 18404 ролика. Что, в общем, понятно. Настольного теннисиста легко определить. Он скачет вокруг стола с ракеткой. А вот с уверенностью сказать, чем занимается причудливо вертящийся в воздухе и почти голый человечек, довольно сложно, тут не поспоришь.

Нам, уже немного вялым кожаным мешкам, знание о том, что теперь нейросети могут распознавать чайные церемонии, никак не поможет. Потому что совершенно не понятно, как будет использована эта база видеоданных — для того чтобы однажды, в час «Ч», избавиться сразу от всех чайных мастеров, работающих в китайском стиле, или наоборот, для того чтобы первыми перенести их в дивный новый мир.

С подпиской рекламы не будет

Подключите Дзен Про за 159 ₽ в месяц