Недавно вышла Sapiens — серия инновационных моделей машинного обучения, разработанных для решения ключевых задач анализа человеческого тела. Эти модели могут выполнять задачи такие, как 2D-оценка позы, сегментация частей тела, оценка глубины и предсказание нормалей поверхности. Авторы сосредоточились на задачах, связанных с людьми, что делает их работу особенно актуальной. В результате получился набор моделей, которые эффективно решают четыре ключевые задачи: оценку 2D-позы, сегментацию частей тела, оценку глубины и предсказание нормалей. В чем фишка? Они сделали акцент на улучшении качества по сравнению с существующими решениями и выложили всё это в открытый доступ. Проект включает в себя впечатляющее количество данных. Авторы собрали миллиард изображений людей, из которых оставили 300 миллионов после фильтрации мусора. Интересно, что 17% из этих изображений показывают одного человека, а 56% — более четырех человек на кадре. Это важно для генерации данных в будущем. Для оценки глубины
Новые модели для анализа человеческого движения и формы: знакомьтесь с Sapiens
27 августа 202427 авг 2024
2
1 мин