Американские ученые из Института искусственного интеллекта Аллена разработали технику предугадывания поведения собак. Технология основывается на анализе видеозаписи с камеры, закрепленной на собаке.
Само предугадывание заключается в том, что видео анализируется на 5 секунд вперед. Как комментируют ученые, цель проекта в дальнейшем – создать аналогичное устройство для анализа поведения более сложных животных и людей, а на текущем этапе выбрана собака, так как она достаточно умна, и реакции её отличаются разнообразием, но при этом мотивы и цели животного недостаточно изучены. Камеры и инерционные датчики, фиксирующие позы и положение собаки, закреплялись на головах, лапах и хвостах животных. Данные с камеры – видео «от лица собаки» и сопровождающий звук – синхронизировались с показателями датчиков.
Видео записывалось со скоростью 5 кадров в секунду, показания датчиков снимались с периодичностью 20 раз в секунду. При записи использовалось более 50 локаций (дом, парк, конура, двор) и более 10 ситуаций (контакт с сородичами, прогулка, обучение, игра, поиск предметов). На основе полученных картинок сформировалась база данных, которая помогла типизировать поведенческие проявления и создать модель поведения собак.
База собранного материала позволила предсказать действия собаки («думать, как собака»), ход её обучения («обучаться, как собака») и процесс принятия решений («планировать, как собака). При исследовании задействовали два вида нейросетей: CNN для распознавания изображений и LSTM для сортировки и анализа поступающих картинок. Третья, новая нейросеть создает на основе уже полученных данных создает следующие изображения, то есть, выстраивает возможную траекторию движения животного и его реакцию. В данный момент ученые говорят о совершенствовании уже имеющейся системы – увеличении скорости анализа показателей и увеличении прогнозируемого времени. В дальнейшем ученые планируют изучить и других животных, а затем, возможно, приступить к человеку.
Полезное приложение для смартфона получилось бы – видишь стаю бродячих собак, наводишь смартфон и за пять секунд до неприятностей определяешь, какая из них проявит агрессию. Впрочем, нет, спасибо – интуиция и быстрые ноги будут по-эффективнее в этой ситуации. А вот для анализа поведения массового скопления людей, пассажиров метро или посетителей крупных торговых центров такая сеть была бы востребована.