В сети появились сведения о новой патентной заявке Apple, посвящённой любопытной технологии взаимодействия смартфона с пользователем. Предполагается, что с её помощью фирменный голосовой помощник научится различать беззвучные команды, даже не «глядя» на владельца аппарата. В этом цифровому ассистенту должны помочь другие устройства американского бренда.
Документ описывает преимущества нового способа распознавания речи и методы его реализации. Например, в перечень минусов традиционного «прослушивания» компания внесла высокий расход заряда АКБ, заметные затраты вычислительной мощности и не 100-процентную точность.
Чтобы исправить эти недостатки, инженеры Apple предлагают использовать не только голос, но и движения пользователя — головы, шеи и рта. Считывать их будет акселерометр или гироскоп телефона, наушников или гарнитуры смешанной реальности.
Предполагается, что для создания базы соответствия движений и слов в Apple будут использовать искусственный интеллект, хотя компания пока официально не заявляла о значительном прогрессе в этой области. Единственное упоминание языковой модели было сделано на WWDC в контексте функции автозамены в iOS 17. Впрочем, по слухам, внутри компании уже работает собственный аналог ChatGPT.
Отраслевой аналитик Мин-Чи Куо также утверждает, что Apple значительно отстаёт от конкурентов в области генеративного ИИ, поэтому механизм реализации «чтения по губам» пока неясен. Нет и гарантий, что он вообще когда-нибудь появится: ранее Apple запатентовала дисплей в виде рулона и зарядный кейс для AirPods в форме браслета, но в серию ни одна из разработок так и не пошла.