Группа исследователей ИИ из Google и Берлинского технического университета представила PaLM-E, визуально-языковую модель (VLM) с 562 миллиардами параметров.Ferra
Создатели пишут, что это самая большая VLM из когда-либо разработанных и что она может выполнять различные задачи без необходимости переобучения.Ferra
По данным Google, при подаче команды высокого уровня, например, "принеси мне рисовые чипсы из ящика", PaLM-E может сгенерировать план действий и самостоятельно выполнить эти действия.Ferra
Это устраняет необходимость предварительной обработки или аннотирования данных человеком и позволяет более автономно управлять роботом.Ferra