Grab рассказал, что разрабатывает систему под названием KartaVision, которая превращает панорамные снимки улиц в эмбеддинги – цифровые векторы, «понятные» ИИ, по которым можно искать запрошенные объекты. Если раньше изображения просто хранились и отображались на сайте, то теперь они индексируются и становятся частью единой базы данных. Для этого Grab использует комбинацию моделей: свою для первичного отбора, и модель OpenAI – для более точного распознавания. В ходе демонстрации нам показали, как по простому запросу “mcdonald's” система выдала все панорамы, на которых виднеется эта вывеска. А вот с “Ferrari” так не вышло – вероятно, потому что Феррари на индонезийских улицах оказалось немного и модель начала галлюцинировать. На сайте можно протестировать сервис самостоятельно, работает правильно не со всеми запросами. Зачем им это нужно? В компании привели несколько сценариев использования: например, алгоритмы могут автоматически находить дорожные ямы, перекопанные участки или поврежден