Дисклеймер: канал с 19 марта прекращает существование. Подпишитесь на Telegram.
В смартфонах Google Pixel лучшая камера в мире (и была такой даже по цифрам DXOMark до теста Galaxy S9), а одна из причин её крутости — искусственный интеллект. Google использовала свои возможности в машинном обучении, чтобы выжать все соки из крошечной матрицы и объектива своих смартфонов для получения лучших фото. Теперь компания открыла один из инструментов ИИ — часть программного обеспечения, которая используется в портретном режиме Pixel 2.
Как было объявлено в их блоге ранее на этой неделе, Google открыла исходный код проекта DeepLab-v3+. Это инструмент сегментации изображения, построенный на свёрточных нейронных сетях (CNN, convolutional neural networks): метод машинного обучения, который особенно хорош при анализе визуальных данных. Сегментация изображений анализирует объекты внутри изображения и разделяет их на части, отделяя элементы переднего плана от заднего плана.
Всё это может показаться тривиальным, но это невероятно полезный инструмент для мобильных камер, и Google использует его для улучшения своих портретных снимков в Pixel 2. Это обычные фотографии в стиле боке, у которых размытый фон на снимке, но сам человек или предмет на переднем плане чёткий. Короче, если вы не нищеброд, то у вас есть хотя бы дешёвый iPhone 7 Plus и вы понимаете о чём речь. Однако, начав говорить про iPhone, то Apple использует два объектива для создания эффекта боке, а Google — делает это с одним объективом.
С моей точки зрения, Pixel 2 снимает портретку лучше, чем iPhone, не говоря уже о селфи-портретах (я попробовал и iPhone 7+, iPhone 8+, iPhone 10, Pixel 2 и он мой смартфон на каждый день).
Как объясняют разработчики ПО Google Лян-Че Чен (Liang-Chieh Chen) и Юкун Жу (Yukun Zhu), сегментация изображений резко улучшилась из-за недавнего бума на глубокое машинное обучение, достигнув «уровня точности, который было трудно себе представить ещё 5 лет [назад]». Компания заявляет, что открывая для общественности информацию, «другие группы в академическом сообществе и в продакшене [смогут] воспроизвести и даже улучшить» наработки Google.
По крайней мере, открытие этой части ПО для сообщества должно помочь разработчикам приложений, которые нуждаются в подобной сегментации изображений, как у Google.
Хотите больше похожих статей в своей ленте? Ставьте LIKE
Понравилось читать меня? Подпишитесь на канал
Подпишитесь на канал в Telegram