Найти тему
ZEROSPIEL — НОВОСТИ IT

Google открыл код ИИ, который улучшает портретные фото Pixel

Дисклеймер: канал с 19 марта прекращает существование. Подпишитесь на Telegram.

В смартфонах Google Pixel лучшая камера в мире (и была такой даже по цифрам DXOMark до теста Galaxy S9), а одна из причин её крутости — искусственный интеллект. Google использовала свои возможности в машинном обучении, чтобы выжать все соки из крошечной матрицы и объектива своих смартфонов для получения лучших фото. Теперь компания открыла один из инструментов ИИ — часть программного обеспечения, которая используется в портретном режиме Pixel 2.

Как было объявлено в их блоге ранее на этой неделе, Google открыла исходный код проекта DeepLab-v3+. Это инструмент сегментации изображения, построенный на свёрточных нейронных сетях (CNN, convolutional neural networks): метод машинного обучения, который особенно хорош при анализе визуальных данных. Сегментация изображений анализирует объекты внутри изображения и разделяет их на части, отделяя элементы переднего плана от заднего плана.

Простейший пример сегментации фото
Простейший пример сегментации фото

Всё это может показаться тривиальным, но это невероятно полезный инструмент для мобильных камер, и Google использует его для улучшения своих портретных снимков в Pixel 2. Это обычные фотографии в стиле боке, у которых размытый фон на снимке, но сам человек или предмет на переднем плане чёткий. Короче, если вы не нищеброд, то у вас есть хотя бы дешёвый iPhone 7 Plus и вы понимаете о чём речь. Однако, начав говорить про iPhone, то Apple использует два объектива для создания эффекта боке, а Google — делает это с одним объективом.

С моей точки зрения, Pixel 2 снимает портретку лучше, чем iPhone, не говоря уже о селфи-портретах (я попробовал и iPhone 7+, iPhone 8+, iPhone 10, Pixel 2 и он мой смартфон на каждый день).

Как объясняют разработчики ПО Google Лян-Че Чен (Liang-Chieh Chen) и Юкун Жу (Yukun Zhu), сегментация изображений резко улучшилась из-за недавнего бума на глубокое машинное обучение, достигнув «уровня точности, который было трудно себе представить ещё 5 лет [назад]». Компания заявляет, что открывая для общественности информацию, «другие группы в академическом сообществе и в продакшене [смогут] воспроизвести и даже улучшить» наработки Google.

По крайней мере, открытие этой части ПО для сообщества должно помочь разработчикам приложений, которые нуждаются в подобной сегментации изображений, как у Google.

Хотите больше похожих статей в своей ленте? Ставьте LIKE

Понравилось читать меня? Подпишитесь на канал

Подпишитесь на канал в Telegram