Apple хочет, чтобы вы поверили, что iPhone 16 - это единственный настоящий телефон с искусственным интеллектом, который изменит вашу жизнь в значительной степени. В конце концов, вы же не ставите маркер «Создано для Apple Intelligence» на каждой странице, где телефоны поэтично рассказывают о своих личных и практических возможностях ИИ.
Пока что мой пробег разочаровывает, и, похоже, не стоит верить всем этим заявлениям, пока Apple не выпустит все обещанные на данный момент трюки с искусственным интеллектом. Это ожидание может затянуться до 2025 года. С другой стороны, у вас есть Google Pixel 9.
Это телефон, который действительно борется со своим искусственным интеллектом. Он хочет, чтобы вы подружились с болтливым ИИ. Он будет внедрять ИИ в ваши изображения в надежде, что трюки Photoshop покажутся древними. Он хочет быть вашим вторым пилотом и в рабочих делах, таких как написание ответов на почту или мозговой штурм черновика.
Помимо абсолютно обыденных вещей вроде установки будильника, Pixel 9 хочет внедрить искусственный интеллект практически во все, для чего вам нужен телефон. Даже просмотр и принятие звонков здесь не исключены. ИИ повсюду. Такова основная идея.
Но это не значит, что внедрение ИИ обязательно будет значимым. Или даже точным. С тех пор как я взял в руки телефон Pixel 9, я не переставал испытывать его возможности в области искусственного интеллекта. Если вы задавались вопросом, стоит ли этот телефон своей искусственной соли, вот трюки ИИ, которые могут вас покорить.
ПРИМЕЧАНИЕ: Приложение Pixel Screenshots предназначено исключительно для телефонов Pixel 9. Остальные функции связаны с приложением Gemini Advanced, которое бесплатно в течение года на устройствах Pixel 9 Pro и требует подписки Google One AI Premium (от 20 долларов в месяц) со многими другими функциями.
Gemini в Gmail
Неудивительно, что Google продвигает Gemini во всех уголках своей продуктовой экосистемы. Gmail - один из самых вездесущих, сразу после Google Search.
Google - не первая компания, которая экспериментирует с искусственным интеллектом для электронной почты. Компания Shortwave была одной из первых, кто решился на этот шаг, и продолжает отлично справляться со своей работой. Apple Intelligence также внедрила в почту систему подведения итогов и функцию «умных ответов», но это не всегда удается.
Gemini предлагает лучшую интеграцию искусственного интеллекта, которую я видел в любом почтовом приложении на данный момент. Хотя он существует отдельно в виде собственной иконки в верхней части, прямо у строки поиска, он может обрабатывать ваши запросы более интуитивно.
Допустим, единственное, что вы помните о письме, - это то, что в нем говорилось о какой-то клавиатуре, но нет никаких подробностей о бренде или отправителе. Запрос типа «Что это было за письмо о компактной клавиатуре, которую я получил в июле?» отлично справится с этой задачей.
Но это только начало. Добавив в запрос немного деталей, вы сможете написать ответ на письмо, даже не открывая его. Вы можете сказать: «Отправьте ответ Джессике, сообщив ей, что мне нравится идея сумки со встроенным трекером».
Gemini не только подготовит ответ, но и возьмет из соответствующего письма несколько других деталей, таких как название продукта, запуск, характеристики и т. д., и подготовит хорошо написанный профессиональный ответ. Кроме того, вы можете просто попросить его написать оригинальное письмо.
Идя дальше, Gemini делает работу с переполненным почтовым ящиком еще более удобной. Резюме в основном точные и намного лучше, чем Apple Intelligence или любое другое программное обеспечение, которое я использовал до сих пор.
Более того, эти сводки отлично работают как для отдельных писем, так и для целых потоков. Однако я рекомендую нажать на опцию «Просмотреть более длинное резюме», так как она делает фантастическую работу, улавливая общий тон и мельчайшие детали, которые имеют значение. Система «Предложить ответ» также отлично справляется со своей задачей.
А еще есть аналитическая часть. Я регулярно получаю в свой ящик научные работы. Gemini протягивает руку помощи и здесь. Gemini Advanced предлагает контекстное окно стоимостью в миллион токенов, что вполне достаточно для 1500-страничной книги.
Я скормил ИИ 60-страничную статью об истории кастовой дискриминации и попросил его кратко описать один конкретный аспект. Примерно за семь или восемь секунд Gemini разобрал весь PDF, нашел нужные фрагменты и представил их в виде аккуратно отформатированной статьи. Это почти волшебно.
Расширения Gemini
Один из самых недооцененных аспектов Gemini - его интеграция с набором инструментов Google Workspace, включая Docs, Gmail и Drive. Интеграция распространяется на YouTube, Google Flights, Maps и Hotels.
Расширения можно использовать двумя способами. Вы можете использовать в запросе указатель ярлыка, например @Gmail (подобно тому, как вы подталкиваете товарища по команде в групповом чате в таких приложениях, как WhatsApp или Slack), чтобы Gemini выполнял запрос в этом конкретном сервисе.
Если вы склоняетесь к голосовым командам, то можете указать приложение, в котором ИИ должен искать нужную информацию. Даже если вы этого не сделаете, Gemini сможет найти детали или названия указанного файла в портфеле «Рабочее пространство» и сделать то, что нужно.
Например, вы можете начать с базовых команд вроде «просуммировать последнее электронное письмо от профессора Люсьена». А можно копнуть глубже. Я попросил Gemini обобщить статью в Google Docs, указав только название проекта, и Gemini выделил все основные моменты и представил их в виде пулевого списка.
Gemini также заглянул в мой почтовый ящик и собрал информацию о моем предстоящем полете. В ответе также интегрированы быстрые сокращения из различных электронных писем, каждое из которых содержит уникальную информацию, например копию билета, данные о терминале и маршрут регистрации на сайте.
Он также может обрабатывать запросы с развлекательных платформ, таких как YouTube. Но имейте в виду, что он не сможет выполнить детализированную работу в другом приложении Workspace, даже если речь идет о такой простой вещи, как добавление трека в определенный плейлист на YouTube Music.
На данный момент Gemini Extensions призваны быстро предоставить пользователям информацию, сохраненную в экосистеме сервисов Google. ИИ-помощник извлечет всю необходимую информацию - от электронных таблиц до PDF-файлов, сохраненных в Google Drive.
После того как он получит доступ к файлу заявки, вы сможете выбрать способ ее представления - в виде резюме, пунктирных точек или в виде устной речи. Все варианты на столе. Парсинг нужных файлов, особенно при отсутствии нужного ярлыка в рабочей области, часто занимает несколько секунд, поэтому он не идеален.
Но потенциал здесь огромен. Представьте себе, как сторонние приложения открывают доступ к Gemini Extensions и создают доступные ярлыки. Google уже заложила основы, и это лишь вопрос времени, когда мы увидим, как жаждущие разработчики подхватят эту идею.
Остается только надеяться, что, когда это станет мейнстримом, процесс будет прозрачным, а безопасность данных не будет стоять на втором плане. Сейчас это большое «если», так что будем надеяться.
Скриншоты Pixel
Скриншоты - это новые закладки, так я себе говорю. Кристофер Мур написал фантастическую исследовательскую работу под названием «Скриншоты как виртуальная фотография» в журнале Advancing Digital Humanities. В ней он утверждает, что они напрямую связаны с динамичным живым сенсорным опытом потребителей цифровых технологий.
Для людей, обменивающихся скриншотами в Интернете, они также играют важную роль в укреплении социальных связей и формировании культурного опыта, который вы получаете в сети. Но давайте остановимся на менее научных и более обычных вещах. Мы часто делаем скриншоты как своего рода дневник памяти. Это может быть что угодно - от билета или профессионально важной информации до просто забавного мема.
Мы занимаемся скриншотингом, потому что это удобно. Но при этом мы почти никогда не возвращаемся к папке «Скриншоты». Отчасти это связано с тем, что это утомительно, особенно когда вы не можете вспомнить, в каком месяце или году был сделан скриншот или как глубоко нужно прокрутить страницу, чтобы найти нужный снимок.
В Pixel 9 появилась функция, которая, по сути, выступает в роли мудрого хранителя ваших скриншотов. Жутко мудрый, я бы сказал. Секретным соусом здесь является Pixel Screenshots, приложение, работающее на базе Gemini Nano, установленного на устройстве. Думайте о нем как об инструменте OCR со сверхспособностями искусственного интеллекта, который существует скорее как хранитель воспоминаний и знаний, скрытых в ваших скриншотах.
Оно просто работает, и даже больше, чем можно предположить из названия приложения. У меня на телефоне хранится несколько тысяч скриншотов, сделанных по меньшей мере пять лет назад. Да, я барахольщик и ужасно боюсь потерять что-то ценное, если очищу папку со скриншотами. Но теперь у всего этого накопительства есть цель.
С помощью приложения для скриншотов Pixel я смог извлечь любую информацию. От аббревиатур на странице настройки игрового контроллера до описания того, как игровой персонаж размахивает своим огромным мечом в сцене, - приложение Pixel Screenshots отлично справляется с поглощением любой информации и ее последующим выводом на экран.
Это фантастический инструмент для поиска не только серьезной информации, например, для проверки счета за электричество за март или купона на Starbucks, который я потерял в стиральной машине. Для фотографий, на которых изображены люди и домашние животные, оно работает довольно хорошо.
Приложение обрабатывает естественный язык или даже короткие дескрипторы в режиме реального времени, просматривая галерею соответствующих скриншотов, пока не найдет точное совпадение. Для тех, кто часто делает скриншоты статей в ленте Discover или социальных сетей для последующего прочтения, Pixel Screenshots - удобный инструмент, который действует скорее как суперумный банк памяти.
Его стоит пересматривать снова и снова из-за его точности. Я редко видел, чтобы инструмент искусственного интеллекта был настолько точен в своих результатах, как приложение Pixel Screenshots. Это «спящий» хит без каких-либо функциональных оговорок или драматических подводных камней. А глазурь на торте заключается в том, что, когда вы приземляетесь на нужный скриншот, вы можете добавить для него запись в календарь и поместить его в новую или заранее созданную папку.
Многообещающий ИИ
Я никогда не был поклонником шумихи вокруг генеративного ИИ, и на то есть причины. По большей части он кажется забавным, но довольно бесполезным. Генератор текста в изображение Pixel Studio - отличный пример. Попытки Apple создать аналогичный инструмент - не более чем прогиб.
Но внедрить ИИ туда, где мы сможем выполнять ценную работу, очень сложно. Gemini, какими бы незначительными способами ей ни удалось повлиять на несколько основных продуктов, справилась с этой задачей просто фантастически. Никогда не думал, что скажу это, но я считаю, что лучшее место для внедрения ИИ в рабочий процесс - это почтовый ящик.
Gemini отлично справляется с этой задачей. С другой стороны, приложение Pixel Screenshots - это не только мастер для ваших воспоминаний, но и надежный способ найти информацию, которую вы, возможно, сохранили в виде скриншота и забыли.
Расширения, хотя и ограниченные в своей нынешней форме, имеют огромные возможности для изменения того, как помощник ИИ должен взаимодействовать с другими сервисами, которые являются частью ваших повседневных привычек в телефоне. В целом, я считаю, что Gemini делает Pixel 9 достойным покупки сам по себе, поскольку он действительно переопределяет то, как вы взаимодействуете со своим телефоном. Это скачок, которого стоит ожидать, и свидетельство того, насколько хороши инструменты искусственного интеллекта Google.
Если вам понравилась эта статья, подпишитесь на нее, чтобы не пропустить новые полезные статьи!