Представьте, что вы показываете другу фотографии из отпуска, рассказываете историю голосом и ещё включаете видео с пляжа. Друг всё это воспринимает одновременно и понимает полную картину, а не кусочками. Раньше компьютеры так не умели. Им нужно было сначала текст прочитать, потом картинку отдельно посмотреть, потом звук послушать. А теперь Gemini 3 делает это всё сразу, как человек. Что именно произошло? Google выпустил новую версию своего искусственного интеллекта, которая может одновременно анализировать текст, изображения, видео и аудио. Это называется мультимодальность, то есть работа с разными форматами информации в один момент. Причём контекст, с которым работает Gemini 3, огромный. Это как если бы вы могли держать в голове содержание нескольких толстых книг и при этом ещё смотреть фильм и слушать подкаст. Всё это машина обрабатывает без потери нити разговора. Зачем это нам, обычным людям? Допустим, вы сняли на телефон длинное видео с семейного праздника. Раньше, чтобы найти моме
Gemini 3 научился понимать всё сразу: слова, картинки, видео и звуки в одном окне.
15 февраля15 фев
2
1 мин