Найти тему
Intermedia

9 прогнозов от AI Нейросетей на 2023 год

Робот пытается заглянуть в будущее с помощью хрустального шара в стиле Бэнкси (от DALL-E)
Робот пытается заглянуть в будущее с помощью хрустального шара в стиле Бэнкси (от DALL-E)

Настройка сцены

Когда-то было сказано, что «программное обеспечение пожирает мир» . Если судить по последним нескольким месяцам, то можно предположить, что ИИ сейчас переписывает его, перерисовывает и, как правило, создает всевозможные новые версии.

Запуск ChatGPT и последующий рост до 1 миллиона пользователей менее чем за неделю, по-видимому, стал переломным моментом, поскольку более широкое общественное сознание начало пробуждаться к текущему состоянию и будущим возможностям больших языковых моделей (LLM), генеративных ИИ и другой искусственный интеллект. Тем не менее, помимо ажиотажа вокруг одного конкретного продукта и общего внедрения ИИ, следует рассмотреть гораздо больше. Итак, помимо этого, какие технологические достижения и какие приложения мы можем ожидать в наступающем году?

Отказ от ответственности: прогнозы сложны (если вы не машина)

Как выразился Билл Гейтс: «Большинство людей переоценивают то, что они могут сделать за один год, и недооценивают то, что они могут сделать за десять лет».

Первое легкое предсказание здесь должно заключаться в том, что такое утверждение, безусловно, соответствует общепринятому взгляду на ИИ. В этом контексте краткосрочная переоценка будет происходить из-за недостаточного понимания проблем, связанных с инфраструктурой данных и качеством данных, а также трудностей в решении всех нюансов и сложностей, связанных с развертыванием технологий в используемых продуктах и ​​рабочих процессах. нормальными людьми. Долгосрочная недооценка будет происходить из-за неспособности полностью представить совокупный эффект развития технологий.

С момента нашего запуска в 2020 году мы в J12 уделяли большое внимание инфраструктуре данных, необходимой для создания интеллектуальных продуктов, а также поддержке команд, создающих различные передовые приложения ИИ. Мы ' _ _ _ _ _ _ _ _ _ _ _ _ _ Мы видели, как передовые команды в своих секторах используют данные и искусственный интеллект, чтобы открывать новые горизонты.

Итак, вот что мы ожидаем увидеть в наступающем году и области, в которых мы особенно заинтересованы. Другими словами, давайте попробуем переоценить год вперед…

Прогноз на 2023 год

1. В окружении моделей

ChatGPT, построенный поверх OpenAI GPT-3, до сих пор является моделью, которая увенчалась наибольшей славой. Однако даже Сэм Альтман — генеральный директор OpenAI — выразил удивление тем, что до них никто не создал ChatGPT:

«У нас была модель для ChatGPT в API за 10 месяцев до того, как мы сделали ChatGPT… Я как бы думал, что кто-то (другой) просто ее создаст».

Это должно послужить четким напоминанием о том, что прямо сейчас существует ряд подобных незавершенных и невыпущенных продуктов, и OpenAI далеко не одинок. Предположение о том, что ChatGPT и OpenAI станут убийцами поиска Google, несколько фантастично, даже если оно поднимает вопрос о том, как поиск будет развиваться сейчас и как это может повлиять на бизнес-модель Google. И Google, и Meta разрабатывают аналогичные технологии и имеют талант продолжать это делать, но OpenAI до сих пор получал преимущество благодаря своей практике выпуска языковых моделей для общественного использования и предоставления отзывов.

Размеры крупноязыковых моделей по состоянию на декабрь 2022 г. ( https://lifearchitect.ai/models/ )
Размеры крупноязыковых моделей по состоянию на декабрь 2022 г. ( https://lifearchitect.ai/models/ )

Google, вероятно, полностью выпустит LaMDA для широкой публики в этом году, в то время как Meta, скорее всего, не останется позади. Со стороны OpenAI ожидается выпуск следующего поколения GPT-4 в начале 2023 года — и хотя он не будет иметь широко упоминаемых 100 триллионов параметров по сравнению со 175 миллиардами GPT-3 — это будет еще один скачок вперед. .

Гонка только началась.

И на старте стоят не только крупные технологии, несколько стартапов, таких как Cohere , Character.AI , Adept и Inflection.AI , разработали аналогичные модели, которые будут подготовлены к выпуску.

2. Структурирование неструктурированного мира

Около 80–90% данных, генерируемых организациями, неструктурированы. Примеры включают электронную почту, презентации, записи телефонных разговоров, мультимедийные файлы, изображения с камер наблюдения и т. д. Несмотря на то, что эти типы данных содержат большое количество информации, их, как правило, трудно анализировать.

Большие языковые модели (LLM) теперь могут решать эти проблемы — понимать большие наборы неструктурированных данных и позволять организациям раскрывать полезную информацию. Мы можем ожидать, что эти возможности будут использоваться в ряде бизнес-процессов, улучшая поиск в корпоративном программном обеспечении, предоставляя правительствам возможность повышать национальную безопасность и везде, где структурирование данных может выявить скрытые закономерности, которые могут способствовать научным прорывам или улучшать качество обслуживания клиентов.

3. Заявки, заявки, заявки — а кто выигрывает?

По мере того, как инфраструктурный и платформенный уровни генеративного ИИ начинают обретать форму, мы наблюдаем появление прикладного уровня.

Генеративный ИИ резко снижает барьеры для творчества — благодаря мощным продуктам для письменного контента, преобразования текста в изображение, текста в видео и создания 3D-игр. Столь же резко мы наблюдаем значительный прирост производительности — благодаря решениям, позволяющим генерировать код, повышать эффективность отдела продаж, улучшать обслуживание клиентов и автоматически создавать все, от маркетинговых материалов и рекламы до юридических документов.

Сегодня трудно увидеть какие-либо системные рвы в генеративном ИИ, поскольку приложениям не хватает дифференциации из-за использования схожих моделей. В ближайшей перспективе компании, скорее всего, укрепят свои позиции благодаря тому, что они раньше применят эти модели в различных контекстах, а также в результате создания удобных продуктов для их обслуживания. Хотя понимание бизнеса и проектирование могут обеспечить некоторую защиту, они, как правило, не являются самыми сильными барьерами с течением времени.

Ряд компаний, разрабатывающих приложения, смогли быстро расти, успешно приобретая клиентов, которые быстро пробуют новые решения, которые могут дать им преимущество, но испытывают трудности с удержанием и дифференциацией по мере выхода на рынок новых игроков. В течение следующего года мы узнаем больше о готовности клиентов платить за эти решения и действительно интегрировать их в свои процессы, а также начнем видеть, какие рвы могут быть созданы компаниями, которые прокладывают дорогу. способ. Они могут быть связаны с данными (например, использование собственных наборов данных поверх базовых моделей), с производительностью модели (например, возможность адаптировать модель к конкретному набору данных) или могут быть более традиционными (например, распределению и сетевым эффектам).

Акварельный и карандашный рисунок средневекового рыцаря, стоящего у замка и спрашивающего: «Где мой ров?» (DALL-E)
Акварельный и карандашный рисунок средневекового рыцаря, стоящего у замка и спрашивающего: «Где мой ров?» (DALL-E)

4. Мультимодальность?

«Модальность относится к тому, как что-то происходит или переживается » , и пока что модели и приложения, с которыми мы взаимодействуем, выполняют одномодальные задачи — они реагируют на чисто текстовое взаимодействие, выводя текст (в случае ChatGPT) или вывод изображения в случае DALL-E).

Мультимодальность означает способность сочетать понимание различных типов данных (текст, изображение, аудио, видео, числовые данные) и использовать их для решения задач, связанных с любой модальностью. Такая модель может принимать текстовый ввод и создавать видео или объединять изображения и аудио для создания текста. Точно так же, как наше знание мира происходит из комбинации визуальных, языковых, звуковых и других сенсорных сигналов — это значительно улучшает здравый смысл и контекстуальное понимание ИИ.

Одним из многообещающих приложений является здравоохранение, где можно ставить диагнозы на основе мультимодального анализа изображений, описанных симптомов и данных пациентов.

Сэм Альтман недавно заявил , что ожидает увидеть мультимодальную модель в ближайшем будущем, хотя он не зашел так далеко, чтобы заявить, что этой моделью будет GPT-4. Скорее всего, этого не будет, но в какой-то момент в этом году мы можем больше узнать о том, на что способен мультимодальный ИИ.

5. Рекомендации, о которых вы не знали, что вам нужны

В то время как генеративный ИИ претендует на все заголовки, мы можем ожидать, что многие продукты будут продолжать строиться на улучшенных алгоритмических системах рекомендаций. В последние годы TikTok произвел революцию в социальных сетях своим алгоритмически курируемым контентом, в то время как в сфере моды и коммерции значительный рост SHEIN отчасти был обусловлен его способностью рекомендовать одежду к покупке, а Spotify продолжает лидировать в мире потоковой передачи музыки, обслуживая правильная музыка для вас в нужное время.

Как выразился Рекс Вудбери из Index Ventures, «основные потребительские приложения ИИ будут в значительной степени опираться на сложные рекомендации, которые предвосхищают ваши потребности и желания еще до того, как вы о них узнаете» .

Категории, которые в последнее десятилетие определялись игроками, предоставившими лучший цифровой или мобильный опыт, могут быть в дальнейшем переопределены игроками, которые могут наилучшим образом использовать мощные системы рекомендаций для предоставления пользователям наиболее персонализированного контента. Все, от финансов и путешествий до поиска работы, свиданий и всех сфер коммерции. Все, что ранее было связано с личным консультантом или коучем, может быть разрушено.

6. Появление цифровых двойников

Появляется новое поколение реалистичных цифровых двойников , поскольку моделирование реальных активов и сред становится все более сложным и полезным. Примеры включают:

  • Так называемая промышленная революция посредством моделирования, когда все, что создается в реальном мире, сначала моделируется в виртуальном мире (как описано Бобом Петтом ). Смоделированные фабрики и рабочие места позволяют оптимизировать производственные процессы и повысить безопасность работников, а виртуальные города дают возможность вывести городское планирование на новый уровень.
  • Цифровые двойники, которые могут в любом масштабе моделировать среду для обучения высококвалифицированных специалистов. Будь то хирурги в виртуальной операционной, репетирующие операции, или операторы, работающие с современным оборудованием в фабричном цеху.
( https://vidyatec.com/blog/the-3-levels-of-the-digital-twin-technology-2/ )
( https://vidyatec.com/blog/the-3-levels-of-the-digital-twin-technology-2/ )

7. Кибербезопасность ИИ против киберугроз ИИ

Рост генеративного ИИ — в письменном контенте, изображениях, искусстве, видео и голосе — означает рост дипфейков, мошеннического контента, мошенничества и угроз кибербезопасности.

Фишинговые мошенники теперь имеют гораздо больше возможностей воспроизводить человеческое общение в текстовых сообщениях, электронной почте и голосовых вызовах, чтобы взломать системы. В то время как генеративный ИИ также можно использовать для синтеза паролей или создания похожих отпечатков пальцев для взлома аутентификации или для лучшей маскировки вредоносных программ. Мы ожидаем повышения осведомленности о кибербезопасности и появления решений, направленных на защиту прав, конфиденциальность и безопасность отдельных лиц и предприятий.

8. Данные и ИИ в борьбе с изменением климата

На пересечении самой большой угрозы этого поколения и одной из самых больших технологических революций.

Поскольку энергетическая сеть становится все более сложной из-за роста возобновляемых источников энергии и распределенных энергетических ресурсов, сетевым операторам требуются более совершенные инструменты мониторинга, в то время как коммунальные предприятия должны использовать ИИ для улучшения прогнозирования спроса и повышения эффективности за счет балансировки нагрузки. В то же время данные об энергопотреблении можно использовать для продвижения бизнеса и домашних хозяйств к более устойчивому энергетическому балансу и более оптимизированным моделям потребления.

Фото Американской ассоциации общественной власти на Unsplash
Фото Американской ассоциации общественной власти на Unsplash

9. Множество новых компаний

В то время как различные макроэкономические факторы могут привести к тому, что некоторые люди почувствуют, что сейчас не самое подходящее время для того, чтобы рискнуть и начать новую компанию, существуют и другие положительные факторы, которые могут иметь перевешивающий эффект.

  • Генеративный ИИ представляет собой своего рода сдвиг технологической парадигмы, который может трансформироваться в масштабах, превышающих даже рост мобильных и облачных технологий чуть более десяти лет назад.
  • Теперь мы видим появление прикладного уровня, поскольку новые продукты начинают касаться нашей повседневной жизни. Эта повышенная наглядность технического потенциала, видимая через приложения и возможность изучения возможностей базовых моделей, служит для пробуждения воображения создателей и строителей.
  • Из-за замораживания найма и массовых увольнений в крупных технологических компаниях, а также опционов на акции, которые больше не приносят прибыли, и удержания сотрудников в собственности, в этом году будет высвобождено беспрецедентное количество предпринимательских талантов.
  • Эта динамика выталкивания и вытягивания вместе направит таланты поколений к возможности поколений использовать новаторские технологии и создавать компании, определяющие категорию.

Робот лежит на пляже и читает газету (Nordic AI Weekly) (Stable Diffusion)
Робот лежит на пляже и читает газету (Nordic AI Weekly) (Stable Diffusion)

С подпиской рекламы не будет

Подключите Дзен Про за 159 ₽ в месяц