Искусственный интеллект в 2024: отчет AI Index Десять лет назад лучшие системы искусственного интеллекта не могли классифицировать объекты на изображениях, различать язык и решать математические задачи. Однако сегодня искусственный интеллект регулярно превосходят человеческие возможности по стандартным критериям. Седьмое издание отчета AI Index от Стенфордского университета представило данные 2024 года о технических достижениях в области развития искусственного интеллекта, а также об общественном восприятии технологий и геополитической динамике, связанной с их развитием. Отметим важные для развития информационных технологий моменты. Исследования и разработки Промышленность продолжает преобладать в передовых исследованиях в области искусственного интеллекта. В 2023 году промышленные предприятия разработали 51 значимую ML-модель, в то время как академические круги создали лишь 15 моделей. Их совместные усилия привели к созданию 21 значимой модели. Общее число базовых моделей, выпущенных в 2023 году, составило 149 (65,7% из них имеют открытый исходный код), что превышает показатели 2022 года более чем в два раза. Затраты на обучение современных моделей ИИ, согласно оценкам AI Index, достигли рекордного уровня. 78 миллионов долларов вычислительных ресурсов требовалось для обучения OpenAI GPT-4, а для Gemini Ultra от Google — 191 миллион долларов. С 2021 по 2022 год количество выданных патентов на ИИ в мире выросло на 62,7%. С начала 2010-х годов количество выданных патентов на искусственный интеллект увеличилось в 31 раз. Исследования open source AI стремительно набирают популярность. С 2011 года количество проектов на GitHub постоянно растет: с 845 проектов в 2011 году до примерно 1,8 млн в 2023 году. Особенно заметен рост в 2023 году, когда общее количество таких проектов на GitHub увеличилось на 59,3%. Технические характеристики Искусственный интеллект опередил человека показателям классификации изображений, визуального мышления и понимания английского языка. Однако он продолжает отставать в решении более сложных задач, таких как математические задачи высокого уровня, визуальные рассуждения и планирование. Ранее искусственные интеллекты были ограничены в своих возможностях: языковые модели хорошо понимали текст, но были неэффективны в обработке изображений, и наоборот. Однако последние более мощные мультимодальные модели, такие как Gemini от Google и GPT-4 от OpenAI, демонстрируют высокую гибкость и способны обрабатывать изображения, текст и звук. Наблюдается рост значимости человеческой оценки. Благодаря генеративным моделям, создающим качественный текст, изображения и другие данные, внимание постепенно переключается на включение человеческих оценок, таких как рейтинги в Chatbot Arena, вместо компьютеризированных рейтингов, таких как ImageNet и SQuAD. Общественное мнение об искусственном интеллекте становится все более важным фактором при оценке прогресса в этой области. Соединение языкового моделирования с робототехникой привело к появлению более гибких роботизированных систем: PaLM-E и RT-2. Кроме улучшенных роботизированных возможностей, эти модели также способны задавать вопросы, что представляет собой значительный шаг в направлении создания роботов, способных более эффективно взаимодействовать с реальным миром.
1 год назад