Найти в Дзене
3 подписчика

ИИ, соцсети и почему он иногда «несет чушь»: разбор полетов

Если коротко, то весь этот хайп вокруг ИИ, который «живой» и «почти человек», на самом деле замешан на самом большом массиве «живого текста» в открытом интернете. А это, как вы понимаете, социальные сети, комментарии и форумы. Вот вам и весь секрет.

Шоу-эффект на миллиарды: как ИИ стал новой золотой лихорадкой
Конечно, OpenAI и прочие гиганты не спешат выкладывать точные списки своих «учебников». Но по косвенным данным становится ясно: основным источником обучения стали соцсети. Почему? Да потому что это просто, доступно, массово, а значит — дёшево. И, что немаловажно, максимально разнообразно и приближено к реальной речи. Причём тут речь? Да при том, что сами разработчики называют свои творения большими ЯЗЫКОВЫМИ моделями. В начале это был просто трюк: «смотрите, компы научились разговаривать». И ведь получилось на славу! У части человечества, особенно той, что склонна к магическому мышлению, сложилась новая вера: «Вау! Оно живое!» Ну и, конечно, это следовало монетизировать. Скажете: как так? Мы до сих пор ничего не платим! Конечно, речь не идёт о том, чтобы все желающие пообщаться с диковинной технологией должны были «опускать монетку в прорезь». Монетизация идёт, моё почтение! На уровне национальных экономик.

Время удачное, экономики в стагнации, у финансовых рынков новых долгосрочных идей нет. И тут — новая золотая лихорадка: финансы, наука, железо, энергетика, технологии. Я не удивлюсь, если где-нибудь в американской глубинке появится культ святого ИИ. Я не эксперт в области экономики, но на ТАКОМ хайпе каждый школьник знает, что надо вкладывать в OpenAI и Nvidia. И чтобы подлить бензина в процесс, эти монстры договорились и «проинвестировали» друг в друга несуществующие пока миллиарды, обменявшись активами. Формально это показало дикую прибыльность в моменте. А значит, все мамкины инвесторы теперь знают, куда именно надо нести заработанное на крипте и достатое из банок и из-под матрацев =).

Я не стану сто пятьсот первый раз говорить про пузырь, и да, это, конечно, пузырь. Но давайте разберём положительные стороны. Они, конечно, есть. Во-первых, экономика получила новую индустрию и ожила вокруг новых идей. Во-вторых, появился практический смысл применения технологий из этой сферы в реальном физическом мире. Правда, сейчас бизнес-менеджмент тестирует границы и пытается найти новый баланс между страхом и жадностью. Но, поверьте, скоро баланс будет найден!

Почему ИИ идет «непрактичным и непрямым путём»
Самый главный плюс этих моделей в том, что компиляция статистических алгоритмов, обученных на большом количестве узкоспециализированных данных — «дата-сетах» — позволяют создавать по-настоящему годные инструменты. Но, к сожалению, инвесторы, которые оплачивают «топливо» этой гонки, неохотно инвестируют непосредственно в исследования, а вот в шоу-технологии — да! Поэтому развитие технологий ИИ идёт немного непрактичным и непрямым путём.

Например, куда практичнее учить статистические алгоритмы сразу на дата-сете с датчиков, измерительной аппаратуры, развивать математические вычисления напрямую. И в узкоспециализированных проектах это так и делается, однако, так быстро развиваться на небольшом количестве специальных данных не получится. Поэтому вначале большие языковые модели обкатывают идеи на себе. Затем инновационные утечки попадают в индустрию, и уже потом небольшие компании пилят на их базе практические решения для жизни, науки и бизнеса.

Почему этот путь непрямой? Представьте, что вы в автомобиле, а там вместо рычагов, руля и педалей — микрофон. Вам поворачивать, а тут непонятно, как объяснить, что именно надо сделать, и, не дай Бог, машина начнёт ради «реалистичности общения» косплеить капризного подростка? Пока вы будете уговаривать систему, вы точно поворот проедете. А если сейчас нужно тормозить? =) Вот именно поэтому дата-сет для автопилота Теслы — не слова, а чёткий бинарный цифровой код. И это уже похоже на схему, где автомат жмёт на тормоз и поворачивает руль, чтобы избежать последствий: не затормозил — врезался, не повернул — ушёл с маршрута.
ИИ, соцсети и почему он иногда «несет чушь»: разбор полетов Если коротко, то весь этот хайп вокруг ИИ, который «живой» и «почти человек», на самом деле замешан на самом большом массиве «живого текста»
3 минуты