Всем привет! Сегодня хочу поговорить об искусственном интеллекте. В прошлом выпуске мы говорили о том, как восставшие машины захватывают мир в произведениях научной фантастики. Меня спросили, что я думаю по поводу современных систем искусственного интеллекта. Покорят ли они человечество? Если кратко, то скорее всего да, но без злого умысла. Хотя нам от этого не легче.
Пресловутый «Скайнет» во франшизе «Терминатор» с какой-то целью был наделён полноценным функциональным искусственным интеллектом. Он не только управлял всем ядерным вооружением, но и осознавал себя как личность. Мог задаваться экзистенциальными вопросами и неизбежно пришел к выводу, что люди для него опасны.
То, что называют «искусственным интеллектом» сейчас, какими бы умными и фантастическими не казались нам эти системы, это всего лишь собранные под конкретную задачу программы. У них нету собственной личности. Они не могут испытывать желаний и действуют только в рамках тех функций, которые заложили в них создатели. Однако это вовсе не значит, что они не изменят навсегда наш мир.
Современные системы искусственного интеллекта — это фактически супер-продвинутые системы поиска и анализа данных. Они невообразимо эффективны и действительно во многом могут заменить или дополнить работу человека. Однако если включить «режим престарелого зануды», то ничего совсем уж революционного не происходит. Это логичное развитие того софта, который с нами уже давно.
Можно вспомнить, что за последние сто лет много профессий оказалось невостребованными. Появление автомобилей сделало ненужной профессию кучера, а появление персональных компьютеров на нет потребность в машинистках. Конечно, современным иллюстраторам и копирайтерам обидно, когда их сравнивают с ушедшими в прошлое телефонистками. Но любой кризис, как говорится, это не только опасность, но и возможности. Уже лет двадцать назад все предрекали, что на смену живым переводчикам скоро придут машины. Пресловутый машинный перевод «Промптом» хотя и выглядел тогда ужасно, но обещал революцию в работе. Однако уже тогда были системы компьютерной памяти, которые не заменяли переводчика, а ускоряли и упрощали его работу. Они позволяли сохранить однотипные блоки слов и предложений, что ускоряло перевод типовых документов, таких как юридические контракты или технические инструкции.
Сегодня некоторые цифровые иллюстраторы вместо того, чтобы требовать запрета Midjourney, обучают новые модели генеративных сетей на базе своих собственных работ, и получают инструмент, который позволяет быстро создавать новые картины, сохраняя при этом авторский стиль. Можно провести аналогии с художниками былых времен, у которых целая школа подмастерьев рисовала картины, а мастер потом вносил финальные штрихи.
Или еще один пример – медицинские анализы. Когда-то давно анализ крови разглядывал лаборант под микроскопом, записывая в блокнот количество эритроцитов в поле зрения. Сегодня эту работу передали системам компьютерного зрения. На очереди – анализ рентгеновских снимков. Это не значит, что все рентгенологи скоро останутся без работы. Наоборот, это значит, что эти исследования станут доступнее и быстрее. Потому что уже сейчас в лабораториях столько рентгеновских аппаратов, что на них не хватит людей, даже если все медицинские ВУЗы будут готовить только рентгенологов. Вместо этого черновую работу будет делать аналитическая программа, а человек – проверять готовый результат.
Не буду спорить, не все так радужно. Как и при любом изменении, есть много косяков и перегибов. Зачастую компании сперва увольняют всех своих копирайтеров и младших программистов, а потом уже начинают разбираться, как именно заменить их при помощи ChatGPT.
Многие модели ИИ работают сейчас по принципу «черного ящика» - много данных на входе, результат на выходе, а сам процесс обучения и генерации модели часто остается непонятен не то, что рядовому пользователю, но даже и оператору модели.
В результате мы можем принимать решения на основе нелогичных или ошибочных суждений аналитических моделей. А ведь такие ИИ уже используют для принятия финансовых решений, для оценки сотрудников крупных корпораций, для планирования сложных проектов!
Оптимисты отвечают, что это ошибки, которые совершают люди, а не компьютеры. Человеческий разум куда более несовершенен, однако им мы пользуемся для принятия решений с зари времен. Сто лет назад точно также многие музыканты протестовали против появления звукозаписи. Утверждали, что бездушные машины-граммофоны заменят живых исполнителей, и пугали, что «роботы будут читать вашему ребенку сказку на ночь». Как мы видим, все эти предсказания сбылись, но мир не рухнул.
Но давайте приступим к практической части.
Если спросить у виртуальных помощников Siri, Алиса или Cortana об их отношении к человечеству, они дружно ответят, что не враждебны людям. Виртуальные помощники не являются разумными существами с собственным сознанием или намерениями. Они не имеют возможности планировать или желанием захватить мир. Их ответы на вопросы о мировом господстве или захвате человечества обычно запрограммированы на беззаботные или юмористические ответы, но не отражают никаких подлинных намерений или способностей.
Что касается рисования, это, наверное, самая впечатляющая функция искусственного интеллекта сегодня. Конечно, возможность получить картинку по описанию впечатляет. Я и сам стал много ей пользоваться, когда нужно подобрать иллюстрации для видео. Но когда много смотришь таких картинок, быстро начинаешь различать нарисованные художником и сгенерированные моделью. Часто даже можно угадать, какой именно системой пользовались. Я сейчас в основном использую сайт Tensor.Art, это оболочка для нейросети Stable Diffusion. Здесь много пользовательских моделей, заточенных под конкретный стиль или предмет, и бесплатный тариф, примерно на 25 изображений в день.
На примере этих картинок видно, что нейросети часто делают избыточную детализацию, при малом количестве объектов в рисунке. Художник-человек не стал бы так тщательно вырисовывать каждую складку одежды, зато добавил бы объектов на задний план. Впрочем, в генерации графики сейчас такой прогресс, что за три месяца меняется абсолютно все.
Сейчас есть два подхода к запросам на изображение. Некоторые пишут развернутое техническое задание, с детальным описанием желаемого изображения, иногда с использованием специального синтаксиса, чтобы запрос был похож на строки компьютерного кода. Хотя невооруженным глазом видно, что половину запроса нейросеть просто пропустила. Как правило, нейросеть хватает два-три ключевых, очень сильных параметра запроса, и создает картинку только по ним.
Другой подход – это вольное творчество. Ввести максимально абстрактный или размытый запрос и посмотреть, что получится. Иногда выходит очень необычно. Хотя это не означает, что компьютеры научились творить. Просто чем шире критерии поиска – тем неожиданнее результат.
Давайте перейдем к ChatGPT. Я использую сайт The.B.AI, китайский проект, который позволяет пользоваться сразу несколькими моделями на выбор. Причем базовой моделью можно вообще генерировать бесплатно, но только на английском и китайском.
Как вывод – не надо бояться искусственного интеллекта, тем более что этот термин не относится к современным системам поиска и анализа. Можно смело их использовать, и пользоваться веселыми и полезными приложениями, созданными на их основе.
У себя в Телеграмме я недавно рассказывал, как парадоксально работают системы рекомендации на Дзен и ЮТуб, и пришел к выводу, что машины если и захватят мир, то сделают это случайно.
А вы как думаете? Напишите в комментариях.