В январе 2021 года исследовательская лаборатория искусственного интеллекта OpenAI выпустила ограниченный выпуск программного обеспечения под названием Dall-E.
Программное обеспечение позволяло пользователям вводить простое описание изображения, которое они имели в виду, и после короткой паузы программное обеспечение выдавало почти сверхъестественно хорошую интерпретацию их предложения, достойную начинающего иллюстратора или опытного дизайнера Adobe, но намного быстрее и бесплатно.
Набрав, например, “свинья с крыльями, летящая над Луной, иллюстрированная Антуаном де Сент-Экзюпери”, после минуты или двух обработки получилось нечто, напоминающее неровные, но узнаваемые акварельные кисти создателя "Маленького принца".
Примерно через год, когда программное обеспечение получило более широкий выпуск, интернет сошел с ума.
Социальные сети были наводнены всевозможными причудливыми и чудесными творениями, буйной мешаниной фантазий и художественных стилей. И несколько месяцев спустя это произошло снова, на этот раз с языком и продуктом под названием ChatGPT, также производимым OpenAI.
Если вы сделаете запрос в ChatGPT составить краткое изложение Книги Иова в стиле поэта Аллена Гинзберга, и он за несколько секунд придумает разумную попытку. Попросите его представить стихотворение Гинзберга "Вой" в виде презентации консультанта по менеджменту, и он тоже это сделает.
Способность этих программ создавать странные новые миры в словах и картинках привела публику в восторг, а желание попробовать самому породило растущую литературу о том, как наилучшим образом использовать эти инструменты, и особенно, как структурировать входные данные для получения наиболее интересных результатов.
Последний навык стал известен как “оперативная разработка”: техника формулирования инструкций в терминах, наиболее четко понятных системе, поэтому она возвращает результаты, которые наиболее точно соответствуют ожиданиям – или, возможно, превосходят их.
Технические комментаторы поспешили предсказать, что быстрое проектирование станет востребованной и хорошо оплачиваемой работой в будущем “без кода”, где наиболее эффективным способом взаимодействия с интеллектуальными системами будет использование человеческого языка.
Нам больше не нужно было бы знать, как рисовать или как писать компьютерный код: мы бы просто шептали наши желания машине, и она сделала бы все остальное. Пределы творений ИИ были бы пределами нашего собственного воображения.
Подражатели и достижения в Dall-E
Dall-E mini (позже переименованный в Craiyon) дал возможность тем, кого не пригласили на частные сервисы OpenAI, поиграть с аналогичным, менее мощным, но все еще весьма впечатляющим инструментом.
Между тем, независимое коммерческое издание Midjourney и open-source Stable Diffusion использовали другой подход к классификации и генерации изображений, во многом с теми же целями. В течение нескольких месяцев эта область быстро продвинулась до создания коротких видеороликов и 3D-моделей. При этом новые инструменты ежедневно появлялись у академических отделов и программистов-любителей, а также устоявшихся гигантов социальных сетей: ИИ Facebook (он же Meta), Google, Microsoft и других. Открылась новая область исследований, программного обеспечения и оспаривания.
Имя Далл-И объединяет робота-главного героя диснеевского фильма "Уолл-И" с испанским художником-сюрреалистом Сальвадором Дали. С одной стороны, у вас есть фигура отважной, автономной и очаровательной маленькой машины, подметающей обломки рухнувшей человеческой цивилизации, а с другой - человек, чьи наиболее часто повторяющиеся бон-моты включают:
- “Те, кто не хочет ничему подражать, ничего не производят” и
- “Важно сеять смятение, а не устранять его”.
Оба являются замечательными тезками для широкого спектра инструментов, которые стали известны как генераторы изображений ИИ.
Новая волна потребительского ИИ, которая включает в себя как создание изображений, так и такие инструменты, как ChatGPT, захватила воображение людей. Всё это также способствовал росту благосостояния крупных технологических компаний, которые, несмотря на большие усилия, не смогли убедить большинство из нас в том, что блокчейн или виртуальная реальность (“метавселенная”) - это будущее, которого хочет каждый из нас.
По крайней мере, это кажется забавным, минут на пять или около того; и “ИИ” по-прежнему обладает этим блестящим научно-фантастическим качеством, благоухающим гигантскими роботами и сверхчеловеческими мозгами, что обеспечивает тот небольшой контакт с подлинно новым.
Но то, что происходит под капотом, конечно, далеко не ново.
Ставьте лайк! Спасибо!
Продолжение статьи Глава 2 Искусственный интеллект основан на массовом присвоении существующей культуры. Станет ли ИИ разумным и насколько это опасно? (глава 2)
Глава 3 Искусственный интеллект основан на массовом присвоении существующей культуры. Станет ли ИИ разумным и насколько это опасно? (глава 3)
Глава 4 Искусственный интеллект основан на массовом присвоении существующей культуры. Станет ли ИИ разумным и насколько это опасно? (глава 4)