Генеративные сервисы по Искусственному Интеллекту (далее ИИ) в этом году захватывает мир. Благодаря тому, что приложения для преобразования текста в изображение, наподобие как DALL-E, становятся мейнстримом, даже для энтузиастов, не использующих в своей работе, ИИ теперь является частью современного духа времени. Мы отобрали топ лучших сервисов для генерации ИИ, с большинством из которых вы можете поэкспериментировать бесплатно.
1. ChatGPT
На данный момент самым большим достижением в области Искусственого Интеллекта является ChatGPT, проект OpenAI, который может предоставлять ответы на запросы на уровне человека, и все это обучено с помощью обучения с подкреплением на основе алгоритма RLHF. От рецептов до написания блогов — удивительно, насколько хорошо это работает. Это больше, чем просто модель вопросов и ответов, поскольку он может признать, что он неправильный или у него недостаточно данных, выписать четкие и исчерпывающие ответы, написать код и даже подробно выписать ответы. Microsoft в начале 2023 инвестировал больше 10 миллиардов долларов для дальнейших усовершенствований.
Хотя ИИ сам по себе не вызывает споров, его использование сталкивается с некоторыми этическими проблемами, поскольку студенты используют его для написания своих эссе и дипломов, а один студент из Принстона даже создал GPTZero , который может определять, было ли что-то написано на ChatGPT или нет.
2. GPT-3
Хотя в последнее время мы в основном слышим о ChatGPT, GPT-3 никуда не денется в ближайшее время. Поскольку он находит множество практических применений в бизнесе . GPT-3, также разработанный OpenAI, представляет собой большую языковую модель, предназначенную для множества задач на естественном языке, таких как перевод, генерация текста и обобщение, а ChatGPT — это инструмент в рамках GPT-3, специально разработанный для вопросов и ответов и функций общения в виде чат-бота. Из-за более широкого использования GPT-3 может быть не таким удобным для тех, кто не разбирается в искусственном интеллекте, в отличие от ChatGPT, хотя у него гораздо более широкий потенциал для широких масс.
3. CodeGPT
Хотя CodeGPT и не является полноценным приложением, это расширение для VSCode, позволяющее использовать GPT-3 внутри VSCode через официальный API OpenAI. CodeGPT упрощает создание кода, объяснение кода, рефакторинг и многое другое.
4. BLOOM
BLOOM (BigScience Large Open-science Open-access Multilingual Language Model) способна генерировать текст на 46 естественных языках и 13 языках программирования и является первой когда-либо созданной языковой моделью с более чем 100 миллиардами параметров. BLOOM — это авторегрессивная модель большого языка (LLM), обученная для продолжения текста из подсказки на огромных на объемах текстовых данных с использованием вычислительных ресурсов промышленного масштаба. BLOOM также можно поручить выполнять текстовые задачи, для которых он явно не обучен, путем преобразования их в задачи генерации текста.
5. Whisper
Еще один инструмент от OpenAI, Whisper. Представляет собой модель распознавания речи общего назначения, обученную на большом количестве разнообразных аудиоданных и способную выполнять многоязычное распознавание речи, перевод и идентификацию языка. Его высокие уровни точности позволяют OpenAI надеяться, что люди будут использовать его в практических целях при переводе и распознавании речи. Whisper может интерпретировать несколько языков и даже выводить переводы на несколько языков.
6.DALL-E 2
Нашумевший летом 2022 DALL-E покорил социальные сети благодаря своей способности создавать изображения в текстовых подсказках. Используя подсказки на естественном языке, такие,например, как «последнее селфи, которое человек когда-либо сделал на Земле », DALL-E создает искусство на основе всех изображений, на которых он был обучен, иногда создавая что-то красивое, что может выиграть художественные конкурсы.
7.Craiyon
Ранее известный как DALL-E Mini, Craiyon, по сути, является ответвлением DALL-E, поскольку он создает больше, но более простые художественные работы с использованием текстовой подсказки. Это было особенно популярно летом, когда люди заполняли свои ленты в соцсетях творениями сервиса. Его довольно просто и интересно использовать, делать быстрые мэшапы, чтобы убить время.
8. Stable Diffusion
Подобно DALL-E, Stable Diffusion представляет собой скрытую модель распространения текста в изображение. Одна вещь, которая отличает его от других генераторов преобразования текста в изображение, заключается в том, что выходные данные, как правило, больше напоминают реальную жизнь, а не стилизованные художественные выходные данные из связанных приложений ИИ. Stable Diffusion обучался на 2b англоязычном подмножестве LAION 5b , общей базе изображений из Интернета, созданном немецкой благотворительной организацией LAION.
9. Imagen
Ответ Google в ответ на разработки конкурентов как DALL-E, так и Make-A-Video. Imagen может преобразовывать текст как в изображения, так и в видео. Разработанный командой Google Brain, Imagen «опирается на мощь больших языковых моделей преобразования в понимании текста и опирается на силу моделей распространения в высокоточном создании изображений». Его выходы могут быть как стилизованными, так и фотореалистичными. Вы даже можете использовать Imagen Editor и EditBench для редактирования существующих изображений без необходимости создавать новые.
10. Make-A-Video
Делая шаг вперед по сравнению с генераторами текста в изображения, Make-A-Video — это именно то, на что это похоже — ИИ для преобразования текста в видео. Приложение AI может превращать текстовые подсказки в короткие видеоролики, больше похожие на GIF-файлы, чем на контент из YouTube, — но этого достаточно, чтобы показать идею в движении. Make-A-Video может превращать текстовые подсказки в выходные данные в различных стилях или даже добавлять движение к статичному изображению.
Заключение
Эти десять генеративных проектов искусственного интеллекта — лишь некоторые из многих, которые сейчас вызывают бурю эмоций. Учитывая, насколько молода эта область и как быстро генеративный ИИ приобрел известность, можно с уверенностью ожидать и увидеть больше стартапов и технических центров, разрабатывающих аналогичные инструменты в 2023 году.
Какие проекты в области генеративного ИИ привлекли ваше внимание? Что нового, по вашему мнению, должно составить дополнительный список? Дайте нам знать!