Добавить в корзинуПозвонить
Найти в Дзене
Код Дурова

OpenAI представила Images 2.0 — первую визуальную модель с «рассуждениями» для генерации изображений

Больше новостей об IT в Telegram канале «Код Дурова» OpenAI представила Images 2.0 — первую визуальную модель компании с возможностями «рассуждений», сообщается в анонсе. Когда в ChatGPT выбрана рассуждающая модель, Images 2.0 может выполнять поиск релевантной информации в интернете, генерировать несколько изображений для одного промпта и перепроверять свой результат. В отличие от других моделей для генерации изображений компании, Images 2.0 лучше воспроизводит языки, которые используют не латинский алфавит — в частности, японский, корейский, китайский, хинди и бенгали. Сгенерированные на них тексты не только отображаются корректно, но и написаны связно. Images 2.0 лучше передаёт детали — например, на фотографиях добавляет «крошечные недостатки» для придания реализма, — точнее воспроизводит кинематографические кадры, пиксельную графику и другие стили. Компания отметила, что пока Images 2.0 может испытывать сложности с задачами вроде генерации руководства по оригами, головоломок или дет

Больше новостей об IT в Telegram канале «Код Дурова»

OpenAI представила Images 2.0 — первую визуальную модель компании с возможностями «рассуждений», сообщается в анонсе.

Когда в ChatGPT выбрана рассуждающая модель, Images 2.0 может выполнять поиск релевантной информации в интернете, генерировать несколько изображений для одного промпта и перепроверять свой результат.

 📷 📷 📷 📷 📷
📷 📷 📷 📷 📷

В отличие от других моделей для генерации изображений компании, Images 2.0 лучше воспроизводит языки, которые используют не латинский алфавит — в частности, японский, корейский, китайский, хинди и бенгали. Сгенерированные на них тексты не только отображаются корректно, но и написаны связно.

Images 2.0 лучше передаёт детали — например, на фотографиях добавляет «крошечные недостатки» для придания реализма, — точнее воспроизводит кинематографические кадры, пиксельную графику и другие стили.

Компания отметила, что пока Images 2.0 может испытывать сложности с задачами вроде генерации руководства по оригами, головоломок или деталей на наклонных поверхностях.

Images 2.0 доступна всем пользователям ChatGPT и Codex. Режим работы с рассуждениями — подписчикам ChatGPT Plus, Pro и Business. Модель gpt-image-2 также доступна в API.

Больше новостей об IT в Telegram канале «Код Дурова»