Сайт

Категория

Следующее приложение

GLIDE by OpenAI

Текст в изображение - Создание фотореалистичных изображений

О GLIDE от OpenAI

Недавно OpenAI запустила GLIDE (Guided Language-to-Image Diffusion for Generation and Editing) - модель на основе искусственного интеллекта, которая позволяет пользователям создавать фотореалистичные изображения на основе естественноязыковых подсказок. У этой модели сопоставимая производительность с DALL-E, но она использует гораздо меньше ресурсов, так как работает только с 3,5 миллиардами параметров, в то время как DALL-E использует 12 миллиардов.

С помощью GLIDE пользователи могут легко и быстро создавать визуальные элементы на основе текстовых вводов, что упрощает уточнение и редактирование изображений. Его также можно использовать для изменения существующих изображений с помощью естественноязыковых команд, таких как добавление объектов, теней, отражений и выполнение заполнения изображения. Кроме того, у него есть возможность преобразовывать простые линейные рисунки в реалистичные фотографии, и он даже может выполнять задачи нулевого образца и восстановления для сложных обстоятельств.

Люди предпочитают изображения, созданные с помощью GLIDE, по сравнению с DALL-E, даже если первая модель использует меньше параметров. Более того, у нее более короткая задержка выборки и нет необходимости в переупорядочивании CLIP.

Источник: https://www.marktechpost.com/2021/12/29/openai-introduces-glide-model-for-photorealistic-image-generation/

GLIDE by OpenAI скриншоты

GLIDE by OpenAI - скриншот 1

Читать на английском