Получил доступ к Dalle-2. Вы не поверите, что может нарисовать машина… Дизайнеры больше не нужны

Блог компании RUVDS.com. Автор: Алерон. Недавно мне посчастливилось стать обладателем доступа к API Dalle-2. Если ты ещё не слышал про Dalle, то это такая CLIP-архитектура, обученная на огромном корпусе пар текст-изображение. Иначе говоря — она умеет генерировать очень качественные изображения из текста. Отличить результаты генерации от рисунков человека иногда просто невозможно! Это одновременно впечатляет и в то же время — немного шокирует.

По сравнению с предыдущей версией — DALL-E 2 умеет генерировать изображения в более высоком разрешении (1024×1024 пикселей, что в 16 раз превышает разрешение в предыдущей версии модели) да ещё и намного быстрее. Более того, DALL-E 2 позволяет редактировать уже существующие изображения.

Нет больше терпения ждать, давайте же опробуем её!

Посмотрим на несколько моих сгенерированных фаворитов

ris1.png

Просто вау! Dalle-2 очень точно узнаёт сущности, которые закладываются в тексте. Видно, что сетка в курсе, что такое Moscow, как выглядит Эйнштейн и как седлают панду… (Панду? Хотя писали мы про быка, ну это мелочи). Более того, обратим внимание на сохранение стилей, заданных в тексте. Сеточка хорошо различает pixel, digital и cyberpunk стили. Кайф! Давайте поиграем ещё!

Дизайнеры больше не нужны!

Допустим, мне очень нравятся красные роботы, и я хочу сделать для себя постер на стену и т.д. Поиграем в дизайнера!

Подробнее
Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 5 (3 votes)
Источник(и):

Хабр