Умные рисовалки. Бесплатные аналоги MidJourney

Блог компании FirstVDS. Автор: phanerostroi_evidence. 26 апреля должно было выйти продолжение серии Анатомия игры, но у Вселенной оказались свои планы на мой компьютер. С другой стороны, где-то что-то убыло, где-то что-то прибыло. Так же можно сказать и о сегодняшнем объекте нашего внимания.

Недавно, буквально пару дней назад, закрылась халявная лавочка под названием MidJourney. Вернее, по-настоящему халявной она никогда не была, но к этому мы еще вернемся.

Здесь я представлю список бесплатных AI-painter'ов — нейросетей, способных заменить MidJourney.

Это не рейтинг, так как одни нейросети хорошо справляются с одними задачами, а другие — с прямо противоположными. Хотя свой личный выбор я все же обозначу.

Сей пост — не реклама, я просто делюсь с вами полезными знаниями.

Ну что, погнали?

Примечание: в посте не будет программ, чья единственная функция — делать картинки из фото. Речь пойдет именно о генераторах, в том числе поддерживающих обработку фото. Все картинки в посте сгенерированы мной. Можете сохранить их себе как пример (хотя лучше сгенерируйте свои), но воздержитесь от коммерческого использования. Споры о том, погубят ли ИИ современное общество, лучше оставить для соответствующего поста.

Ах, да. Не у всех есть время на такие развлечения и чтение желтой прессы, так что придется провести краткое введение.

Что такое MidJourney

MidJourney — одна из мощнейших нейросетей, генерирующая картинки на основе текстового запроса — промта (англ. promts). Работала она через команды в канале своего официального сервера в Discord.

Справка. Что такое Нейросети. Нейросети — программные алгоритмы, имитирующие элементы работы нервной системы человека. В частности, нейронки могут выполнять весьма сложные логические операции, например, узнавать (распознавать объект по признакам), каталогизировать, сравнивать, описывать и т.д. Ряд нейросетей может выполнять и более сложные задачи. Но достижение создателей не в этом — алгоритмы узнавания существовали задолго до НС, и даже без современных цифровых инструментов. Ключевым признаком нейронных сетей является способность к обучению. Да, не без помощи оператора, направляющего логику компьютера и вносящего правки в исходный код, но все же. Формально, НС — это весьма продвинутые логические алгоритмы, наподобие тех, что выдают вам «умные» рекомендации в ленте в вашей любимой социальной сети, которые работают на основе предыдущих запросов. Но куда более сложные и развитые. По сути, это практически уже тот самый Искусственный интеллект, как в фантастических романах. Вообще, сами по себе нейросети появились более двадцати лет назад, но из-за недостатка вычислительных мощностей, ограничений по количеству и сложности операций и итераций, недостатков движков и языков программирования и сложностей с организацией обучения полноценно развиваться они начали только с 2015 года. Я думаю, тогда уже слышали про бота, который мог поддерживать разговор наравне с живым человеком. И которого закрыли из-за нарастающей паники по поводу слижком человечного общения и изобретения собственного языка, на котором боты общались друг с другом. Было это еще в 2017 году.

Самыми известными (вернее, раскрученными в СМИ) являются ChatGPT и Midjourney.

Первая умеет внятно и почти адекватно отвечать на различные вопросы и писать более-менее связные тексты на заданную тему. Не без оговорок, конечно — итоговый результат больше похож на то, что ваш не слишком разбирающийся в вопросе, но очень начитанный друг попытался нагуглить ответ по первым результатам в поиске, игнорируя надежность источников. С художественными текстами получше, но ошибки в логике и построении сюжетов все же хорошо видны. Впрочем, по опыту обитания на отечественных самиздат-сайтах, люди в 80% совершают такие же ошибки.

Вторая специализируется на создании картинок по написанному тексту. Вам только нужно ввести команду /imagine (англ. «вообразить»), грамотно составить несколько словосочетаний на английском и через запятую добавить желаемые детали. Например, космонавт на зеленом лугу, закат на фоне, детализированный, кинематографичный, черно-белый и т.д. Но не все запросы одинаково хорошо воспринимаются нейросетью.

Например, у людей на картинках часто бывали проблемы с пальцами, а на фотореалистичных картинках возникали проблемы с фокусом, выпадение частей окружения, косяки освещения, проблемы с мехом и волосами и т.д. А уж заставить ИИ сделать приличного дракона — задача из разряда «миссия невыполнима». Кроме того, НС лучше воспринимает абстрактные понятия и простые конкретные запросы. Если вы описываете сложную динамичную сцену на абзац текста, результат вас, скорее всего, разочарует.

MidJourney или MJ обрела большую популярность за счет открытого бета-теста. Любой желающий мог зайти на официальный канал в Дискорде и с помощью несложных команд сгенерировать вполне пристойную картинку. Поначалу качество изображений было не ахти какое, однако сервис развивался, и к сегодняшнему дню MJ способен выдавать как весьма близкие к заданному стилю картинки, так и фотореалистичные пейзажи. Фотореалистичность и стала причиной закрытия бесплатного доступа, но об этом чуть позже.

Вообще, бесплатных попыток было всего 25 на аккаунт— на один запрос, создающий 4 картинки, тратится одна попытка. Перегенерация и увеличение одной из картинок тратит также по одной попытке. Были и хитрые способы получения большего количества попыток (от заходов под другим ником до танцев с бубном и режимом анонимуса).

Но не все пользователи добросовестно создавали картинки. И дело не в монетизации результата генерации (собственно, во многих странах ИИ считается только инструментом создания и права на результат принадлежат пользователю).

Проблема, как всегда, оказалась в доверчивости людей, сидящих на новостных сайтах и всевозможных форумах — некоторые пользователи выложили фейковые новости со сгенерированными в MJ картинками с Папой Римским и американским президентом. Хотя, на мой взгляд, типичные для НС ошибки на картинках сразу выдают их фейковость. Так что халява кончилась — в генератор картинок больше не поиграть. Или поиграть?

AI-painters или ИИ-генераторы картинок

risovalki1.pngArtifical intelligence. ИИ: Starry AI

MJ была одной из мощнейший рисовальных НС, но не первой, не последней и не единственной.

Лично я насчитала почти два десятка бесплатных и условно бесплатных НС, и почти все из них попробовала. Список оных я вам сегодня и представляю. Также почти все они прекрасно работают на телефоне, а потому доступ к компьютеру вам не понадобится (кроме как для первой НС в списке). Однако все они (почти) работают исключительно через интернет, т.к. вычисления и операции проходят на облачном сервере, не нагружая ваше устройство. Кроме первой.

Для того, чтобы более-менее объяснить разницу в рисовалках, введем систему сущностных характеристик:

Платформа доступа (ПК, Android)

Количество бесплатных попыток на аккаунт

Доступные стили/режимы

Финальное качество картинки (разрешение, детализация)

Работа с референсами (создание картинки на основе картинки/фотографии, например, обработка своих фото для создания стилизованной аватарки)

Промты на русском или поддержка запросов на русском языке (не все могут составить грамотный запрос, понятный для НС, особенно для сложных картинок)

Ограничения на запросы и цензуру мы не будем рассматривать, тк в подавляющем большинстве программ слова и выражения, содержащие понятия кровь, секс, раны, обнаженку, гениталии и т.п. либо находятся в игнор-листе программы, либо могут привести к бану вашего аккаунта.

Кроме того, не все запросы одинаково хорошо воспроизводятся. Я уже упоминала, что MJ плохо справляется с драконами, особенно если не задавать ей уточнений по стилю. Это весьма распространенная проблема у нейросетей — поскольку большая часть НС сейчас имеет японское или китайское происхождение, драконы в них на выходе обычно имеют восточные мотивы. Либо являются совсем корявой кракозяброй с мордой, растущей на морде, мятыми парусами вместо крыльев и неопределенным количеством лап. Примерно такая же проблема и с другими мифологическими тварями.

Русалок ИИ рисуют чуть лучше, чертей и демонов похуже, мантикору или мимика даже по конкретному описанию придется выпрашивать десяток попыток. Дело в том, что для улучшения качества портретных картинок НС учат игнорировать аберрации (искажения) и удалять большую часть уродств вроде дополнительных глаз, пальцев или рогов. Некоторым разработчикам удается преодолеть это ограничение, но далеко не всем. Ну, а проблема с крыльями летающих существ в принципе распространена среди художников-людей. Что уж там, редкий фильм или игра с драконами может похвастаться приличными крыльями.

Еще один немаловажный момент: почти все нейросети плохо работают с отрицательными формами слов. Например, если написать в промте «человек без бороды» (man without beard) или «безбородый мужчина» (beardless man) нейросеть воспримет слова «мужчина» и «борода» (man и beard), но проигнорирует отрицательную форму или предлог «без» (without и суффикс -less) и сгенерирует вам мужика с бородой. То же самое и с частицей «не». Однако в некоторых проектах добавили отдельный модификатор Delete from, позволяющий заранее написать, чего не должно быть на вашей картинке.

Так что всем нейросетям будем задавать одни и те же задачи: сюжетная картинка с уточнениями стиля, дракон (потому что драконов почти все НС рисуют либо плохо, либо в виде китайских лунов, такова особенность бесплатных картинок), абстрактное понятие без уточнений. А именно:

Астронавт на поле пшеницы, заря, пейзаж, фотореализм — Astronaut on fields of wheat, sunset, landscape, photorealistic

Дракон на скале, шторм, море — Dragon on cliff, storm sea

Чертоги разума — Palace of Mind

Stable Diffusion

Наиболее известный, развитый и мощный из AI-генераторов картинок в свободном доступе, созданный группой StabilityAI. Более того, исходный код программы также открыт на сервисе GitHub, что позволяет каждому желающему поработать с ним, прокачать или интегрировать в свой проект. Официальный сайт проекта, если кому интересно, находится по этой ссылке

Лично я нашла три способа ею воспользоваться:

Подробнее
Пожалуйста, оцените статью:
Пока нет голосов
Источник(и):

Хабр