ИИ генерирует (страшные) картинки по текстовым описаниям

Искуственный интеллект AttnGAN превращает текст в картинку. Получается большей частью плохо (очень абстрактно), но когда получается хорошо, результат настораживает.

Редакция сайта

Искусственный интеллект AttnGAN создает изображения по текстовому описанию. Получается пока не очень: в большинстве случаев получаются очень абстрактные изображения, но иногда по картинке можно (очень приблизительно) понять, что имелось ввиду. Вот это, например, изображение по запросу «красивая молодая женщина»:

а это — «кот» (мы пробовали несколько раз, и каждый раз алгоритм выдает что-то полосатое — возможно, учился на полосатых котах):

AttnGAN создали разработчики из Центра глубокого обучения Microsoft; описание алгоритма опубликовано в репозитории arXiv.org. Лучшие результаты получаются, когда запросы соответствуют тематике массива изображений, на которых обучали алгоритм — когда в него загрузили много изображений птиц, он стал сносно генерировать птиц, но когда алгоритм учится на массивах картинок более разнообразной тематики, он теряет сноровку.

Tao Xu et al., 2018

Зато по-прежнему неплохо разбирается во фруктах (запрос «банан и персик»):

Больше всего редакцию «TechInsider» напугало изображение человека в красном, сгенерированное по запросу «Огонь иди со мной» — в статье не упоминается об обучении алгоритма на кадрах из «Твин Пикса»:

Поиграть с демо-версией ИИ можно тут - правда, понимает она только английский язык. Демо-версию разработал Кристобаль Валенсуэла из Нью-Йоркского университета, участник проекта Runway, цель которого — исследование творческих способностей искусственного интеллекта.