Искуственный интеллект AttnGAN превращает текст в картинку. Получается большей частью плохо (очень абстрактно), но когда получается хорошо, результат настораживает.
Редакция ПМ
ИИ генерирует (страшные) картинки по текстовым описаниям

Искусственный интеллект AttnGAN создает изображения по текстовому описанию. Получается пока не очень: в большинстве случаев получаются очень абстрактные изображения, но иногда по картинке можно (очень приблизительно) понять, что имелось ввиду. Вот это, например, изображение по запросу «красивая молодая женщина»:

а это — «кот» (мы пробовали несколько раз, и каждый раз алгоритм выдает что-то полосатое — возможно, учился на полосатых котах):

AttnGAN создали разработчики из Центра глубокого обучения Microsoft; описание алгоритма опубликовано в репозитории arXiv.org. Лучшие результаты получаются, когда запросы соответствуют тематике массива изображений, на которых обучали алгоритм — когда в него загрузили много изображений птиц, он стал сносно генерировать птиц, но когда алгоритм учится на массивах картинок более разнообразной тематики, он теряет сноровку.

Tao Xu et al., 2018

Зато по‑прежнему неплохо разбирается во фруктах (запрос «банан и персик»):

Больше всего редакцию «Популярной механики» напугало изображение человека в красном, сгенерированное по запросу «Огонь иди со мной» — в статье не упоминается об обучении алгоритма на кадрах из «Твин Пикса»:

Поиграть с демо-версией ИИ можно тут — правда, понимает она только английский язык. Демо-версию разработал Кристобаль Валенсуэла из Нью-Йоркского университета, участник проекта Runway, цель которого — исследование творческих способностей искусственного интеллекта.

Понравилась статья?
Подпишись на новости и будь в курсе самых интересных и полезных новостей.
Спасибо.
Мы отправили на ваш email письмо с подтверждением.