Microsoft представила бот-художника

Компания Microsoft разработала технологию на базе ИИ (искусственного интеллекта), которая способна рисовать изображение на основе текстового описания (например, желтую птичку с черными крыльями и коротким клювом). Согласно исследованию, разработчики почти в 3 раза улучшили рекорд качества получаемых изображений.

В основе бот-художника лежит технология GAN (Generative Adversarial Network). Она содержит две модели машинного обучения, одна из которых генерирует изображения по текстовому описанию, а другая отвечает за оценку их достоверности. Работая вместе, они совершенствуют качество получающихся рисунков.

Специалисты разработали алгоритм AttnGAN, который позволяет не обрабатывать предложение целиком, а разбивать его на отдельные слова. За счет этого технология более точно выбирает область для размещения каждой детали изображения. Помимо того, что содержится в описании, программа способна дорисовывать предметы, которые подходят к композиции по смыслу. К примеру, на большинстве фотографий птицы изображены сидящими на ветвях деревьев. Технология может добавить этот элемент, даже если он не прописан в задании.

Такие боты могут применяться для помощи дизайнерам и художникам в создании эскизов. По мнению разработчиков, при возможности использования больших вычислительных мощностей, алгоритм сможет также создавать анимационные фильмы по тексту сценария.

Будущее уже сегодня!

Ссылки по теме

Задать вопрос

Telegram Vostok.UA Viber Vostok.UA