Microsoft представила бот-художника

Компанія Microsoft розробила технологію на базі ШІ (штучного інтелекту), яка здатна малювати зображення на основі текстового опису (наприклад, жовту пташку з чорними крилами та коротким дзьобом). Згідно з дослідженням, розробники майже у 3 рази покращили рекорд якості одержуваних зображень.

В основі бот-художника лежить технологія GAN (Generative Adversarial Network). Вона містить дві моделі машинного навчання, одна з яких генерує зображення по текстовому опису, а інша відповідає за оцінку їх вірогідності. Працюючи разом, вони вдосконалюють якість малюнків, які виходять.

Фахівці розробили алгоритм AttnGAN, який дозволяє не обробляти пропозицію цілком, а розбивати його на окремі слова. Внаслідок цього технологія більш точно вибирає область для розміщення кожної деталі зображення. Крім того, що міститься в описі, програма здатна домальовувати предмети, які підходять до композиції за змістом. Наприклад, на більшості фотографій птиці зображені сидячими на гілках дерев. Технологія може додати цей елемент, навіть якщо він не прописаний у завданні.

Такі боти можуть застосовуватися для допомоги дизайнерам та художникам у створенні ескізів. На думку розробників, при можливості використання великих обчислювальних потужностей, алгоритм зможе також створювати анімаційні фільми по тексту сценарію.

Майбутнє вже сьогодні!

Посилання по темі

Задати питання

Вызов консультанта