Нейросеть научили создавать изображения по текстовому описанию
Нейросеть научили создавать изображения по текстовому описанию
Разработчики компании OpenAI представили нейронную сеть DALL-E. Она анализирует англоязычный текст и создает изображения на его основе.
В духе великого испанца
Создатели назвали нейросеть в честь испанского художника Сальвадора Дали и робота WALL-E из мультфильма Pixar.
DALL-E успешно справится даже со странными запросами. Вот так, например, выглядит кресло в форме авокадо:
А так – улитка в виде арфы:
Как работает нейросеть
В основу DALL-Е легла архитектура нейросети GPT-3, которая создает тексты на основе заданных параметров. Эта сеть неделю выдавала себя за человека, генерируя посты для блога.
DALL-E – расширение GPT-3 – задействует 12 млрд параметров. Она умеет анализировать текстовые запросы, находить в них объекты и смыслы, составлять изображения, пользуясь базой основных картинок.
Формально на вход поступает 1280 токенов: 256 содержат текст, 1024 – фрагменты изображения. Затем нейросеть по авторегрессионной модели создает новые картинки.
Основные навыки
DALL-Е может создавать картины с одним или несколькими объектами, передавать объем и перспективу, восстанавливать фото по его части. При создании фото она учитывает местные особенности: например, национальной еды или пейзажей.
Нейросеть добавляет надписи в различных стилях на дорожные знаки или рекламные таблички.
Кроме того, DALL-E умеет достраивать недостающие фрагменты изображений. Например, для решения задачи на уровень IQ.
Разработчики подчеркнули: DALL-Е понимает сложные фразы и способна генерировать абстракции. В результате создаются объекты, которых не существует в реальном мире – речь идет именно о генерации, а не о наилучшей поисковой выдаче.
В OpenAI отметили, что в будущем собираются применять DALL-E и подобные ей нейросети для решения мировых проблем. Например, прогнозировать востребованность профессий, как будут развиваться производства и экономика в целом.
Источник: https://infostart.ru/journal/news/tekhnologii/neyroset-nauchili-sozdavat-izobrazheniya-po-tekstovomu-opisaniyu_1363704/
См. также
Треть пользователей готова избавиться от предустановленного отечественного ПО
07.04.2021 2038 VKuser24342747 2
Google начала тестировать FLoC – технологию-убийцу cookies в Chrome
06.04.2021 4466 VKuser24342747 0
В России пройдет закрытое тестирование электронной почты с кириллицей в адресах
02.04.2021 2232 Senator_I 1
Samsung стала предустанавливать на смартфоны неудаляемые приложения. Яндекс против
01.04.2021 2477 user1015646 0
Google и Microsoft начали совместную работу над совместимостью браузеров
30.03.2021 1152 VKuser24342747 0
Google Chrome начнет автоматически добавлять https:// ко всем веб-адресам
29.03.2021 3135 VKuser24342747 0
Разработчик придумал фейковый язык программирования MOVA, чтобы отсеивать лживые резюме
26.03.2021 2406 SKravchenko 4
Фонд свободного программного обеспечения назвал лауреатов премии Free Software Awards 2020
25.03.2021 4648 VKuser24342747 0
Мода на электронное искусство: цифровой коллаж продали за 69 млн долларов
18.03.2021 4862 user1015646 0
Google перестанет следить за пользователями для показа рекламы. Но есть нюанс
16.03.2021 6041 user1015646 1