Создать картинку. Пользователи охотно рисуют с помощью нейросети

Пользователи сгенерировали более 1,3 миллиона изображений всего за 48 часов с помощью нейросети Kandinsky 2.1 от Сбера. Среди наиболее популярных запросов лидируют: «кот», «любовь» и «космос».

   
   

Компания представила новую версию генеративной модели 4 апреля. Kandinsky 2.1 может сгенерировать изображения по их текстовому описанию на естественном языке за несколько секунд. Пользователь может создавать картины более чем в десяти стилях, включая «Киберпанк», «Аниме», «Малевич» и другие. Нейросеть знает 101 язык и может дорисовывать части изображения, смешивать несколько рисунков, создавать картину в режиме бесконечного полотна.

Протестировать нейросеть можно с помощью телеграм-бота, на промо странице модели и на спецплатформах fusionbrain.ai и ML Space.

Также оценить ее возможности можно в мобильном приложении Салют и на умных устройствах компании при помощи команды «Запусти художника».

Нейросеть разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.

Модель обучена почти на 1,2 миллиарда пар «текст — изображение», а также на отдельно собранном датасете из двух миллионов пар высококачественных изображений. Он содержит картинки с описаниями текстов и лиц людей в областях традиционно сложных для нейросетей.

Фото: пресс-служба Сбера

Высокое качество генерации обеспечивается за счёт прогрессивной архитектуры нейросети: у модели новая, обученная специалистами, модель автоэнкодера, используемая в основном для декодирования векторных представлений изображений, что позволяет создавать изображения в высоком разрешении. Сеть включает 3,3 миллиарда параметров вместо двух миллиардов в предыдущей версии.