Встречаем Kandinsky 2.2 — новая версия нейросети Сбера

Наука - свежие новости, обзоры, статьи - Hi-Tech Mail.ru
12-07-2023, 16:42 1

Картинки стали реалистичнее, детализация портретов улучшились, а еще появилась возможность создавать стикеры. Hi-Tech Mail.ru протестировал — показываем результат.

Что такое Kandinsky

Так называют генеративную модель Сбера. Принцип работы напоминает популярные ИИ-генераторы изображении, включая Midjourney и Stable Diffusion. Вводишь текстовый запрос — получаешь картинку. Модель умеет рисовать в разных стилях и понимает написанное на 101 языке, в том числе на русском.

В апреле пользователям стала доступна модель Kandinsky 2.1, теперь Сбер выпустил ее обновленную версию.

Как изменилась нейросеть

Kandinsky 2.2 обучена на большем наборе данных — использовали 1,5 млрд пар «текст-изображение». Для справки: в первой версии было на 300 млн пар меньше. В результате нейросеть научилась лучше понимать запрос и выдавать более реалистичные изображения.

Как вам айфон 2030 года? Kandinsky 2.2 сгенерировала его по просьбе Hi-Tech Mail.ru. На наш взгляд, гаджет будущего получился очень громоздким:

В новую версию нейросети встроили ControlNet — структурный блок управляемых изменений. Он позволяет менять отдельные элементы на созданных изображениях с сохранением исходной композиции.

Подробнее https://hi-tech.mail.ru/news/101311-vstrechae...

Комментарии могут оставлять только зарегистрированные пользователи