Картинки стали реалистичнее, детализация портретов улучшились, а еще появилась возможность создавать стикеры. Hi-Tech Mail.ru протестировал — показываем результат.
Что такое Kandinsky
Так называют генеративную модель Сбера. Принцип работы напоминает популярные ИИ-генераторы изображении, включая Midjourney и Stable Diffusion. Вводишь текстовый запрос — получаешь картинку. Модель умеет рисовать в разных стилях и понимает написанное на 101 языке, в том числе на русском.
В апреле пользователям стала доступна модель Kandinsky 2.1, теперь Сбер выпустил ее обновленную версию.
Как изменилась нейросеть
Kandinsky 2.2 обучена на большем наборе данных — использовали 1,5 млрд пар «текст-изображение». Для справки: в первой версии было на 300 млн пар меньше. В результате нейросеть научилась лучше понимать запрос и выдавать более реалистичные изображения.
Как вам айфон 2030 года? Kandinsky 2.2 сгенерировала его по просьбе Hi-Tech Mail.ru. На наш взгляд, гаджет будущего получился очень громоздким:
В новую версию нейросети встроили ControlNet — структурный блок управляемых изменений. Он позволяет менять отдельные элементы на созданных изображениях с сохранением исходной композиции.
Подробнее https://hi-tech.mail.ru/news/101311-vstrechae...