Нейросеть Кандинский от Сбера – один из главных генераторов картинок в русскоязычном пространстве. В отличие от аналогов, Kandinsky AI отлично погружен в русскую культуру и корректно понимает описание картинок на русском языке. На этой странице вы узнаете не только о возможностях нейросети Кандинский, но и научитесь пользоваться ИИ.
Что такое Kandinsky от Сбера
Kandinsky – это бесплатная отечественная нейросеть, разработанная командой Сбера, генерирующая изображения из текстового описания по модели Latent Diffusion. Например:
Нейросеть работает на базе промптов – коротких текстовых описаний. В отличие от основных конкурентов, Кандинский понимает русский язык. Например, на запрос Викинг, 4к
нейросеть создаст подобное изображение:
Основная особенность генеративной модели – высокая реалистичность финального результата, что вы видите и на примере фотографии выше. Сгенерированные изображения получаются настолько фотореалистичными, что порой сложно отличить их от настоящей фотографии.
ИИ Кандинский умеет генерировать изображения не только в фотореалистичном стиле, но и других, например, изначальный запрос Викинг, 4к
в стиле аниме даст подобный результат:
Нейросеть умеет генерировать и более нишевые изображения, например, с помощью “Кандинского” можно создать стикер-пак для Телеграма, если добавить в промпт упоминание об этом. Пример такого промпта – Викинг, стикер для Телеграма
:
Один запрос можно повторять неоднократно, и каждый раз ИИ будет выдавать уникальный результат. Так вы сможете собрать полноценный стикер-пак.
Помимо создания изображений с нуля (генерация по тексту), нейросеть позволяет решить и другие задачи с картинками:
- Смешивание;
- Перенос стиля;
- Вариации картинки;
Последнее – функция «Вариации картинки», позволит вам из одного изображения сделать несколько. Например, из фотографии Брэда Питта нейросеть создала следующий вариант:
На этом примере отлично видны основные возможности последней версии нейросети – Кандинский 2.2 научился лучше справляться с волосами, кожей и остальными чертами человеческого тела, а также теперь генерирует изображения в разрешении до 1024 пикселей по каждой стороне.
ИИ справляется и с нетривиальными задачами. Например, если отправить запрос на создание логотипа со следующим промптом – логотип для сайта ai-pedia.ru, тематика сайта нейросети
, то получите подобный результат:
Смешивание работает в двух режимах – вы можете смешать две картинки между собой или одну картинку с текстовым описанием. Например, фотография Брэда Питта и промпт “Пожилой человек, старый мужчина
” дадут подобный результат:
Перенос стиля работает также двумя способами – с картинки или с текста. Например, если использовать тот же исходный кадр с Брэдом Питтом и задать нейросети стиль аниме, можно получить подобное изображение:
На генерацию и обработку изображений уходит от 10 секунд. При высокой нагрузке на нейросеть возможны задержки, а в некоторых случаях и полный отказ системы.
Если вы столкнулись с тем, что нейросеть не выдает результаты, то единственное решение – вернуться в ИИ Кандинский позже. В некоторых случаях нейросеть восстанавливает работу за 5-10 минут, но иногда перебои длятся дольше.
Как пользоваться нейросетью Кандинский
Нейросеть Кандинский работает на базе промптов – коротких текстовых описаний, что именно ИИ необходимо сделать. Поэтому никаких сложных технических знаний для использования нейросети не требуется, главное понять базовый принцип, как пользоваться нейросетью Кандинский.
Запуск
Скачать нейросеть Кандинский и установить ИИ на компьютер – первая мысль, которая может прийти в голову. Но нейросеть работает исключительно онлайн. То есть вы не сможете скачать Kandinsky на свое устройство, зато сможете запустить сразу разными способами:
- AI – это официальный международный сайт “Кандинского”, на котором можно онлайн запустить ИИ не только на русском, но и других языках.
- Телеграм-бот – это официальный бот, который поддерживает все те же возможности, что и онлайн версия, и является наиболее удобным форматом для взаимодействия с ИИ.
- RuDALLE – второй официальный сайт “Кандинского”, ориентированный на русскоязычную аудиторию. На сайте также доступны предыдущие версии искусственного интеллекта, которые также можно протестировать.
- Бот Вконтакте – “Kandinsky generative art” является официальным ботом ИИ, который позволяет раскрыть все возможности нейросети в рамках чата во Вконтакте.
- Android приложение – голосовой помощник “Салют” также умеет создавать изображения на базе нейросети Кандинский. Для запуска необходимо активировать навык “Включи художника” на устройстве, поддерживающем создание изображений.
Далее вы найдете короткую инструкцию по основным функциям нейросети. Мы рассмотрели на базе бота в Телеграме, но аналогичным образом вы можете использовать “Кандинского” и в других доступных форматах (Вконтакте, приложение и и других).
Генерация изображений
Генерация изображений по тексту – основная функция нейросети Kandinsky. Чтобы создать ваше первое изображение, запустите бота в своем Телеграме, и выберите в меню “Генерация по тексту”:
Далее введите запрос в текстовом формате. Опишите задачу по формуле:
объект+фон+стиль
Пишите коротко и ясно, но вы можете использовать для описания задачи больше, чем одно определение. Например, вы можете задать подобный промпт: молодая девушка, длинные светлые волосы, на зеленом лугу, рядом пушистая собака черного цвета, вечер, 4к
. По такому запросу вы получите подобное изображение:
Это пример изображения без дополнительного стиля. Вы можете выбрать один из предложенных стилей:
Например, если использовать тот же промпт про девушку с собакой, вы можете получить подобное изображение в стиле аниме:
При генерации изображений вы можете выбрать соотношение сторон, например 16:9 или 1:1. Такая функция появилась лишь в версии Кандинский 2.2. Если в вашей версии нет выбора соотношения сторон, вероятно, вы используете устаревшую версию нейросети.
Вы можете использовать Kandinsky для создания стикеров для Телеграма. Для этого добавьте в промпт слово “Стикер”. Альтернативное решение – создать стикер в DALL-E 3, инструкция доступна на этой странице.
Смешивание
Вы можете смешать две картинки, чтобы получить третью или смешать картинку с текстом. Для этого в меню бота выберите “Смешивание” и затем выберите один из двух форматов:
Смешивание картинки и текста позволит вам сгенерировать новое изображение на базе старого с учетом вашего текстового описания. Например, промпт “дождь, радуга
” в режиме смешивания с предыдущей фотографией девушки с собакой, дает подобный результат:
Девушка пропала со снимка – это ошибка ИИ, но вы можете сохранить исходный смысл, уточнив это в промпте или сгенерировав изображение несколько раз до получения необходимого результата.
Перенос стиля
Вы можете изменить стиль существующей картинки, выбрав в меню пункт “Перенос стиля”. В качестве референса стиля вы можете использовать другую картинку или же текстом описать вашу задачу:
Для примера используем предыдущее изображение девушки с собакой на лугу, и зададим стиль “Футуризм”. Нейросеть выдала следующий результат:
Этот инструмент отлично подойдет для набросков – вы можете загрузить свой набросок, а нейросеть создаст на его базе изображение в нужном стиле.
Вариации картинки
Вы можете создать уникальную копию исходного изображения, использовав функцию “Вариации картинки”. Для этого отправьте оригинал изображения, нейросеть вернет в ответ новое изображение, созданное на базе оригинала. Для примера используем изображение девушки с собакой на лугу, и получим следующий результат:
Вы можете бесконечно генерировать вариации одной картинки. Каждый запрос приведет к уникальному результату. Например, повторный запрос исходного снимка девушки с собакой на лугу дал повторно другой результат:
Повторные запросы работают аналогично и в других функциях нейросети. Например, вы можете повторно отправить тот же самый промпт при генерации картинки, и нейросеть создаст повторно абсолютно уникальное изображение.
Альтернативные решения
Кандинский от Сбера – не уникальная нейросеть, существуют десятки альтернативных решений, например:
Часть из них такие же бесплатные, часть платные, но все представленные в списке решения работают схожим с Kandinsky AI образом – вы задаете текстом описание картинки (промпт), а ИИ генерирует изображение.
Кандинский специализируется на стиле “Фотореализм”, поэтому не является 100% аналогом мультифункциональных нейросетей, таких как Stable Diffusion, где вы можете сгенерировать изображение в различных стилях. Кроме того, Stable Diffusion поддерживает расширения, а в Кандинский вы не можете добавить ни новые модели, ни LoRA файлы, ни внести другие изменения в генеративную модель.
Нейросеть Кандинский 2.2 – для кого?
Сбер создал отличную нейросеть для генерации изображений из текстового описания, которая в дополнение к этому умеет обрабатывать фотографии. Команда Сбера постоянно дорабатывает ИИ, благодаря чему версия Кандинский 2.2 способна удивить даже опытных пользователей нейросетей.
ИИ отлично подойдет для любых задач, где необходимо сгенерировать изображение онлайн. Вы можете использовать искусственный интеллект и для развлечения, и для работы. Сбер никак не ограничивает использование, кроме ограничений на создание откровенного контента или контента с насилием.
Совет: если вы ищете нейросеть, поддерживающую откровенный контент, изучите эту подборку или попробуйте один из Телеграм-ботов для раздевания девушек по фото.
У Кандинского много конкурентов, но если сравнивать ИИ по возможностям для русскоязычного сегмента, то самый ближайший аналог Кандинского – это YandexART, где нейросеть также хорошо погружена в отечественный контекст и работает полностью на русском языке.