Обзор нейросети Stable Diffusion 3

Обзор нейросети Stable Diffusion 3

В конце февраля Stability AI анонсировала скорый релиз Stable Diffusion 3 – новой версии нейросети для генерации картинок по текстовому описанию. На этой странице вы узнаете о возможностях Stable Diffusion 3, увидите примеры изображений, а также найдете ответы на частые вопросы, например, о дате выхода, о раннем доступе, о минимальных требованиях и о потенциальной стоимости инструмента.

Что такое нейросеть Stable Diffusion 3

Stable Diffusion 3 – это новая нейросеть для генерации изображений по текстовому описанию, то есть нейронка из разряда “text-to-image”. Ближайшие аналоги – Stable Diffusion 2.1 или Stable Cascade, вышедшие ранее от тех же разработчиков, компании Stability AI.

Главные отличия новой модели от всех предшественников в скорости генерации, в точности понимания задачи, в детализации картинок и в безопасности. Первые примеры работы Stable Diffusion 3 демонстрируют ещё одну отличительную особенность – нейросеть отлично справляется с текстами в кадре:

Пример картинки с текстом в кадре, созданной в нейросети Stable Diffusion 3

Подробная техническая информация о новой модели ещё не опубликована, но уже известно, что Stable Diffusion 3 сочетает в себе архитектуру диффузии и поточной генерации. Это позволяет добиться высокой точности результатов за короткий срок выполнения задачи при минимальной нагрузке. Например, вы сможете сгенерировать подобное изображение:

Пример картинки, созданной в нейросети Stable Diffusion 3

Stable Diffusion 3 работает с разным количеством параметров – от 800 миллионов до 8 миллиардов. Ожидается, что Stability AI разделят версии нейросети SD 3 по количеству параметров, сделав продукт частично бесплатным в минимальной версии.

Разделение версий также потенциально позволит запускать версию с минимальным количеством параметров даже на слабых устройствах. Например, вы сможете создать картинки, как в следующем примере изображений из нейросети SD 3:

Пример картинок из нейросети Stable Diffusion 3

В основу новой модели легли наработки всех прошлых моделей от Stability AI. По заверениям разработчиков, особое внимание в третьей версии уделялось безопасности. Это касается как обучения, так и непосредственно генерации. В данный момент неизвестно, будет ли поддерживаться генерация NSFW контента в новой нейронке, но сцены насилия, расовой дискриминации и другие неприемлемы сцены будут исключены. Зато вы сможете создать подобные изображения:

Пример изображений, созданных в нейросети Stable Diffusion 3

Ответы на частые вопросы

Вопросов о Stable Diffusion 3 больше, чем ответов, так как ещё не было ни полноценного релиза, ни публикации подробной технической документации. Но по первой информации об искусственном интеллекте уже сегодня можно понять больше о Stable Diffusion 3.

Как получить доступ к Stable Diffusion 3

В данный момент Stable Diffusion 3 находится в стадии закрытого тестирования, доступ есть у разработчиков и избранных создателей контента.

Вы можете быть среди первых пользователей, когда нейросеть станет доступна широкой публике. Для этого оставьте свои контакты на странице с листом ожидания. Так вы среди первых получите уведомление о релизе искусственного интеллекта.

Минимальные системные требования

Минимальные системные требования Stable Diffusion 3 ещё не опубликованы, но исходя из официального описания, что новая модель работает на базе от 800 миллионов параметров, минимальные системные требования могут быть следующими:

  • Память: 8 Гб
  • Видеокарта: Nvidia RTX 1060

Максимальное количество параметров – 8 миллиардов, потребует не менее 24 Гб видеопамяти и карту топового уровня, как Nvidia RTX 4090.

Требования актуальны только для офлайн версии нейронки, которую вы установите на свой компьютер. В случае релиза онлайн версии SD 3 вопрос минимальных требований будет неактуальным, так как задачи будут обрабатываться онлайн.

Дата релиза нейросети Stable Diffusion 3

Разработчики из Stability AI в данный момент собирают заявки на доступ к ранней версии нейросети. Это значит, что релиз состоится в ближайшие месяцы, но в этот момент выйдет лишь предварительная версия платформы.

Стабильная версия SD 3 появится лишь после теста и исправления багов, что можно ожидать не ранее 2 квартала 2024 года.

Стоимость Stable Diffusion 3

Ещё неизвестно, как именно Stability AI будут распространять новую нейронку, однако ожидается, что будет две версии – бесплатная и платная.

Самая мощная и расширенная версия, возможно, будет доступна только по подписке. А бесплатная версия будет с минимальным количеством параметров. Возможно, что будет ограничение на количество генераций картинок в онлайн версии или в Дискорде.

Существует шанс, что Stable Diffusion 3 будет полностью бесплатной нейросетью с другой моделью монетизации, но ожидается, что полноценный доступ будет платным – от 5 долларов в месяц.

Есть ли онлайн версия Stable Diffusion 3

В настоящий момент нет ни офлайн, ни онлайн версии Stable Diffusion 3. Проект находится в стадии сбора заявок, однако при релизе ожидается, что нейросеть будет доступна, в том числе через Дискорд, как работает MidJourney и некоторые другие нейросети, генерирующие картинки по описанию.

Какие режимы генерации доступны

Заявлено, что Stable Diffusion 3 – это text-to-image нейросеть. То есть искусственный интеллект создает изображение по текстовому запросу (промпту). Аналогичным образом сейчас работает Stable Diffusion 2.1 и другие инструменты, например, YandexART или ImageFX от Google.

Будет ли поддержка других режимов, например image-to-image, неизвестно. Вероятно, в новой версии нейросети будут различные режимы в рамках “text-to-image”. Например, генерация целой картинки, генерация объекта, расширение границ изображения и некоторые другие.

Аналоги и альтернативы Stable Diffusion 3

С выходом Stable Diffusion 3 версия Stable Diffusion 2.1 потенциально останется актуальной, так как модели работают по разному принципу. В некоторых случаях предыдущие версии, включая SD 1.5, могут выдавать более подходящие результаты. Например, если в третьей версии нейросети NSFW контент будет под запретом, то старые версии SD станут лучшей альтернативой для генерации контента для взрослых.

DALL-E, MidJourney и другие нейросети, которые рисуют по словам, также являются отличной альтернативой для Stable Diffusion 3. Не все аналоги также качественно справляются с задачами, где есть текст на картинке, но у каждой альтернативы есть свои сильные стороны.

Фанат нейросетей ещё до того, как это стало мейнстримом. Активный участник ИИ сообщества, автор с опытом разработки моделей для искусственного интеллекта.

AI-PEDIA | Каталог нейросетей
Добавить комментарий