Stable Diffusion Version 2 - обновление одного из продуктов по работе с нейросетью, в котором текст преобразуется в изображение. Оригинальный Stable Diffusion V1, созданный CompVis, изменил природу моделей ИИ с открытым исходным кодом и породил сотни других моделей и инноваций по всему миру.
Первая версия ПО была создана талантливым коллективом в составе Робина Ромбаха (Stability AI) и Патрика Эссера (Runway ML) из группы CopmVis в LMU Munich под руководством профессора доктора Бьорна Оммера. Stabl Diffusion 2.0 предоставляет ряд значительных улучшений и возможностей по сравнению с первоначальным выпуском V1.
Релиз Stable Diffusion 2.0 включает в себя стабильные модели преобразования текста в изображение, обученные с использованием совершенно нового текстового кодировщика (OpenCLIP), разработанного LAION при поддержке Stability AI, что значительно улучшает качество генерируемых изображений по сравнению в релизом V1. Модели преобразования текста в изображение в этом релизе могут генерировать изображения с разрешением по умолчанию в 512x512 пикселей и 768x768 пикселей.
Данные модели обучаются на наборах данных LAION-5B, созданного командой DeepFloyd
...
Читать дальше »