![cover image](https://wikiwandv2-19431.kxcdn.com/_next/image?url=https://upload.wikimedia.org/wikipedia/commons/thumb/d/d3/Astronaut_Riding_a_Horse_%2528SDXL%2529.jpg/640px-Astronaut_Riding_a_Horse_%2528SDXL%2529.jpg&w=640&q=50)
Stable Diffusion
З Вікіпедії, безкоштовно encyclopedia
Stable Diffusion — це модель глибокого навчання для перетворення тексту в зображення, випущена у 2022 році. Використовується переважно для генерування детальних зображень на основі текстових описів або модифікації зображень[2]. Розроблена стартапом Stability AI у співпраці з низкою академічних дослідників і некомерційних організацій.
![]() | |
Тип | текст-у-зображення |
---|---|
Розробник | Stability AI |
Перший випуск | 22 серпня 2022 |
Стабільний випуск | SDXL 1.0 (model)[1] (26 липня 2023) |
Операційна система | Всі що підтримують CUDA kernels |
Мова програмування | Python |
Ліцензія | Creative ML OpenRAIL-M |
Репозиторій | github.com/Stability-AI/stablediffusion |
Вебсайт | stability.ai/stable-image |
Stable Diffusion — це модель прихованої дифузії, різновид глибокої генеративної нейронної мережі. Його код і ваги моделі були опубліковані[3], і він може працювати на більшості споживчого обладнання, оснащеного скромним графічним процесором із принаймні 8 ГБ VRAM. Це означало відхід від попередніх власних моделей перетворення тексту в зображення, таких як DALL-E та Midjourney, які були доступні лише через хмарні служби[4].