Stable Diffusion 3: Die neue Ära der Bildgenerierung
Stability AI hat Stable Diffusion 3 vorgestellt – mit revolutionärer neuer Architektur. Text in Bildern wird endlich korrekt dargestellt.
Stable Diffusion 3 markiert einen Wendepunkt in der Geschichte der Open-Source-Bildgenerierung. Die neue Architektur löst eines der größten Probleme bisheriger Modelle: Text.
Die neue Architektur
SD3 verwendet einen Multimodal Diffusion Transformer (MMDiT), der Text- und Bildinformationen parallel verarbeitet. Das Ergebnis: kohärente Texte, bessere Komposition und feinere Details.
Neue Fähigkeiten
- Korrekter Text in Bildern (Schilder, Logos, Beschriftungen)
- Besseres Verständnis räumlicher Beziehungen
- Fotorealistischere Hände und Gesichter
- Konsistentere Style-Adherence
Modellgrößen
SD3 kommt in verschiedenen Größen: 800M bis 8B Parameter. Selbst die kleinste Version übertrifft SD2.1 in allen Benchmarks.
Open Source?
Stability AI hat angekündigt, die Gewichte zu veröffentlichen – allerdings unter einer neuen, restriktiveren Lizenz als bei SD1.5.
Gefällt dir dieser Artikel?
Abonniere KI Weekly und erhalte jeden Montag die wichtigsten KI-News.