Stable Diffusion 3: Die neue Ära der Bildgenerierung

Stable Diffusion 3 markiert einen Wendepunkt in der Geschichte der Open-Source-Bildgenerierung. Die neue Architektur löst eines der größten Probleme bisheriger Modelle: Text.

Die neue Architektur

SD3 verwendet einen Multimodal Diffusion Transformer (MMDiT), der Text- und Bildinformationen parallel verarbeitet. Das Ergebnis: kohärente Texte, bessere Komposition und feinere Details.

Neue Fähigkeiten

Korrekter Text in Bildern (Schilder, Logos, Beschriftungen)
Besseres Verständnis räumlicher Beziehungen
Fotorealistischere Hände und Gesichter
Konsistentere Style-Adherence

Modellgrößen

SD3 kommt in verschiedenen Größen: 800M bis 8B Parameter. Selbst die kleinste Version übertrifft SD2.1 in allen Benchmarks.

Open Source?

Stability AI hat angekündigt, die Gewichte zu veröffentlichen – allerdings unter einer neuen, restriktiveren Lizenz als bei SD1.5.

Stable Diffusion 3: Die neue Ära der Bildgenerierung

Die neue Architektur

Neue Fähigkeiten

Modellgrößen

Open Source?

Artikel teilen

Gefällt dir dieser Artikel?

Ähnliche Artikel

Sora: OpenAIs Video-KI definiert Content-Erstellung neu

Midjourney v7: Fotorealismus auf neuem Niveau

Die neue Architektur

Neue Fähigkeiten

Modellgrößen

Open Source?

Artikel teilen

Gefällt dir dieser Artikel?

Ähnliche Artikel

Sora: OpenAIs Video-KI definiert Content-Erstellung neu

Midjourney v7: Fotorealismus auf neuem Niveau

Anmelden