Menu
Zurück zu allen Ausgaben
Generative KI

Stable Diffusion 3: Die neue Ära der Bildgenerierung

Stability AI hat Stable Diffusion 3 vorgestellt – mit revolutionärer neuer Architektur. Text in Bildern wird endlich korrekt dargestellt.

Stable Diffusion 3: Die neue Ära der Bildgenerierung

Stable Diffusion 3 markiert einen Wendepunkt in der Geschichte der Open-Source-Bildgenerierung. Die neue Architektur löst eines der größten Probleme bisheriger Modelle: Text.

Die neue Architektur

SD3 verwendet einen Multimodal Diffusion Transformer (MMDiT), der Text- und Bildinformationen parallel verarbeitet. Das Ergebnis: kohärente Texte, bessere Komposition und feinere Details.

Neue Fähigkeiten

  • Korrekter Text in Bildern (Schilder, Logos, Beschriftungen)
  • Besseres Verständnis räumlicher Beziehungen
  • Fotorealistischere Hände und Gesichter
  • Konsistentere Style-Adherence

Modellgrößen

SD3 kommt in verschiedenen Größen: 800M bis 8B Parameter. Selbst die kleinste Version übertrifft SD2.1 in allen Benchmarks.

Open Source?

Stability AI hat angekündigt, die Gewichte zu veröffentlichen – allerdings unter einer neuen, restriktiveren Lizenz als bei SD1.5.

Artikel teilen

Twitter LinkedIn

Gefällt dir dieser Artikel?

Abonniere KI Weekly und erhalte jeden Montag die wichtigsten KI-News.