Ergebnisse, Anpassungen und Erkenntnisse – Entrauschungs-KI

Aus HSHL Mechatronik
Zur Navigation springen Zur Suche springen
Autoren: Fabian Babik, Adrian Klinspon
Art: Projekt im Praxissemester
Dauer: 29.09.2025 bis 09.01.2026
Betreuer: Prof. Dr.-Ing. Schneider

DnCNN

Ziel der KI

Das ursprüngliche Ziel war die Implementierung eines DnCNN (Denoising Convolutional Neural Network) zur automatischen Bildverbesserung. Die KI sollte darauf trainiert werden, Rauschen aus verschiedenen Quellen (Sensorfehler, ISO-Rauschen) nicht nur zu identifizieren, sondern aktiv zu entferne und das Bildmaterial zu rekonstruieren.

Status der Umsetzung: Die geplante Bildverbesserung hat in der Testphase nicht funktioniert. Die KI ist nicht in der Lage, das bereinigte Bild auszugeben. Stattdessen liefert die KI lediglich eine Differenzmaske (Residual-Output). Das bedeutet: Das Rauschen wurde zwar erfolgreich erkannt und isoliert, aber die Korrektur bzw. das eigentliche "Denoising" fand nicht statt.

Ergebnisse der Analyse (Differenzmasken)

Obwohl die Hauptfunktion (die Bildverbesserung) fehlgeschlagen ist, zeigt die KI bei der reinen Isolation des Rauschens (Detektion) folgende Ergebnisse:

Ente_SaltPepper Impulsrauschen Hervorragende Isolation der schwarzen/weißen Störpixel (siehe Abb. 1).
noisylena Gaußsches Rauschen Erfassung der feinen, stochastischen Körnung.
ZionNoise Natürliches Korn Gute Trennung zwischen atmosphärischem Rauschen und statischen Objekten.
Abbildung 1: Anstatt die Ente zu säubern, liefert das DnCNN-Modell nur die Differenzmaske der Störpixel (rechts).

Stärken und Schwächen der KI

Stärken

  • Hohe Sensivität: Das Modell erkennt Rauschen selbst an sehr feinen Texturen
  • Präzise Lokalisierung: Die Masken zeigen exakt auf, wo Bildfehler vorliegen.
  • Signalschonung: In den meisten Fällen werden homogene Farbflächen korrekt erkannt und nicht fälschlicherweise in die Rauschmaske aufgenommen

Schwächen

Tiling-Artefakte (Gitterbildung)

Das größte technische Problem ist die sichtbare Gitterbildung im Output. Die KI verarbeitet Bilddaten in Blöcken (Tiles). Da die Übergänge zwischen diesen Blöcken nicht nahtlos berechnet werden, entsteht im Output ein künstliches Gittermuster.

Abbildung 2: Fehlerhafte Blockverarbeitung führt zu einem deutlichen Gittermuster im Output des Campus-Bildes.

Kanten-Bleeding

An sehr kontrastreichen Kanten (z.B. Fensterrahmen oder Gravuren) kann die KI nicht sauber zwischen Bildstruktur und Rauschen unterscheiden.

  • Beispiel: Bei NewspaperRock.jpg werden die Umrisse der prähistorischen Zeichnungen fälschlicherweise in die Rauschmaske extrahiert.
Abbildung 3: Kanten-Extraktion – Bilddetails werden vom DnCNN fälschlich als Rauschen markiert.