Ergebnisse, Anpassungen und Erkenntnisse – Entrauschungs-KI

Aus HSHL Mechatronik
Zur Navigation springen Zur Suche springen
Autoren: Fabian Babik, Adrian Klinspon
Art: Projekt im Praxissemester
Dauer: 29.09.2025 bis 09.01.2026
Betreuer: Prof. Dr.-Ing. Schneider

DnCNN

Ziel der KI

Das ursprüngliche Ziel war die Implementierung eines DnCNN (Denoising Convolutional Neural Network) zur automatischen Bildverbesserung. Die KI sollte darauf trainiert werden, Rauschen aus verschiedenen Quellen (Sensorfehler, ISO-Rauschen) nicht nur zu identifizieren, sondern aktiv zu entferne und das Bildmaterial zu rekonstruieren.

Status der Umsetzung: Die geplante Bildverbesserung hat in der Testphase nicht funktioniert. Die KI ist nicht in der Lage, das bereinigte Bild auszugeben. Stattdessen liefert die KI lediglich eine Differenzmaske (Residual-Output). Das bedeutet: Das Rauschen wurde zwar erfolgreich erkannt und isoliert, aber die Korrektur bzw. das eigentliche "Denoising" fand nicht statt.

Ergebnisse der Analyse (Differenzmasken)

Obwohl die Hauptfunktion (die Bildverbesserung) fehlgeschlagen ist, zeigt die KI bei der reinen Isolation des Rauschens (Detektion) folgende Ergebnisse:

Ente_SaltPepper Impulsrauschen Hervorragende Isolation der schwarzen/weißen Störpixel (siehe Abb. 1).
noisylena Gaußsches Rauschen Erfassung der feinen, stochastischen Körnung.
ZionNoise Natürliches Korn Gute Trennung zwischen atmosphärischem Rauschen und statischen Objekten.
Abbildung 1: Anstatt die Ente zu säubern, liefert das DnCNN-Modell nur die Differenzmaske der Störpixel (rechts).

Stärken und Schwächen der KI

Stärken

  • Hohe Sensivität: Das Modell erkennt Rauschen selbst an sehr feinen Texturen
  • Präzise Lokalisierung: Die Masken zeigen exakt auf, wo Bildfehler vorliegen.
  • Signalschonung: In den meisten Fällen werden homogene Farbflächen korrekt erkannt und nicht fälschlicherweise in die Rauschmaske aufgenommen

Schwächen

Tiling-Artefakte (Gitterbildung)

Das größte technische Problem ist die sichtbare Gitterbildung im Output. Die KI verarbeitet Bilddaten in Blöcken (Tiles). Da die Übergänge zwischen diesen Blöcken nicht nahtlos berechnet werden, entsteht im Output ein künstliches Gittermuster.

Abbildung 2: Fehlerhafte Blockverarbeitung führt zu einem deutlichen Gittermuster im Output des Campus-Bildes.

Kanten-Bleeding

An sehr kontrastreichen Kanten (z.B. Fensterrahmen oder Gravuren) kann die KI nicht sauber zwischen Bildstruktur und Rauschen unterscheiden.

  • Beispiel: Bei NewspaperRock.jpg werden die Umrisse der prähistorischen Zeichnungen fälschlicherweise in die Rauschmaske extrahiert.
Abbildung 3: Kanten-Extraktion – Bilddetails werden vom DnCNN fälschlich als Rauschen markiert.

Fazit

Die KI hat ihr primäres Ziel nicht erreicht. Das DnCNN-Modell liefert keine verbesserten Bilder, sondern lediglich Diagnose-Masken. Aufgrund der Tiling-Effekte und der Fehler an Objektkanten ist die KI aktuell weder für die automatisierte Restaurierung noch für eine zuverlässige forensische Analyse einsetzbar.

AI_InitialLearnRate_1e-3

Ziel der KI

Mit dieser KI sollte untersucht werden, wie sich eine andere initiale Lernrate (1103) auf das Training des DnCNN auswirkt. Das Ziel bleibt identisch: Die Transformation eines verrauschten Input-Bildes in ein bereinigtes Output-Bild.

Status der Umsetzung: Die angestrebte Rauschunterdrückung konnte in diesem Durchlauf nicht realisiert werden. Während das vorherige Modell das Rauschen zumindest isolieren konnte, agiert diese Modell primär als "Pass-Through".

Ergebnisse der Analyse (Minimale Transformation)

Bei den untersuchten Bildern im Ordner AI_InitialLearnRate_1e-3 lässt sich beobachten, dass der Output fast eine exakte Kopie des verrauschten Inputs ist. Eine effektive Trennung von Signal und Rauschen findet nicht statt. Die vorgenommenen Änderungen am Bildmaterial sind visuell kaum wahrnehmbar und liefern keinen funktionalen Nutzen.

Ente_SaltPepper Impulsrauschen Das "Salt & Pepper"-Rauschen bleibt im Output fast vollständig erhalten.
dustCCD Sensorstaub Keine Entfernung der Staubpartikel; der Output ist nahezu identisch mit dem Input.
noisylena Gaußsches Rauschen Die Körnung wird ohne nennenswerte Filterung in den Output übernommen.
Campus Komplexes Rauschen Nur marginale Abweichungen zum Original erkennbar, keine effektive Bearbeitung.
Abbildung 1: Die KI leitet die Daten fast unverändert durch. Der Output (rechts) zeigt keine nennenswerte Verbesserung gegenüber dem Input (links).

Stärken der KI