Ergebnisse, Anpassungen und Erkenntnisse – Entrauschungs-KI

Aus HSHL Mechatronik
Zur Navigation springen Zur Suche springen
Autoren: Fabian Babik, Adrian Klinspon
Art: Projekt im Praxissemester
Dauer: 29.09.2025 bis 09.01.2026
Betreuer: Prof. Dr.-Ing. Schneider

DnCNN

Ziel der KI

Das ursprüngliche Ziel war die Implementierung eines DnCNN (Denoising Convolutional Neural Network) zur automatischen Bildverbesserung. Die KI sollte darauf trainiert werden, Rauschen aus verschiedenen Quellen (Sensorfehler, ISO-Rauschen) nicht nur zu identifizieren, sondern aktiv zu entferne und das Bildmaterial zu rekonstruieren.

Status der Umsetzung: Die geplante Bildverbesserung hat in der Testphase nicht funktioniert. Die KI ist nicht in der Lage, das bereinigte Bild auszugeben. Stattdessen liefert die KI lediglich eine Differenzmaske (Residual-Output). Das bedeutet: Das Rauschen wurde zwar erfolgreich erkannt und isoliert, aber die Korrektur bzw. das eigentliche "Denoising" fand nicht statt.

Ergebnisse der Analyse (Differenzmasken)

Obwohl die Hauptfunktion (die Bildverbesserung) fehlgeschlagen ist, zeigt die KI bei der reinen Isolation des Rauschens (Detektion) folgende Ergebnisse:

Ente_SaltPepper Salt & Pepper Hervorragende Isolation der schwarzen/weißen Störpixel (siehe Abb. 1).
noisylena Gaußsches Rauschen Erfassung der feinen, stochastischen Körnung.
ZionNoise Natürliches Korn Gute Trennung zwischen atmosphärischem Rauschen und statischen Objekten.
Abbildung 1: Anstatt die Ente zu säubern, liefert das DnCNN-Modell nur die Differenzmaske der Störpixel (rechts).

Stärken der KI

  • Hohe Sensivität: Das Modell erkennt Rauschen selbst an sehr feinen Texturen
  • Präzise Lokalisierung: Die Masken zeigen exakt auf, wo Bildfehler vorliegen.
  • Signalschonung: In den meisten Fällen werden homogene Farbflächen korrekt erkannt und nicht fälschlicherweise in die Rauschmaske aufgenommen

Schwächen der KI

Tiling-Artefakte (Gitterbildung)

Das größte technische Problem ist die sichtbare Gitterbildung im Output. Die KI verarbeitet Bilddaten in Blöcken (Tiles). Da die Übergänge zwischen diesen Blöcken nicht nahtlos berechnet werden, entsteht im Output ein künstliches Gittermuster.

Abbildung 2: Fehlerhafte Blockverarbeitung führt zu einem deutlichen Gittermuster im Output des Campus-Bildes.

Kanten-Bleeding

An sehr kontrastreichen Kanten (z.B. Fensterrahmen oder Gravuren) kann die KI nicht sauber zwischen Bildstruktur und Rauschen unterscheiden.

  • Beispiel: Bei NewspaperRock.jpg werden die Umrisse der prähistorischen Zeichnungen fälschlicherweise in die Rauschmaske extrahiert.
Abbildung 3: Kanten-Extraktion – Bilddetails werden vom DnCNN fälschlich als Rauschen markiert.

Fazit

Die KI hat ihr primäres Ziel nicht erreicht. Das DnCNN-Modell liefert keine verbesserten Bilder, sondern lediglich Diagnose-Masken. Aufgrund der Tiling-Effekte und der Fehler an Objektkanten ist die KI aktuell weder für die automatisierte Restaurierung noch für eine zuverlässige forensische Analyse einsetzbar.

AI_InitialLearnRate_1e-3

Ziel der KI

Mit dieser KI sollte untersucht werden, wie sich eine andere initiale Lernrate (1103) auf das Training des DnCNN auswirkt. Das Ziel bleibt identisch: Die Transformation eines verrauschten Input-Bildes in ein bereinigtes Output-Bild.

Status der Umsetzung: Die angestrebte Rauschunterdrückung konnte in diesem Durchlauf nicht realisiert werden. Während das vorherige Modell das Rauschen zumindest isolieren konnte, agiert diese Modell primär als "Pass-Through".

Ergebnisse der Analyse (Minimale Transformation)

Bei den untersuchten Bildern im Ordner AI_InitialLearnRate_1e-3 lässt sich beobachten, dass der Output eine fast exakte Kopie des verrauschten Inputs ist. Eine effektive Trennung von Signal und Rauschen findet nicht statt. Die vorgenommenen Änderungen am Bildmaterial sind visuell kaum wahrnehmbar und liefern keinen funktionalen Nutzen.

Ente_SaltPepper Salt & Pepper Das "Salt & Pepper"-Rauschen bleibt im Output fast vollständig erhalten.
dustCCD Sensorstaub Keine Entfernung der Staubpartikel; der Output ist nahezu identisch mit dem Input.
noisylena Gaußsches Rauschen Die Körnung wird ohne nennenswerte Filterung in den Output übernommen.
Campus Komplexes Rauschen Nur marginale Abweichungen zum Original erkennbar, keine effektive Bearbeitung.
Abbildung 4: Die KI leitet die Daten fast unverändert durch. Der Output (rechts) zeigt keine nennenswerte Verbesserung gegenüber dem Input (links).

Stärken der KI

  • Artefaktfreiheit: Da das Netzwerk fast keine Operationen auf das Bild anwendet, entstehen keine Kachelmuster oder Kantenfehler. Dies ist jedoch ein Resultat der ausbleibenden effektiven Verarbeitung und nicht einer optimierten Filterlogik.

Schwächen der KI

Das Ausbleiben einer signifikanten Filterwirkung lässt auf ein Problem in der Gewichtungsoptimierung schließen, das durch die Lernrate von 103 verursacht wurde.

Stagnation des Lernprozesses

Eine Lernrate von 1103 führte dazu, dass das Netzwerk keine wesentlichen Merkmale extrahieren konnte. Anstatt die Rauschstrukturen zu lernen, verharrt das Modell in einem Zustand, in dem die Eingabewerte fast direkt an den Ausgang durchgereicht werden.

Mathematische Annäherung an den Input

Das Modell führt keine effektive Subtraktion des Rauschens durch. Die gewünschte Residual-Lern-Funktion bleibt aus, wodurch das Signal-Rausch-Verhältnis nahezu unverändert bleibt: OutputInput

(Anstatt der angestrebten Funktion: Output=InputNoise)

Fazit

Diese Konfiguration liefert keinen operativen Mehrwert. Im Vergleich zur ersten KI (die immerhin eine Differenzmaske zur Fehlerdiagnose erzeugte) findet hier fast keine Transformation statt. Das Modell verhält sich wie ein transparenter Filter mit vernachlässigbarer Wirkung.

AI_Epoch_70_500_Images

Ziel der KI

Diese KI wurde mit 500 Bildern für 70 Epochen trainiert. Ziel war es, die Fehler der vorangegangenen Versuche zu überwinden und eine echte Rekonstruktion des Bildes zu erreichen.

Status der Umsetzung: Das Ziel wurde erfolgreich erreicht. Dieses Modell ist das erste, das eine tatsächliche Bildverbesserung (Denoising) durchführte. Das Rauschen wird nicht mehr nur isoliert oder ignoriert, sondern aktiv aus dem Bildmaterial herausgerechnet, um ein bereinigtes Output-Bild zu generieren.

Ergebnisse der Analyse (Erfolgreiches Denoising)

Im Vergleich zu den vorherigen Testreihen zeigt der Output hier eine signifikante Steigerung der Bildqualität. Die störenden Artefakte wurden entfernt, während die zugrunde liegende Struktur erhalten blieb.

Motiv Rauschtyp Beobachtung der Bildverbesserung
Ente_SaltPepper Salt & Pepper Nahezu vollständige Entfernung der Störpixel. Das Fahrzeug ist nun rauschfrei sichtbar (siehe Abb. 1).
dustCCD Sensorstaub Die meisten punktuellen Defekte wurden erfolgreich wegretuschiert.
noisylena / Zion Gaußsches Rauschen Starke Glättung der Körnigkeit bei weitgehendem Erhalt der Motivkanten.
Campus Komplexes Rauschen Effektive Bereinigung der Flächen ohne die zuvor beobachtete Kachelbildung.
Abbildung 5: Erfolgreiches Denoising. Die KI hat das "Salt & Pepper"-Rauschen im Output (rechts) fast vollständig eliminiert.

Stärken der KI

  • Echte Rekonstruktion: Das Modell berechnet fehlende oder gestörte Pixelwerte neu, anstatt nur eine Rauschmaske zu erstellen.
  • Keine Tiling-Artefakte: Durch das lange Training und den großen Datensatz verschwindet das Gittermuster, das in der mit der ersten KI auftrat.
  • Hohe Konsistenz: Die KI zeigt eine stabile Leistung bei unterschiedlichsten Rauschstärken und -arten.

Schwächen der KI

Trotz der großen Fortschritte zeigen sich bei genauer Analyse noch zwei wesentliche Punkte:

Detailverlust (Oversmoothing)

Bei sehr feinen Strukturen (z.B. deb Gravuren un NewspaperRock.jpg) neigt die KI dazu, zusammen mit dem Rauschen auch minimale Bilddetails zu glätten. Das Bild wirkt dadurch um Vergleich zum Original "weichgezeichnet".

Abbildung 6: Detailerhalt vs. Glättung – Die Gravuren werden rauschfrei, verlieren aber leicht an Schärfe.

Rechenintensität

Das Training über 70 Epochen mit 500 Bildern ist zeitaufwendig.

AI_Epoch_70_1400_Images

Ziel der KI

Ziel dieses Modells war es, durch eine massive Erhöhung der Trainingsdaten auf 1400 Bilder eine universelle Rauschunterdrückung zu erreichen. Die Erwartung war, dass die KI durch die größere Varianz lernt, verschiedene Rauschtypen (Gauß, Salt & Pepper, Sensorstaub) gleichermaßen effektiv zu behandeln.

Status der Umsetzung: Das Ziel wurde nur teilweise erreicht. Während das Modell bei spezifischen Rauscharten (Salt & Pepper) gute Ergebnisse liefert, versagt es bei feinerem oder punktuellem Rauschen fast vollständig.

Ergebnisse der Analyse (Selektive Wirksamkeit)

Die Auswertung zeigt eine starke Diskrepanz zwischen den Rauschtypen. Es scheint, als hätte die KI eine Spezialisierung entwickelt, anstatt eine universelle Lösung zu finden.

Motiv Rauschtyp Beobachtung der Bildverbesserung
Ente_SaltPepper Salt & Pepper Gut: Die markanten schwarzen und weißen Pixel werden effektiv reduziert.
dustCCD Sensorstaub Schlecht: Die Staubpartikel bleiben im Output fast vollständig erhalten; keine Retusche erkennbar.
noisylena / Zion Gaußsches Rauschen Ungenügend: Der Output ist nahezu identisch mit dem verrauschten Input. Eine Glättung findet kaum statt.
campus Komplexes Rauschen Minimal: Leichte Reduktion von Farbartefakten, aber das Grundrauschen bleibt bestehen.
Abbildung 7: Einziger Erfolg – Bei Salt & Pepper Rauschen (links) zeigt die KI eine deutliche Reinigungsleistung im Output (rechts).

Fazit

Dieses Modell stellt den bisherigen Höhepunkt der Entwicklung dar. Die mathematische Funktion wurde erfolgreich von einer reinen Identität oder Differenz zu einer echten Rekonstruktion überführt: Output=InputNoise+ReconstructionLogic

Das Modell ist nun prinzipiell für den praktischen Einsatz in der Fotorestaurierung oder Sensorreinigung geeignet, sofern ein leichter Schärfeverlust akzeptabel ist.

Stärken der KI

Spezialisierung auf Salt & Pepper: Das Modell hat gelernt, extreme Ausreißer (Salt & Pepper) gut zu isolieren und zu korrigieren.

Stabilität: Im Gegensatz zu früheren Modellen treten keine Tiling-Artefakte oder Bildfehler auf.

Schwächen der KI

Das Modell zeigt deutliche Defizite in der Generalisierung, was vermutlich auf eine Fehlgewichtung während des Trainings mit 1400 Bildern hindeutet.

Inaktivität bei Gaußschem Rauschen

Bei feiner Körnigkeit (Gauß) verhält sich die KI wie ein passiver Filter. Die mathematische Annäherung ist hier fast: OutputInput. Es findet keine aktive Rekonstruktion der glatten Flächen statt.

Versagen bei punktuellen Defekten (dustCCD)

Sensorstaub wird von der KI nicht als Rauschen, sondern vermutlich als Teil der permanenten Bildstruktur interpretiert. Dadurch findet keine Entfernung der Staubflecken statt.

Abbildung 8: Fehlende Filterwirkung – Der Sensorstaub im Input wird unverändert in den Output übernommen.

Fazit

Trotz der großen Datenbasis von 1400 Bildern ist dieses Modell kein Allrounder. Es ist effektiv bei der Entfernung von grobem Salt & Pepper, jedoch für die Retusche von Sensorfehlern oder die Glättung von natürlichem Filmkorn (Gauß-Rauschen) ungeeignet.

AI_Epoch_50_1400_Images_Gauss

Ziele der KI

In diesem Versuch sollte getestet werden, ob eine Spezialisierung auf Gaußsches Rauschen zu besseren Ergebnissen führt als bei den vorangegangen Modellen mit gemischten Datensätzen. Der Fokus lag ausschließlich darauf, die Entrauschungsleistung für diesen spezifischen Rauschtyp zu maximieren. Es wurde untersucht, ob das Netzwerk das Gauß-Rauschen effektiver entfernen kann, wenn es im Training nicht durch andere Störarten (Salt & Pepper) "abgelenkt" wird. Die Leistung bei anderen Rauschtypen war für die Zielsetzung irrelevant.

Status der Umsetzung: Das Ziel einer signifikanten Verbesserung wurde nur bedingt erreicht. Zwar verarbeitet das Modell das Gauß-Rauschen, jedoch findet eher eine Textur-Verfeinerung als eine vollständige Entfernung statt.

Ergebnisse der Analyse (Strukturwandel des Rauschens)

Die Analyse zeigt, dass die Spezialisierung dazu führt, dass die KI das Rauschen nur glättet aber nicht eliminiert.

Motiv Rauschtyp Beobachtung im Output
noisylena Gaußsches Rauschen Verfeinerung: Das Modell verarbeitet das Rauschen anders als die gemischten Modelle. Die Körnung wird deutlich feiner und homogener ("sandiger"), verschwindet aber nicht ganz.
Ente_SaltPepper Salt & Pepper Nebeneffekt: Da das Modell nur Gauß kennt, versucht es auch die harten Salt & Pepper Störungen wie Gauß-Rauschen zu behandeln. Das Ergebnis ist ein Verschmieren der Störpixel zu diffusen Wolken.
ZionNoise Sensorstaub Transformation: Das zuvor sehr grobe Korn wurde aufgebrochen. Der Output wirkt feiner und weniger unruhig, besitzt aber immer noch eine deutliche Rauschtextur.
Abbildung 9: Verfeinerungseffekt – Durch die Spezialisierung auf Gauß wird das Rauschen (links) im Output (rechts) feinkörniger, aber nicht vollständig entfernt.

Stärken der KI

  • Homogenisierung der Fläche: Das Modell schafft es, unruhige Rauschflächen visuell zu beruhigen, indem es das Rauschen verfeinert.
  • Fokus-Erhalt: Da das Modell nicht versuchen muss, verschiedene Rauscharten zu lernen, bleiben die Kanten und Details des Hauptmotivs (z. B. bei der Ente oder Lena) sehr stabil.

Schwächen der KI

Lokales Minimum (Rausch-Transformation)

Trotz der exklusiven Konzentration auf Gauß-Daten gelang es nicht, das Rauschen rückstandslos zu entfernen. Die KI scheint gelernt zu haben, das Rauschen zu minimieren (feiner zu machen), anstatt es als Fremdkörper zu erkennen und zu löschen.

Abbildung 10: Verhalten bei Fremdrauschen. Obwohl irrelevant für das Ziel, zeigt sich hier, dass die KI unbekannte Störungen nur weichzeichnet statt sie zu entfernen.

Fazit

Der Versuch, durch ausschließliches Training auf Gauß-Daten eine überlegene Performance für diesen Rauschtyp zu erzwingen, war nur teilweise erfolgreich. Das Modell liefert zwar ein visuell ruhigeres ("feineres") Bild als manche Vorgänger, eine perfekte Rekonstruktion wurde jedoch nicht erreicht. Die Spezialisierung führte eher zu einer Änderung des Rauschens als zu dessen vollständiger Eliminierung.

AI_Epoch_50_1400_Images_SP

Ziel der KI

Analog zum Versuch mit dem Gauß-Rauschen wurde in diesem Experiment die Spezialisierung auf Salt & Pepper getestet. Die KI wurde für 50 Epochen mit 1400 Bildern trainiert, wobei der Trainingsdatensatz ausschließlich mit Salt & Pepper Störung versehen war. Ziel war es, eine sehr gute Entfernung dieser Rauschart zu erreichen.

Status der Umsetzung: Die KI entfernt Salt & Pepper Rauschen sehr gut. Fremdes Rauschen wurde im Gegensatz zur Gauß-KI vollständig ignoriert.

Ergebnisse der Analyse (Binäre Entscheidung)

Die Analyse zeigt ein "Alles-oder-Nichts"-Verhalten. Da Salt & Pepper Rauschen sich durch extreme Pixelwerte (schwarz/weiß) auszeichnet, scheint die KI gelernt zu haben, nur auf diese starken Kontraste zu reagieren und den Rest des Bildes unangetastet zu lassen.

Motiv Rauschtyp Beobachtung im Output
Ente_SaltPepper Salt & Pepper Das Rauschen wird fast komplett entfernt.
noisylena / Zion Gaußsches Rauschen Das Rauschen bleibt unverändert erhalten.
dustCCD Sensorstaub Das Rauschen bleibt unverändert erhalten.
Campus Komplexes Rauschen Das Rauschen bleibt unverändert erhalten.
Abbildung 11: Das Salt & Pepper Rauschen (links) wird fast komplett entfernt (rechts), da das Modell exakt hierfür trainiert wurde.

Stärken der KI

  • Sehr Gute Signalteue bei Nicht-Ziel-Daten: Im Gegensatz zum Gauss-Modell, das fremde Bilder oft unnötig weichzeichnete ("verschmierte"), lässt dieses Modell Bilder mit Gauß-Rauschen völlig intakt. Es fungiert als Identitätsfunktion für alles, was kein Salt & Pepper ist: f(xSP)xSP
  • Artefaktfreie Reinigung: Bei Salt & Pepper Rauschen entstehen keine sichtbaren Wisch-Effekte oder Ghosting-Artefakte.

Schwächen der KI

Mangelnde Flexibilität

Das Modell ist ein "One-Trick-Pony". Es ist extrem leistungsfähig bei Salt & Pepper, aber vollkommen nutzlos für jede andere Art der Bildverbesserung.

Abhängigkeit von Extremwerten

Die KI scheint gelernt zu haben, auf extreme Helligkeitswerte (0 und 255) zu triggern. Subtilere Störungen (wie grauer Staub auf grauem Grund bei dustCCD) fallen durch das Raster der Erkennung.

Abbildung 12: Da das Modell nur Salt & Pepper kennt, wird das Gaußsche Rauschen im Zion-Bild (links) im Output (rechts) komplett ignoriert.

Fazit

Das Training ausschließlich auf Salt & Pepper führt zu einem hochspezialisierten Filter. Das Modell hat gelernt, spezifische Defekte (Ausreißer) zu reparieren, während es die restliche Bildstruktur (inklusive anderer Rauscharten) als "korrekt" interpretiert und durchwinkt. Dies beweist, dass für eine universelle Rauschunterdrückung zwingend ein gemischter Datensatz (Mixed Noise) erforderlich ist.