HSHL Monumentendiebstahl: Unterschied zwischen den Versionen

Aus HSHL Mechatronik
Zur Navigation springen Zur Suche springen
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
Zeile 28: Zeile 28:
Über VideoReader ist das gedrehte Video in Matlab eingelesen worden. Über NumberOfFrames konnten darauf folgend die einzelnen Bilder des Videos ausgelesen und angesprochen werden.
Über VideoReader ist das gedrehte Video in Matlab eingelesen worden. Über NumberOfFrames konnten darauf folgend die einzelnen Bilder des Videos ausgelesen und angesprochen werden.


[[Datei:Logo01.jpg|400px|Orginalbild]]


Bild 1:
Bild 1:
[[Datei:Logo01.jpg|400px|Orginalbild]]




Zeile 38: Zeile 38:
Um das HSHL-Logo zu finden, ist in jedem einzelnen Bild eine Region of Interest (ROI) verwendet worden (Bild 2, linkes Bild). Durch diese ROI, über dem Logo, wurde nach der Grauwert-Bildung der Canny zur Kantendetektion verwendet (Bild 2, rechtes Bild).   
Um das HSHL-Logo zu finden, ist in jedem einzelnen Bild eine Region of Interest (ROI) verwendet worden (Bild 2, linkes Bild). Durch diese ROI, über dem Logo, wurde nach der Grauwert-Bildung der Canny zur Kantendetektion verwendet (Bild 2, rechtes Bild).   


Bild 2:


[[Datei:Logo02.jpg|400px|Orginalbild]]
[[Datei:Logo02.jpg|400px|Orginalbild]]
Bild 2:


Über die Hough-Transformation (Bild 3, linkes Bild) wurden die maximalen Häufungspunkte von Geraden detektiert und ins Grauwertbild (Bild 3, rechtes Bild) eingetragen. In diesem Bild befindet sich die horizontale Detektion der Geraden. Bei der vertikalen Detektion war das Problem vorhanden, dass die gesuchten Kanten nicht die längsten waren. Daher musste daran weitergearbeitet werden. Da dies zu kompliziert wurde, ist ein anderer Ansatz verwendet worden.  
Über die Hough-Transformation (Bild 3, linkes Bild) wurden die maximalen Häufungspunkte von Geraden detektiert und ins Grauwertbild (Bild 3, rechtes Bild) eingetragen. In diesem Bild befindet sich die horizontale Detektion der Geraden. Bei der vertikalen Detektion war das Problem vorhanden, dass die gesuchten Kanten nicht die längsten waren. Daher musste daran weitergearbeitet werden. Da dies zu kompliziert wurde, ist ein anderer Ansatz verwendet worden.  


Bild 3:


[[Datei:Logo03.JPG|400px|Orginalbild]]
[[Datei:Logo03.JPG|400px|Orginalbild]]
Bild 3:




Zeile 53: Zeile 55:
Bei dem zweiten Ansatz ist ein bestehendes Programm aus dem Software-Ordner  Objekterkennung Kamera entnommen worden. Hierbei sind die Werte für das bestehende Problem angepasst und das Logo erkannt worden. Im Bild 4 (linkes Bild) befindet sich das Grauwertbild innerhalb der ROI, über welchem durch einen Schwellwert die gesuchten Bereiche im rechten Bild eingetragen werden.
Bei dem zweiten Ansatz ist ein bestehendes Programm aus dem Software-Ordner  Objekterkennung Kamera entnommen worden. Hierbei sind die Werte für das bestehende Problem angepasst und das Logo erkannt worden. Im Bild 4 (linkes Bild) befindet sich das Grauwertbild innerhalb der ROI, über welchem durch einen Schwellwert die gesuchten Bereiche im rechten Bild eingetragen werden.


Bild 4:


[[Datei:Logo04.JPG|400px|Orginalbild]]
[[Datei:Logo04.JPG|400px|Orginalbild]]
Bild 4:


Nach der Erkennung wird der relevante Bereich abgespeichert (Bild 5, linkes Bild) und im Originalbild eingetragen (Bild 5, rechtes Bild).
Nach der Erkennung wird der relevante Bereich abgespeichert (Bild 5, linkes Bild) und im Originalbild eingetragen (Bild 5, rechtes Bild).


Bild 5:


[[Datei:Logo05.JPG|400px|Orginalbild]]
[[Datei:Logo05.JPG|400px|Orginalbild]]
Bild 5:




Zeile 68: Zeile 72:
Nachdem das Logo erkannt und gespeichert wurde, wird die Hand im folgenden Abschnitt gesucht. Hierzu wird ebenfalls eine ROI über das Bild gelegt und dieses in ein Graustufenbild umgewandelt (Bild 6, linkes Bild). Durch die Festlegung von zwei Schwellwerten, werden alle zu hellen und dunkeln Bereiche extrahiert. Über den restlichen Pixeln wird nach der Hand gesucht. Hierbei (Bild 6, rechtes Bild) werden vertikal Einsen gesucht. Wenn über 25 Einsen vertikal übereinander gefunden werden, wird diese Position gespeichert.  
Nachdem das Logo erkannt und gespeichert wurde, wird die Hand im folgenden Abschnitt gesucht. Hierzu wird ebenfalls eine ROI über das Bild gelegt und dieses in ein Graustufenbild umgewandelt (Bild 6, linkes Bild). Durch die Festlegung von zwei Schwellwerten, werden alle zu hellen und dunkeln Bereiche extrahiert. Über den restlichen Pixeln wird nach der Hand gesucht. Hierbei (Bild 6, rechtes Bild) werden vertikal Einsen gesucht. Wenn über 25 Einsen vertikal übereinander gefunden werden, wird diese Position gespeichert.  


Bild 6:


[[Datei:Logo06.JPG|400px|Orginalbild]]
[[Datei:Logo06.JPG|400px|Orginalbild]]
Bild 6:




Zeile 77: Zeile 82:
Anhand der gefundenen Stelle in der Hand kann nun das gefunden HSHL-Logo um einen bestimmten Bereich seitlich davon projiziert werden (Bild 7). Im Bild 7 befindet sich ein Ausschnitt aus dem Video in dem beispielhaft das Logo in der Hand reinprojiziert wurde.
Anhand der gefundenen Stelle in der Hand kann nun das gefunden HSHL-Logo um einen bestimmten Bereich seitlich davon projiziert werden (Bild 7). Im Bild 7 befindet sich ein Ausschnitt aus dem Video in dem beispielhaft das Logo in der Hand reinprojiziert wurde.


Bild 7:


[[Datei:Logo07.JPG|400px|Orginalbild]]
[[Datei:Logo07.JPG|400px|Orginalbild]]
Bild 7:





Version vom 20. Juni 2014, 21:35 Uhr

Autor: Adem Hadziric
Betreuer: Prof. Schneider

Motivation

Das YouTube Video unten zeigt wie einfach es ist den Eifelturm zu stehlen.

Ziel

Stehlen virtuell Sie ein Lippstädter Monument z.B. den Wasserturm oder das HSHL-Logo in der Campuseinfahrt mit den Mitteln der digitalen Signalverarbeitung.

Aufgabe

  1. Analysieren Sie das Video. Wie funktioniert der Trick?
  2. Zeichnen Sie selbst ein Video auf, auf dem eine Person scheinbar ein Lippstädter Monument stielt.
  3. Nutzen Sie Matlab, um die Videosequenz in Bilder zu zerlegen.
  4. Nutzen Sie ein Template-Matching-Verfahren, um das Monument automatisch in den Frames zu finden.
  5. Ersetzen Sie das Template nach dem Diebstahl automatisch durch einen neutralen Hintergrund.

Sollten Sie einen anderen Lösungsweg wählen wollen, besprechen Sie dies mit Ihrem Professor.

Lösung

1.Schritt: Videodreh

Auf dem HSHL-Hochschule-Gelände in Lippstadt wurde das entsprechende Video zum Monumentendiebstahl gedreht. Hierbei wurde das große HSHL-Logo auf der Wiese neben der Rixbecker Straße „gestohlen“.


2.Schritt: Video einlesen

Über VideoReader ist das gedrehte Video in Matlab eingelesen worden. Über NumberOfFrames konnten darauf folgend die einzelnen Bilder des Videos ausgelesen und angesprochen werden.


Orginalbild

Bild 1:


3.Schritt: HSHL-Logo finden (Hough)

Um das HSHL-Logo zu finden, ist in jedem einzelnen Bild eine Region of Interest (ROI) verwendet worden (Bild 2, linkes Bild). Durch diese ROI, über dem Logo, wurde nach der Grauwert-Bildung der Canny zur Kantendetektion verwendet (Bild 2, rechtes Bild).


Orginalbild

Bild 2:

Über die Hough-Transformation (Bild 3, linkes Bild) wurden die maximalen Häufungspunkte von Geraden detektiert und ins Grauwertbild (Bild 3, rechtes Bild) eingetragen. In diesem Bild befindet sich die horizontale Detektion der Geraden. Bei der vertikalen Detektion war das Problem vorhanden, dass die gesuchten Kanten nicht die längsten waren. Daher musste daran weitergearbeitet werden. Da dies zu kompliziert wurde, ist ein anderer Ansatz verwendet worden.


Orginalbild

Bild 3:


3.Schritt: HSHL-Logo finden (Objekterkennung Kamera)

Bei dem zweiten Ansatz ist ein bestehendes Programm aus dem Software-Ordner  Objekterkennung Kamera entnommen worden. Hierbei sind die Werte für das bestehende Problem angepasst und das Logo erkannt worden. Im Bild 4 (linkes Bild) befindet sich das Grauwertbild innerhalb der ROI, über welchem durch einen Schwellwert die gesuchten Bereiche im rechten Bild eingetragen werden.


Orginalbild

Bild 4:

Nach der Erkennung wird der relevante Bereich abgespeichert (Bild 5, linkes Bild) und im Originalbild eingetragen (Bild 5, rechtes Bild).


Orginalbild

Bild 5:


4.Schritt: Hand-Erkennung

Nachdem das Logo erkannt und gespeichert wurde, wird die Hand im folgenden Abschnitt gesucht. Hierzu wird ebenfalls eine ROI über das Bild gelegt und dieses in ein Graustufenbild umgewandelt (Bild 6, linkes Bild). Durch die Festlegung von zwei Schwellwerten, werden alle zu hellen und dunkeln Bereiche extrahiert. Über den restlichen Pixeln wird nach der Hand gesucht. Hierbei (Bild 6, rechtes Bild) werden vertikal Einsen gesucht. Wenn über 25 Einsen vertikal übereinander gefunden werden, wird diese Position gespeichert.


Orginalbild

Bild 6:


5.Schritt: Projektion: HSHL-Logo in Hand

Anhand der gefundenen Stelle in der Hand kann nun das gefunden HSHL-Logo um einen bestimmten Bereich seitlich davon projiziert werden (Bild 7). Im Bild 7 befindet sich ein Ausschnitt aus dem Video in dem beispielhaft das Logo in der Hand reinprojiziert wurde.


Orginalbild

Bild 7:


Siehe auch

Weblinks

YouTube: How To Steal Eiffel Tower?



→ zurück zum Hauptartikel: Digitale Signal- und Bildverarbeitung SoSe2014