Winkerrätsel - Entschlüsselung der Signalcodes: Unterschied zwischen den Versionen
(Betreuer nachgetragen) |
|||
(288 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt) | |||
Zeile 2: | Zeile 2: | ||
[[Kategorie:Projekte]] | [[Kategorie:Projekte]] | ||
[[Kategorie:ProjekteET MTR BSE WS2024]] | [[Kategorie:ProjekteET MTR BSE WS2024]] | ||
[[Datei:SemaphoreAttention.png|mini|alternativtext=Strichfigürchen mit einer Kommunikationsaufforderung durch Flaggensignal|"Attention", darf ich um Ihre Aufmerksamkeit bitten - Mit dieser Flaggen | {| class="wikitable" | ||
|- | |||
|'''Autoren:'''|| [[Benutzer:Benedikt_Lipinski| Benedikt Lipinski]] und [[Benutzer:Weiran_Wang| Weiran Wang]] | |||
|- | |||
|'''Betreuer:'''|| [[Benutzer:Ulrich_Schneider| Prof. Schneider]]''' | |||
|- | |||
|} | |||
[[Datei:SemaphoreAttention.png|mini|alternativtext=Strichfigürchen mit einer Kommunikationsaufforderung durch Flaggensignal| Abbildung 1 "Attention", darf ich um Ihre Aufmerksamkeit bitten - Mit dieser Flaggen Bewegung wird in der Flaggen Semaphore eine Verbindung aufgebaut.]] | |||
=Einleitung= | =Einleitung= | ||
Unter Flaggenwinken versteht man in der Nautik nicht das wilde Gestikulieren mit einer Fahne, sondern vielmehr ein komplexes System rein optischer Kommunikation. Während sich an Land schon früh die Kommunikation mittels optischer Telegrafie durchsetzte<ref name"ClaudeChappe">SELLERI, Stefano, 2017. Claude Chappe and the first telecommunication network (without electricity). URSI Radio Science Bulletin [online]. März 2017. Bd. 2017, Nr. 360, S. 96–101. [Zugriff am: 1 Oktober 2024]. DOI 10.23919/URSIRSB.2017.8113174. Verfügbar unter: https://ieeexplore.ieee.org/document/8113174/?arnumber=8113174 | Unter Flaggenwinken versteht man in der Nautik nicht das wilde Gestikulieren mit einer Fahne, sondern vielmehr ein komplexes System rein optischer Kommunikation. Während sich an Land schon früh die Kommunikation mittels optischer Telegrafie durchsetzte<ref name"ClaudeChappe">SELLERI, Stefano, 2017. Claude Chappe and the first telecommunication network (without electricity). URSI Radio Science Bulletin [online]. März 2017. Bd. 2017, Nr. 360, S. 96–101. [Zugriff am: 1 Oktober 2024]. DOI 10.23919/URSIRSB.2017.8113174. Verfügbar unter: https://ieeexplore.ieee.org/document/8113174/?arnumber=8113174 | ||
Zeile 53: | Zeile 59: | ||
| 26|| Z || [[Datei:Z_LetterSemaphore.png|50px|alternativtext=Buchstabe Z im Semaphorealphabet|Buchstabe Z im Semaphorealphabet]] | | 26|| Z || [[Datei:Z_LetterSemaphore.png|50px|alternativtext=Buchstabe Z im Semaphorealphabet|Buchstabe Z im Semaphorealphabet]] | ||
|} | |} | ||
==Vom Videobild zum Buchstaben== | |||
Die Zuordnung von Armbewegungen zu Buchstaben basiert auf der Analyse der Flaggenhaltung durch einen Erkennungsalgorithmus, der Schlüsselpunkte der Körpermitte zur Flaggenposition in einem Bild oder Video identifiziert. Mithilfe geometrischer Berechnungen werden die relativen Winkel zwischen den Gelenkpunkten berechnet. Diese Winkel werden mit vordefinierten Bewegungsmustern oder statischen Positionen verglichen, die nach dem Semaphore-System in 1/8-Teile aufgeteilt wurden. Ein möglicher Ansatzpunkt ist die Berechnung des Winkels zwischen Ober- und Unterarm sowie der Körpermitte, die, aufgeteilt zwischen rechts und links, die in Tabelle 1 gezeigte Zuordnung beschreiben können. Die Genauigkeit der Zuordnung hängt von der präzisen Schlüsselpunkterkennung und einer klaren Definition der Buchstabenpositionen ab. | |||
<br> | |||
Dieses System nutzt Algorithmen der Bidlverarbeitung und der angewandten Trigonometrie unter Zuhilfenahme von Machine-Learning-Algorithmen, um definierte Körperpositionen in Form von Landmarken zu bestimmen, die Position in Echtzeit auszuwerten und zu interpretieren. Neben der Verwendung von Machine-Learning-Ansätzen sind auch Ansätze denkbar, die ausschließlich Bildverarbeitung nutzen. Eine mögliche Umsetzung wäre, die klar definierte Flagge mit ihren beiden Dreiecken in Gelb und Rot als Referenz für die Position und Haltung zu verwenden. | |||
=Bestehende Arbeiten= | =Bestehende Arbeiten= | ||
Die Eingabe von Flaggensignalen in ein Computersystem ist nicht nur als Rätsel für ein Escape-Game interessant, sondern auch in anderen Projekten ein nicht zu vernachlässigender Faktor. Beispielsweise kann die Abbildung des Flaggenalphabets auf die Arme eines Benutzers dazu verwendet werden, Tastenanschläge auf der Tastatur zu simulieren. Ein Beispiel dafür ist das [https://github.com/everythingishacked/Semaphore GitHub-Projekt] des Entwicklers everythingishacked, der eine vollständige Tastatursimulation mit Hilfe von Handsemaphoren in Python umgesetzt hat<ref name"everythingishackedGit">EVERYTHINGISHACKED, [kein Datum]. Semaphore [online]. Verfügbar unter: https://github.com/everythingishacked/Semaphore</ref>. | Die Eingabe von Flaggensignalen in ein Computersystem ist nicht nur als Rätsel für ein Escape-Game interessant, sondern auch in anderen Projekten ein nicht zu vernachlässigender Faktor. Beispielsweise kann die Abbildung des Flaggenalphabets auf die Arme eines Benutzers dazu verwendet werden, Tastenanschläge auf der Tastatur zu simulieren. Ein Beispiel dafür ist das [https://github.com/everythingishacked/Semaphore GitHub-Projekt] des Entwicklers everythingishacked, der eine vollständige Tastatursimulation mit Hilfe von Handsemaphoren in Python umgesetzt hat<ref name"everythingishackedGit">EVERYTHINGISHACKED, [kein Datum]. Semaphore [online]. Verfügbar unter: https://github.com/everythingishacked/Semaphore</ref>. | ||
Auch in der Mathematiksoftware Matlab gibt es bereits Beispiele für Vorstufen einer Armpositionserkennung<ref name"DeepLearningToolBox">Estimate Body Pose Using Deep Learning - MATLAB & Simulink - MathWorks Deutschland, [kein Datum]. [online]. [Zugriff am: 2 Oktober 2024]. Verfügbar unter: https://de.mathworks.com/help/deeplearning/ug/estimate-body-pose-using-deep-learning.html</ref> In beiden Fällen führt der Weg zur Buchstabenerkennung über den Schritt einer Schätzung der Körperhaltung. Konkret ist in diesem Fall die Ermittlung mittels Deep Learning Algorithmen gemeint. | Auch in der Mathematiksoftware Matlab gibt es bereits Beispiele für Vorstufen einer Armpositionserkennung<ref name"DeepLearningToolBox">Estimate Body Pose Using Deep Learning - MATLAB & Simulink - MathWorks Deutschland, [kein Datum]. [online]. [Zugriff am: 2 Oktober 2024]. Verfügbar unter: https://de.mathworks.com/help/deeplearning/ug/estimate-body-pose-using-deep-learning.html</ref> In beiden Fällen führt der Weg zur Buchstabenerkennung über den Schritt einer Schätzung der Körperhaltung. Konkret ist in diesem Fall die Ermittlung mittels Deep Learning Algorithmen gemeint. | ||
==Anforderungen== | ==Anforderungen== | ||
{| class="wikitable" | {| class="wikitable" | ||
Zeile 93: | Zeile 99: | ||
| 1.12 ||Im Profi-Spielmodus sollen nicht nur Buchstaben, sondern auch kurze Wörter oder Zahlen eingegeben werden. || Benedikt Lipinski || 10.10.2024 || Weiran Wang || 10.10.2024 || | | 1.12 ||Im Profi-Spielmodus sollen nicht nur Buchstaben, sondern auch kurze Wörter oder Zahlen eingegeben werden. || Benedikt Lipinski || 10.10.2024 || Weiran Wang || 10.10.2024 || | ||
|- | |- | ||
| 1.13 ||Im | | 1.13 ||Im Expert-Spielmodus soll die bisherige Eingabe auf dem Bildschirm angezeigt werden. || Benedikt Lipinski || 10.10.2024 || Weiran Wang || 10.10.2024 || | ||
|- | |- | ||
| 1.14 ||Im Spielmodus | | 1.14 ||Im Spielmodus Expert muss das Löschen der letzten Ziffer durch ein Flaggensignal möglich sein. || Benedikt Lipinski || 10.10.2024 || Weiran Wang || 10.10.2024 || | ||
|- | |- | ||
| 1.15 ||Das System soll nach Möglichkeit in Matlab realisiert werden; sollten gute Gründe gegen die Verwendung von Matlab sprechen, wird alternativ die Sprache Python verwendet. || Benedikt Lipinski || 10.10.2024 || Weiran Wang || 10.10.2024 || | | 1.15 ||Das System soll nach Möglichkeit in Matlab realisiert werden; sollten gute Gründe gegen die Verwendung von Matlab sprechen, wird alternativ die Sprache Python verwendet. || Benedikt Lipinski || 10.10.2024 || Weiran Wang || 10.10.2024 || | ||
Zeile 123: | Zeile 129: | ||
Im fortgeschrittenen Modus muss die Spielende Person, sich nun selbst an die Einzunehmende Position erinnern oder im Buch nachschlagen. Eingegeben werden müssen in diesem Modus auch nur einzelne Buchstaben. | Im fortgeschrittenen Modus muss die Spielende Person, sich nun selbst an die Einzunehmende Position erinnern oder im Buch nachschlagen. Eingegeben werden müssen in diesem Modus auch nur einzelne Buchstaben. | ||
Der schwierigste Spielmodus, nur geeignet für Profis, fordert von der nutzenden Person die Eingabe kurzer Wörter, was gegebenen falls das Korrigieren der Eingabe nötig macht. | Der schwierigste Spielmodus, nur geeignet für Profis, fordert von der nutzenden Person die Eingabe kurzer Wörter, was gegebenen falls das Korrigieren der Eingabe nötig macht. | ||
Der Ablauf des Winkerrätsels, wie er aus der Sicht des Anwenders dargestellt werden soll, kann dem Ablaufschema in | Der Ablauf des Winkerrätsels, wie er aus der Sicht des Anwenders dargestellt werden soll, kann dem Ablaufschema in Abbildung 2 entnommen werden. Dieses Aktivitätsdiagramm konnte anschließend in einen konkreten Programmablaufplan überführt werden, der in den Abbildungen 3 und beispielhaft für die drei Schwierigkeitsgrade in Abbildung 4, die den Modus "Beginner" darstellt, gezeigt ist. | ||
<gallery widths="330px" heights="330px" captionalign="center"> | |||
Datei:Winkerrätsel Funktionsentwurf.png|400px|center|thumb|Abbildung: 2 Aktivitätsdiagramm des Spielablaufs | |||
Datei:Programmablauf Hauptprogramm.jpg|200px|mini|Abbildung: 3 Programmablaufplan des Hauptprogramms | |||
Datei:PAP Unterfunktion BEGINNER.jpg|mini|Abbildung 4 Programmablaufplan der Unterfunktion Beginner | |||
</gallery> | |||
== Technischer Systementwurf == | == Technischer Systementwurf == | ||
Zeile 137: | Zeile 146: | ||
Eine Gesamtübersicht über die beschriebenen Komponenten und ihre Verknüpfung ist in "Bild 3" dargestellt. <br/> | Eine Gesamtübersicht über die beschriebenen Komponenten und ihre Verknüpfung ist in "Bild 3" dargestellt. <br/> | ||
[[Datei:Winkerraetsel Komponenten.png|frame|400px|center| | [[Datei:Winkerraetsel Komponenten.png|frame|400px|center|Abbildung 3: Relevante, technische Komponenten des Winkerrätsels]] | ||
== | == Komponentenspezifikation und Stückliste == | ||
{| class="wikitable" | {| class="wikitable" | ||
! style="font-weight: bold;" | ID | ! style="font-weight: bold;" | ID | ||
Zeile 155: | Zeile 164: | ||
|RASP PI 5B 4GB mit Ladegerät und Gehäuse | |RASP PI 5B 4GB mit Ladegerät und Gehäuse | ||
|[https://www.reichelt.de/das-raspberry-pi-5-b-4gb-black-bundle-rpi5-bbdl-4gb-p362101.html?&nbc=1&trstct=lp_1358_155298 RPI5 BBDL 4GB Das Raspberry PI 5 B 4GB Black Bundle] | |[https://www.reichelt.de/das-raspberry-pi-5-b-4gb-black-bundle-rpi5-bbdl-4gb-p362101.html?&nbc=1&trstct=lp_1358_155298 RPI5 BBDL 4GB Das Raspberry PI 5 B 4GB Black Bundle] | ||
|[[Datei:Raspberry pi 5B Gruppe.jpg|100px|mini|links| | |[[Datei:Raspberry pi 5B Gruppe.jpg|100px|mini|links|Raspberry pi 5 ]]<ref name"RPI5"> Raspberry Pi 5 Gruppe., [kein Datum]. [online]. [Zugriff am: 11 Oktober 2024]. Verfügbar unter:https://www.reichelt.de/das-raspberry-pi-5-b-4gb-black-bundle-rpi5-bbdl-4gb-p362101.html?&nbc=1&trstct=lp_1358_155298</ref><br> | ||
|- | |- | ||
|- | |- | ||
Zeile 164: | Zeile 173: | ||
|Kurzhubtaster | |Kurzhubtaster | ||
|[https://www.reichelt.de/kurzhubtaster-6x6-mm-hoehe-13-mm-12-v-vert--jtp-1130-p27894.html?&trstct=pos_0&nbc=1 JTP-1130 Kurzhubtaster 6x6 mm, Höhe: 13 mm, 12 V, vert] | |[https://www.reichelt.de/kurzhubtaster-6x6-mm-hoehe-13-mm-12-v-vert--jtp-1130-p27894.html?&trstct=pos_0&nbc=1 JTP-1130 Kurzhubtaster 6x6 mm, Höhe: 13 mm, 12 V, vert] | ||
|[[Datei:Kurzhubtaster 6x6 mm.jpg|100px|mini|links| | |[[Datei:Kurzhubtaster 6x6 mm.jpg|100px|mini|links|Kurzhubtaster 6x6 mm ]]<ref name"JTP-1130"> Kurzhubtaster 6x6 mm, [kein Datum]. [online]. [Zugriff am: 11 Oktober 2024]. Verfügbar unter:https://www.reichelt.de/kurzhubtaster-6x6-mm-hoehe-13-mm-12-v-vert--jtp-1130-p27894.html?&trstct=pos_0&nbc=1</ref><br> | ||
|- | |- | ||
|- | |- | ||
Zeile 173: | Zeile 182: | ||
| LCD128X64 | | LCD128X64 | ||
|[https://www.reichelt.de/entwicklerboards-display-grafik-lcd-128x64-pixel-debo-lcd128x64-p335007.html?&trstct=pos_0&nbc=1 DEBO LCD128X64 Entwicklerboards - Display Grafik-LCD, 128x64 Pixel] | |[https://www.reichelt.de/entwicklerboards-display-grafik-lcd-128x64-pixel-debo-lcd128x64-p335007.html?&trstct=pos_0&nbc=1 DEBO LCD128X64 Entwicklerboards - Display Grafik-LCD, 128x64 Pixel] | ||
|[[Datei:LCD 128x64.jpg|100px|mini|links| | |[[Datei:LCD 128x64.jpg|100px|mini|links|LCD128X64]]<ref name"LCD128X64"> LCD128X64, [kein Datum]. [online]. [Zugriff am: 11 Oktober 2024]. Verfügbar unter:https://www.reichelt.de/entwicklerboards-display-grafik-lcd-128x64-pixel-debo-lcd128x64-p335007.html?&trstct=pos_0&nbc=1</ref><br> | ||
|- | |- | ||
|- | |- | ||
Zeile 182: | Zeile 191: | ||
|Webcam | |Webcam | ||
|[https://www.reichelt.de/webcam-720p-hdready-con-amdis03b-p292005.html?&trstct=pos_7&nbc=1CON AMDIS03B Webcam, 720p, HDready] | |[https://www.reichelt.de/webcam-720p-hdready-con-amdis03b-p292005.html?&trstct=pos_7&nbc=1CON AMDIS03B Webcam, 720p, HDready] | ||
|[[Datei:720p HD Webcam.jpg|100px|mini|links| | |[[Datei:720p HD Webcam.jpg|100px|mini|links|720p HD Webcam]]<ref name"Webcam"> CON AMDIS03B Webcam, [kein Datum]. [online]. [Zugriff am: 11 Oktober 2024]. Verfügbar unter:https://www.reichelt.de/webcam-720p-hdready-con-amdis03b-p292005.html?&trstct=pos_7&nbc=1CON</ref><br> | ||
|- | |- | ||
|- | |- | ||
Zeile 190: | Zeile 199: | ||
|0 € | |0 € | ||
|Signalflaggen | |Signalflaggen | ||
| | | Selbst hergestellt | ||
|[[Datei: | |[[Datei:Winkerflaggen.jpg|100px|mini|zentriert|Charaktaristische Rot/Gelbe Flaggen | ||
<ref name="LipEigen"> LIPINSKI, Benedikt, [kein Datum]. Eigene Aufnahme. [Bild]</ref> | |||
]] | |||
|- | |- | ||
|- | |- | ||
Zeile 199: | Zeile 215: | ||
|0€ | |0€ | ||
|Map mit Flaggensignalen | |Map mit Flaggensignalen | ||
| | |Kopie aus dem Buch Querweltein<ref name="querweltein"> | ||
MAWA, 2008. Querweltein: ein Handbuch - nicht nur für Pfadfinderinnen und Pfadfinder. 6. Aufl. Neuss: Georgs-Verl. ISBN 9783927349087 | |||
</ref> | |||
| | |||
[[Datei:Hilfe Codierung.png|100px|mini|zentriert|Seite zur Semaphore Kommunikation<ref name="querweltein"/>]] | |||
<br> | |||
|} | |||
Datei: | |||
< | |||
< | |||
= Umsetzung HW = | = Umsetzung HW = | ||
==Schaltungsentwurf== | ==Schaltungsentwurf== | ||
<gallery widths=" | <gallery widths="340px" heights="340px" captionalign="center"> | ||
Datei:Neuer Verkabelungsplan.jpg|Abildung | Datei:Neuer Verkabelungsplan.jpg|Abildung 5: Verkabelungsplan | ||
Datei:Winkerrätsel Schaltplan.jpg|Abildung | Datei:Winkerrätsel Schaltplan.jpg|Abildung 6: Schaltplan | ||
Datei:Platine Vorderseite.jpg|Abildung | Datei:Platine Vorderseite.jpg|Abildung 7: Platine Vorderseite <ref name="WanEFert"/> | ||
Datei:Platine Rueckseite.jpg|Abildung | Datei:Platine Rueckseite.jpg|Abildung 8: Platine Rueckseite <ref name="WanEFert"/> | ||
Datei:Rückseite Lochrasterplatine nach Löten.jpg|Abildung | Datei:Rückseite Lochrasterplatine nach Löten.jpg|Abildung 9: Vorderseite Lochrasterplatine nach Löten <ref name="WanEigen"/> | ||
Datei:Vorderseite Lochrasterplatine nach Löten.jpg|Abildung | Datei:Vorderseite Lochrasterplatine nach Löten.jpg|Abildung 10: Rückseite Lochrasterplatine nach Löten <ref name="WanEigen"/> | ||
</gallery> | </gallery> | ||
# Die Abbildung | # Die Abbildung 5 zeigt das mit Fritzing erstellte Gesamtlayout der Verbindungen und erleichtert <br> die schnelle Umsetzung des Projektprototyps | ||
# Abbildung | # Abbildung 6 zeigt das entsprechende Schaltplan-Diagramm, das mit Multisim erstellt wurde. | ||
# Abbildungen | # Abbildungen 7 und 8 stellen das Leiterplattendesign basierend auf dem Schaltplan dar. <br> Die Leiterplatte hat die Abmessungen 90x150 mm, wodurch sie nicht nur alle Hardware-<br>Komponenten aufnehmen kann, sondern auch die Anforderung erfüllt, dass das Gerät in eine <br> Schuhschachtel passen muss. | ||
# Die Abbildung | # Die Abbildung 9 und 10 zeigt die bearbeitete Leiterplatte. Aufgrund eingeschränkter Bedingungen konnte keine<br> gedruckte Leiterplatte (PCB) hergestellt werden, sodass die Schaltung auf einer Lochrasterplatine<br> aufgebaut wurde. Um die Lötarbeit zu erleichtern, wurde das ursprüngliche Leiterbahn-Design angepasst, <br> sodass es besser auf der Lochrasterplatine realisiert werden kann. | ||
===Beschreibung der Verbindung=== | ===Beschreibung der Verbindung=== | ||
'''LCD128x64 mit Raspberry Pi 5''' | '''LCD128x64 mit [[Raspberry Pi |Raspberry Pi 5]]''' | ||
# Der digitale Pin ''' | # Der digitale Pin '''[[Using the Raspberry Pi’s GPIO to control hardware components|GPIO]]25''' des [[Raspberry Pi |Raspberry Pi 5]] wird als Chip-Select-Pin verwendet und mit dem Chip-Select-Pin '''RS''' des LCD-Bildschirms verbunden. | ||
# Der SPI-Daten-Pin '''GPIO10 (MOSI)''' des Raspberry Pi wird mit dem '''RW (MOSI)'''-Pin des LCD-Bildschirms verbunden. | # Der SPI-Daten-Pin '''GPIO10 (MOSI)''' des [[Raspberry Pi]] wird mit dem '''RW (MOSI)'''-Pin des LCD-Bildschirms verbunden. | ||
# Der SPI-Takt-Pin '''GPIO11 (SCK)''' des Raspberry Pi wird mit dem '''E (SCK)'''-Pin des LCD-Bildschirms verbunden. | # Der SPI-Takt-Pin '''GPIO11 (SCK)''' des [[Raspberry Pi]] wird mit dem '''E (SCK)'''-Pin des LCD-Bildschirms verbunden. | ||
# Der '''PSB'''-Pin des LCD-Bildschirms wird mit '''GND''' verbunden, um den Pegel auf Low zu setzen und damit die SPI-Kommunikation zu aktivieren. | # Der '''PSB'''-Pin des LCD-Bildschirms wird mit '''GND''' verbunden, um den Pegel auf Low zu setzen und damit die SPI-Kommunikation zu aktivieren. | ||
# Das LCD-Modul wird über die Pins '''GND (-)''' und '''VCC (+)''' mit 5V-Stromquelle versorgt. | # Das LCD-Modul wird über die Pins '''GND (-)''' und '''VCC (+)''' mit 5V-Stromquelle versorgt. | ||
# Die Hintergrundbeleuchtung wird über die Pins '''BLK (-)''' und '''BLA (+)''' mit 5V-Stromquelle versorgt. | # Die Hintergrundbeleuchtung wird über die Pins '''BLK (-)''' und '''BLA (+)''' mit 5V-Stromquelle versorgt. | ||
'''AMDIS03B Webcam mit Raspberry Pi 5''' | '''AMDIS03B Webcam mit [[Raspberry Pi |Raspberry Pi 5]] ''' | ||
# Verbinden Sie den USB-Anschluss der '''AMDIS03B Webcam''' direkt mit einem beliebigen USB 3.0-Port des '''Raspberry Pi 5'''. | # Verbinden Sie den USB-Anschluss der '''AMDIS03B Webcam''' direkt mit einem beliebigen USB 3.0-Port des '''Raspberry Pi 5'''. | ||
'''Taste mit Raspberry Pi 5''' | '''[[Arduino:_Taster_auswerten_und_LEDs_ansteuern|Taste]] mit [[Raspberry Pi |Raspberry Pi 5]]''' | ||
# Die erste Taste wird mit einer Seite an den '''GPIO26''' des Raspberry Pi und mit der anderen Seite an '''GND''' angeschlossen. | # Die erste Taste wird mit einer Seite an den '''GPIO26''' des Raspberry Pi und mit der anderen Seite an '''GND''' angeschlossen. | ||
# Die zweite Taste wird mit einer Seite an den '''GPIO16''' des Raspberry Pi und mit der anderen Seite an '''GND''' angeschlossen. | # Die zweite Taste wird mit einer Seite an den '''GPIO16''' des Raspberry Pi und mit der anderen Seite an '''GND''' angeschlossen. | ||
'''LED mit Raspberry Pi 5''' | '''[[LED]] mit [[Raspberry Pi |Raspberry Pi 5]]''' | ||
# Der positive Pol der LED wird mit dem '''GPIO6''' des Raspberry Pi verbunden. | # Der positive Pol der LED wird mit dem '''GPIO6''' des Raspberry Pi verbunden. | ||
# Ein '''150Ω'''-Überstromschutzwiderstand wird zwischen den negativen Pol der LED und '''GND''' geschaltet. | # Ein '''150Ω'''-Überstromschutzwiderstand wird zwischen den negativen Pol der LED und '''GND''' geschaltet. | ||
'''Servo MG996R mit Raspberry Pi 5''' | '''[[Servomotor|Servo]] MG996R mit [[Raspberry Pi |Raspberry Pi 5]]''' | ||
# MG996R wird mit dem '''GPIO19''' des Raspberry Pi verbunden, da dieser Pin ein präzises Hardware-PWM-Signal erzeugen kann. | # MG996R wird mit dem '''GPIO19''' des Raspberry Pi verbunden, da dieser Pin ein präzises Hardware-PWM-Signal erzeugen kann. | ||
# MG996R-Servos wird mit ihren '''GND (-)''' und '''VCC (+)''' an 5V-Stromquelle angeschlossen. | # MG996R-Servos wird mit ihren '''GND (-)''' und '''VCC (+)''' an 5V-Stromquelle angeschlossen. | ||
Zeile 338: | Zeile 274: | ||
==Strukturentwurf== | ==Strukturentwurf== | ||
===Hauptteil=== | ===Hauptteil=== | ||
<gallery widths=" | <gallery widths="330px" heights="330px" captionalign="center"> | ||
Datei: | Datei:Monate Hauptteil.jpg|Abildung 11: Hauptteil <ref name="WanEigen"> WANG, Weiran, [kein Datum]. Eigene Aufnahme. [Bild]</ref> | ||
Datei:Gehäuseteil 1.jpg|Abildung | Datei:Gehäuseteil 1.jpg|Abildung 12: Gehäuseteil 1<ref name="WanEFert"/> | ||
Datei:Gehäuseteil 2.jpg|Abildung | Datei:Gehäuseteil 2.jpg|Abildung 13: Gehäuseteil 2<ref name="WanEFert"/> | ||
Datei:Gehäuseteil 3.jpg|Abildung | Datei:Gehäuseteil 3.jpg|Abildung 14: Gehäuseteil 3<ref name="WanEFert"/> | ||
Datei:Platine Masss.jpg|Abildung | Datei:Platine Masss.jpg|Abildung 15: Platine Masss<ref name="WanEFert"/> | ||
Datei:Montage Effekt.jpg|Abildung 16: Montage Effekt<ref name="WanEFert"/> | |||
</gallery> | </gallery> | ||
Abbildungen 11 - 16 zeigen die Gesamtstruktur des Geräts, die aus einer Bodenplatte, einer Leiterplatine, einem Gehäuse und zwei Tastenabdeckungen besteht. Die Abmessungen der einzelnen Komponenten wurden nach präzisen Messungen und Bewertungen streng festgelegt und sind in ihren jeweiligen Dreitafelprojektionen klar ersichtlich. Die mit dem Gehäuse verbundenen Teile werden vollständig im 3D-Druckverfahren hergestellt. Das Gehäusedesign verbindet Ästhetik mit Funktionalität: Es hebt die Tasten und den Bildschirm als die zentralen interaktiven Hardwareelemente für den Benutzer hervor und bietet gleichzeitig die erforderlichen Anschlüsse für externe Geräte. Darüber hinaus schützt das Gehäuse die internen Schaltkreise, indem es verhindert, dass leitfähige Materialien die Leiterplatte berühren und Kurzschlüsse verursachen, oder dass die ICs durch statische Hochspannung der Benutzer beschädigt werden. Durch ein optimiertes Belüftungsdesign wird außerdem eine effiziente Wärmeableitung gewährleistet, wodurch sichergestellt wird, dass der Raspberry Pi während des Betriebs eine stabile Temperatur beibehält und die Zuverlässigkeit des Systems gewährleistet ist. | |||
===Kamerahalterung=== | ===Kamerahalterung=== | ||
<gallery widths=" | <gallery widths="330px" heights="330px" captionalign="center"> | ||
Datei:Kamerahalterung Basis.jpg|Abildung | Datei:Monate Kamerahaltung.jpg|Abildung 17:Monate Kamerahaltung<ref name="WanEigen"/> | ||
Datei:Kamerahalterung Verbindung.jpg|Abildung | Datei:Kamerahalterung Basis.jpg|Abildung 18: Kamerahalterung Basis<ref name="WanEFert"/> | ||
Datei:Kamerahalterung Montage.jpg|Abildung | Datei:Kamerahalterung Verbindung.jpg|Abildung 19: Kamerahalterung Verbindung<ref name="WanEFert"/> | ||
Datei:Kamerahalterung Montage.jpg|Abildung 20: Kamerahalterung Montage<ref name="WanEFert"/> | |||
</gallery> | </gallery> | ||
Zeile 358: | Zeile 296: | ||
= Umsetzung SW = | = Umsetzung SW = | ||
==Wahl der Programmiersprache== | |||
Dieses Projekt wurde in der Interpretersprache [[Python|Python]] umgesetzt. Da [[Python|Python]] sowohl auf den für die Entwicklung verwendeten Windows-Systemen eingesetzt werden kann, als auch auf dem Zielsystem [[Raspberry Pi]] verfügbar ist. Für eine korrekte Bildverarbeitung ist die Verwendung der Bibliothek [https://docs.opencv.org/4.x/d1/dfb/intro.html OpenCV] notwendig, die auch für C++ und somit für [[MATLAB-Befehle|MATLAB]] zur Verfügung stünde. Ausschlaggebend für die Wahl von [[Python|Python]] war die Möglichkeit, die von Google stammende Bibliothek [https://github.com/google-ai-edge/mediapipe Mediapipe] zu verwenden. Mediapipe bietet Zugriff auf verschiedene, optimierte Algorithmen, die unter anderem die Erkennung von Körperhaltungen ermöglichen und ist für die verwendung mit [[Python|Python]] und [https://docs.opencv.org/4.x/d1/dfb/intro.html OpenCV]optimiert | |||
<ref name"GoogleMediaPipe"> Leitfaden zur Erkennung von Positionsmarkierungen | Google AI Edge, [kein Datum]. Google AI for Developers [online]. [Zugriff am: 14 Januar 2025]. Verfügbar unter: https://ai.google.dev/edge/mediapipe/solutions/vision/pose_landmarker?hl=de | |||
</ref>, was die Bildgestützte erkennung der Körperpositionen auf ein Minimum an aufwand reduziert . In [[MATLAB-Befehle|MATLAB]] müssten diese von anderen 3. Bibliotheken<ref name"DeepLearningToolBox">Estimate Body Pose Using Deep Learning - MATLAB & Simulink - MathWorks Deutschland, [kein Datum]. [online]. [Zugriff am: 2 Oktober 2024]. Verfügbar unter: https://de.mathworks.com/help/deeplearning/ug/estimate-body-pose-using-deep-learning.html</ref> implementiert oder über eine [https://de.mathworks.com/products/matlab/matlab-and-python.html Matlab-Python] Schnittstelle eingebunden werden. | |||
==Paralellitaet von Aufgaben == | |||
{| class="mw-datatable" | |||
|+ style="text-align: left" | | |||
|- | |||
|[[Datei:Winkerraetsel Paralellitaet .png|mini|300px|Abbildung 21: Winkerraetsel paralleler Ablauf ]] | |||
| | |||
|} | |||
Parallelität von Aufgaben ermöglicht die gleichzeitige Bearbeitung mehrerer Prozesse, was durch die Verwendung von Threads effizient umgesetzt werden kann, da diese die gleichzeitige Ausführung mehrerer Aufgaben innerhalb eines Programms erlauben. | |||
Jeder Thread arbeitet unabhängig, teilt sich aber denselben Speicherbereich, was eine schnelle Kommunikation ermöglicht, aber auch zu Synchronisationsproblemen führen kann. | |||
In [[Python]] ermöglicht das Threading-Modul das Erstellen und Verwalten von Threads, um parallele Aufgaben effizient auszuführen. Es bietet einfache Mechanismen, um Threads zu starten, zu synchronisieren und Ressourcen zwischen ihnen zu teilen. | |||
Die parallele Ausführung der Tasks <code>camera_video_worker</code> und <code>user_input_worker</code> ist für das Winkerätsel entscheidend, da beide Prozesse gleichzeitig neben dem Hauptprogramm aktiv sein müssen. Der <code>camera_video_worker</code> verarbeitet kontinuierlich die Kameradaten, analysiert die Bewegungen und erkennt das Winken als Teil des Spiels. Der <code>user_input_worker</code> hingegen ist primär für die Erfassung der Benutzereingaben zuständig, insbesondere um einen Spielabbruch durch den Benutzer zu ermöglichen. Durch diese parallele Struktur können Kameraverarbeitung und sofortige Abbruchmöglichkeit gleichzeitig und ohne gegenseitige Beeinflussung ablaufen. Dies gewährleistet einen reibungslosen Spielablauf und gibt dem Benutzer die volle Kontrolle ohne Verzögerungen oder Unterbrechungen des Spielverlaufs zum besseren verständnis ist in Abbildung 21 der Zeitliche ablauf in einem Sequenzdiagramm dargestellt. Um die eingangs beschriebenen Synchronisationsprobleme bei der Kommunikation zwischen den einzelnen Subthreads in den Griff zu bekommen, wird auf die Verwendung von Queues gesetzt die, die gesendeten Nachrichten ähnlich wie in einem Shiftregister in einer Schlange zur Verfügung stellen<ref name="queue-geeksforgeeks"> | |||
| Titel = Queue in Python | |||
| Autor = GeeksforGeeks | |||
| Jahr = 2019 | |||
| Werk = GeeksforGeeks | |||
| URL = https://www.geeksforgeeks.org/queue-in-python/ | |||
| Zugriff = 15. Januar 2025 | |||
</ref>. | |||
==Grafische Ausgabe== | |||
===LCD Modul=== | |||
{| class="mw-datatable" | |||
! style="font-weight: bold;" | | |||
! style="font-weight: bold;" | | |||
|+ style = "text-align: left"| | |||
|- | |||
|[[Datei:Timing-Diagramm.jpg|mini|625px|Abbildung 22: LCD128X64 - Timing Diagramm]] | |||
| | |||
|} | |||
Das LCD-Programmmodul erfüllt die Anforderungen dieses Projekts in Bezug auf die Anzeige von Text und Symbolen. Mit der Funktion '''Eine_Zeile_Zeichenkette(Zeile, Spalte, Text_Eingeben)''' kann Text an einer beliebigen Zeile und Spalte des Bildschirms angezeigt werden, während die Funktion '''Eine_Seite_Zeichenkette(Zeile, Spalte, Text_Eingeben)''' dazu dient, eine komplette Seite mit Text darzustellen. Für längere Zeichenketten kann die Funktion '''Mehr_Seite_Zeichenkette(Zeile, Spalte, Text_Eingeben)''' verwendet werden, die den Text automatisch in mehrere Seiten aufteilt und alle 4 Sekunden umblättert. | Das LCD-Programmmodul erfüllt die Anforderungen dieses Projekts in Bezug auf die Anzeige von Text und Symbolen. Mit der Funktion '''Eine_Zeile_Zeichenkette(Zeile, Spalte, Text_Eingeben)''' kann Text an einer beliebigen Zeile und Spalte des Bildschirms angezeigt werden, während die Funktion '''Eine_Seite_Zeichenkette(Zeile, Spalte, Text_Eingeben)''' dazu dient, eine komplette Seite mit Text darzustellen. Für längere Zeichenketten kann die Funktion '''Mehr_Seite_Zeichenkette(Zeile, Spalte, Text_Eingeben)''' verwendet werden, die den Text automatisch in mehrere Seiten aufteilt und alle 4 Sekunden umblättert. | ||
Die Schlüsselfunktionen des LCD-Moduls sind | Die Schlüsselfunktionen des LCD-Moduls sind <code>spi_init()</code>, <code>senden_zu_st7920(Auswahl, Daten)</code> und <code>lcd_Konfiguration()</code>. Die Funktion '''spi_init()''' initialisiert die SPI-Schnittstelle des [[Raspberry Pi]] entsprechend dem Kommunikationseingenschaft des LCD128x64. Die Funktion <code>senden_zu_st7920(Auswahl, Daten)</code> wurde basierend auf dem in der Abbildung 22 gezeigten Kommunikationszeitdiagramm von LCD entwickelt, damit können sowohl Befehle zur Konfiguration des LCD128x64 als auch Inhalte zur Anzeige gesendet werden. Die Funktion <code>lcd_Konfiguration()</code> konfiguriert die wichtigsten Register des LCD-Controllers gemäß dem Datenblatt und aktiviert die Hauptfunktionen des Displays. | ||
Im folgenden Scroll-Fenster können die Details für LCD Modul eingesehen werden. | Im folgenden Scroll-Fenster können die Details für LCD Modul eingesehen werden. | ||
Zeile 474: | Zeile 443: | ||
</div> | </div> | ||
==Kamera Regler Modul== | ==Bildaufnahme und Verarbeitung== | ||
=== BodyPoseEstimation Modul=== | |||
Zur Realisierung der Flaggenerkennung wurde in diesem Projekt die Aufnahme mittels Kamera und anschließender [[OpenCV mit Python|OpenCV-Bildverarbeitung]] gewählt. | |||
Diese Aufgabe wird durch die Funktion <code>Camera_Video_Worker(cv_worker_result_queue)</code> umgesetzt. | |||
Durch das asynchrone Ausführen der Funktion lassen sich Videostreams in Echtzeit zur Extraktion und Visualisierung von Körperskelettdaten mit [https://pypi.org/project/mediapipe/ Mediapipe-Bibliotheken]verarbeiten. Aus dem Bild werden Daten zur Körpererkennung extrahiert, um basierend auf den im Modell hinterlegten Schlüsselmerkmalen Gelenkpositionen zu erkennen und als Landmarks zu speichern. Neben der grafischen Darstellung der erkannten Person kann, basierend auf den Landmarken und der in einem Abschnitt beschriebenen geometrischen Funktion, eine Winkelberechnung erfolgen. Diese ermöglicht es, einen Abgleich der gezeigten Armposition des Spielers mit den im Semaphore-Alphabet festgelegten Positionen durchzuführen.<br> | |||
Die konkrete Umsetzung in diesem Projekt nutzt, neben der Standard-Bildverarbeitung mit [[OpenCV mit Python|OpenCV]], die Erweiterung der [https://pypi.org/project/mediapipe/ Mediapipe-Bibliotheken], die auf Machine-Learning-Algorithmen basierende Modelle zur Körpermarkenerkennung zur Verfügung stellen. | |||
Der Vorteil ergibt sich daraus, dass sich direkt auf die Körperpunkte des Spielers bezogen werden kann, egal in welchem Winkel er zur Kamera steht oder wie er seinen Körperschwerpunkt nach links oder rechts verlagert. | |||
Zudem ist durch das landmarkenbasierte Verfahren direkt eine einheitliche Definition von Links und Rechts gegeben, die im sonstigen Umgang mit Flaggen-Semaphore durchaus zur Verwirrung führen kann. | |||
<syntaxhighlight lang="python"> | |||
def Camera_Video_Worker(resultQeue): | |||
""" | |||
Mediapipe-spezifische Verarbeitung zur Extraktion von Körperskelett und Schlüsselpunkten. | |||
""" | |||
# Initialisierung von Mediapipe-Werkzeugen | |||
mp_drawing = mp.solutions.drawing_utils | |||
mp_pose = mp.solutions.pose | |||
# Mediapipe Pose-Erkennung initialisieren | |||
with mp_pose.Pose(min_detection_confidence=0.51, min_tracking_confidence=0.51) as pose: | |||
while True: # Endlosschleife für die Verarbeitung | |||
# Mediapipe-Prozess zur Verarbeitung eines Bildes | |||
results = pose.process(image) # Hier wird ein Bild übergeben | |||
if results.pose_landmarks: # Wenn Schlüsselpunkte erkannt wurden | |||
# Zeichnen des Körperskeletts und der Referenzlinien | |||
image = GraphicalUserInterface.user_skeleton_visualisation(image, results.pose_landmarks) | |||
#Bereitstellen der Körpermarken für die Hautpfunktion | |||
resultQeue.put(escape.PoseObject(results.pose_landmarks, image )) | |||
if platform.system()== 'Linux': | |||
Kamera_Regelung(image, nose) | |||
</syntaxhighlight> | |||
===Kamera Regler Modul=== | |||
Das Ziel eines Kamerahalters besteht darin, die Kamera mithilfe eines Servomotors zu bewegen, sodass sie sich um eine vorgegebene Achse drehen kann, um den optimalen Blickwinkel zu erreichen. Um die Positioniergeschwindigkeit und -genauigkeit zu verbessern, kann ein Regelkreis verwendet werden, der eine schnelle und präzise Ausrichtung der Kamera ermöglicht. | Das Ziel eines Kamerahalters besteht darin, die Kamera mithilfe eines Servomotors zu bewegen, sodass sie sich um eine vorgegebene Achse drehen kann, um den optimalen Blickwinkel zu erreichen. Um die Positioniergeschwindigkeit und -genauigkeit zu verbessern, kann ein Regelkreis verwendet werden, der eine schnelle und präzise Ausrichtung der Kamera ermöglicht. | ||
===Grundelemente der Regelung=== | ====Grundelemente der Regelung==== | ||
'''Sollgröße & Istgröße''' | '''Sollgröße & Istgröße''' | ||
Zeile 487: | Zeile 488: | ||
In diesem Regelkreis entspricht die Strecke der gesamten Kamerahalterung, wobei das Eingangssignal ein PWM-Signal und das Ausgangssignal die Gesichtskoordinaten sind. Um die Analyse der Strecke zu vereinfachen, kann die Kamerahalterung in zwei Teile unterteilt werden: den Servomotor und die Kamera, die jeweils separat analysiert werden. | In diesem Regelkreis entspricht die Strecke der gesamten Kamerahalterung, wobei das Eingangssignal ein PWM-Signal und das Ausgangssignal die Gesichtskoordinaten sind. Um die Analyse der Strecke zu vereinfachen, kann die Kamerahalterung in zwei Teile unterteilt werden: den Servomotor und die Kamera, die jeweils separat analysiert werden. | ||
*''' Servomotors''' | |||
{| class="mw-datatable" | |||
! style="font-weight: bold;" | | |||
! style="font-weight: bold;" | | |||
|+ style = "text-align: left"| | |||
|- | |||
|[[Datei:Regelkreis Servomotor.jpg|mini|625px|Abbildung. 23: Regelkreis Servomotor<ref name="embaddedLabRegelkreis> | |||
Lab 21: Servo motor control | Embedded Lab, 2012. [online]. [Zugriff am: 16 Januar 2025]. Verfügbar unter: https://embedded-lab.com/blog/lab-21-servo-motor-control/ | |||
</ref>]] | |||
| | |||
|} | |||
Die Abbildung 23 zeigt das Funktionsprinzip eines Servomotors zur präzisen Einstellung des Winkels, welches ein typischer geschlossener Regelkreis ist. Das Eingangssignal ist ein PWM-Signal, das durch einen Wandler in ein Spannungssignal umgewandelt wird. Die '''Regelstrecke''' besteht aus einem Gleichstrommotor und einem Getriebe, wobei die Ausgangsgröße der Winkel ist. Wenn der '''Strecke''' ein Sprungspannungssignal zugeführt wird, erhöht das Getriebe den Ausgangswinkel mit einer konstanten Winkelgeschwindigkeit. Daher erfüllt die '''Regelstrecke''' die Eigenschaften eines '''I-Glieds'''. | |||
Der vom Getriebe ausgegebene Winkel kann über ein Potentiometer in ein Spannungssignal umgewandelt und als Rückführungssignal verwendet werden. Das Fehlersignal wird anschließend durch einen Operationsverstärker proportional verstärkt, um ein Steuersignal zu erzeugen, das das System regelt. | |||
Die Übertragungsfunktion dieses Regelkreises lautet: | |||
<math> | |||
G_{Servo}(s) = \frac{K_{p,\text{operationsverstärker}} \cdot K_{i,\text{winkel}} / s}{1 + K_{p,\text{operationsverstärker}} \cdot K_{i,\text{winkel}} / s} = \frac{1}{\frac{1}{K_{p,\text{operationsverstärker}} \cdot K_{i,\text{winkel}}} \cdot s + 1} | |||
</math> | |||
Aus der Übertragungsfunktion des Servomotors lässt sich erkennen, dass dessen dynamische Eigenschaften einem '''PT1-Glied''' entsprechen. | |||
*''' Kamera''' | |||
{| class="mw-datatable" | |||
! style="font-weight: bold;" | | |||
! style="font-weight: bold;" | | |||
|+ style = "text-align: left"| | |||
|- | |||
|[[Datei:FOV.png|mini|625px|Abbildung. 24: Bildwinkel]] | |||
| | |||
|} | |||
Für die Kamera als Strecke ist die '''Stellgröße''' der Winkel <math>\Delta \alpha(t)</math>, und die Ausgabe ist die horizontale Pixelkoordinate des Spielers im Bild <math>\Delta x(t)</math>. | |||
Die Abbildung zeigt das Konzept des '''Bildwinkels'''. Dieser bezeichnet den horizontalen Sichtwinkel einer Kamera oder eines optischen Systems, der in der Regel in Grad angegeben wird. Der Bildwinkel beschreibt den maximalen Bereich, den die Kamera in horizontaler Richtung erfassen kann, und ist ein wichtiger Parameter in optischen Systemen. | |||
Die Beziehung zwischen der Winkeländerung und der Pixelkoordinatenverschiebung ergibt sich aus der folgenden Formel: | |||
<math>\Delta x(t) = \frac{W}{HFOV} \cdot \Delta \alpha(t)</math> | |||
Dabei gilt: | |||
* <math>W</math>: Die horizontale Pixelanzahl (Breite des Bildes). | |||
* <math>HFOV</math>: Der horizontale Sichtwinkel der Kamera (Horizontal Field of View). | |||
* <math>\Delta \alpha(t)</math>: Die Änderung des Winkels. | |||
Durch Anwendung der Laplace-Transformation wird die Gleichung in den Frequenzbereich übertragen: | |||
<math>\Delta X(s) = \frac{W}{HFOV} \cdot \Delta \alpha(s)</math> | |||
Die Übertragungsfunktion der Kamera ergibt sich zu: | |||
<math>G_{\text{Kamera}}(s) = \frac{W}{HFOV}</math> | |||
Aus der Übertragungsfunktion <math>G_{\text{Kamera}}(s)</math> geht hervor, dass diese Kamerastrecke ein '''P-Glied''' (proportionales Glied) darstellt. Der Verstärkungsfaktor lautet: | |||
<math>Kp_{\text{Kamera}} = \frac{W}{HFOV}</math>. | |||
Die Gesamtübertragungsfunktion der '''Kamerahalterung''' ergibt sich aus der Verknüpfung der beiden Übertragungsfunktionen <math>G_{\text{Kamera}}(s)</math> und <math>G_{\text{Servo}}(s)</math>. Da beide in Serie geschaltet sind, multiplizieren sich die Übertragungsfunktionen: | |||
<math> | |||
G_{\text{Kamerahalterung}}(s) = G_{\text{Kamera}}(s) \cdot G_{\text{Servo}}(s) | |||
</math> | |||
Einsetzen der Einzelübertragungsfunktionen: | |||
<math> | |||
G_{\text{Kamerahalterung}}(s) = \left( \frac{W}{HFOV} \right) \cdot \left( \frac{1}{\frac{1}{K_{p,\text{operationsverstärker}} \cdot K_{i,\text{winkel}}} \cdot s + 1} \right) | |||
</math> | |||
Nach Vereinfachung ergibt sich: | |||
<math> | |||
G_{\text{Kamerahalterung}}(s) = \frac{\frac{W}{HFOV}}{\frac{1}{K_{p,\text{operationsverstärker}} \cdot K_{i,\text{winkel}}} \cdot s + 1} | |||
</math> | |||
Aus der Übertragungsfunktion der Strecke Kamerahalterung geht vor, die Kamerahalterung ist noch ein PT1 Glied | |||
*'''Die Verifizierung für Theorie''' | |||
{| class="mw-datatable" | |||
! style="font-weight: bold;" | | |||
! style="font-weight: bold;" | | |||
|+ style = "text-align: left"| | |||
|- | |||
|[[Datei:Regelstrecke Analyse.jpg|mini|625px|Abbildung. 25:Regelstrecke Analyse<ref name="WanEFert"/>]] | |||
| | |||
|} | |||
Die Abbildung 25 zeigt den praktischen Test der Strecke-Kamerahalterung. Die Testschritte sind wie folgt: | |||
# Der Anfangswinkel der Kamera wird mit einem PWM-Signal eingestellt. | |||
# Die Kamera dient als Positionssensor und liest in einer Schleife kontinuierlich die x-Koordinaten des Spielers aus. | |||
# Die Koordinateninformationen werden in Echtzeit gespeichert. | |||
# Ein PWM-Stufensignal wird eingespeist. | |||
# Die gemessenen Daten werden in MATLAB importiert, die Kurve wird gezeichnet und analysiert. | |||
Da der Servomotor eine sehr hohe Reaktionsgeschwindigkeit aufweist, führen die schnellen dynamischen Änderungen während des Betriebs zu einer deutlichen Bewegungsunschärfe bei den Aufnahmen der Kamera. Diese Unschärfe beeinträchtigt die Bildqualität erheblich, sodass in dieser Phase keine optimale Bildverarbeitung durchgeführt werden kann. | |||
Infolgedessen wird die Anzahl und Genauigkeit der Abtastpunkte eingeschränkt, was dazu führt, dass die tatsächlich gemessenen Daten in bestimmten Momenten eine unzureichende Diskretheit aufweisen können. | |||
Trotz dieser Einschränkungen zeigt die gemessene Kurve weiterhin klar die charakteristischen Merkmale eines '''PT1-Glieds'''. In Kombination mit der theoretischen Herleitung und den praktischen Testergebnissen lässt sich weitgehend bestätigen, dass die '''Kamerahalterung''' ein '''PT1-Glied''' ist. | |||
Zeile 494: | Zeile 602: | ||
PID Regelalgorithmus wird eingesetzt. Der PID-Regelalgorithmus basiert auf einem mathematischen Modell aus Proportional-, Integral- und Differentialanteilen und zeichnet sich durch seine einfache Umsetzung aus. Er wird in einer Vielzahl von Regelungsszenarien eingesetzt. Der Algorithmus erfordert nur geringe Rechenleistung und ist daher besonders für Echtzeitsysteme geeignet. Die Parametereinstellung ist ebenfalls relativ unkompliziert und kann durch Experimente oder Erfahrungswerte schnell optimiert werden. Bei einer geeigneten Parametrierung gewährleistet der PID-Algorithmus eine stabile Regelungsleistung, verhindert Systemdivergenzen und sorgt für Zuverlässigkeit. | PID Regelalgorithmus wird eingesetzt. Der PID-Regelalgorithmus basiert auf einem mathematischen Modell aus Proportional-, Integral- und Differentialanteilen und zeichnet sich durch seine einfache Umsetzung aus. Er wird in einer Vielzahl von Regelungsszenarien eingesetzt. Der Algorithmus erfordert nur geringe Rechenleistung und ist daher besonders für Echtzeitsysteme geeignet. Die Parametereinstellung ist ebenfalls relativ unkompliziert und kann durch Experimente oder Erfahrungswerte schnell optimiert werden. Bei einer geeigneten Parametrierung gewährleistet der PID-Algorithmus eine stabile Regelungsleistung, verhindert Systemdivergenzen und sorgt für Zuverlässigkeit. | ||
== | |||
[[Datei: | Durch Berechnungen und Auswahl wurde festgestellt, dass eine präzise Regelung allein durch den P- und I-Anteil des PID-Reglers erreicht werden kann, ohne den D-Anteil einzusetzen. Der Berechnungsprozess ist wie folgt: | ||
Die Führungsübertragungsfunktion lautet: | |||
<math> | |||
G_w(s) = \frac{G_{\text{PID}}(s) \cdot G_{\text{Kamerahalterung}}(s)}{1 + G_{\text{PID}}(s) \cdot G_{\text{Kamerahalterung}}(s)} = \frac{\frac{K_c \cdot K_p}{T_c \cdot s + 1} + \frac{K_c \cdot K_i}{s \cdot (T_c \cdot s + 1)}}{1 + \frac{K_c \cdot K_p}{T_c \cdot s + 1} + \frac{K_c \cdot K_i}{s \cdot (T_c \cdot s + 1)}} | |||
</math> | |||
Die Störsübertragungsfunktion lautet: | |||
<math> | |||
G_z(s) = \frac{G_{\text{Kamerahalterung}}(s)}{1 + G_{\text{PID}}(s) \cdot G_{\text{Kamerahalterung}}(s)} = \frac{\frac{K_c}{T_c \cdot s + 1}}{1 + \frac{K_c \cdot K_p}{T_c \cdot s + 1} + \frac{K_c \cdot K_i}{s \cdot (T_c \cdot s + 1)}} | |||
</math> | |||
Dabei gilt: | |||
* <math>G_{\text{PID}}(s) = K_p + \frac{K_i}{s}</math> ist die Übertragungsfunktion des PID-Reglers. | |||
* <math>G_{\text{Kamerahalterung}}(s) = \frac{K_c}{T_c \cdot s + 1}</math> beschreibt die Kamera-Halterung: | |||
* <math>K_c = \frac{W}{\text{HFOV}}</math> ist die Verstärkung. | |||
* <math>T_c = \frac{1}{K_{p,\text{operationsverstärker}} \cdot K_{i,\text{winkel}}}</math> ist die Zeitkonstante. | |||
Die Eingangs-Sollgröße wird als Stufensignal mit der Amplitude 1 definiert. Ziel ist es, den Wert im stationären Zustand zu beobachten, wenn <math>t \to \infty</math>: | |||
<math> | |||
\lim_{s \to 0} G_w(s) = 1 | |||
</math> | |||
Die Eingangs-Störung wird als Stufensignal mit der Amplitude 1 definiert. Ziel ist es, den Wert im stationären Zustand zu beobachten, wenn <math>t \to \infty</math>: | |||
<math> | |||
\lim_{s \to 0} G_z(s) = 0 | |||
</math> | |||
*'''Die Implementierung des Regelungsprogramms''' | |||
Im folgenden Scroll-Fenster können die Details für Regelungsprogramm eingesehen werden. | |||
<div style="max-height:400px; overflow-y:auto; border:1px solid #ccc; padding:10px; background-color:#f8f8f8;"> | |||
<syntaxhighlight lang="python"> | |||
import cv2 | |||
from rpi_hardware_pwm import HardwarePWM | |||
import time | |||
import csv | |||
#glaobal variabel | |||
PWM_CHANNEL = 0 # PWM kanel0(GPIO12) | |||
# PID Parameter | |||
Kp = 0.015 # proportionkoeffizient | |||
Ki = 0.00001 # Integrationskoeffizient | |||
Integraltion = 0 | |||
Letzter_Fehler = 0 | |||
# Initialisierung pwm und Servo Motor | |||
def init_servo(): | |||
global pwm | |||
pwm = HardwarePWM(pwm_channel=PWM_CHANNEL, hz=50, chip=2) #Auswahl PWM-Ausgangspins | |||
pwm.start(0) | |||
def Einstellung_Servo_Winkel(Winkel): | |||
global pwm | |||
duty_cycle = 3 + (Winkel / 270.0) * 10 # Umwandlung des Winkels(0-270) in ein PWM-Signal | |||
pwm.change_duty_cycle(duty_cycle) # Einsatz fuer PWM-Signal | |||
# PID Regler | |||
def PID(Ziel_x, Aktuell_x): | |||
global Integraltion, Letzter_Fehler | |||
Fehler = Ziel_x - Aktuell_x | |||
Integraltion += Fehler | |||
Letzter_Fehler = Fehler | |||
PID_Ausgabe = Kp * Fehler + Ki * Integraltion | |||
return PID_Ausgabe | |||
# Haar-Kaskadenklassifikator laden | |||
def lade_gesichtskaskade(): | |||
haarcascade_pfad = cv2.data.haarcascades + 'haarcascade_frontalface_default.xml' # haarcascade_frontalface_default.xml ist ein gut trainiertes Gesichtserkennungsmodell. | |||
gesichtskaskade = cv2.CascadeClassifier(haarcascade_pfad) # mithilfe cv2.CascadeClassifier() wird Gesichtserkennungsmodell geladen | |||
return gesichtskaskade | |||
def Gesichtserkennung(Rahmen, gesichtskaskade): | |||
skalierungsfaktor = 1.1 | |||
min_nachbarn = 5 | |||
min_Groesse = (30, 30) | |||
Gesicht = gesichtskaskade.detectMultiScale( | |||
Rahmen, | |||
scaleFactor=skalierungsfaktor, | |||
minNeighbors=min_nachbarn, | |||
minSize=min_Groesse | |||
) | |||
return Gesicht | |||
# CSV Datei fuer Analyse | |||
def init_csv(filename): | |||
with open(filename, mode='w', newline='') as file: | |||
writer = csv.writer(file) | |||
writer.writerow(["Timestamp", "Zentral_Bild_x", "Zentral_x"]) # Titel | |||
def save_to_csv(filename, timestamp, Zentral_Bild_x, Zentral_x): | |||
with open(filename, mode='a', newline='') as file: | |||
writer = csv.writer(file) | |||
writer.writerow([timestamp, Zentral_Bild_x, Zentral_x]) | |||
def Kamera_Regelung(): | |||
csv_filename = 'Messdaten.csv' # initialisierung CSV Datei | |||
init_csv(csv_filename) | |||
init_servo() | |||
video_Erfassen = cv2.VideoCapture(0) # oeffnen kamera - Nr.0 | |||
gesichtskaskade = lade_gesichtskaskade() # Haar-Kaskadenklassifikator laden | |||
Aktuell_Winkel = 90 | |||
Einstellung_Servo_Winkel(Aktuell_Winkel) # initialisieren des servowinkels | |||
start_time = time.time() | |||
while time.time() - start_time < 20: # 20s zum Reglerung | |||
Bild_Breite = int(video_Erfassen.get(cv2.CAP_PROP_FRAME_WIDTH)) | |||
Bild_Hoehe = int(video_Erfassen.get(cv2.CAP_PROP_FRAME_HEIGHT)) | |||
Zentral_Bild_x = Bild_Breite // 2 | |||
ret,Rahmen = video_Erfassen.read() # Zum Lesen jedes einzelnen Frames aus der Kamera | |||
# ret: Ein boolescher Wert, der angibt, | |||
#ob das Videoframe erfolgreich gelesen wurde | |||
#frame: Das erfasste Bildframe | |||
Rahmen = cv2.cvtColor(Rahmen, cv2.COLOR_BGR2GRAY) # umwandlung zu binaerem Bild | |||
Gesicht = Gesichtserkennung(Rahmen, gesichtskaskade) # Gesicht Erkennung | |||
if len(Gesicht) > 0: # Stellen sicher, dass der Inhalt von Gesicht nur dann aufgerufen | |||
# wird, wenn ein Gesicht erkannt wurde. | |||
x, y, w, h = Gesicht[0] | |||
Zentral_x = x + w // 2 # Zentrumskoordinaten Berechnung | |||
PID_Ausgabe = PID(Zentral_Bild_x, Zentral_x) # PID Reglung | |||
Aktuell_Winkel += PID_Ausgabe # Aktualisierung des Winkels | |||
Aktuell_Winkel = max(0, min(270, Aktuell_Winkel)) # Winkel wird damit zwischen 0-270 Grad begrenzt | |||
Einstellung_Servo_Winkel(Aktuell_Winkel) | |||
# Messdatein fuer Analyse werden gespeichert | |||
save_to_csv(csv_filename, time.time(), Zentral_Bild_x, Zentral_x) | |||
cv2.imshow('Fenster', Rahmen) # Visualisierung | |||
# Druecken 'q' Tastatur zum Ende | |||
if cv2.waitKey(1) & 0xFF == ord('q'): | |||
break | |||
</syntaxhighlight> | |||
</div> | |||
Um das Verständnis dieses Regelungsprogramms zu erleichtern, zeigt die folgende Abbildung 26 die Hauptlogik und den Ablauf des Programms in Form eines Simulink-Modells. | |||
{| class="mw-datatable" | |||
! style="font-weight: bold;" | | |||
! style="font-weight: bold;" | | |||
|+ style = "text-align: left"| | |||
|- | |||
|[[Datei:Regelkreis Simulinkmodell.jpg|mini|700px|Abbildung. 26: Regelkreis Simulinkmodell<ref name="WanEFert"/>]] | |||
| | |||
|} | |||
Zur Bestimmung der Proportional- und Integralverstärkungen wurde zunächst die Methode von Ziegler/Nichols verwendet. Anhand der Diagramme wurden die Werte für <math>T_u</math>, <math>T_a</math>, <math>K_s</math> und <math>T_I</math> ermittelt, um daraus die Verstärkungskoeffizienten <math>K_p</math> und <math>K_i</math> abzuleiten. | |||
Nach Tests mit diesen Koeffizienten stellte sich jedoch heraus, dass das System instabil war. Dies ist vermutlich auf die unzureichende Anzahl der Abtastpunkte in den Diagrammen zurückzuführen, was zu falschen Koeffizienten führte. | |||
Schließlich wurde die Feinabstimmung der Koeffizienten durch eine empirische Methode vorgenommen: | |||
# Zunächst wurde <math>K_i</math> auf 0 gesetzt, um sich ausschließlich auf die Einstellung von <math>K_p</math> zu konzentrieren, sodass die Kamerahalterung so schnell und präzise wie möglich reagieren konnte. | |||
# Anschließend wurde <math>K_i</math> schrittweise kalibriert, um den stationären Fehler auszugleichen. | |||
====Kontrolleffekt des Regelkreises==== | |||
{| class="mw-datatable" | |||
! style="font-weight: bold;" | | |||
! style="font-weight: bold;" | | |||
|+ style = "text-align: left"| | |||
|- | |||
|[[Datei:Analyse Effekt Regler.jpg|mini|700px|Abbildung 27: Effekt der Regel<ref name="WanEFert"/>]] | |||
| | |||
|} | |||
'''1. Dynamische Leistung''' | |||
* Aus der Antwortkurve (rote Linie: ''Istgröße'', blaue Linie: ''Sollgröße'') ist zu erkennen, dass die tatsächliche Ausgabe (''Istgröße'') dem Sollwert (''Sollgröße'') unter der Wirkung des Regelkreises schnell folgt. | |||
* Das System zeigt einen schnellen Anstieg in der Anfangsphase (ca. 0-1,5 Sekunden) und erreicht nach etwa 1,5 Sekunden den stationären Zustand. | |||
'''2. Stationäre Leistung''' | |||
* Im stationären Zustand (ca. nach 1,5 Sekunden) ist der Fehler zwischen der tatsächlichen Ausgabe und dem Sollwert minimal und fast vernachlässigbar, was eine gute stationäre Genauigkeit des Systems zeigt. | |||
* Der stationäre Fehler nähert sich nahezu null, was die Erfüllung des Regelziels bestätigt. | |||
'''3. Stabilität des Systems''' | |||
* Aus dem Nullstellen- und Polstellen-Diagramm (zweite Abbildung) ist ersichtlich, dass der Pol des Systems in der linken Hälfte der komplexen Ebene liegt (s = -1,67), was darauf hinweist, dass das System stabil ist. | |||
* Es gibt keine Oszillationen, die Systemantwort ist eine exponentielle Dämpfung ohne Schwingungen. | |||
'''4. Zusammenfassung der Kontrolleffekte''' | |||
* Das Regelungssystem weist eine schnelle Reaktionsfähigkeit und gute stationäre Leistung auf, sodass es in kurzer Zeit den Sollwert verfolgen kann. | |||
* Sowohl die dynamische als auch die stationäre Leistung des Systems sind ausgezeichnet, was zeigt, dass das Design des Regelkreises die gewünschten Ziele erfüllt. | |||
==Spielablauf== | |||
''' Start Game'''<br> | |||
Die Funktion <code>startGame(Level)</code> initialisiert und startet einen separaten Thread für die Körpererkennung <code>cv_worker_thread</code>, um eine unabhängige Verarbeitung sicherzustellen, während das Spiel läuft. Sie setzt zudem den Schwierigkeitsgrad basierend auf dem übergebenen Parameter Level mithilfe der Funktion <code>setSkillLevel(SkillLevel.NONE)</code> und gibt diesen zur Kontrolle aus. Als Output ruft die Funktion schließlich die <code>play_game()</code>-Funktion auf, wodurch das eigentliche Spiel gestartet wird. | |||
<br> | |||
'''Play Game'''<br> | |||
Die Funktion <code>play_game()</code> steuert den Hauptspielablauf des Winkerraetsels, bei dem Körperposen analysiert werden, um Gesten zu erkennen. Sie initialisiert das Spiel, verarbeitet den Nutzer- und Kamerainput in vorm von Landmarken, und entscheidet abhängig vom Spielmodus <code>BEGINNER, PROFI, EXPERT</code> über Fortschritt und Spielende. Der Input umfasst Sensordaten (Körperwinkel), Benutzereingaben und Spielvorgaben wie Schwierigkeitsgrade und Lösungswörter. Die Ausgabe erfolgt über die bereits beschriebene LCD-Ausgabe. | |||
Die Besonderheiten der Funktion liegen in der dynamischen Anpassung an Schwierigkeitsstufen. Bei den Modi <code>BEGINNER</code> und <code>PROFI</code> wird das gesamte Lösungswort( einzelner Buchstabe) mit erkannten Buchstaben verglichen, während im <code>EXPERT</code>-Modus Buchstaben sequentiell auf das vorhanden sein in einem Wort geprüft werden. Die Funktion integriert eine Echtzeit-Verarbeitung von Körperwinkeln, die mit [[OpenCV mit Python|OpenCV]] berechnet und anschließend interpretiert werden. | |||
Das Spiel endet, wenn das Rätsel erfolgreich gelöst oder manuell abgebrochen wird. Die Funktion ruft hierzu die <code>close_game</code>-Funktion auf, um das Spiel erfolgreich zu beenden. Andernfalls wird die <code>play_game</code>-Funktion zyklisch mittels einer Schleife und einer generellen Wartezeit von 0,1 Sekunden ausgeführt, um die CPU zu schützen. Im zeitlichen Worst-Case ist durch das Gewinnen des Spiels mit Zykluszeiten von über 30 Sekunden zu rechnen.<br> | |||
'''Stop Game'''<br> | |||
Die vorliegende Funktion überwacht eine Bedingung<code> stop_game</code>, die bei Aktivierung den laufenden Spielprozess kontrolliert beendet. Hierbei wird insbesondere der parallel ausgeführte Thread <code>cv_worker_thread</code> entweder geordnet synchronisiert oder, falls erforderlich, mittels eines erzwungenen Stopps terminiert. Diese Vorgehensweise gewährleistet eine effiziente Ressourcennutzung und trägt zur Stabilität des Gesamtsystems bei. | |||
==Berechnung der Flaggensignale== | |||
=== Videosignal zu Winkel=== | |||
Da die Position der Arme beim Flaggenwinken in feste Bereiche mit einer festen Ausrichtung eingeteilt werden kann, ist die Idee, die Position der Arme mit grafischen oder geometrischen Verfahren zu bestimmen. | Da die Position der Arme beim Flaggenwinken in feste Bereiche mit einer festen Ausrichtung eingeteilt werden kann, ist die Idee, die Position der Arme mit grafischen oder geometrischen Verfahren zu bestimmen. | ||
Der Ansatz zur Umsetzung, beruht auf der Ausrichtung des Arms zur Körpermitte mit grafischen beziehungsweise geometrischen Methoden zu bestimmen. Hierzu wird der Körper des Spielers in einen rechten und einen linken Winkel unterteilt. Beide Winkel beginnen jeweils unten, also bei 6 Uhr, steigen über die Körperaußenseite nach 12 Uhr, bis sie in der Körpermitte wieder bei 6 Uhr angelangen. | |||
Zur Winkelberechnung wird der Vektor genutzt, der zwischen der Schulter- und der Ellbogen-Landmarke entsteht, sowie der Vektor, der als Körpermittelpunkt in der Mitte zwischen den Schultern und der Hüfte entsteht. | |||
Für eine erfolgreiche Winkelberechnung müssen demnach genau diese Punkte im Sichtfeld der Kamera sein. | |||
'''Vorkenntnisse - arctan2''' | |||
Mathematische Definitiont: | |||
<math> | |||
\text{arctan2}(y, x) = | |||
\begin{cases} | |||
\arctan\left(\frac{y}{x}\right), & x > 0 \\ | |||
\arctan\left(\frac{y}{x}\right) + \pi, & y \geq 0, x < 0 \\ | |||
\arctan\left(\frac{y}{x}\right) - \pi, & y < 0, x < 0 \\ | |||
\frac{\pi}{2}, & y > 0, x = 0 \\ | |||
-\frac{\pi}{2}, & y < 0, x = 0 \\ | |||
0, & y = 0, x = 0 | |||
\end{cases} | |||
</math> | |||
'''arctan2(y, x)''' ist eine häufig verwendete Funktion in Mathematik und Informatik, die den Winkel zwischen einem Punkt (x, y) im kartesischen Koordinatensystem und der positiven x-Achse berechnet. Im Vergleich zu der traditionellen Funktion '''arctan(y/x)''' unterscheidet '''arctan2''' präzise die Quadranten des Ergebnisses und behebt die Einschränkung, dass '''arctan(y/x)''' nur Werte im Bereich von −π/2 bis π/2 liefert. | |||
Der Wertebereich von '''arctan2''' liegt zwischen −π und π (entspricht −180° bis 180°). Mit einer einfachen Umrechnung können die Werte in den Bereich von 0° bis 360° konvertiert werden, was die Funktion besonders nützlich für die Umrechnung in Polarkoordinaten und geometrische Berechnungen macht. | |||
'''Theoretische Unterstützung''' | |||
Die folgenden drei Abbildungen zeigen der Reihe nach, wie der Prozess der Winkelumrechnung anhand der mit Mediapipe erkannten Schlüsselkoordinaten des Körpers berechnet wird. | |||
{| class="mw-datatable" | |||
! style="font-weight: bold;" | | |||
! style="font-weight: bold;" | | |||
|+ style="text-align: left" | | |||
|- | |||
|[[Datei:Pixel zu Kartesisches Koordinatensystem.jpg|mini|700px|Abbildung 28: Pixel zu Kartesisches Koordinatensystem<ref name="WanEFert"> | |||
WANG, Weiran, [kein Datum]. Eigene Anfertigung. [Bild] | |||
</ref>]]<br> | |||
|- | |||
|[[Datei:Kartesisches zu Polarkoordinatensystem.jpg|mini|700px|Abbildung 29: Kartesisches zu Polarkoordinatensystem<ref name="WanEFert"/>]]<br> | |||
|- | |||
|[[Datei:Winkelumrechnung.jpg|mini|700px|Abbildung 30: Winkelumrechnung<ref name="WanEFert"/>]] | |||
|- | |||
|} | |||
Variablenerklärung:<br> | |||
'''1. Pixel-Koordinatensystem zu Kartesisches-Koordinatensystem'''<br> | |||
*'''x_LS, y_LS''': x- und y-Koordinaten der linken Schulter<br> | |||
*'''x_RS, y_RS''': x- und y-Koordinaten der rechten Schulter<br> | |||
*'''x_MS, y_MS''': x- und y-Koordinaten des mittleren Schulterpunkts<br> | |||
<br> | |||
*'''x_LE, y_LE''': x- und y-Koordinaten des linken Ellbogens<br> | |||
*'''x_RE, y_RE''': x- und y-Koordinaten des rechten Ellbogens<br> | |||
<br> | |||
*'''x_LH, y_LH''': x- und y-Koordinaten der linken Hüfte<br> | |||
*'''x_RH, y_RH''': x- und y-Koordinaten der rechten Hüfte<br> | |||
*'''x_MH, y_MH''': x- und y-Koordinaten des mittleren Hüftpunkts<br> | |||
'''2. Kartesisches-Koordinatensystem zu Polarkoordinatensystem'''<br> | |||
*'''Winkel_1''': Winkel zwischen dem Rumpf und der positiven Richtung der X-Achse (Berechnung in Bogenmaß)<br> | |||
*'''Winkel_2''': Winkel zwischen der Richtung des linken Arms und der positiven Richtung der X-Achse (Berechnung in Bogenmaß)<br> | |||
*'''Winkel_3''': Winkel zwischen der Richtung des rechten Arms und der positiven Richtung der X-Achse (Berechnung in Bogenmaß)<br> | |||
'''3. Polarkoordinatensystem - Normalisierte Winkel'''<br> | |||
*'''Winkel_l_A_R''': Linksarmwinkel relativ zum Rumpf (Winkel linkem Arm zu Rumpf in Grad)<br> | |||
*'''Winkel_r_A_R''': Rechtsarmwinkel relativ zum Rumpf (Winkel rechtem Arm zu Rumpf in Grad)<br> | |||
'''Entwurf des Kalmanfilters'''<br> | |||
Bei praktischen Tests wurde festgestellt, dass der Körper des Spielers gelegentlich nicht korrekt erkannt wird, wenn er sich nicht im optimalen Sichtfeld der Kamera befindet, was zu erheblichen Abweichungen bei der Winkelberechnung führen kann. Außerdem erfordern bestimmte Körperhaltungen für Buchstaben im Spiel, dass der Spieler die Arme überkreuzt, was ebenfalls Fehler bei der Winkelberechnung verursachen kann. Zur Verbesserung der Messergebnisse kann der lineare Kalman-Filter eingesetzt werden, der durch seine Vorhersageeigenschaften präzisere Ergebnisse liefert. | |||
Die Zustandsvariablen sind das Herzstück des Kalman-Filters und beschreiben den aktuellen Zustand des Systems. In diesem Problem umfassen die Zustandsvariablen: | |||
* '''x₁''': Winkel (zwischen Arm und Körper, Einheit: Grad) | |||
* '''x₂''': Winkelgeschwindigkeit (Änderungsrate des Winkels, Einheit: Grad/Sekunde) | |||
* '''x₃''': Winkelbeschleunigung (Änderungsrate der Winkelgeschwindigkeit, Einheit: Grad/Sekunde²) | |||
Daher ist der Zustandsvektor definiert als:<br> | |||
<math> | |||
x = \begin{bmatrix} | |||
x_1 \\ | |||
x_2 \\ | |||
x_3 | |||
\end{bmatrix} | |||
</math> | |||
Die Zustandsübergangsmatrix A wird aus den Bewegungsgleichungen hergeleitet. Nachfolgend die einzelnen Schritte:<br> | |||
<math> | |||
x_1[k+1] = x_1[k] + x_2[k] \cdot dt + \frac{1}{2} x_3[k] \cdot dt^2 | |||
</math> | |||
<math> | |||
x_2[k+1] = x_2[k] + x_3[k] \cdot dt | |||
</math> | |||
<math> | |||
x_3[k+1] = x_3[k] | |||
</math> | |||
Die obigen Gleichungen lassen sich in Matrixform schreiben: | |||
<math> | |||
\begin{bmatrix} | |||
x_1[k+1] \\ | |||
x_2[k+1] \\ | |||
x_3[k+1] | |||
\end{bmatrix} | |||
= | |||
\begin{bmatrix} | |||
1 & dt & \frac{1}{2} dt^2 \\ | |||
0 & 1 & dt \\ | |||
0 & 0 & 1 | |||
\end{bmatrix} | |||
\begin{bmatrix} | |||
x_1[k] \\ | |||
x_2[k] \\ | |||
x_3[k] | |||
\end{bmatrix} | |||
</math> | |||
Die Zustandsübergangsmatrix A lautet: | |||
<math> | |||
A = | |||
\begin{bmatrix} | |||
1 & dt & \frac{1}{2} dt^2 \\ | |||
0 & 1 & dt \\ | |||
0 & 0 & 1 | |||
\end{bmatrix} | |||
</math> | |||
Bestimmung der Messrausch-Kovarianzmatrix R: | |||
Da nur der Winkel gemessen werden kann, ist R eine 1 X 1-Matrix. Der Parameter sigma_R kann durch die statische Analyse der gemessenen Winkelwerte bestimmt werden. Die folgenden Abbildungen zeigen die Analyse der Messwerte eines Sensors, der aus einer Kamera und einem Bildverarbeitungsalgorithmus besteht. Um die Messdaten aussagekräftiger zu machen und die Genauigkeit des Sensors besser zu repräsentieren, sollte während der Messphase der Arm möglichst stabil gehalten werden, um unnötige Bewegungen zu vermeiden und den Einfluss von Prozessrauschen auf die Messdaten zu reduzieren. Außerdem sollte bei der Datenanalyse ein Datenfenster mit einer festen Größe verwendet werden, um die Messwerte zu sampeln. Dies kann das Prozessrauschen in der Messanalyse bis zu einem gewissen Grad unterdrücken. Die folgenden Abbildungen zeigen die Analyse der Messwerte für 760 Daten, wobei die Analyse der 20. bis 0. Daten hervorgehoben ist. Aus den Daten ergibt sich, dass die Standardabweichung der Messwerte 0,1308 beträgt. Daher wird 0,1308^2 als Koeffizient für die Messfehlerkovarianzmatrix R des Kalman-Filters verwendet.<br> | |||
{| class="mw-datatable" | |||
! style="font-weight: bold;" | | |||
! style="font-weight: bold;" | | |||
|+ style="text-align: left" | | |||
|- | |||
|[[Datei:Statische Analyse des Messwinkels.jpg|mini|700px|Abbildung 31:Statische Analyse des Messwinkels<ref name="WanEFert"/>]]<br> | |||
|- | |||
|} | |||
Die Messrausch-Kovarianzmatrix R lautet:<br> | |||
<math> | |||
R = 0.1308^2 \cdot | |||
\begin{bmatrix} | |||
1 | |||
\end{bmatrix} | |||
</math> | |||
Bestimmung der Messrausch-Kovarianzmatrix Q: | |||
Das Systemrauschen beschreibt die Unsicherheiten im Zustandsmodell und spiegelt die Ungewissheiten wider, die im Prognoseprozess durch Modellvereinfachungen sowie externe zufällige Störungen eingeführt werden. Das Zustandsübergangsmodell in diesem Kalman-Filter, das den Winkel zwischen Arm und Körper beschreibt, wird als ideal angenommen, obwohl in der realen Bewegung nichtlineare Faktoren auftreten können. Darüber hinaus ist die Abtastzeit <math>dt</math> nicht konstant und weist Abtastzeitfehler auf. Daher wird der Koeffizient der Kovarianzmatrix Q auf einen größeren Wert gesetzt. Zusätzlich muss Qin Echtzeit entsprechend den unterschiedlichen <math>dt</math>-Werten aktualisiert werden.<br> | |||
<math> | |||
Q = 0.5^2 \cdot | |||
\begin{bmatrix} | |||
\frac{dt^4}{4} & \frac{dt^3}{2} & \frac{dt^2}{2} \\ | |||
\frac{dt^3}{2} & dt^2 & dt \\ | |||
\frac{dt^2}{2} & dt & 1 | |||
\end{bmatrix} | |||
</math> | |||
Bestimmung der Messmatrix H: <br> | |||
Die Messmatrix verknüpft den Zustandsvektor mit den tatsächlichen Messwerten. Da in diesem Problem nur eine einzelne Messeingabe vorhanden ist, wird H als 1x3 -Matrix definiert.<br> | |||
<math> | |||
H = | |||
\begin{bmatrix} | |||
1 & 0 & 0 | |||
\end{bmatrix} | |||
</math> | |||
Bestimmung der Zustands-Kovarianzmatrix P:<br> | |||
Die Zustands-Kovarianzmatrix beschreibt die Unsicherheiten in der Schätzung des Zustands. Die Anfangswerte der Zustands-Kovarianzmatrix wurden wie folgt festgelegt: Da der Anfangswinkel bekannt ist, wird ein kleiner Koeffizient gewählt. Die Winkelgeschwindigkeit und die Beschleunigung hingegen sind unbekannt und basieren auf Schätzungen, weshalb große Koeffizienten gewählt wurden.<br> | |||
<math> | |||
P = | |||
\begin{bmatrix} | |||
10 & 0 & 0 \\ | |||
0 & 100 & 0 \\ | |||
0 & 0 & 100 | |||
\end{bmatrix} | |||
</math> | |||
Darstellung des Filtereffekts: | |||
Die folgende Abbildung32 zeigt den gemessenen Winkel nach der Kalman-Filterung. Es ist ersichtlich, dass einige Störungen effektiv unterdrückt wurden. | |||
{| class="mw-datatable" | |||
! style="font-weight: bold;" | | |||
! style="font-weight: bold;" | | |||
|+ style="text-align: left" | | |||
|- | |||
|[[Datei:Gefilter Winkel.jpg|mini|700px|Abbildung 32: Gefilter Winkel<ref name="WanEFert"/>]]<br> | |||
|- | |||
|} | |||
=== Winkel zu Buchstabe=== | |||
Die Funktion <code>angleToLetter</code> interpretiert die Winkel zweier Arme (in Grad) und ordnet diese mithilfe einer Zuordnungstabelle einem Buchstaben des Semaphore-Flaggenalphabets zu. Sie berücksichtigt dabei eine Toleranz von ±20 Grad, um kleine Abweichungen in der Armhaltung auszugleichen, was die Robustheit der Zuordnung bei ungeübten Signalgebern erhöht.<br> | |||
Besonderheiten sind die Ruhestellung (0°/0°) und die Möglichkeit eines Korrektursignals(135°/45°) für den Expertenmodus | |||
---- | ---- | ||
= Komponententest = | = Komponententest = | ||
Der Komponententest dient der Überprüfung einzelner Module oder Funktionen eines Softwaresystems in Isolation, um deren korrekte Funktionalität sicherzustellen und zu Belegen. | |||
== | == Video zu Winkel== | ||
<br>'''Testbeschreibung'''<br> | |||
Dieser Test überprüft die korrekte Berechnung der Winkel, basierend auf den aus dem Video extrahierten Landmarken. Die Überprüfung wird für zwei Punkte durchgeführt: | |||
* Überprüfung, ob eine Winkelberechnung basierend auf künstlich erzeugten Landmarken korrekt durchgeführt wird. | |||
* Überprüfung der Stabilität der Funktion, insbesondere ob sie auch mit untypischen Eingaben umgehen kann. | |||
== | <br>'''Test'''<br> | ||
Das Ergebnis des Tests ist auf den ersten Blick weniger erfreulich, da dem Dokument in beiden aufgezählten Fällen ein Durchfallen zu entnehmen ist. Genauer betrachtet ist jedoch zu erkennen, dass der berechnete Winkel lediglich 15 Grad vom erwarteten Winkel abweicht. Diese geringe Abweichung ist vor allem vor dem Hintergrund, dass hauptsächlich ungeübte Spieler und nicht Profis aus der Seefahrt als Zielgruppe in Frage kommen, vernachlässigbar. Zudem war während der Entwicklung in keiner gespielten Runde ein Abweichen der gezeigten und der gemessenen Position wahrnehmbar. | |||
<br> Der zweite Punkt, der sich auf die Stabilität der Funktion bezieht, zeigt, dass trotz der guten Qualität des Codes eine Verbesserung in Zukunft notwendig ist. Eine umgehende Dringlichkeit besteht jedoch nicht, da ein Abstürzen des Spiels aus diesem Grund zu keinem Zeitpunkt aufgetreten ist. | |||
<br>'''Testbericht'''<br> | |||
[[Datei:TestReport GetAngleFromVideo.pdf|200px|rahmenlos|links|Dokument. 1: Testbericht Video zu Winkel]] | |||
<br> | |||
== Winkel zu Buchstaben == | |||
'''Testbeschreibung'''<br> | |||
Ziel dieses Tests ist es, die Einteilung des linken und des rechten Kreises in die korrekten und zugehörigen Buchstaben zu prüfen. Hierzu wird die Funktion <code>angle_to_letter</code> isoliert betrachtet, um Einflüsse anderer Funktionen auszuschließen. | |||
Getestet werden die folgenden Fälle:<br> | |||
* Durchlauf aller korrekten und zugehörigen Winkel. | |||
* Prüfung, ob zufällig ausgewählte Winkel inkl. Toleranz korrekt eingeteilt werden. | |||
* Die Stabilität der Funktion bei Eingaben mit <code>None</code>. | |||
* Das Verhalten bei der Eingabe von nicht validen, negativen Winkeln. | |||
* Das Verhalten bei der Eingabe von Winkeln außerhalb eines Toleranzwertes. | |||
<br>'''Test'''<br> | |||
Das Testen mit der Python-Bibliothek unittest ermöglicht die strukturierte Überprüfung von Funktionen und Modulen auf korrekte Funktionalität, indem erwartete Ausgaben mit tatsächlichen Ergebnissen verglichen werden. So könenn zum Beispiel <code> assert</code>-Funktionen verwednet werden um annahmen mit dem Tatsächlichen rückgabewert zu vergelichen. | |||
<syntaxhighlight lang="python"> | |||
import unittest | |||
from BodyPoseEstimation import angleToLetter | |||
class TestAngleToLetter(unittest.TestCase): | |||
def test_valid_angles(self): | |||
self.assertEqual(angleToLetter(0, 45), "A") | |||
def test_tolerance(self): | |||
self.assertEqual(angleToLetter(5, 50), "A") | |||
def test_outside_tolerance(self): | |||
self.assertIsNone(angleToLetter(10, 70)) | |||
def test_none_inputs(self): | |||
self.assertIsNone(angleToLetter(None, 0)) | |||
def test_invalid_angles(self): | |||
self.assertIsNone(angleToLetter(-10, 0)) # Negativer Winkel | |||
</syntaxhighlight> | |||
'''Testbericht'''<br> | |||
Als Ergebnis kann ein Testreport ausgegeben werden, mit dem Ergebnis, dass bis auf einen Test alle Tests erfolgreich waren. Durchgefallen ist die Funktion beim Punkt ''test_outside_tolerance'', was darauf zurückzuführen ist, dass sie kein Verhalten zeigt, wenn keine validen Winkel erkannt wurden. Demnach beeinflusst das Durchfallen in keiner Weise die Funktionalität dieser oder anderer Funktionen. | |||
<br>[[Datei:TestReport test angel to letter.pdf|200px|Dokument. 1: Testbericht Winkel zu Buchstabe]]<br> | |||
= Ergebnis = | = Ergebnis = | ||
{| class="wikitable" | |||
! ID !! Anforderung !! Beschreibung !! Status !! Anmerkung | |||
|- | |||
| 1.1 || Personenerkennung || | |||
[[Datei:Personenerkennung.jpg|center|100px|Abbildung 33: Visualiserung einer erkannten Person <ref name="LipEigen"/>|mini]] | |||
|| OK || | |||
|- | |||
| 1.2, 1.3 || Armerkennung und Winkelberechnung || [[Winkerrätsel - Entschlüsselung der Signalcodes#Video zu Winkel|Ergebnis Komponententest]]|| Teilweise OK || Abweichung, aber kein Einfluss auf Funktion | |||
|- | |||
| 1.4 || Winkel zu Buchstaben || [[Winkerrätsel - Entschlüsselung der Signalcodes#Winkel zu Buchstaben|Ergebnis Komponententest]] || Teilweise OK || Funktion ok. Fehlerbehandlung fehlerhaft | |||
|- | |||
| 1.5 || Rückmeldung für Buchstaben || | |||
[[Datei:Screenshot LCD Simulation.jpg|rahmenlos|center|100px|]]<ref name="LipEFert"> | |||
LIPINSKI, Benedikt, [kein Datum]. Eigene Anfertigung. [Bild] | |||
</ref> | |||
|| OK || | |||
|- | |||
| 1.6 || Rückmeldung für richtigen Input || <syntaxhighlight lang="python"> | |||
if round_counter >= 3: | |||
if game_settings_engine.puzzleWord[0] == recognized_letter: | |||
lcd_instance.Entfernen() | |||
lcd_instance.Eine_Seite_Zeichenkette(2,1,"Richtig !") | |||
</syntaxhighlight> ,Abbildung: Spiel im Experten-Modus || OK || | |||
|- | |||
| 1.7 || Ausgabe des Lösungsworts || | |||
<syntaxhighlight lang="python"> | |||
if round_counter >= 3: | |||
lcd_instance.Mehr_Seite_Zeichenkette(1,1, str(game_settings_engine.getPinCode())) | |||
time.sleep(30) | |||
</syntaxhighlight> | |||
|| OK || | |||
|- | |||
| 1.8 || Verwendung von OpenCV || Informationen im Abschnitt: [[Winkerrätsel - Entschlüsselung der Signalcodes#BodyPoseEstimation Modul|BodyPoseEstimation Modul]] || OK || inkl. Mediapipe als Erweiterung | |||
|- | |||
| 1.9 || Kameraauflösung || siehe: Abbildung: 33 Visualiserung einer erkannten Person|| OK || Die Person muss nur vom Kopf bis knapp unter der Hüfte zu sehen sein (Vorteil von ML, teilweise nicht mal die Hüfte) | |||
|- | |||
| 1.10 || SPielstart per Button | |||
|| [[Datei:SpielStarten perButton.jpg|rahmenlos|center|100px|]] <ref name="LipEFert"/>|| OK || | |||
|- | |||
| 1.11 || Schwierigkeitsgrad || | |||
[[Datei:Schwierigkeitsgrad.jpg|rahmenlos|100px|zentriert]]<ref name="LipEFert"/> | |||
|| OK || | |||
|- | |||
| 1.12 || Verwendung von Wörtern im Experte modus | |||
|| [[Datei:VIdeoForWiki.gif|mini|100px|Abbildung. 34: Spiel im Experten-Modus<ref name="LipEigen"/>|zentriert]] || OK || | |||
|- | |||
| 1.13 || Anzeige es bisher eingegebenen Worts||siehe: Abbildung: 34 Spiel im Experten-Modus|| OK || | |||
|- | |||
| 1.14 || Löschen von Zeichen durch Flaggensignal|| siehe: Abbildung: 34 Spiel im Experten-Modus|| OK || | |||
|- | |||
| 1.15 || Matlab || [[Winkerrätsel_-_Entschlüsselung_der_Signalcodes#Wahl der Programmiersprache|Verwendung von Python]]|| Nicht OK || Gründe für Python im WIKI | |||
|- | |||
| 1.16 || Hilfe im Beginner || | |||
[[Datei:Screenshot Hilfe.jpg|100px|rahmenlos|zentriert|Abbildung: Aktivierte Hilfe]]<ref name="LipEFert"/> | |||
|| OK || | |||
|} | |||
== Fehler == | == Fehler == | ||
Bei der Umsetzung der WinkerGame-Software wurde von Anfang an, auch aus Gründen des gemeinsamen Arbeitens, Wert auf Modularität und Austauschbarkeit gelegt. Dies hatte in einigen Fällen jedoch zur Folge, dass der Code eine gewisse Komplexität erreichte. | |||
Infolgedessen kommt es vor allem bei der grafischen Darstellung des Videobildes zu starken Performanceeinbußen. | |||
Leider wirkt sich dies auch auf den Startvorgang der Körperposenerkennung aus, der in ungünstigen Situationen mehr als 20 Sekunden dauern kann. Eine Maßnahme besteht darin, die Videoerkennung nicht zu beenden und den entsprechenden Thread dauerhaft am Leben zu halten. | |||
Da die Software ursprünglich als Stand-alone-Anwendung ohne Videobild geplant war, ist dieser Fehler nicht allzu dramatisch einzustufen. Dennoch ist die Videoausgabe für Vorführungen ein beeindruckendes Element, welches gegebenenfalls noch optimiert werden sollte. | |||
= Zusammenfassung = | = Zusammenfassung = | ||
== Lessons Learned == | == Lessons Learned == | ||
Wie bereits im Kapitel [[Winkerrätsel - Entschlüsselung der Signalcodes#Fehler|Fehler]] angesprochen, ist das größte Problem der Software die niedrige Performance. | |||
Wie ebenfalls in [[Winkerrätsel - Entschlüsselung der Signalcodes#Fehler|Fehler]] angedeutet, könnte dies auf den komplexen und teilweise chaotischen Code zurückgeführt werden, was mit der Umsetzung per Low-Code-Programmierung, z. B. in Matlab-Simulink, nicht in diesem Ausmaß aufgetreten wäre. | |||
Das "Lessons Learned", das für die Beteiligten unterm Strich aus diesem Projekt mitgenommen wird, ist, dass ein strukturiertes Vorgehen bei der Entwicklung komplexer Software im Team unerlässlich ist. | |||
Defizite, die in diesem Kontext zu benennen wären: | |||
*Fehlende Absprachen über konventionelle Themen, zum Beispiel bei Funktionen oder Variablenbezeichnungen, was das Verständnis des Codes der Partner nur auf Basis des Codes erschwerte und regelmäßig in Meetings geklärt werden musste. | |||
*Eine sinnvolle und klare Trennung von Struktur, Eingabe und Grafikanwendungen, was zur Folge hatte, dass zusammengehörende Funktionen verteilt wurden und eine Analyse, z. B. der Performanceprobleme, schwierig gestalteten<br> | |||
Alles in allem wurden die geforderten Funktionen umgesetzt, allerdings ist bei der Qualität des entwickelten Codes und der Codeorganisation noch Luft nach oben. | |||
= Projektunterlagen = | = Projektunterlagen = | ||
Alle für das Spiel notwendigen daten, können aus dem SVN der Hochschule Hamm-Lippstadt unter dem folgenden link bezogen werden. <br> | |||
Projektordner: [https://svn.hshl.de/svn/Elektrotechnik%20Fachpraktikum/trunk/Projekte/172-184/181%20Winkerraetsel/ SVN-Projektordner] <br> | |||
Wikidaten: [[Datei:Winkerraetsel BSE4.zip|mini]] <br> | |||
== Projektplan == | == Projektplan == | ||
== | ===Zeitplanung=== | ||
[[Datei:ZeitlinieWinkerraetsel.png|700px|center|thumb|Bild 35: Relevante, technische Komponenten des Winkerrätsels]] | |||
= YouTube Video = | = YouTube Video = | ||
{{#ev:youtube| https://youtube.com/watch?v=1Z9MqzDy5oc?feature=share | 800 | | Ergebnisvideo für das Escape Game: Winkerrätsel - Entschlüsselung des Signalcodes <ref name="WanEigen"/>|frame}} | |||
= Quellen = | = Quellen = |
Aktuelle Version vom 17. Januar 2025, 20:13 Uhr
Autoren: | Benedikt Lipinski und Weiran Wang |
Betreuer: | Prof. Schneider |
Einleitung
Unter Flaggenwinken versteht man in der Nautik nicht das wilde Gestikulieren mit einer Fahne, sondern vielmehr ein komplexes System rein optischer Kommunikation. Während sich an Land schon früh die Kommunikation mittels optischer Telegrafie durchsetzte[1], wurde auch in der Schifffahrt die Kommunikation mittels Flaggenzeichen, den so genannten Semaphoren, immer populärer. Heute wird aufgrund der leistungsfähigen Funktechnik in der Regel nicht mehr mit Flaggen kommuniziert. Dennoch soll die Kommunikation via flaggen auch im Zeitalter der Elektronischen kommunikation zum Einsatz kommen, z.B. von der US Navy bei der Betankung von Schiff zu Schiff.[2]
Der Spieler soll nun selbst die Rolle eines Kommunikationspartners übernehmen und seinem Gegenüber (dem Spiel) eine geheime und verschlüsselte Nachricht zukommen lassen.
Theoretische Grundlagen
Flaggen Semaphore
Eine Kommunikation über Flaggen ist, anders als man auf den ersten Blick vermuten könnte, gar nicht so weit von der Kommunikation entfernt, die uns Studierenden der 2020er Jahren in den Informatikmodulen gelehrt wird[3]. Denn die in dem "Video 1" zusehende und für Menschen lesbare Codierung einzelner Flaggenpositionen ist nichts anderes als die Codierung von Zeichen in eine Bitfolge, nur dass sich an dieser Stelle die Codierung der Nachricht und das Transportprotokoll unterscheiden[4]. Die Kommunikation mit den Flaggen beginnt mit der Aufforderung zum Verbindungsaufbau (Attention #Anker:AttentionMessage).
# | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
1 | A | 2 | B | 3 | C | 4 | D | ||||
5 | E | 6 | F | 7 | G | 8 | H | ||||
9 | I | 10 | J | 11 | K | 12 | L | ||||
13 | M | 14 | N | 15 | O | 16 | P | ||||
17 | Q | 18 | R | 19 | S | 20 | T | ||||
21 | U | 22 | V | 23 | W | 24 | X | ||||
25 | Y | 26 | Z |
Vom Videobild zum Buchstaben
Die Zuordnung von Armbewegungen zu Buchstaben basiert auf der Analyse der Flaggenhaltung durch einen Erkennungsalgorithmus, der Schlüsselpunkte der Körpermitte zur Flaggenposition in einem Bild oder Video identifiziert. Mithilfe geometrischer Berechnungen werden die relativen Winkel zwischen den Gelenkpunkten berechnet. Diese Winkel werden mit vordefinierten Bewegungsmustern oder statischen Positionen verglichen, die nach dem Semaphore-System in 1/8-Teile aufgeteilt wurden. Ein möglicher Ansatzpunkt ist die Berechnung des Winkels zwischen Ober- und Unterarm sowie der Körpermitte, die, aufgeteilt zwischen rechts und links, die in Tabelle 1 gezeigte Zuordnung beschreiben können. Die Genauigkeit der Zuordnung hängt von der präzisen Schlüsselpunkterkennung und einer klaren Definition der Buchstabenpositionen ab.
Dieses System nutzt Algorithmen der Bidlverarbeitung und der angewandten Trigonometrie unter Zuhilfenahme von Machine-Learning-Algorithmen, um definierte Körperpositionen in Form von Landmarken zu bestimmen, die Position in Echtzeit auszuwerten und zu interpretieren. Neben der Verwendung von Machine-Learning-Ansätzen sind auch Ansätze denkbar, die ausschließlich Bildverarbeitung nutzen. Eine mögliche Umsetzung wäre, die klar definierte Flagge mit ihren beiden Dreiecken in Gelb und Rot als Referenz für die Position und Haltung zu verwenden.
Bestehende Arbeiten
Die Eingabe von Flaggensignalen in ein Computersystem ist nicht nur als Rätsel für ein Escape-Game interessant, sondern auch in anderen Projekten ein nicht zu vernachlässigender Faktor. Beispielsweise kann die Abbildung des Flaggenalphabets auf die Arme eines Benutzers dazu verwendet werden, Tastenanschläge auf der Tastatur zu simulieren. Ein Beispiel dafür ist das GitHub-Projekt des Entwicklers everythingishacked, der eine vollständige Tastatursimulation mit Hilfe von Handsemaphoren in Python umgesetzt hat[5]. Auch in der Mathematiksoftware Matlab gibt es bereits Beispiele für Vorstufen einer Armpositionserkennung[6] In beiden Fällen führt der Weg zur Buchstabenerkennung über den Schritt einer Schätzung der Körperhaltung. Konkret ist in diesem Fall die Ermittlung mittels Deep Learning Algorithmen gemeint.
Anforderungen
ID | Inhalt | Erstellt von: | Erstellt am: | Geprüft von: | Geprüft am: | |
---|---|---|---|---|---|---|
1 | System Anforderungen | |||||
1.1 | Das System muss eine Person durch bildbasierte Verfahren identifizieren. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
1.2 | Das System muss die Armhaltung erkennen. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
1.3 | Das System muss die Position der Arme in Winkel umwandeln. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
1.4 | Das System muss die Winkel in Buchstaben einteilen. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
1.5 | Das System muss eine Rückmeldung über den eingegebenen Buchstaben geben. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
1.6 | Das System muss eine Rückmeldung über die richtige Eingabe signalisieren, wenn der Buchstabe richtig angezeigt wird. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
1.7 | Das System muss bei korrekter Eingabe eine korrekte Stelle des Lösungswortes ausgeben. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
1.8 | Zur Erkennung der menschlichen Körperhaltung ist die Open-CV-Bibliothek zu verwenden. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
1.9 | Die verwendete Kamera muss eine Auflösung haben, bei der eine Person vollständig in das Bild passt. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
1.10 | Das Spiel soll per Knopfdruck oder über eine angeschlossene Tastatur gestartet werden. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
1.11 | Der Schwierigkeitsgrad muss über eine Taste oder eine angeschlossene Tastatur einstellbar sein. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
1.12 | Im Profi-Spielmodus sollen nicht nur Buchstaben, sondern auch kurze Wörter oder Zahlen eingegeben werden. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
1.13 | Im Expert-Spielmodus soll die bisherige Eingabe auf dem Bildschirm angezeigt werden. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
1.14 | Im Spielmodus Expert muss das Löschen der letzten Ziffer durch ein Flaggensignal möglich sein. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
1.15 | Das System soll nach Möglichkeit in Matlab realisiert werden; sollten gute Gründe gegen die Verwendung von Matlab sprechen, wird alternativ die Sprache Python verwendet. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
1.16 | Im Anfängermodus soll die spielende Person eine Hilfestellung erhalten | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
2 | Oganisatorische Anforderungen | |||||
2.1 | Das Rätsel soll nach Erklärung innerhalb von 5 Minuten lösbar sein. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
2.2 | Das Puzzle soll verschiedene Schwierigkeitsgrade haben. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
2.3 | Das Material zum Verständnis des Puzzles sollte in nicht-elektrischer Hardware vorhanden sein. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 | |
2.4 | Das System muss zur Aufbewahrung und zum Transport in einen Schuhkarton passen. | Benedikt Lipinski | 10.10.2024 | Weiran Wang | 10.10.2024 |
Funktionaler Systementwurf/Technischer Systementwurf
Funktionaler Systementwurf
Als Vorbereitung für das Winkerrätsel, zunächst durch die spielende Person, der Schwierigkeitsgrad gewählt werden. Das Spiel beginnt bei dem Winkerrätsel nicht mit dem drücken eines Startbuttons oder ähnlichem, sondern in Escape-Room Manier mit dem erkennen des Problems selbst. Hierzu bekommt die Spielende Person nach einstellen des Schwierigkeitsgrades, lediglich die 2 Flaggen und Literatur über Signale ausgehändigt. Somit ergibt sich als erste Aufgabe für die Spielenden, unter zu Hilfenahme der Flaggen zu erkenne, dass es sich bei der geforderten Aufgabe um das Winkeralphabet handelt. Mit der Erkenntnis aus der Literatur und der Tatsache, dass die spielende Person bereits unweigerlich Feedback zur erkannten Position bekommen wird, sollte durch die spielende Person kombiniert werden, nun mittels Körperposition
den erhaltenen Rätselcode einzugeben.
Die spielende Person wird aufgrund des grafischen Feedbacks schnell verstehen, dass bei korrekter Eingabe eines Buchstabens, dieser umcodiert wird.
Für den Spielmodus Profi, bei dem die spielende Person kleine Wörter aus der gängigen Sprache oder dem Internationalen Signal Kommunikation verwendet werden, bekommt die nutzende Person die bereits korrekt eingegebenen Buchstaben aufgelistet. Zudem wird der nutzenden Person aufgezeigt ob die eingegebene stelle korrekt oder falsch ist. Ziel ist es an dieser stelle, das Korrektur Signal zu benutzen.
Mit der erfolgreichen Entschlüsselung der letzten Stelle, hat die spielende Person das Rätsel beendet und sich innerhalb des gesamten Spiels Schritt für schritt das Lösungswort erspielt. An dieser stelle ist nun auch das Winkerrätsel beendet. Grundsätzlich stehen der spielenden Person 3 Spielmodi zur Verfügung. Leicht: hier soll eine visuelle Hilfestellung für die spielende Person gegeben werden, diese muss durch die spielende Person nur noch Nach gemacht werden.
Im fortgeschrittenen Modus muss die Spielende Person, sich nun selbst an die Einzunehmende Position erinnern oder im Buch nachschlagen. Eingegeben werden müssen in diesem Modus auch nur einzelne Buchstaben.
Der schwierigste Spielmodus, nur geeignet für Profis, fordert von der nutzenden Person die Eingabe kurzer Wörter, was gegebenen falls das Korrigieren der Eingabe nötig macht.
Der Ablauf des Winkerrätsels, wie er aus der Sicht des Anwenders dargestellt werden soll, kann dem Ablaufschema in Abbildung 2 entnommen werden. Dieses Aktivitätsdiagramm konnte anschließend in einen konkreten Programmablaufplan überführt werden, der in den Abbildungen 3 und beispielhaft für die drei Schwierigkeitsgrade in Abbildung 4, die den Modus "Beginner" darstellt, gezeigt ist.
-
Abbildung: 2 Aktivitätsdiagramm des Spielablaufs
-
Abbildung: 3 Programmablaufplan des Hauptprogramms
-
Abbildung 4 Programmablaufplan der Unterfunktion Beginner
Technischer Systementwurf
Da der im Arduino Uno R3 verwendete Atmega328-Mikrocontroller hinsichtlich Datenverarbeitung, RAM und Flash-Speicher begrenzt ist und somit für Bildverarbeitungsaufgaben ungeeignet, wird der Raspberry Pi 5B als Ersatz eingesetzt, um die Kernaufgaben der maschinellen Bildverarbeitung zu übernehmen. Das System wird über ein 5V 5A Netzteil mit Strom versorgt, um den stabilen Betrieb aller Geräte zu gewährleisten.
In diesem Flaggen-Signal-Interaktionssystem fungiert eine Kamera als Sensor, die über das USB-Protokoll Bilddaten an den Raspberry Pi 5B überträgt. Der Raspberry Pi 5B verwendet vordefinierte Algorithmen, um die von den Spielern eingegebenen Flaggen-Signale zu erkennen, und gibt Rückmeldungen über ein 128x64 Pixel Display aus. Das Display ist über das SPI-Protokoll mit dem Raspberry Pi 5B verbunden, um eine effiziente Datenübertragung sicherzustellen.
Darüber hinaus ist das System mit einem Moduswahlknopf ausgestattet, der an die GPIO-Pins des Raspberry Pi 5B angeschlossen ist. Durch Überwachung der Spannungsänderungen an den Pins kann das System die Benutzereingaben erkennen und verarbeiten.
Das gesamte System wird auf einer speziell angefertigten Leiterplatte integriert, um eine saubere und zuverlässige Verbindung der Leitungen sicherzustellen und das Gerät erfolgreich in ein Gehäuse von der Größe einer Schuhschachtel einzubauen.
Eine Gesamtübersicht über die beschriebenen Komponenten und ihre Verknüpfung ist in "Bild 3" dargestellt.
Komponentenspezifikation und Stückliste
ID | Anzahl | Kosten pro Stück € | Summe | Bezeichnung / Komponente | technische Bezeichnung | Abbildung |
---|---|---|---|---|---|---|
1 | 1x | 104,50€ | 104,50€ | RASP PI 5B 4GB mit Ladegerät und Gehäuse | RPI5 BBDL 4GB Das Raspberry PI 5 B 4GB Black Bundle | [7] |
2 | 1x | 0,2€ | 0,2€ | Kurzhubtaster | JTP-1130 Kurzhubtaster 6x6 mm, Höhe: 13 mm, 12 V, vert | [8] |
3 | 1x | 9,9€ | 9,9€ | LCD128X64 | DEBO LCD128X64 Entwicklerboards - Display Grafik-LCD, 128x64 Pixel | [9] |
4 | 1x | 14,95€ | 14,95€ | Webcam | AMDIS03B Webcam, 720p, HDready | [10] |
5 | 2x | 0 € | 0 € | Signalflaggen | Selbst hergestellt | |
6 | 1x | 0€ | 0€ | Map mit Flaggensignalen | Kopie aus dem Buch Querweltein[12] |
|
Umsetzung HW
Schaltungsentwurf
-
Abildung 5: Verkabelungsplan
-
Abildung 6: Schaltplan
-
Abildung 7: Platine Vorderseite [13]
-
Abildung 8: Platine Rueckseite [13]
-
Abildung 9: Vorderseite Lochrasterplatine nach Löten [14]
-
Abildung 10: Rückseite Lochrasterplatine nach Löten [14]
- Die Abbildung 5 zeigt das mit Fritzing erstellte Gesamtlayout der Verbindungen und erleichtert
die schnelle Umsetzung des Projektprototyps - Abbildung 6 zeigt das entsprechende Schaltplan-Diagramm, das mit Multisim erstellt wurde.
- Abbildungen 7 und 8 stellen das Leiterplattendesign basierend auf dem Schaltplan dar.
Die Leiterplatte hat die Abmessungen 90x150 mm, wodurch sie nicht nur alle Hardware-
Komponenten aufnehmen kann, sondern auch die Anforderung erfüllt, dass das Gerät in eine
Schuhschachtel passen muss. - Die Abbildung 9 und 10 zeigt die bearbeitete Leiterplatte. Aufgrund eingeschränkter Bedingungen konnte keine
gedruckte Leiterplatte (PCB) hergestellt werden, sodass die Schaltung auf einer Lochrasterplatine
aufgebaut wurde. Um die Lötarbeit zu erleichtern, wurde das ursprüngliche Leiterbahn-Design angepasst,
sodass es besser auf der Lochrasterplatine realisiert werden kann.
Beschreibung der Verbindung
LCD128x64 mit Raspberry Pi 5
- Der digitale Pin GPIO25 des Raspberry Pi 5 wird als Chip-Select-Pin verwendet und mit dem Chip-Select-Pin RS des LCD-Bildschirms verbunden.
- Der SPI-Daten-Pin GPIO10 (MOSI) des Raspberry Pi wird mit dem RW (MOSI)-Pin des LCD-Bildschirms verbunden.
- Der SPI-Takt-Pin GPIO11 (SCK) des Raspberry Pi wird mit dem E (SCK)-Pin des LCD-Bildschirms verbunden.
- Der PSB-Pin des LCD-Bildschirms wird mit GND verbunden, um den Pegel auf Low zu setzen und damit die SPI-Kommunikation zu aktivieren.
- Das LCD-Modul wird über die Pins GND (-) und VCC (+) mit 5V-Stromquelle versorgt.
- Die Hintergrundbeleuchtung wird über die Pins BLK (-) und BLA (+) mit 5V-Stromquelle versorgt.
AMDIS03B Webcam mit Raspberry Pi 5
- Verbinden Sie den USB-Anschluss der AMDIS03B Webcam direkt mit einem beliebigen USB 3.0-Port des Raspberry Pi 5.
Taste mit Raspberry Pi 5
- Die erste Taste wird mit einer Seite an den GPIO26 des Raspberry Pi und mit der anderen Seite an GND angeschlossen.
- Die zweite Taste wird mit einer Seite an den GPIO16 des Raspberry Pi und mit der anderen Seite an GND angeschlossen.
LED mit Raspberry Pi 5
- Der positive Pol der LED wird mit dem GPIO6 des Raspberry Pi verbunden.
- Ein 150Ω-Überstromschutzwiderstand wird zwischen den negativen Pol der LED und GND geschaltet.
Servo MG996R mit Raspberry Pi 5
- MG996R wird mit dem GPIO19 des Raspberry Pi verbunden, da dieser Pin ein präzises Hardware-PWM-Signal erzeugen kann.
- MG996R-Servos wird mit ihren GND (-) und VCC (+) an 5V-Stromquelle angeschlossen.
Strukturentwurf
Hauptteil
-
Abildung 11: Hauptteil [14]
-
Abildung 12: Gehäuseteil 1[13]
-
Abildung 13: Gehäuseteil 2[13]
-
Abildung 14: Gehäuseteil 3[13]
-
Abildung 15: Platine Masss[13]
-
Abildung 16: Montage Effekt[13]
Abbildungen 11 - 16 zeigen die Gesamtstruktur des Geräts, die aus einer Bodenplatte, einer Leiterplatine, einem Gehäuse und zwei Tastenabdeckungen besteht. Die Abmessungen der einzelnen Komponenten wurden nach präzisen Messungen und Bewertungen streng festgelegt und sind in ihren jeweiligen Dreitafelprojektionen klar ersichtlich. Die mit dem Gehäuse verbundenen Teile werden vollständig im 3D-Druckverfahren hergestellt. Das Gehäusedesign verbindet Ästhetik mit Funktionalität: Es hebt die Tasten und den Bildschirm als die zentralen interaktiven Hardwareelemente für den Benutzer hervor und bietet gleichzeitig die erforderlichen Anschlüsse für externe Geräte. Darüber hinaus schützt das Gehäuse die internen Schaltkreise, indem es verhindert, dass leitfähige Materialien die Leiterplatte berühren und Kurzschlüsse verursachen, oder dass die ICs durch statische Hochspannung der Benutzer beschädigt werden. Durch ein optimiertes Belüftungsdesign wird außerdem eine effiziente Wärmeableitung gewährleistet, wodurch sichergestellt wird, dass der Raspberry Pi während des Betriebs eine stabile Temperatur beibehält und die Zuverlässigkeit des Systems gewährleistet ist.
Kamerahalterung
-
Abildung 17:Monate Kamerahaltung[14]
-
Abildung 18: Kamerahalterung Basis[13]
-
Abildung 19: Kamerahalterung Verbindung[13]
-
Abildung 20: Kamerahalterung Montage[13]
Die obige Abbildung zeigt das Design der Kamerahalterung. Beide Komponenten werden mittels 3D-Drucktechnologie hergestellt. Die Basis dient zur Befestigung der Drehachse des MG996R-Servomotors, während das Verbindungsbauteil zur Befestigung der Kamera und des Servomotorgehäuses verwendet wird. Die Kombination dieser Komponenten bietet der Kamera einen Rotationsfreiheitsgrad und ermöglicht somit die Regelung der Kamera.
Umsetzung SW
Wahl der Programmiersprache
Dieses Projekt wurde in der Interpretersprache Python umgesetzt. Da Python sowohl auf den für die Entwicklung verwendeten Windows-Systemen eingesetzt werden kann, als auch auf dem Zielsystem Raspberry Pi verfügbar ist. Für eine korrekte Bildverarbeitung ist die Verwendung der Bibliothek OpenCV notwendig, die auch für C++ und somit für MATLAB zur Verfügung stünde. Ausschlaggebend für die Wahl von Python war die Möglichkeit, die von Google stammende Bibliothek Mediapipe zu verwenden. Mediapipe bietet Zugriff auf verschiedene, optimierte Algorithmen, die unter anderem die Erkennung von Körperhaltungen ermöglichen und ist für die verwendung mit Python und OpenCVoptimiert [15], was die Bildgestützte erkennung der Körperpositionen auf ein Minimum an aufwand reduziert . In MATLAB müssten diese von anderen 3. Bibliotheken[16] implementiert oder über eine Matlab-Python Schnittstelle eingebunden werden.
Paralellitaet von Aufgaben
Parallelität von Aufgaben ermöglicht die gleichzeitige Bearbeitung mehrerer Prozesse, was durch die Verwendung von Threads effizient umgesetzt werden kann, da diese die gleichzeitige Ausführung mehrerer Aufgaben innerhalb eines Programms erlauben.
Jeder Thread arbeitet unabhängig, teilt sich aber denselben Speicherbereich, was eine schnelle Kommunikation ermöglicht, aber auch zu Synchronisationsproblemen führen kann.
In Python ermöglicht das Threading-Modul das Erstellen und Verwalten von Threads, um parallele Aufgaben effizient auszuführen. Es bietet einfache Mechanismen, um Threads zu starten, zu synchronisieren und Ressourcen zwischen ihnen zu teilen.
Die parallele Ausführung der Tasks camera_video_worker
und user_input_worker
ist für das Winkerätsel entscheidend, da beide Prozesse gleichzeitig neben dem Hauptprogramm aktiv sein müssen. Der camera_video_worker
verarbeitet kontinuierlich die Kameradaten, analysiert die Bewegungen und erkennt das Winken als Teil des Spiels. Der user_input_worker
hingegen ist primär für die Erfassung der Benutzereingaben zuständig, insbesondere um einen Spielabbruch durch den Benutzer zu ermöglichen. Durch diese parallele Struktur können Kameraverarbeitung und sofortige Abbruchmöglichkeit gleichzeitig und ohne gegenseitige Beeinflussung ablaufen. Dies gewährleistet einen reibungslosen Spielablauf und gibt dem Benutzer die volle Kontrolle ohne Verzögerungen oder Unterbrechungen des Spielverlaufs zum besseren verständnis ist in Abbildung 21 der Zeitliche ablauf in einem Sequenzdiagramm dargestellt. Um die eingangs beschriebenen Synchronisationsprobleme bei der Kommunikation zwischen den einzelnen Subthreads in den Griff zu bekommen, wird auf die Verwendung von Queues gesetzt die, die gesendeten Nachrichten ähnlich wie in einem Shiftregister in einer Schlange zur Verfügung stellen[17].
Grafische Ausgabe
LCD Modul
Das LCD-Programmmodul erfüllt die Anforderungen dieses Projekts in Bezug auf die Anzeige von Text und Symbolen. Mit der Funktion Eine_Zeile_Zeichenkette(Zeile, Spalte, Text_Eingeben) kann Text an einer beliebigen Zeile und Spalte des Bildschirms angezeigt werden, während die Funktion Eine_Seite_Zeichenkette(Zeile, Spalte, Text_Eingeben) dazu dient, eine komplette Seite mit Text darzustellen. Für längere Zeichenketten kann die Funktion Mehr_Seite_Zeichenkette(Zeile, Spalte, Text_Eingeben) verwendet werden, die den Text automatisch in mehrere Seiten aufteilt und alle 4 Sekunden umblättert.
Die Schlüsselfunktionen des LCD-Moduls sind spi_init()
, senden_zu_st7920(Auswahl, Daten)
und lcd_Konfiguration()
. Die Funktion spi_init() initialisiert die SPI-Schnittstelle des Raspberry Pi entsprechend dem Kommunikationseingenschaft des LCD128x64. Die Funktion senden_zu_st7920(Auswahl, Daten)
wurde basierend auf dem in der Abbildung 22 gezeigten Kommunikationszeitdiagramm von LCD entwickelt, damit können sowohl Befehle zur Konfiguration des LCD128x64 als auch Inhalte zur Anzeige gesendet werden. Die Funktion lcd_Konfiguration()
konfiguriert die wichtigsten Register des LCD-Controllers gemäß dem Datenblatt und aktiviert die Hauptfunktionen des Displays.
Im folgenden Scroll-Fenster können die Details für LCD Modul eingesehen werden.
import spidev
from gpiozero import DigitalOutputDevice
import time
# Definition Pins SPI und CS
SS_PIN = 5
cs = DigitalOutputDevice(SS_PIN)
spi = spidev.SpiDev()
def spi_init():
spi.open(0, 0) # Verwenden SPI Kanel 0
spi.max_speed_hz = 2000000 # SPI Clock
spi.mode = 0b11 # CPOL=1, CPHA=1 Modi 3
spi.bits_per_word = 8
def senden_zu_st7920(Auswahl, Daten):
if Auswahl == 0:
Start_Datei = 0xf8
else:
Start_Datei = 0xfa
MSB = Daten & 0xF0
LSB = (Daten << 4) & 0xF0
cs.on() # SPI KOmmunikation Start
spi.writebytes([Start_Datei])
spi.writebytes([MSB])
spi.writebytes([LSB])
cs.off() # SPI KOmmunikation End
# Stellen die Position von cursor ein
def Einstellung_cursor(Zeile, Spalte):
# DDRAM Adresse Berechnen
Zeile_addresses = [0x80, 0x90, 0x88, 0x98]
Address = Zeile_addresses[Zeile - 1] + (Spalte - 1)
senden_zu_st7920(0, Address) #
def lcd_Konfiguration():
senden_zu_st7920(0, 0x30) # Funktion Einstellung 0x30 fuer Schriftdarstellung
time.sleep(0.00072) # 72 us Pause fuer Einstellung
senden_zu_st7920(0, 0x0C) # Cursor OFF
time.sleep(0.00072) # 72 us Pause fuer Einstellung
senden_zu_st7920(0, 0x01) # Eliminierung der Inhalte in LCD
time.sleep(0.0016) # Pause fuer Einstellung
def Entfernen():
senden_zu_st7920(0, 0x01) # Eliminierung der Inhalte in LCD
time.sleep(0.0016) # 16ms Pause fuer Einstellung
def Eine_Zeile_Zeichenkette(Zeile,Spalte,Text_Eingeben):
Einstellung_cursor(Zeile, Spalte)
for char in Text_Eingeben:
senden_zu_st7920(1, ord(char))
def Eine_Seite_Zeichenkette(Zeile,Spalte,Text_Eingeben):
Erster_Lauf = 1;
for Zeile in range(Zeile, 5):
if Erster_Lauf==1:
senden_zu_st7920(0, 0x01) # Eliminierung der Inhalte in LCD
time.sleep(0.0016) # 16ms Pause fuer Einstellung
start_index = 0;
end_index = 16-(2*(Spalte-1));
Einstellung_cursor(Zeile, Spalte)
line = Text_Eingeben[start_index:end_index]
Erster_Lauf=0;
else:
start_index = end_index
end_index = start_index+16
Einstellung_cursor(Zeile, 1)
line = Text_Eingeben[start_index:end_index]
for char in line:
senden_zu_st7920(1, ord(char))
def Mehr_Seite_Zeichenkette(Zeile,Spalte,Text_Eingeben):
# Liste für die Gruppen initialisieren
gruppen = []
puffer = ""
# Aufteilung langer Zeichenfolgen in mehrere Seiten
for wort in Text_Eingeben.split():
if len(puffer) + len(wort) + 1 <= 64:
puffer += (wort + " ")
else:
gruppen.append(puffer.strip())
puffer = wort + " "
if puffer:
gruppen.append(puffer.strip())
# Seite fuer Seite werden angezeigt
for idx, gruppe in enumerate(gruppen):
Eine_Seite_Zeichenkette(Zeile, Spalte, gruppe)
time.sleep(4) # 4 Sekunden pro Seite
Bildaufnahme und Verarbeitung
BodyPoseEstimation Modul
Zur Realisierung der Flaggenerkennung wurde in diesem Projekt die Aufnahme mittels Kamera und anschließender OpenCV-Bildverarbeitung gewählt.
Diese Aufgabe wird durch die Funktion Camera_Video_Worker(cv_worker_result_queue)
umgesetzt.
Durch das asynchrone Ausführen der Funktion lassen sich Videostreams in Echtzeit zur Extraktion und Visualisierung von Körperskelettdaten mit Mediapipe-Bibliothekenverarbeiten. Aus dem Bild werden Daten zur Körpererkennung extrahiert, um basierend auf den im Modell hinterlegten Schlüsselmerkmalen Gelenkpositionen zu erkennen und als Landmarks zu speichern. Neben der grafischen Darstellung der erkannten Person kann, basierend auf den Landmarken und der in einem Abschnitt beschriebenen geometrischen Funktion, eine Winkelberechnung erfolgen. Diese ermöglicht es, einen Abgleich der gezeigten Armposition des Spielers mit den im Semaphore-Alphabet festgelegten Positionen durchzuführen.
Die konkrete Umsetzung in diesem Projekt nutzt, neben der Standard-Bildverarbeitung mit OpenCV, die Erweiterung der Mediapipe-Bibliotheken, die auf Machine-Learning-Algorithmen basierende Modelle zur Körpermarkenerkennung zur Verfügung stellen.
Der Vorteil ergibt sich daraus, dass sich direkt auf die Körperpunkte des Spielers bezogen werden kann, egal in welchem Winkel er zur Kamera steht oder wie er seinen Körperschwerpunkt nach links oder rechts verlagert.
Zudem ist durch das landmarkenbasierte Verfahren direkt eine einheitliche Definition von Links und Rechts gegeben, die im sonstigen Umgang mit Flaggen-Semaphore durchaus zur Verwirrung führen kann.
def Camera_Video_Worker(resultQeue):
"""
Mediapipe-spezifische Verarbeitung zur Extraktion von Körperskelett und Schlüsselpunkten.
"""
# Initialisierung von Mediapipe-Werkzeugen
mp_drawing = mp.solutions.drawing_utils
mp_pose = mp.solutions.pose
# Mediapipe Pose-Erkennung initialisieren
with mp_pose.Pose(min_detection_confidence=0.51, min_tracking_confidence=0.51) as pose:
while True: # Endlosschleife für die Verarbeitung
# Mediapipe-Prozess zur Verarbeitung eines Bildes
results = pose.process(image) # Hier wird ein Bild übergeben
if results.pose_landmarks: # Wenn Schlüsselpunkte erkannt wurden
# Zeichnen des Körperskeletts und der Referenzlinien
image = GraphicalUserInterface.user_skeleton_visualisation(image, results.pose_landmarks)
#Bereitstellen der Körpermarken für die Hautpfunktion
resultQeue.put(escape.PoseObject(results.pose_landmarks, image ))
if platform.system()== 'Linux':
Kamera_Regelung(image, nose)
Kamera Regler Modul
Das Ziel eines Kamerahalters besteht darin, die Kamera mithilfe eines Servomotors zu bewegen, sodass sie sich um eine vorgegebene Achse drehen kann, um den optimalen Blickwinkel zu erreichen. Um die Positioniergeschwindigkeit und -genauigkeit zu verbessern, kann ein Regelkreis verwendet werden, der eine schnelle und präzise Ausrichtung der Kamera ermöglicht.
Grundelemente der Regelung
Sollgröße & Istgröße
Wie zuvor erwähnt, besteht das Ziel des Geräts darin, schnell und präzise den optimalen Blickwinkel einzustellen. Der „optimale Blickwinkel“ bedeutet, dass das aufzunehmende Objekt (Spieler) im Bildzentrum positioniert ist. Da sich das Gerät nur um die z-Achse drehen kann, lässt sich ausschließlich die x-Koordinate im Bild verändern. Daraus ergibt sich, dass das Regelziel des Geräts darin besteht, die x-Koordinate des Spielers auf die Mittellinie des Bildes auszurichten. Basierend auf diesem Ziel lässt sich schließen, dass die Sollgröße und die Istgröße im Regelkreis beide die x-Koordinate des Spielers beschreiben.
Strecke
In diesem Regelkreis entspricht die Strecke der gesamten Kamerahalterung, wobei das Eingangssignal ein PWM-Signal und das Ausgangssignal die Gesichtskoordinaten sind. Um die Analyse der Strecke zu vereinfachen, kann die Kamerahalterung in zwei Teile unterteilt werden: den Servomotor und die Kamera, die jeweils separat analysiert werden.
- Servomotors
Die Abbildung 23 zeigt das Funktionsprinzip eines Servomotors zur präzisen Einstellung des Winkels, welches ein typischer geschlossener Regelkreis ist. Das Eingangssignal ist ein PWM-Signal, das durch einen Wandler in ein Spannungssignal umgewandelt wird. Die Regelstrecke besteht aus einem Gleichstrommotor und einem Getriebe, wobei die Ausgangsgröße der Winkel ist. Wenn der Strecke ein Sprungspannungssignal zugeführt wird, erhöht das Getriebe den Ausgangswinkel mit einer konstanten Winkelgeschwindigkeit. Daher erfüllt die Regelstrecke die Eigenschaften eines I-Glieds.
Der vom Getriebe ausgegebene Winkel kann über ein Potentiometer in ein Spannungssignal umgewandelt und als Rückführungssignal verwendet werden. Das Fehlersignal wird anschließend durch einen Operationsverstärker proportional verstärkt, um ein Steuersignal zu erzeugen, das das System regelt.
Die Übertragungsfunktion dieses Regelkreises lautet:
Aus der Übertragungsfunktion des Servomotors lässt sich erkennen, dass dessen dynamische Eigenschaften einem PT1-Glied entsprechen.
- Kamera
Für die Kamera als Strecke ist die Stellgröße der Winkel , und die Ausgabe ist die horizontale Pixelkoordinate des Spielers im Bild . Die Abbildung zeigt das Konzept des Bildwinkels. Dieser bezeichnet den horizontalen Sichtwinkel einer Kamera oder eines optischen Systems, der in der Regel in Grad angegeben wird. Der Bildwinkel beschreibt den maximalen Bereich, den die Kamera in horizontaler Richtung erfassen kann, und ist ein wichtiger Parameter in optischen Systemen.
Die Beziehung zwischen der Winkeländerung und der Pixelkoordinatenverschiebung ergibt sich aus der folgenden Formel:
Dabei gilt:
- : Die horizontale Pixelanzahl (Breite des Bildes).
- : Der horizontale Sichtwinkel der Kamera (Horizontal Field of View).
- : Die Änderung des Winkels.
Durch Anwendung der Laplace-Transformation wird die Gleichung in den Frequenzbereich übertragen:
Die Übertragungsfunktion der Kamera ergibt sich zu:
Aus der Übertragungsfunktion geht hervor, dass diese Kamerastrecke ein P-Glied (proportionales Glied) darstellt. Der Verstärkungsfaktor lautet: .
Die Gesamtübertragungsfunktion der Kamerahalterung ergibt sich aus der Verknüpfung der beiden Übertragungsfunktionen und . Da beide in Serie geschaltet sind, multiplizieren sich die Übertragungsfunktionen:
Einsetzen der Einzelübertragungsfunktionen:
Nach Vereinfachung ergibt sich: Aus der Übertragungsfunktion der Strecke Kamerahalterung geht vor, die Kamerahalterung ist noch ein PT1 Glied
- Die Verifizierung für Theorie
Die Abbildung 25 zeigt den praktischen Test der Strecke-Kamerahalterung. Die Testschritte sind wie folgt:
- Der Anfangswinkel der Kamera wird mit einem PWM-Signal eingestellt.
- Die Kamera dient als Positionssensor und liest in einer Schleife kontinuierlich die x-Koordinaten des Spielers aus.
- Die Koordinateninformationen werden in Echtzeit gespeichert.
- Ein PWM-Stufensignal wird eingespeist.
- Die gemessenen Daten werden in MATLAB importiert, die Kurve wird gezeichnet und analysiert.
Da der Servomotor eine sehr hohe Reaktionsgeschwindigkeit aufweist, führen die schnellen dynamischen Änderungen während des Betriebs zu einer deutlichen Bewegungsunschärfe bei den Aufnahmen der Kamera. Diese Unschärfe beeinträchtigt die Bildqualität erheblich, sodass in dieser Phase keine optimale Bildverarbeitung durchgeführt werden kann.
Infolgedessen wird die Anzahl und Genauigkeit der Abtastpunkte eingeschränkt, was dazu führt, dass die tatsächlich gemessenen Daten in bestimmten Momenten eine unzureichende Diskretheit aufweisen können.
Trotz dieser Einschränkungen zeigt die gemessene Kurve weiterhin klar die charakteristischen Merkmale eines PT1-Glieds. In Kombination mit der theoretischen Herleitung und den praktischen Testergebnissen lässt sich weitgehend bestätigen, dass die Kamerahalterung ein PT1-Glied ist.
Regler
PID Regelalgorithmus wird eingesetzt. Der PID-Regelalgorithmus basiert auf einem mathematischen Modell aus Proportional-, Integral- und Differentialanteilen und zeichnet sich durch seine einfache Umsetzung aus. Er wird in einer Vielzahl von Regelungsszenarien eingesetzt. Der Algorithmus erfordert nur geringe Rechenleistung und ist daher besonders für Echtzeitsysteme geeignet. Die Parametereinstellung ist ebenfalls relativ unkompliziert und kann durch Experimente oder Erfahrungswerte schnell optimiert werden. Bei einer geeigneten Parametrierung gewährleistet der PID-Algorithmus eine stabile Regelungsleistung, verhindert Systemdivergenzen und sorgt für Zuverlässigkeit.
Durch Berechnungen und Auswahl wurde festgestellt, dass eine präzise Regelung allein durch den P- und I-Anteil des PID-Reglers erreicht werden kann, ohne den D-Anteil einzusetzen. Der Berechnungsprozess ist wie folgt:
Die Führungsübertragungsfunktion lautet:
Die Störsübertragungsfunktion lautet:
Dabei gilt:
- ist die Übertragungsfunktion des PID-Reglers.
- beschreibt die Kamera-Halterung:
- ist die Verstärkung.
- ist die Zeitkonstante.
Die Eingangs-Sollgröße wird als Stufensignal mit der Amplitude 1 definiert. Ziel ist es, den Wert im stationären Zustand zu beobachten, wenn :
Die Eingangs-Störung wird als Stufensignal mit der Amplitude 1 definiert. Ziel ist es, den Wert im stationären Zustand zu beobachten, wenn :
- Die Implementierung des Regelungsprogramms
Im folgenden Scroll-Fenster können die Details für Regelungsprogramm eingesehen werden.
import cv2
from rpi_hardware_pwm import HardwarePWM
import time
import csv
#glaobal variabel
PWM_CHANNEL = 0 # PWM kanel0(GPIO12)
# PID Parameter
Kp = 0.015 # proportionkoeffizient
Ki = 0.00001 # Integrationskoeffizient
Integraltion = 0
Letzter_Fehler = 0
# Initialisierung pwm und Servo Motor
def init_servo():
global pwm
pwm = HardwarePWM(pwm_channel=PWM_CHANNEL, hz=50, chip=2) #Auswahl PWM-Ausgangspins
pwm.start(0)
def Einstellung_Servo_Winkel(Winkel):
global pwm
duty_cycle = 3 + (Winkel / 270.0) * 10 # Umwandlung des Winkels(0-270) in ein PWM-Signal
pwm.change_duty_cycle(duty_cycle) # Einsatz fuer PWM-Signal
# PID Regler
def PID(Ziel_x, Aktuell_x):
global Integraltion, Letzter_Fehler
Fehler = Ziel_x - Aktuell_x
Integraltion += Fehler
Letzter_Fehler = Fehler
PID_Ausgabe = Kp * Fehler + Ki * Integraltion
return PID_Ausgabe
# Haar-Kaskadenklassifikator laden
def lade_gesichtskaskade():
haarcascade_pfad = cv2.data.haarcascades + 'haarcascade_frontalface_default.xml' # haarcascade_frontalface_default.xml ist ein gut trainiertes Gesichtserkennungsmodell.
gesichtskaskade = cv2.CascadeClassifier(haarcascade_pfad) # mithilfe cv2.CascadeClassifier() wird Gesichtserkennungsmodell geladen
return gesichtskaskade
def Gesichtserkennung(Rahmen, gesichtskaskade):
skalierungsfaktor = 1.1
min_nachbarn = 5
min_Groesse = (30, 30)
Gesicht = gesichtskaskade.detectMultiScale(
Rahmen,
scaleFactor=skalierungsfaktor,
minNeighbors=min_nachbarn,
minSize=min_Groesse
)
return Gesicht
# CSV Datei fuer Analyse
def init_csv(filename):
with open(filename, mode='w', newline='') as file:
writer = csv.writer(file)
writer.writerow(["Timestamp", "Zentral_Bild_x", "Zentral_x"]) # Titel
def save_to_csv(filename, timestamp, Zentral_Bild_x, Zentral_x):
with open(filename, mode='a', newline='') as file:
writer = csv.writer(file)
writer.writerow([timestamp, Zentral_Bild_x, Zentral_x])
def Kamera_Regelung():
csv_filename = 'Messdaten.csv' # initialisierung CSV Datei
init_csv(csv_filename)
init_servo()
video_Erfassen = cv2.VideoCapture(0) # oeffnen kamera - Nr.0
gesichtskaskade = lade_gesichtskaskade() # Haar-Kaskadenklassifikator laden
Aktuell_Winkel = 90
Einstellung_Servo_Winkel(Aktuell_Winkel) # initialisieren des servowinkels
start_time = time.time()
while time.time() - start_time < 20: # 20s zum Reglerung
Bild_Breite = int(video_Erfassen.get(cv2.CAP_PROP_FRAME_WIDTH))
Bild_Hoehe = int(video_Erfassen.get(cv2.CAP_PROP_FRAME_HEIGHT))
Zentral_Bild_x = Bild_Breite // 2
ret,Rahmen = video_Erfassen.read() # Zum Lesen jedes einzelnen Frames aus der Kamera
# ret: Ein boolescher Wert, der angibt,
#ob das Videoframe erfolgreich gelesen wurde
#frame: Das erfasste Bildframe
Rahmen = cv2.cvtColor(Rahmen, cv2.COLOR_BGR2GRAY) # umwandlung zu binaerem Bild
Gesicht = Gesichtserkennung(Rahmen, gesichtskaskade) # Gesicht Erkennung
if len(Gesicht) > 0: # Stellen sicher, dass der Inhalt von Gesicht nur dann aufgerufen
# wird, wenn ein Gesicht erkannt wurde.
x, y, w, h = Gesicht[0]
Zentral_x = x + w // 2 # Zentrumskoordinaten Berechnung
PID_Ausgabe = PID(Zentral_Bild_x, Zentral_x) # PID Reglung
Aktuell_Winkel += PID_Ausgabe # Aktualisierung des Winkels
Aktuell_Winkel = max(0, min(270, Aktuell_Winkel)) # Winkel wird damit zwischen 0-270 Grad begrenzt
Einstellung_Servo_Winkel(Aktuell_Winkel)
# Messdatein fuer Analyse werden gespeichert
save_to_csv(csv_filename, time.time(), Zentral_Bild_x, Zentral_x)
cv2.imshow('Fenster', Rahmen) # Visualisierung
# Druecken 'q' Tastatur zum Ende
if cv2.waitKey(1) & 0xFF == ord('q'):
break
Um das Verständnis dieses Regelungsprogramms zu erleichtern, zeigt die folgende Abbildung 26 die Hauptlogik und den Ablauf des Programms in Form eines Simulink-Modells.
Zur Bestimmung der Proportional- und Integralverstärkungen wurde zunächst die Methode von Ziegler/Nichols verwendet. Anhand der Diagramme wurden die Werte für , , und ermittelt, um daraus die Verstärkungskoeffizienten und abzuleiten.
Nach Tests mit diesen Koeffizienten stellte sich jedoch heraus, dass das System instabil war. Dies ist vermutlich auf die unzureichende Anzahl der Abtastpunkte in den Diagrammen zurückzuführen, was zu falschen Koeffizienten führte.
Schließlich wurde die Feinabstimmung der Koeffizienten durch eine empirische Methode vorgenommen:
- Zunächst wurde auf 0 gesetzt, um sich ausschließlich auf die Einstellung von zu konzentrieren, sodass die Kamerahalterung so schnell und präzise wie möglich reagieren konnte.
- Anschließend wurde schrittweise kalibriert, um den stationären Fehler auszugleichen.
Kontrolleffekt des Regelkreises
1. Dynamische Leistung
- Aus der Antwortkurve (rote Linie: Istgröße, blaue Linie: Sollgröße) ist zu erkennen, dass die tatsächliche Ausgabe (Istgröße) dem Sollwert (Sollgröße) unter der Wirkung des Regelkreises schnell folgt.
- Das System zeigt einen schnellen Anstieg in der Anfangsphase (ca. 0-1,5 Sekunden) und erreicht nach etwa 1,5 Sekunden den stationären Zustand.
2. Stationäre Leistung
- Im stationären Zustand (ca. nach 1,5 Sekunden) ist der Fehler zwischen der tatsächlichen Ausgabe und dem Sollwert minimal und fast vernachlässigbar, was eine gute stationäre Genauigkeit des Systems zeigt.
- Der stationäre Fehler nähert sich nahezu null, was die Erfüllung des Regelziels bestätigt.
3. Stabilität des Systems
- Aus dem Nullstellen- und Polstellen-Diagramm (zweite Abbildung) ist ersichtlich, dass der Pol des Systems in der linken Hälfte der komplexen Ebene liegt (s = -1,67), was darauf hinweist, dass das System stabil ist.
- Es gibt keine Oszillationen, die Systemantwort ist eine exponentielle Dämpfung ohne Schwingungen.
4. Zusammenfassung der Kontrolleffekte
- Das Regelungssystem weist eine schnelle Reaktionsfähigkeit und gute stationäre Leistung auf, sodass es in kurzer Zeit den Sollwert verfolgen kann.
- Sowohl die dynamische als auch die stationäre Leistung des Systems sind ausgezeichnet, was zeigt, dass das Design des Regelkreises die gewünschten Ziele erfüllt.
Spielablauf
Start Game
Die Funktion startGame(Level)
initialisiert und startet einen separaten Thread für die Körpererkennung cv_worker_thread
, um eine unabhängige Verarbeitung sicherzustellen, während das Spiel läuft. Sie setzt zudem den Schwierigkeitsgrad basierend auf dem übergebenen Parameter Level mithilfe der Funktion setSkillLevel(SkillLevel.NONE)
und gibt diesen zur Kontrolle aus. Als Output ruft die Funktion schließlich die play_game()
-Funktion auf, wodurch das eigentliche Spiel gestartet wird.
Play Game
Die Funktion play_game()
steuert den Hauptspielablauf des Winkerraetsels, bei dem Körperposen analysiert werden, um Gesten zu erkennen. Sie initialisiert das Spiel, verarbeitet den Nutzer- und Kamerainput in vorm von Landmarken, und entscheidet abhängig vom Spielmodus BEGINNER, PROFI, EXPERT
über Fortschritt und Spielende. Der Input umfasst Sensordaten (Körperwinkel), Benutzereingaben und Spielvorgaben wie Schwierigkeitsgrade und Lösungswörter. Die Ausgabe erfolgt über die bereits beschriebene LCD-Ausgabe.
Die Besonderheiten der Funktion liegen in der dynamischen Anpassung an Schwierigkeitsstufen. Bei den Modi BEGINNER
und PROFI
wird das gesamte Lösungswort( einzelner Buchstabe) mit erkannten Buchstaben verglichen, während im EXPERT
-Modus Buchstaben sequentiell auf das vorhanden sein in einem Wort geprüft werden. Die Funktion integriert eine Echtzeit-Verarbeitung von Körperwinkeln, die mit OpenCV berechnet und anschließend interpretiert werden.
Das Spiel endet, wenn das Rätsel erfolgreich gelöst oder manuell abgebrochen wird. Die Funktion ruft hierzu die close_game
-Funktion auf, um das Spiel erfolgreich zu beenden. Andernfalls wird die play_game
-Funktion zyklisch mittels einer Schleife und einer generellen Wartezeit von 0,1 Sekunden ausgeführt, um die CPU zu schützen. Im zeitlichen Worst-Case ist durch das Gewinnen des Spiels mit Zykluszeiten von über 30 Sekunden zu rechnen.
Stop Game
Die vorliegende Funktion überwacht eine Bedingung stop_game
, die bei Aktivierung den laufenden Spielprozess kontrolliert beendet. Hierbei wird insbesondere der parallel ausgeführte Thread cv_worker_thread
entweder geordnet synchronisiert oder, falls erforderlich, mittels eines erzwungenen Stopps terminiert. Diese Vorgehensweise gewährleistet eine effiziente Ressourcennutzung und trägt zur Stabilität des Gesamtsystems bei.
Berechnung der Flaggensignale
Videosignal zu Winkel
Da die Position der Arme beim Flaggenwinken in feste Bereiche mit einer festen Ausrichtung eingeteilt werden kann, ist die Idee, die Position der Arme mit grafischen oder geometrischen Verfahren zu bestimmen. Der Ansatz zur Umsetzung, beruht auf der Ausrichtung des Arms zur Körpermitte mit grafischen beziehungsweise geometrischen Methoden zu bestimmen. Hierzu wird der Körper des Spielers in einen rechten und einen linken Winkel unterteilt. Beide Winkel beginnen jeweils unten, also bei 6 Uhr, steigen über die Körperaußenseite nach 12 Uhr, bis sie in der Körpermitte wieder bei 6 Uhr angelangen. Zur Winkelberechnung wird der Vektor genutzt, der zwischen der Schulter- und der Ellbogen-Landmarke entsteht, sowie der Vektor, der als Körpermittelpunkt in der Mitte zwischen den Schultern und der Hüfte entsteht. Für eine erfolgreiche Winkelberechnung müssen demnach genau diese Punkte im Sichtfeld der Kamera sein.
Vorkenntnisse - arctan2
Mathematische Definitiont:
arctan2(y, x) ist eine häufig verwendete Funktion in Mathematik und Informatik, die den Winkel zwischen einem Punkt (x, y) im kartesischen Koordinatensystem und der positiven x-Achse berechnet. Im Vergleich zu der traditionellen Funktion arctan(y/x) unterscheidet arctan2 präzise die Quadranten des Ergebnisses und behebt die Einschränkung, dass arctan(y/x) nur Werte im Bereich von −π/2 bis π/2 liefert.
Der Wertebereich von arctan2 liegt zwischen −π und π (entspricht −180° bis 180°). Mit einer einfachen Umrechnung können die Werte in den Bereich von 0° bis 360° konvertiert werden, was die Funktion besonders nützlich für die Umrechnung in Polarkoordinaten und geometrische Berechnungen macht.
Theoretische Unterstützung
Die folgenden drei Abbildungen zeigen der Reihe nach, wie der Prozess der Winkelumrechnung anhand der mit Mediapipe erkannten Schlüsselkoordinaten des Körpers berechnet wird.
Variablenerklärung:
1. Pixel-Koordinatensystem zu Kartesisches-Koordinatensystem
- x_LS, y_LS: x- und y-Koordinaten der linken Schulter
- x_RS, y_RS: x- und y-Koordinaten der rechten Schulter
- x_MS, y_MS: x- und y-Koordinaten des mittleren Schulterpunkts
- x_LE, y_LE: x- und y-Koordinaten des linken Ellbogens
- x_RE, y_RE: x- und y-Koordinaten des rechten Ellbogens
- x_LH, y_LH: x- und y-Koordinaten der linken Hüfte
- x_RH, y_RH: x- und y-Koordinaten der rechten Hüfte
- x_MH, y_MH: x- und y-Koordinaten des mittleren Hüftpunkts
2. Kartesisches-Koordinatensystem zu Polarkoordinatensystem
- Winkel_1: Winkel zwischen dem Rumpf und der positiven Richtung der X-Achse (Berechnung in Bogenmaß)
- Winkel_2: Winkel zwischen der Richtung des linken Arms und der positiven Richtung der X-Achse (Berechnung in Bogenmaß)
- Winkel_3: Winkel zwischen der Richtung des rechten Arms und der positiven Richtung der X-Achse (Berechnung in Bogenmaß)
3. Polarkoordinatensystem - Normalisierte Winkel
- Winkel_l_A_R: Linksarmwinkel relativ zum Rumpf (Winkel linkem Arm zu Rumpf in Grad)
- Winkel_r_A_R: Rechtsarmwinkel relativ zum Rumpf (Winkel rechtem Arm zu Rumpf in Grad)
Entwurf des Kalmanfilters
Bei praktischen Tests wurde festgestellt, dass der Körper des Spielers gelegentlich nicht korrekt erkannt wird, wenn er sich nicht im optimalen Sichtfeld der Kamera befindet, was zu erheblichen Abweichungen bei der Winkelberechnung führen kann. Außerdem erfordern bestimmte Körperhaltungen für Buchstaben im Spiel, dass der Spieler die Arme überkreuzt, was ebenfalls Fehler bei der Winkelberechnung verursachen kann. Zur Verbesserung der Messergebnisse kann der lineare Kalman-Filter eingesetzt werden, der durch seine Vorhersageeigenschaften präzisere Ergebnisse liefert.
Die Zustandsvariablen sind das Herzstück des Kalman-Filters und beschreiben den aktuellen Zustand des Systems. In diesem Problem umfassen die Zustandsvariablen:
- x₁: Winkel (zwischen Arm und Körper, Einheit: Grad)
- x₂: Winkelgeschwindigkeit (Änderungsrate des Winkels, Einheit: Grad/Sekunde)
- x₃: Winkelbeschleunigung (Änderungsrate der Winkelgeschwindigkeit, Einheit: Grad/Sekunde²)
Daher ist der Zustandsvektor definiert als:
Die Zustandsübergangsmatrix A wird aus den Bewegungsgleichungen hergeleitet. Nachfolgend die einzelnen Schritte:
Die obigen Gleichungen lassen sich in Matrixform schreiben:
Die Zustandsübergangsmatrix A lautet:
Bestimmung der Messrausch-Kovarianzmatrix R:
Da nur der Winkel gemessen werden kann, ist R eine 1 X 1-Matrix. Der Parameter sigma_R kann durch die statische Analyse der gemessenen Winkelwerte bestimmt werden. Die folgenden Abbildungen zeigen die Analyse der Messwerte eines Sensors, der aus einer Kamera und einem Bildverarbeitungsalgorithmus besteht. Um die Messdaten aussagekräftiger zu machen und die Genauigkeit des Sensors besser zu repräsentieren, sollte während der Messphase der Arm möglichst stabil gehalten werden, um unnötige Bewegungen zu vermeiden und den Einfluss von Prozessrauschen auf die Messdaten zu reduzieren. Außerdem sollte bei der Datenanalyse ein Datenfenster mit einer festen Größe verwendet werden, um die Messwerte zu sampeln. Dies kann das Prozessrauschen in der Messanalyse bis zu einem gewissen Grad unterdrücken. Die folgenden Abbildungen zeigen die Analyse der Messwerte für 760 Daten, wobei die Analyse der 20. bis 0. Daten hervorgehoben ist. Aus den Daten ergibt sich, dass die Standardabweichung der Messwerte 0,1308 beträgt. Daher wird 0,1308^2 als Koeffizient für die Messfehlerkovarianzmatrix R des Kalman-Filters verwendet.
Die Messrausch-Kovarianzmatrix R lautet:
Bestimmung der Messrausch-Kovarianzmatrix Q:
Das Systemrauschen beschreibt die Unsicherheiten im Zustandsmodell und spiegelt die Ungewissheiten wider, die im Prognoseprozess durch Modellvereinfachungen sowie externe zufällige Störungen eingeführt werden. Das Zustandsübergangsmodell in diesem Kalman-Filter, das den Winkel zwischen Arm und Körper beschreibt, wird als ideal angenommen, obwohl in der realen Bewegung nichtlineare Faktoren auftreten können. Darüber hinaus ist die Abtastzeit nicht konstant und weist Abtastzeitfehler auf. Daher wird der Koeffizient der Kovarianzmatrix Q auf einen größeren Wert gesetzt. Zusätzlich muss Qin Echtzeit entsprechend den unterschiedlichen -Werten aktualisiert werden.
Bestimmung der Messmatrix H:
Die Messmatrix verknüpft den Zustandsvektor mit den tatsächlichen Messwerten. Da in diesem Problem nur eine einzelne Messeingabe vorhanden ist, wird H als 1x3 -Matrix definiert.
Bestimmung der Zustands-Kovarianzmatrix P:
Die Zustands-Kovarianzmatrix beschreibt die Unsicherheiten in der Schätzung des Zustands. Die Anfangswerte der Zustands-Kovarianzmatrix wurden wie folgt festgelegt: Da der Anfangswinkel bekannt ist, wird ein kleiner Koeffizient gewählt. Die Winkelgeschwindigkeit und die Beschleunigung hingegen sind unbekannt und basieren auf Schätzungen, weshalb große Koeffizienten gewählt wurden.
Darstellung des Filtereffekts:
Die folgende Abbildung32 zeigt den gemessenen Winkel nach der Kalman-Filterung. Es ist ersichtlich, dass einige Störungen effektiv unterdrückt wurden.
Winkel zu Buchstabe
Die Funktion angleToLetter
interpretiert die Winkel zweier Arme (in Grad) und ordnet diese mithilfe einer Zuordnungstabelle einem Buchstaben des Semaphore-Flaggenalphabets zu. Sie berücksichtigt dabei eine Toleranz von ±20 Grad, um kleine Abweichungen in der Armhaltung auszugleichen, was die Robustheit der Zuordnung bei ungeübten Signalgebern erhöht.
Besonderheiten sind die Ruhestellung (0°/0°) und die Möglichkeit eines Korrektursignals(135°/45°) für den Expertenmodus
Komponententest
Der Komponententest dient der Überprüfung einzelner Module oder Funktionen eines Softwaresystems in Isolation, um deren korrekte Funktionalität sicherzustellen und zu Belegen.
Video zu Winkel
Testbeschreibung
Dieser Test überprüft die korrekte Berechnung der Winkel, basierend auf den aus dem Video extrahierten Landmarken. Die Überprüfung wird für zwei Punkte durchgeführt:
- Überprüfung, ob eine Winkelberechnung basierend auf künstlich erzeugten Landmarken korrekt durchgeführt wird.
- Überprüfung der Stabilität der Funktion, insbesondere ob sie auch mit untypischen Eingaben umgehen kann.
Test
Das Ergebnis des Tests ist auf den ersten Blick weniger erfreulich, da dem Dokument in beiden aufgezählten Fällen ein Durchfallen zu entnehmen ist. Genauer betrachtet ist jedoch zu erkennen, dass der berechnete Winkel lediglich 15 Grad vom erwarteten Winkel abweicht. Diese geringe Abweichung ist vor allem vor dem Hintergrund, dass hauptsächlich ungeübte Spieler und nicht Profis aus der Seefahrt als Zielgruppe in Frage kommen, vernachlässigbar. Zudem war während der Entwicklung in keiner gespielten Runde ein Abweichen der gezeigten und der gemessenen Position wahrnehmbar.
Der zweite Punkt, der sich auf die Stabilität der Funktion bezieht, zeigt, dass trotz der guten Qualität des Codes eine Verbesserung in Zukunft notwendig ist. Eine umgehende Dringlichkeit besteht jedoch nicht, da ein Abstürzen des Spiels aus diesem Grund zu keinem Zeitpunkt aufgetreten ist.
Testbericht
Winkel zu Buchstaben
Testbeschreibung
Ziel dieses Tests ist es, die Einteilung des linken und des rechten Kreises in die korrekten und zugehörigen Buchstaben zu prüfen. Hierzu wird die Funktion angle_to_letter
isoliert betrachtet, um Einflüsse anderer Funktionen auszuschließen.
Getestet werden die folgenden Fälle:
- Durchlauf aller korrekten und zugehörigen Winkel.
- Prüfung, ob zufällig ausgewählte Winkel inkl. Toleranz korrekt eingeteilt werden.
- Die Stabilität der Funktion bei Eingaben mit
None
. - Das Verhalten bei der Eingabe von nicht validen, negativen Winkeln.
- Das Verhalten bei der Eingabe von Winkeln außerhalb eines Toleranzwertes.
Test
Das Testen mit der Python-Bibliothek unittest ermöglicht die strukturierte Überprüfung von Funktionen und Modulen auf korrekte Funktionalität, indem erwartete Ausgaben mit tatsächlichen Ergebnissen verglichen werden. So könenn zum Beispiel assert
-Funktionen verwednet werden um annahmen mit dem Tatsächlichen rückgabewert zu vergelichen.
import unittest
from BodyPoseEstimation import angleToLetter
class TestAngleToLetter(unittest.TestCase):
def test_valid_angles(self):
self.assertEqual(angleToLetter(0, 45), "A")
def test_tolerance(self):
self.assertEqual(angleToLetter(5, 50), "A")
def test_outside_tolerance(self):
self.assertIsNone(angleToLetter(10, 70))
def test_none_inputs(self):
self.assertIsNone(angleToLetter(None, 0))
def test_invalid_angles(self):
self.assertIsNone(angleToLetter(-10, 0)) # Negativer Winkel
Testbericht
Als Ergebnis kann ein Testreport ausgegeben werden, mit dem Ergebnis, dass bis auf einen Test alle Tests erfolgreich waren. Durchgefallen ist die Funktion beim Punkt test_outside_tolerance, was darauf zurückzuführen ist, dass sie kein Verhalten zeigt, wenn keine validen Winkel erkannt wurden. Demnach beeinflusst das Durchfallen in keiner Weise die Funktionalität dieser oder anderer Funktionen.
Ergebnis
ID | Anforderung | Beschreibung | Status | Anmerkung |
---|---|---|---|---|
1.1 | Personenerkennung | OK | ||
1.2, 1.3 | Armerkennung und Winkelberechnung | Ergebnis Komponententest | Teilweise OK | Abweichung, aber kein Einfluss auf Funktion |
1.4 | Winkel zu Buchstaben | Ergebnis Komponententest | Teilweise OK | Funktion ok. Fehlerbehandlung fehlerhaft |
1.5 | Rückmeldung für Buchstaben | [19] | OK | |
1.6 | Rückmeldung für richtigen Input | if round_counter >= 3:
if game_settings_engine.puzzleWord[0] == recognized_letter:
lcd_instance.Entfernen()
lcd_instance.Eine_Seite_Zeichenkette(2,1,"Richtig !")
|
OK | |
1.7 | Ausgabe des Lösungsworts |
if round_counter >= 3:
lcd_instance.Mehr_Seite_Zeichenkette(1,1, str(game_settings_engine.getPinCode()))
time.sleep(30)
|
OK | |
1.8 | Verwendung von OpenCV | Informationen im Abschnitt: BodyPoseEstimation Modul | OK | inkl. Mediapipe als Erweiterung |
1.9 | Kameraauflösung | siehe: Abbildung: 33 Visualiserung einer erkannten Person | OK | Die Person muss nur vom Kopf bis knapp unter der Hüfte zu sehen sein (Vorteil von ML, teilweise nicht mal die Hüfte) |
1.10 | SPielstart per Button | [19] | OK | |
1.11 | Schwierigkeitsgrad | [19] | OK | |
1.12 | Verwendung von Wörtern im Experte modus | OK | ||
1.13 | Anzeige es bisher eingegebenen Worts | siehe: Abbildung: 34 Spiel im Experten-Modus | OK | |
1.14 | Löschen von Zeichen durch Flaggensignal | siehe: Abbildung: 34 Spiel im Experten-Modus | OK | |
1.15 | Matlab | Verwendung von Python | Nicht OK | Gründe für Python im WIKI |
1.16 | Hilfe im Beginner | [19] | OK |
Fehler
Bei der Umsetzung der WinkerGame-Software wurde von Anfang an, auch aus Gründen des gemeinsamen Arbeitens, Wert auf Modularität und Austauschbarkeit gelegt. Dies hatte in einigen Fällen jedoch zur Folge, dass der Code eine gewisse Komplexität erreichte.
Infolgedessen kommt es vor allem bei der grafischen Darstellung des Videobildes zu starken Performanceeinbußen. Leider wirkt sich dies auch auf den Startvorgang der Körperposenerkennung aus, der in ungünstigen Situationen mehr als 20 Sekunden dauern kann. Eine Maßnahme besteht darin, die Videoerkennung nicht zu beenden und den entsprechenden Thread dauerhaft am Leben zu halten.
Da die Software ursprünglich als Stand-alone-Anwendung ohne Videobild geplant war, ist dieser Fehler nicht allzu dramatisch einzustufen. Dennoch ist die Videoausgabe für Vorführungen ein beeindruckendes Element, welches gegebenenfalls noch optimiert werden sollte.
Zusammenfassung
Lessons Learned
Wie bereits im Kapitel Fehler angesprochen, ist das größte Problem der Software die niedrige Performance. Wie ebenfalls in Fehler angedeutet, könnte dies auf den komplexen und teilweise chaotischen Code zurückgeführt werden, was mit der Umsetzung per Low-Code-Programmierung, z. B. in Matlab-Simulink, nicht in diesem Ausmaß aufgetreten wäre. Das "Lessons Learned", das für die Beteiligten unterm Strich aus diesem Projekt mitgenommen wird, ist, dass ein strukturiertes Vorgehen bei der Entwicklung komplexer Software im Team unerlässlich ist.
Defizite, die in diesem Kontext zu benennen wären:
- Fehlende Absprachen über konventionelle Themen, zum Beispiel bei Funktionen oder Variablenbezeichnungen, was das Verständnis des Codes der Partner nur auf Basis des Codes erschwerte und regelmäßig in Meetings geklärt werden musste.
- Eine sinnvolle und klare Trennung von Struktur, Eingabe und Grafikanwendungen, was zur Folge hatte, dass zusammengehörende Funktionen verteilt wurden und eine Analyse, z. B. der Performanceprobleme, schwierig gestalteten
Alles in allem wurden die geforderten Funktionen umgesetzt, allerdings ist bei der Qualität des entwickelten Codes und der Codeorganisation noch Luft nach oben.
Projektunterlagen
Alle für das Spiel notwendigen daten, können aus dem SVN der Hochschule Hamm-Lippstadt unter dem folgenden link bezogen werden.
Projektordner: SVN-Projektordner
Wikidaten: Datei:Winkerraetsel BSE4.zip
Projektplan
Zeitplanung
YouTube Video
Quellen
→ zurück zur Übersicht: WS 24/25: Escape Game
- ↑ SELLERI, Stefano, 2017. Claude Chappe and the first telecommunication network (without electricity). URSI Radio Science Bulletin [online]. März 2017. Bd. 2017, Nr. 360, S. 96–101. [Zugriff am: 1 Oktober 2024]. DOI 10.23919/URSIRSB.2017.8113174. Verfügbar unter: https://ieeexplore.ieee.org/document/8113174/?arnumber=8113174
- ↑ Navy Seaman Ryan Ruona uses semaphore flags to signal another ship., [kein Datum]. [online]. [Zugriff am: 1 Oktober 2024]. Verfügbar unter: https://www.defense.gov/Multimedia/Photos/igphoto/2001244016/
- ↑ Codierung von Texten - Fakultät für Elektrotechnik, Informatik und Mathematik - Fakultäten - Kategorien - Videoportal der Uni Paderborn, [kein Datum]. [online]. [Zugriff am: 1 Oktober 2024]. Verfügbar unter: https://videos.uni-paderborn.de/category/video/codierung-von-texten/3a9cfca393633045f308a88c20e8ad82/7
- ↑ Education Codes and Communication, [kein Datum]. National Museum of the Marine Corps [online]. [Zugriff am: 1 Oktober 2024]. Verfügbar unter: https://www.usmcmuseum.com/uploads/6/0/3/6/60364049/nmmc_semaphore_flag_booklet_final_1.pdf
- ↑ EVERYTHINGISHACKED, [kein Datum]. Semaphore [online]. Verfügbar unter: https://github.com/everythingishacked/Semaphore
- ↑ Estimate Body Pose Using Deep Learning - MATLAB & Simulink - MathWorks Deutschland, [kein Datum]. [online]. [Zugriff am: 2 Oktober 2024]. Verfügbar unter: https://de.mathworks.com/help/deeplearning/ug/estimate-body-pose-using-deep-learning.html
- ↑ Raspberry Pi 5 Gruppe., [kein Datum]. [online]. [Zugriff am: 11 Oktober 2024]. Verfügbar unter:https://www.reichelt.de/das-raspberry-pi-5-b-4gb-black-bundle-rpi5-bbdl-4gb-p362101.html?&nbc=1&trstct=lp_1358_155298
- ↑ Kurzhubtaster 6x6 mm, [kein Datum]. [online]. [Zugriff am: 11 Oktober 2024]. Verfügbar unter:https://www.reichelt.de/kurzhubtaster-6x6-mm-hoehe-13-mm-12-v-vert--jtp-1130-p27894.html?&trstct=pos_0&nbc=1
- ↑ LCD128X64, [kein Datum]. [online]. [Zugriff am: 11 Oktober 2024]. Verfügbar unter:https://www.reichelt.de/entwicklerboards-display-grafik-lcd-128x64-pixel-debo-lcd128x64-p335007.html?&trstct=pos_0&nbc=1
- ↑ CON AMDIS03B Webcam, [kein Datum]. [online]. [Zugriff am: 11 Oktober 2024]. Verfügbar unter:https://www.reichelt.de/webcam-720p-hdready-con-amdis03b-p292005.html?&trstct=pos_7&nbc=1CON
- ↑ 11,0 11,1 11,2 LIPINSKI, Benedikt, [kein Datum]. Eigene Aufnahme. [Bild]
- ↑ 12,0 12,1 MAWA, 2008. Querweltein: ein Handbuch - nicht nur für Pfadfinderinnen und Pfadfinder. 6. Aufl. Neuss: Georgs-Verl. ISBN 9783927349087
- ↑ 13,00 13,01 13,02 13,03 13,04 13,05 13,06 13,07 13,08 13,09 13,10 13,11 13,12 13,13 13,14 13,15 13,16 13,17 WANG, Weiran, [kein Datum]. Eigene Anfertigung. [Bild]
- ↑ 14,0 14,1 14,2 14,3 14,4 WANG, Weiran, [kein Datum]. Eigene Aufnahme. [Bild]
- ↑ Leitfaden zur Erkennung von Positionsmarkierungen | Google AI Edge, [kein Datum]. Google AI for Developers [online]. [Zugriff am: 14 Januar 2025]. Verfügbar unter: https://ai.google.dev/edge/mediapipe/solutions/vision/pose_landmarker?hl=de
- ↑ Estimate Body Pose Using Deep Learning - MATLAB & Simulink - MathWorks Deutschland, [kein Datum]. [online]. [Zugriff am: 2 Oktober 2024]. Verfügbar unter: https://de.mathworks.com/help/deeplearning/ug/estimate-body-pose-using-deep-learning.html
- ↑ | Titel = Queue in Python | Autor = GeeksforGeeks | Jahr = 2019 | Werk = GeeksforGeeks | URL = https://www.geeksforgeeks.org/queue-in-python/ | Zugriff = 15. Januar 2025
- ↑ Lab 21: Servo motor control | Embedded Lab, 2012. [online]. [Zugriff am: 16 Januar 2025]. Verfügbar unter: https://embedded-lab.com/blog/lab-21-servo-motor-control/
- ↑ 19,0 19,1 19,2 19,3 LIPINSKI, Benedikt, [kein Datum]. Eigene Anfertigung. [Bild]