Die Kombination aus Mikrocomputern und effizienter Bildverarbeitung ist ein spannendes und rasant wachsendes Querschnittsthema, das nahezu unerschöpfliches Potential in Industrie und Hochschule besitzt. Im Projekt soll die Expertise des ICP, in Zusammenarbeit mit anderen Instituten und Zentren an der ZHAW, im Bereich Bildverarbeitung ausgebaut und vernetzt werden.
“Guten Tag. Ich kenne Sie nicht, aber Sie sehen
aus wie Brad Pitt.” könnte Ihre Begrüßung des fertiggestellten Demonstrators des πVision Projekts
sein.
Fig.~1: Raspberry Pi, Qielle: privat
Im Rahmen dieses Projektes wurde ein mobiles
System zur rechnergestützten Gesichtserkennung
entwickelt. Das System beinhaltet eine Kamera
und wird über einen “Raspberry Pi” (s. Fig. 1),
einen vollwertigen Mikrocomputer von der Größe
einer Kreditkarte, gesteuert. Es ist in der Lage,
sowohl Standbilder als auch Videos aufzunehmen
und die Gesichter der aufgenommenen Personen
zu identifizieren. Im Projekt wurde untersucht wie
sich verschiedene Algorithmen zur Bilderkennung
auf solchen eher leistungsschwachen Architekturen einsetzen lassen. Die Entwicklung des Kamerasystems mit Gesichtserkennung diente dabei primär als proof-of-principle und illustriert den
Kompetenzaufbau und die interne Vernetzung von
SoE-Expertinnen und Experten.
Im Bereich der Bildverarbeitung zielte πVision einerseits darauf ab, bestehende Algorithmen hinsichtlich Rechenaufwand, Zuverlässigkeit und Genauigkeit zu untersuchen. Daneben war das Beschreiten neuer Wege, etwa die Entwicklung und
Bewertung neuer Algorithmen zur Bilderkennung
und Bildanalyse, oder deren effiziente Implementierung auf Mikrocomputern, ein wesentliches Projektziel.
Im Verlaufe des Projektes ist es gelungen, durch
Untersuchung verschiedener Methoden zur Bilderfassung und Gesichtserkennung, Algorithmen zu
entwickeln, die nicht nur deutlich schneller, sondern auch erheblich genauer arbeiten als die Standardmethoden, die in frei verfügbaren Softwarepaketen wie etwa OpenCV implementiert sind. Dazu gehören nicht nur traditionelle Ansätze wie beispielsweise Eigenfaces, sondern auch Local Binary Pattern histograms in Kombination mit Support
Vector Machines, oder hochmoderne Deep Learning Algorithmen, die auf neuronalen Netzen basieren und in aller Regel eine sehr hohe Rechenleistung benötigen.
Im Dezember 2014 wurde ein Prototyp in Betrieb
genommen, der in der Lage ist, die Mitglieder des
Projektteams mit einer Trefferquote von mehr als
95% zu identifizieren. Das Erlernen der Gesichter
im Trainingsset (s. Fig. 2) wurde auf einem rechenstarken PC durchgeführt, die Gesichtserkennung
selbst findet auf dem Raspberry Pi statt.
Fig. 2: Training- (oben) und Testsets (unten), Quelle: Projektteam
Hier ein Demonstrationsvideo, das die wichtigs-
ten Resultate, einschliesslich einer Echtzeit-
Demonstration, zusammenfasst: