pi-Vision

Die Kombination aus Mikrocomputern und effizienter Bildverarbeitung ist ein spannendes und rasant wachsendes Querschnittsthema, das nahezu unerschöpfliches Potential in Industrie und Hochschule besitzt. Im Projekt soll die Expertise des ICP, in Zusammenarbeit mit anderen Instituten und Zentren an der ZHAW, im Bereich Bildverarbeitung ausgebaut und vernetzt werden.

“Guten Tag. Ich kenne Sie nicht, aber Sie sehen aus wie Brad Pitt.” könnte Ihre Begrüßung des fertiggestellten Demonstrators des πVision Projekts sein.


Fig.~1: Raspberry Pi, Qielle: privat

Im Rahmen dieses Projektes wurde ein mobiles System zur rechnergestützten Gesichtserkennung entwickelt. Das System beinhaltet eine Kamera und wird über einen “Raspberry Pi” (s. Fig. 1), einen vollwertigen Mikrocomputer von der Größe einer Kreditkarte, gesteuert. Es ist in der Lage, sowohl Standbilder als auch Videos aufzunehmen und die Gesichter der aufgenommenen Personen zu identifizieren. Im Projekt wurde untersucht wie sich verschiedene Algorithmen zur Bilderkennung auf solchen eher leistungsschwachen Architekturen einsetzen lassen. Die Entwicklung des Kamerasystems mit Gesichtserkennung diente dabei primär als proof-of-principle und illustriert den Kompetenzaufbau und die interne Vernetzung von SoE-Expertinnen und Experten.

Im Bereich der Bildverarbeitung zielte πVision einerseits darauf ab, bestehende Algorithmen hinsichtlich Rechenaufwand, Zuverlässigkeit und Genauigkeit zu untersuchen. Daneben war das Beschreiten neuer Wege, etwa die Entwicklung und Bewertung neuer Algorithmen zur Bilderkennung und Bildanalyse, oder deren effiziente Implementierung auf Mikrocomputern, ein wesentliches Projektziel.

Im Verlaufe des Projektes ist es gelungen, durch Untersuchung verschiedener Methoden zur Bilderfassung und Gesichtserkennung, Algorithmen zu entwickeln, die nicht nur deutlich schneller, sondern auch erheblich genauer arbeiten als die Standardmethoden, die in frei verfügbaren Softwarepaketen wie etwa OpenCV implementiert sind. Dazu gehören nicht nur traditionelle Ansätze wie beispielsweise Eigenfaces, sondern auch Local Binary Pattern histograms in Kombination mit Support Vector Machines, oder hochmoderne Deep Learning Algorithmen, die auf neuronalen Netzen basieren und in aller Regel eine sehr hohe Rechenleistung benötigen.

Im Dezember 2014 wurde ein Prototyp in Betrieb genommen, der in der Lage ist, die Mitglieder des Projektteams mit einer Trefferquote von mehr als 95% zu identifizieren. Das Erlernen der Gesichter im Trainingsset (s. Fig. 2) wurde auf einem rechenstarken PC durchgeführt, die Gesichtserkennung selbst findet auf dem Raspberry Pi statt.


Fig. 2: Training- (oben) und Testsets (unten), Quelle: Projektteam

Hier ein Demonstrationsvideo, das die wichtigs- ten Resultate, einschliesslich einer Echtzeit- Demonstration, zusammenfasst:


Quelle: Oliver Dürr
(Aus ICP-Report 2014)