Gestikerkennung - Ein Eingabemedium der Kiosksysteme für die Navigation auf Fingerzeig

Mit dem "SIVIT" (Siemens Virtual Touchscreen) stellte Siemens eine Technologie vor, bei der konventionelle Bedienelemente wie Monitor, Maus, Tastatur oder der klassische Touchscreen durch ein virtuelles Panel substituiert werden, über welches die Bedienung des Systems bzw. der Applikation erfolgt.

Statt die Daten über ein eine spezifische Hardware erforderndes Medium auszugeben, kann die Visualisierung – ähnlich wie bei einem Dia – auf prinzipiell beliebigen Oberflächen stattfinden. Während bei konventionellen Ausgabemedien die Projektion auf die Größe des jeweiligen Mediums (z.B. eines Monitors oder Fernsehers) beschränkt ist, ermöglicht der SIVIT variable Darstellungsgrößen. Die Steuerung der Kiosk-Applikation wird durch die Beobachtung von Hand, Fingern oder Kopfbewegungen mittels einer Videokamera realisiert. Diese Kamera ist oberhalb des virtuellen Touchscreens befestigt und registriert die Bewegungen auf der sich innerhalb eines Lichtkegels befindlichen Interaktionsfläche. Aus dem Videobild ermittelt die Gestenerkennung des Steuerungscomputers die geometrischen Koordinaten und leitet die daraus resultierenden Steuersignale für die Applikation ab.

Technische Grundlagen der Gestikerkennung für Kiosksysteme am Beispiel des SIVIT

Ein virtueller Touchscreen besteht aus drei Komponenten: Ein Beamer projiziert – ähnlich wie bei einem klassischen Dia – die Informationen eines Steuerungscomputers auf nahezu beliebig reflektierende Oberflächen. Eine oberhalb des virtuellen Touchscreens befestigte Videokamera registriert und speichert Bewegungen auf der sich innerhalb eines Lichtkegels befindlichen Interaktionsfläche. Ein Steuerungscomputer mit Bildbearbeitungssoftware erkennt die Position und die Bewegungen der Hand. Verharrt ein Finger für einen bestimmten Bruchteil einer Sekunde über dem virtuellen Bedienfeld oder führt eine dem System bekannte dynamische Geste aus, errechnet ein Bildverarbeitungsalgorithmus in Echtzeit die entsprechenden geometrischen Koordinaten. Diese werden anschließend an das Kiosksystem zur Steuerung der Applikation weitergeleitet.

Zentrale Hardware-Komponente deieses Eingabemediums ist die Infrarot-Modul-Box. In diesem Modul befinden sich eine Infrarot-Quelle mit einer speziellen Steuerungselektronik, eine CCD-Kamera und spezielle Objektive. In Kombination mit einer Reflektionsfolie ermöglicht die Modul-Box selbst unter widrigen Umständen – wie beispielsweise Streulicht aus Kunst- und Tageslichtquellen oder großen Abständen – eine genaue Gestikerkennung.

Die zentrale Software-Komponente ist der SIVIT-Treiber. Der Kalibrierungsmodus dient der Überprüfung der SIVIT-Hardware sowie der automatischen Einstellung der Parameter des Komplett-Systems. Die Kalibrierung erfolgt bei der erstmaligen Inbetriebnahme des SIVIT-Systems. Darüber hinausgehende Kalibrierungen sind nicht erforderlich. Der Gestikerken-nungsmodus des Treibers übernimmt die Steuerung der Echtzeit-Bildverarbeitung sowie die Interpretation von Gesten und Störeinflüssen. Er beinhaltet insbesondere Algorithmen zur Erkennung mehrerer Hände bzw. Finger im Bild und identifiziert Fremdkörper auf der Interaktionsfläche. Die einzelnen Hardware-Komponenten des virtuellen Touchscreens, Infrarot-Modul-Box und Beamer, werden in einen Optik-Modul-Box genannten Mechanikwürfel integriert. Dieser ermöglicht eine Decken- oder Wand-Montage des Systems. Der Steuerungscomputer des Kiosksystems und die Optik-Modul-Box lassen sich bis zu fünfzig Meter voneinander entfernt aufstellen.

Der virtuelle Touchscreen wurde in zwei verschiedenen technischen Ausführungsvarianten konstruiert: Als Universalkiosk dient dieser vor allem als Informations- und Transaktionskiosk. Hardwaremäßig ist er für die Integration verschiedener Peripheriegeräte wie Videokamera, Kartenleser, Tastatur, Personalcomputer und Drucker vorgerüstet.

Durch den Einsatz von Gestikcomputern wird erstmalig eine intuitiv zu bedienende dreidimensionale Steuerung von Kiosksystemen möglich, die den Kiosknutzer selbst Teil der Präsentation und die Nutzung zum Erlebnis werden lässt. Durch den Verzicht auf freiliegende, mechanische Bauteile wird ein hoher Grad an Vandalismussicherheit geboten, der diese Innovation sowohl für den Out- und Indoorbereich prädestiniert und somit auch ein hohes Maß an Betriebssicherheit und Wartungsfreundlichkeit gewährt.

Die vorwiegend bei klassischen Kiosksystemen eingesetzten Touchscreens verschmutzen bei häufiger Nutzung und bedürfen daher der Säuberung, um weiter genutzt zu werden. Durch den Verzicht auf die physische Berührung des Terminals entfällt somit eine in der Praxis häufig festzustellende, nicht zu unterschätzende Nutzungsbarriere.

Die Gestikerkennung wird sich am Point Of Information, Point Of Sale und Point Of Communication in dem Maße durchsetzen, in dem es gelingt, Produkte für Endanwender im Markt erfolgreich zu platzieren. Insbesondere die Miniaturisierung der Endgeräte beeinflusst die Bedeutung der Beamertechnologie bzw. Holographie – und daraus folgend der Gestenerkennung – positiv. Auch spielt die Etablierung der Beamertechnologie im Office- und Home-Bereich eine wesentliche Rolle für den Breiteneinsatz. Auf notwendige Standardisierungen und die Offenlegung von Treiberschnittstellen, die der Verbreitung dieser Technologie einen weiteren Schub geben werden, soll nur verwiesen werden.

Die Entwicklung und Vermarktung des SIVIT wurde von Siemens leider eingestellt. "Leider" muss man sagen, denn der SIVIT war seiner Zeit einfach nur voraus. Erst jetzt, d.h. ca. 20 Jahre nach der Vorstellung des SIVIT, beginnt die Gestensteuerung langsam massenmarkttauglich zu werden.

Beispiel für die Gestenerkennung / virtuelle Touchscreens: Eingabededium für die Navigation auf Fingerzeig
										Kiosksysteme Eingabegeräte: Gestikerkennung
									(Quelle: Siemens AG)