Sprachassistenten: Zauberlehrlinge in der digitalen Welt

In der digitalen Welt eröffnen sich durch Sprachassistenten ungleich mehr Möglichkeiten. Die meisten von uns kennen die Systeme bereits aus eigener Erfahrung. Ob es das Navi im Auto ist, das Treppenlicht, das auf Befehl an- und ausgeht, der Musikplayer, der auf Zuruf die gewünschte Playlist spielt. Sprachsteuerung ist praktisch, spart Zeit und funktioniert im Wesentlichen gut.  Wenigen ist die Anwendungsvielfalt der Sprachassistenz-Systeme ins Detail bekannt und vor allem, dass man sie ganz konkret auf die eigenen Bedürfnisse anpassen / programmieren kann.

Sprachassistenz-Systeme

Auch auf diesem Markt gibt es die Big-Player, die Dir wahrscheinlich bekannt sind:

  • Alexa (Amazon)
  • Google Assistent (Google)
  • Siri (Apple)
  • Bixby (Samsung)
  • Cortana (Windows)

Welche konkreten Möglichkeiten bieten Sprachassistenten?

Sie haben zwar unterschiedliche Bezeichnungen, denn was bei Alexa als „Skill“ bezeichnet wird, heißt bei Google „Funktionen“, sind im Grunde genommen jedoch dasselbe. Es handelt sich dabei um Funktionserweiterungen, die oft auch von Drittanbietern angeboten werden. Man schätzt, dass rund 50.000 Skills für Alexa bereitstehen, vor allem im SmartHome Segment. Schließlich nutzen fast die Hälfte der Deutschen und Österreicher Sprachassistenz-Systeme auf PC, Tablet oder Smartphone.

Mit Skills lässt sich Musik steuern, die Lautstärke regulieren, eine Auswahl treffen. Der Kontakt unterschiedlicher Geräte miteinander, die Personen, die sich darüber austauschen und verbinden, gehören zu den klaren Favoriten im Kosmos dieser Vielfalt.

Kann man Skills selbst programmieren?

Ein Skill als Benutzerschnittstelle zu programmieren ist grundsätzlich möglich, wenn auch für den Laien nicht ganz so einfach. Am Beispiel Alexa sind folgende Voraussetzungen erforderlich:

  • Developer Konsole (Entwicklungsumgebung) freischalten lassen (Entwicklerkonto einrichten). Mit Blueprint stellt Amazon zusätzlich eine sehr einfache, intuitive Umgebung bereit.
  • Interaktionsmodell wählen (benutzerdefiniert, vordefinierte Modelle für News, SmartHome, Video) und konfigurieren.
  • Programmlogik
  • Interaktionsmodelle mit Programmlogik verbinden.
  • Ausführliches Testen.
  • Veröffentlichen.
  • Zertifizieren.

Im letzten Schritt, der Zertifizierung, erfolgt die Überprüfung. Wenn das System feststellt, dass alle Angaben korrekt sind, wird das Programm zur Veröffentlichung im Store zugelassen. Im anderen Fall erhältst Du die Meldung, dass es an Deiner Entwicklung noch einiges zu verbessern oder richtigzustellen gibt. Erst nach Anpassung kann eine neue Zertifizierung angestoßen werden.