Alexa & Co.
Hallo Computer, jetzt reden wir mal!
Grenzen der künstlichen Intelligenz
Doch so gut die Stimmen sind, und so gut maschinelles Lernen funktioniert: Es existieren Grenzen, sagt Klakow. Und zwar "dort, wo es keine Trainingsdaten gibt, wo Menschen sich nicht sicher sind, ob die Antwort dieses oder jenes ist". Ironie ist so ein Bereich - und Humor. Auch Fragen nach dem "Warum" sind von Maschinen bisher schwer zu beantworten. "Alles wo man Beispiele geben kann, und wo Menschen unzweifelhaft sagen, das wäre die richtige Antwort, da funktioniert es", erläutert Klakow.
Die Ergebnisse können sich sehen lassen. Den Anbietern ist es sogar gelungen, ihren Systemen eine gewisse Persönlichkeit zu verpassen. Amazons Alexa bringt manche Besitzer mit einer Art Nerd-Humor zum lächeln und kann ein wenig wie die "Star-Wars"-Figur Yoda reden. Microsofts Cortana punktet mit Übersetzungsfähigkeiten. Und Apples Siri kommt mit einer natürlich klingenden Sprache daher.
Fakt ist: Die Sprachsysteme werden besser. Sie erobern immer mehr Lebensbereiche. Und mit den Assistenten dringt auch die Künstliche Intelligenz weiter vor. Deshalb mahnen Experten, man müsse die Risiken im Blick haben: So haben manche Menschen Angst davor, von Alexa & Co. ungewollt belauscht zu werden.
Die Anbieter betonen zwar, dass die Systeme nicht rund um die Uhr Gespräche aufzeichnen, sondern nur auf die Eingabe des Schlüsselwortes warten. Aber es kann Pannen geben. So horchte der Lautsprecher Google Home Mini ungewollt auf. Grund war ein Hardware-Fehler: Die Aufnahme sollte zusätzlich zum Sprachbefehl "Okay Google" auch per Fingerdruck auf das Gehäuse aktiviert werden können. Wegen eines Defekts registrierten einige Geräte eine Berührung, auch wenn es keine gab. Die Funktion wurde deaktiviert.
Und selbst wenn Lautsprecher und Smartphone-Systeme wie vorgesehen laufen, tun sich Datenschutz-Probleme auf. Bei führenden Sprachassistenten werden die Eingaben auf Servern der US-Anbieter verarbeitet und zum Teil sehr lange gespeichert. Bei Google und Amazon kann der Nutzer sich die Liste der Sprachaufzeichnungen anschauen und bei Bedarf einzeln löschen.
Der Direktor des Hasso-Plattner-Instituts in Potsdam, Christoph Meinel, sagt: "Alle Segnungen, die IT bringt, haben ihren Preis." Früher habe es eine Verletzung der Privatsphäre bedeutet, wenn man ausspionierte, wo jemand ist und was er tut. Heute teilen viele ihren Standort den Anbietern verschiedener Apps sorgenfrei mit. Nutzt man Sprachsteuerung, kommen viele weitere Daten hinzu, "die da herumschwirren und von denen man nicht weiß, wer darauf Zugriff hat". Wie die Gesellschaft damit umgehe, werde sich in einem langen Prozess zeigen müssen, sagt Meinel.
Wo setzt sich Sprachsteuerung durch?
Trotz der Grenzen des maschinellen Lernens und der Risiken dürfte sich Sprachsteuerung mittelfristig durchsetzen. Da sind sich die Experten recht einig. Nicht unbedingt im öffentlichen Raum, im Bus und am Flughafen. In Situationen, in denen viele Leute um einen herum sind, würde Sprachsteuerung durch die Lautstärke zu viele andere stören, meint Michael Mikolajczak. Er ist Kurator des Heinz-Nixdorf-Museumsforums, eines Computermuseums in Paderborn.
In diesen Situationen würden Displays zum Berühren auf dem Smartphone besser angenommen. Auch die Maus werde uns noch längere Zeit begleiten - etwa im Büro. Aber zu Hause, im Auto, überall, wo wir die Hände nicht frei haben oder uns nicht bewegen wollen, werden Menschen künftig oft Sprache zur Steuerung von Geräten nutzen.
Auch der Direktor des Hasso-Plattner-Instituts meint: Für Sprachassistenten bestünden gute Chancen des Durchbruchs auf den Massenmarkt. Vor einigen Jahren habe der Umgang mit sprechenden Helfern noch wenig Spaß gemacht. Das habe die Verbreitung gebremst. "Das ändert sich gerade", sagt Meinel, vor allem weil die Technik dahinter immer besser werde.
Wird Sprachsteuerung allgegenwärtig?
Aus Sicht des Museums-Experten Mikolajczak ist eine wirklich natürliche Kommunikation mit Computern allerdings noch Zukunftsmusik. Mit einem Rechner zu sprechen, sei nichts anderes, als Befehle zu geben: "Das ist keine Interaktion." Eine Antwort des Computers auf eine Frage sei kein Vorschlag aus seiner Intelligenz heraus, sondern er rufe Daten aus dem Speicher ab. "Der Computer kann nicht denken."
Auch Professor Klakow aus Saarbrücken urteilt: "Bis wir so weit sind, dass Sie mit so einem System reden können wie mit einem Menschen, da wird noch viel Zeit ins Land gehen." Und wahrscheinlich werde die Steuerung mit gesprochener Sprache ein grafisches Interface - also auch eine Oberfläche, einen Bildschirm, als Übergang ins Digitale - nicht ersetzen, sondern nur ergänzen.
In einigen Situationen können echte Fans dann irgendwann an die "Star-Trek"-Figur Scotty denken, der in einer Folge etwas irritiert vor einem Computer sitzt, der nicht auf Sprache reagiert. Und an seine Worte: "Tastatur. Wie rückständig." (dpa/ad)