Von Wolfgang Noelke
Dass die Stimme der Computer leider noch immer noch klingt wie vor 20 Jahren, liegt an dem geringen Speicherplatz, den eine derartige Stimmerzeugung bedarf. Hinzugekommen ist allerdings die Fähigkeit der Computer, Gefühle des Gegenübers zu interpretieren und darauf zu reagieren. Das erfordert wesentlich mehr Speicherplatz, funktioniert jedoch erst in Ansätzen - beispielsweise in der Warteschleife eines virtuellen Call-Center: Wird der Anrufer am Telefon laut und genervt - dann schaltet der Computer am anderen Ende der Leitung lieber um zu einem echten Menschen im Call-Center. Computer können außerhalb ihrer beschränkten Programmierungen noch nicht "richtig" mit Menschen kommunizieren, aber - das zeigte man auf der Tagung in Berlin: Die Entwickler sind auf dem Weg, Sensoren für viele uns Menschen geläufigen Kommunikationsformen in die Kommunikationsprogramme einzusetzen. Dazu gehört neben der Stimm- Analyse auch die Fähigkeit der Computer, mittels Kameras Gesten zu deuten und diese auch umgekehrt an den Menschen vor dem Bildschirm zu vermitteln. Denn auch der Mensch will ein ihm ähnliches Wesen als Gegenüber. Dazu reicht ein simples Kunstwesen auf dem Bildschirm, so Manfred Weiss, Sprecher des Projektes MAP - Multimedia-ArbeitsPlatz der Zukunft:
Unsere Untersuchungen zeigten, dass der Mensch mit Maschinen nur ungerne redet, wenn er das Gefühl hat, dass er selbst nicht richtig verstanden wird. Wir entwickelten daher einen so genannten Avatar, ein anthropomorphes Abbild eines Menschen, der etwa Missverständnis oder Unverständnis zum Ausdruck bringen kann. Wenn ich eine Aufgabe delegiere, dann signalisiert mir der Avatar auch, dass er das verstanden hat und sie ausführen wird.
Der Mensch braucht keine komplizierten - meist auch schlecht übersetzten Bedienungsanleitungen zu interpretieren, sondern spricht seinen Computer einfach an. Und dessen Aufgabe soll es künftig sein, sich auf "seinen" Menschen einzustellen und dessen Wünsche zu erfüllen. Dass dieser persönliche Computer drahtlos ans weltweite Kommunikationsnetz angeschlossen ist, ist Voraussetzung, denn für die Wunscherfüllung sorgen kleine Programme, sogenannte Software- Agenten, die uns Menschen die Aufgabe des Surfens im Netz abnehmen sollen, mit einem durchschlagenden Erfolg, dass sehr viel an Bandbreite gespart wird, denn die Agenten übertragen beispielsweise nur die Bilder, die sie suchen sollen. Ulrich Pinsdorf vom Fraunhofer- Institut für Graphische Datenverarbeitung in Darmstadt:
Bislang ist es so, dass derjenige, der Daten im Internet anbietet, dazu auch den Suchalgorithmus anbieten muss. Wir haben jetzt Algorithmen verwendet, mit denen man Bilder vergleichen kann. Wir geben dann unserem Agenten ein Beispielbild vor, anhand dessen er ähnliche Bilder finden soll. Als Kenngröße können wir Merkmale vorgeben wie eine ähnliche Farbverteilung. Oder man gibt dem Agenten eine Handskizze, mit der er nach ähnichen Fotos sucht..
Im Prinzip sind die Arbeitsplätze der Zukunft mobil - oder wenigstens Teile ihrer Software wandern durchs Netz. Allerdings, je mehr sich Mensch und Computer annähern, desto größer ist die Gefahr, dass sich in diesem lukrativen Geschäft die Computer voneinander entfernen, dass Insellösungen entstehen. Dieser Gefahr aber hat die Arbeitsgruppe MAP - so deren Sprecher Manfred Weiss schon vorgebeugt:
Alle diese Technologien, die wir benutzen, sind irgendwo schon einmal in internationale Standards eingebunden. Um beispielsweise Multimodalität international durchsetzbar zu machen, muss es ein Standardisierungsgremium passieren, wie etwa das W3-Konsortium. Dort sind wir aktiv in der Standardisierung für multimodale Interaktion eingetreten. Somit werden Projektergebnisse aus MAP in die internationale Standardisierung eingebracht.
Dass die Stimme der Computer leider noch immer noch klingt wie vor 20 Jahren, liegt an dem geringen Speicherplatz, den eine derartige Stimmerzeugung bedarf. Hinzugekommen ist allerdings die Fähigkeit der Computer, Gefühle des Gegenübers zu interpretieren und darauf zu reagieren. Das erfordert wesentlich mehr Speicherplatz, funktioniert jedoch erst in Ansätzen - beispielsweise in der Warteschleife eines virtuellen Call-Center: Wird der Anrufer am Telefon laut und genervt - dann schaltet der Computer am anderen Ende der Leitung lieber um zu einem echten Menschen im Call-Center. Computer können außerhalb ihrer beschränkten Programmierungen noch nicht "richtig" mit Menschen kommunizieren, aber - das zeigte man auf der Tagung in Berlin: Die Entwickler sind auf dem Weg, Sensoren für viele uns Menschen geläufigen Kommunikationsformen in die Kommunikationsprogramme einzusetzen. Dazu gehört neben der Stimm- Analyse auch die Fähigkeit der Computer, mittels Kameras Gesten zu deuten und diese auch umgekehrt an den Menschen vor dem Bildschirm zu vermitteln. Denn auch der Mensch will ein ihm ähnliches Wesen als Gegenüber. Dazu reicht ein simples Kunstwesen auf dem Bildschirm, so Manfred Weiss, Sprecher des Projektes MAP - Multimedia-ArbeitsPlatz der Zukunft:
Unsere Untersuchungen zeigten, dass der Mensch mit Maschinen nur ungerne redet, wenn er das Gefühl hat, dass er selbst nicht richtig verstanden wird. Wir entwickelten daher einen so genannten Avatar, ein anthropomorphes Abbild eines Menschen, der etwa Missverständnis oder Unverständnis zum Ausdruck bringen kann. Wenn ich eine Aufgabe delegiere, dann signalisiert mir der Avatar auch, dass er das verstanden hat und sie ausführen wird.
Der Mensch braucht keine komplizierten - meist auch schlecht übersetzten Bedienungsanleitungen zu interpretieren, sondern spricht seinen Computer einfach an. Und dessen Aufgabe soll es künftig sein, sich auf "seinen" Menschen einzustellen und dessen Wünsche zu erfüllen. Dass dieser persönliche Computer drahtlos ans weltweite Kommunikationsnetz angeschlossen ist, ist Voraussetzung, denn für die Wunscherfüllung sorgen kleine Programme, sogenannte Software- Agenten, die uns Menschen die Aufgabe des Surfens im Netz abnehmen sollen, mit einem durchschlagenden Erfolg, dass sehr viel an Bandbreite gespart wird, denn die Agenten übertragen beispielsweise nur die Bilder, die sie suchen sollen. Ulrich Pinsdorf vom Fraunhofer- Institut für Graphische Datenverarbeitung in Darmstadt:
Bislang ist es so, dass derjenige, der Daten im Internet anbietet, dazu auch den Suchalgorithmus anbieten muss. Wir haben jetzt Algorithmen verwendet, mit denen man Bilder vergleichen kann. Wir geben dann unserem Agenten ein Beispielbild vor, anhand dessen er ähnliche Bilder finden soll. Als Kenngröße können wir Merkmale vorgeben wie eine ähnliche Farbverteilung. Oder man gibt dem Agenten eine Handskizze, mit der er nach ähnichen Fotos sucht..
Im Prinzip sind die Arbeitsplätze der Zukunft mobil - oder wenigstens Teile ihrer Software wandern durchs Netz. Allerdings, je mehr sich Mensch und Computer annähern, desto größer ist die Gefahr, dass sich in diesem lukrativen Geschäft die Computer voneinander entfernen, dass Insellösungen entstehen. Dieser Gefahr aber hat die Arbeitsgruppe MAP - so deren Sprecher Manfred Weiss schon vorgebeugt:
Alle diese Technologien, die wir benutzen, sind irgendwo schon einmal in internationale Standards eingebunden. Um beispielsweise Multimodalität international durchsetzbar zu machen, muss es ein Standardisierungsgremium passieren, wie etwa das W3-Konsortium. Dort sind wir aktiv in der Standardisierung für multimodale Interaktion eingetreten. Somit werden Projektergebnisse aus MAP in die internationale Standardisierung eingebracht.