Originalansicht: Microsoft: Forscher feiern Durchbruch in Spracherkennung mit Fehlerquote von nur noch 5,9 Prozent

Die mit Windows 10 auch auf Desktop-PCs eingeführte Sprachassistentin Cortana wird sicherlich jeder User schon einmal, sei es aus reiner Neugier, ausprobiert haben. Worin sich aber alle Nutzer einig sind, unabhängig ob Cortana nun verwendet wird oder nicht, ist dass die Sprachassistentin immer noch hier und da Probleme hat, Wörter oder ganze Sätze zu verstehen. Das soll sich aber in Zukunft ändern, da Microsoft-Forscher aktuell einen Durchbruch in der Entwicklung der Spracherkennung feiern, die nun die menschliche Sprache so gut verstehen soll, als säße einem ein echter Mensch gegenüber


Build 9879 Slowring verspätet-entwickler-team.jpg


Wer schon einmal mit Microsofts Sprachassistentin Cortana kommuniziert hat, sollte festgestellt haben, dass zu der aus Halo bekannten Dame sehr deutlich gesprochen werden muss, da die Informationen ansonsten nicht bearbeitet werden können, wenn sie überhaupt korrekt verstanden werden. Fakt ist, dass die Kommunikation und Arbeit mit Cortana dem einem Nutzer mehr liegt als manch anderen.

Wie Microsoft jetzt im Blog berichtet, soll es einem hauseigenen Forscher-Team gelungen sein, die Spracherkennung soweit entwickelt zu haben, dass diese die menschliche Sprache so gut verstehen kann, als säße einem in dem Gespräch ein anderer Mensch gegenüber. Die neue Technologie soll den für Spracherkennungs-Test entwickelte Methode "NIST 2000" mit einer Fehlerquote von lediglich 5,9 Prozent absolviert haben, was zwar immer noch nicht perfekt sei, aber dem menschlichen Niveau entspräche. Keine bisherige Spracherkennungs-Technologie habe bislang besser abschneiden können, weshalb man dieses Ergebnis als Anlass zum Feiern genommen hat.

Bereits vor einem Jahr hat sich das Entwicklerteam bei Microsoft zum Ziel gesetzt, die zu entwickelnde Technologie auf ein Niveau zu bringen, dass diese Worte einer Unterhaltung genauso gut verstehen könne, als würde bei der Unterhaltung ein echter Mensch gegenüber sitzen. Wie das Team nun berichtet, habe man dieses Ziel nun erreicht.

Interessant an der neuen Technologie ist zudem, dass diese nicht nur einzelne Worte erkennt, sondern auch den eigentlichen Inhalt einer Unterhaltung erkennen kann. Zum aktuellen Zeitpunkt stecke man diesbezüglich aber noch im Entwicklungsprozess.

Meinung des Autors: Wie man an Cortana, Siri und Google Now jetzt schon erkennen kann, wird die Interaktion via Spracheingabe aktuell schon genutzt und wird sich zukünftig mit neuen, wie der jetzt von Microsoft entwickelten Technologie(n) nochmals intensivieren können. So kann man die Maschine dann auch mal "anmaulen" wenn man schlecht gelaunt ist, und sie versteht einen trotzdem?
Nutzer für diese Technik wird es immer geben, ganz gleich ob man Fürsprecher oder auch Gegner davon sein sollte. Ich persönlich finde das Ganze zwar recht spannend, doch da ich auch nie auf Anrufbeantworter spreche(gesprochen habe, kann ich mir auch jetzt nicht vorstellen, mit einer Maschine zu sprechen. Spracherkennung ist das Eine, das Andere ist die KI dahinter. Selbständig denkende Maschinen bereiten mir ein unbehagliches Gefühl. Wie seht ihr das?