UFESQ - User-Friendly Estimation of Speech Quality for Telecommunications and Network Carriers

01.04.2015 -

Abgeschlossen
TU Berlin & Deutsche Telekom AG

Name des Teilnehmers: Friedemann Köster

Beschreibung des IT-Forschungsprojekts: Für die Anbieter von Telekommunikationssystemen ist die Qualität der übertragenen Sprache einer der wichtigsten Indikatoren um ihre Systeme zu evaluieren. Deswegen ist die Bestimmung der Sprachqualität essentiell. Traditionell wird die Sprachqualität mit subjektiven Verfahren evaluiert. Hierzu werden naive Testpersonen gefragt Sprachproben zu bewerten. Dies resultiert dann für jede Sprachprobe in einer mittleren Bewertung. Da subjektive Tests kosten- und zeitintensiv sind haben sich instrumentelle Qualitätsschätzer etabliert. Diese schätzen auf Basis der subjektiven Bewertungen die Qualität der einzelnen Sprachproben. Hierfür wird das ungestörte Eingangssignal eines Übertragungssystems und dessen gestörtes Ausgangssignal miteinander verglichen und über die Unterscheide wird die subjektive Bewertung modelliert. Diese Modelle werden intrusive Vergleichsmaße genannt. Die genannten Methoden liefern zwar valide Ergebnisse, weisen allerdings auch entscheidende Grenzen auf:

  • Um eine Verbesserung zu erreichen, ist es nicht nur wichtig die Sprachqualität zu kennen, sondern auch diese analysieren bzw. diagnostizieren zu können. So ist es bspw. ein großer Unterschied, ob ein Sprachsignal als schlecht bewertet wird, weil es oft unterbrochen ist oder weil es starkem Rauschen ausgesetzt ist. Es werden keine diagnostischen Informationen bereitgestellt.
  • Für das instrumentelle Evaluieren der Sprachqualität steht das ungestörte Eingangssignal oft nicht oder nur mit erheblichen Aufwand zur Verfügung. Aus diesem Grund kann die genannte Methode des Signalvergleichs nur effektiv im Labor angewandt werden. Für die praktische online Evaluierung, dem Monitoring, eignen sich diese Methoden nur bedingt.

In diesem Projekt sollen diese Grenzen überwunden werden. Dafür ist es das Ziel, eine Methode zu entwickeln, mit der es möglich ist, die integrale Sprachqualität online zu schätzen und dazu auch noch diagnostische Informationen zu liefern. 

Zur erfolgreichen Umsetzung dieses Ziels ist die Beantwortung einer Reihe anwenderorientierter Forschungsfragen notwendig, welche im Rahmen des Forschungsprojektes erfolgen soll:

  1. Parameterfindung: Welche Informationen des übertragenen Sprachsignals können verwendet werden um Eigenschaften der Qualitäts-Dimensionen zu modellieren?
  2. Dimensionsschätzung: Wie lassen sich die unter 1. gefunden Parameter kombinieren um die perzeptiven Dimensionen vorherzusagen?
  3. Gesamtqualitätsschätzung: Wie lässt sich die Gesamtqualität aus den geschätzten Dimensionen schätzen?
  4. Evaluation: Wie valide und zuverlässig ist ein solches nicht-intrusives Modell, insbesondere im Vergleich zu existierenden intrusiven Modellen?
  5. Einsatz: Wie kann ein solches Modell implementiert werden und wie kann es im laufenden Betrieb, bspw. bei der Deutschen Telekom AG, eingesetzt werden?

Software Campus-Partner: TU Berlin, Deutsche Telekom AG

Umsetzungszeitraum: 01.04.2015 - 31.01.2017