-
Die
vorliegende Erfindung betrifft ein nicht-intrusives Sprachqualitätsbestimmungssystem.
-
Über Telekommunikationsverbindungen
geführte
Signale können
beträchtlichen
Transformationen unterzogen werden, wie z.B. Digitalisierung, Verschlüsselung
und Modulation. Außerdem
können
sie aufgrund der Effekte von verlustbehafteter Kompression und Übertragungsfehlern
verzerrt werden.
-
Objektive
Prozesse zum Zwecke des Messens der Qualität eines Signals werden gerade
entwickelt und finden in der Geräteentwicklung,
Geräteprüfung und
Bewertung der Systemleistungsfähigkeit Anwendung.
-
Bestimmte
automatisierte Systeme erfordern das Abspielen eines bekannten (Referenz-)Signals durch
ein verzerrendes System (das Kommunikationsnetz oder anderes zu
prüfendes
System), um ein verschlechtertes Signal abzuleiten, das mit einer
unverzerrten Version des Referenzsignals verglichen wird. Solche
Systeme sind als "intrusive" Qualitätsbestimmungssysteme
bekannt, da, obwohl die Prüfung ausgeführt wird,
der geprüfte
Kanal im allgemeinen keinen Live-Verkehr führen kann.
-
Dagegen
sind nicht-intrusive Qualitätsbestimmungssysteme
Systeme, die benutzt werden können,
während
Live-Verkehr durch den Kanal geführt
wird, ohne daß Prüfanrufe
notwendig sind.
-
Die
nicht-intrusive Prüfung
ist erforderlich, weil es für
bestimmte Prüfungen
nicht möglich
ist, Prüfanrufe
durchzuführen.
Dies könnte
der Fall sein, weil die Anrufabschlußpunkte geographisch divers oder
unbekannt sind. Außerdem
könnte
es sein, daß die
Kosten von Kapazität
auf der zu prüfenden
Route besonders hoch sind. Eine nicht-intrusive Überwachungsanwendung kann dagegen
die ganze Zeit auf den Live-Anrufen ablaufen, um eine sinnvolle
Messung der Leistungsfähigkeit
zu ergeben.
-
Ein
bekanntes nicht-intrusives Qualitätsbestimmungssystem verwendet
eine Datenbank verzerrter Proben, die von Teams von Zuhörerpersonen bewertet
wurden, um eine mittlere Meinungsbewertung (MOS) bereitzustellen.
-
MOS
werden durch subjektive Prüfungen
erzeugt, die darauf abzielen, die Wahrnehmung der Sprachqualität eines
Systems eines durchschnittlichen Benutzers herauszufinden, indem
einem Team von Zuhörern
eine direkte Frage gestellt und eine begrenzte Antwortauswahl bereitgestellt
wird. Um zum Beispiel die Zuhörqualität zu bestimmen,
werden Benutzer gebeten, die "Qualität der Sprache" auf einer Skala
von fünf
Punkten von Schlecht bis Ausgezeichnet einzustufen. Die MOS wird
für eine
bestimmte Bedingung durch Mittelung der Einstufungen aller Zuhörer berechnet.
-
Um
das Qualitätsbestimmungssystem
zu trainieren, wird jede Probe parameterisiert und es wird eine
Kombination der Parameter bestimmt, die die beste Prädiktion
der von Zuhörerpersonen
beurteilten MOS ergibt. Die internationale Patentanmeldung Nr. WO
01/35393 beschreibt ein Verfahren zum Parameterisieren von Sprachproben
zur Verwendung in einem nicht-intrusiven Qualitätsbestimmungssystem.
-
Das
Patent Nr.
US 6,446,038 beschreibt
ein Verfahren und ein System zur Bewertung der Qualität von Sprache
in einem Voice-Kommunikationssystem, bei dem ein verfälsches Sprachsignal
empfangen und verarbeitet wird, um mehrere Verzerrungen zu bestimmen.
Die mehreren Verzerrungen werden durch ein nicht lineares neuronales
Netzwerkmodell verarbeitet, um eine subjektive Bewertung zu erzeugen,
die Benutzerakzeptanz des verfälschten Sprachsignals
repräsentiert.
-
Das
Patent Nr.
US 5,794,188 beschreibt
eine Telekommunikationsprüfvorrichtung
mit einem Analysator, der aus dem verzerrten Signal periodisch mehrere
Spektralkomponenten ableitet, die die Verzerrungen in jedem von
mehreren Spektralbändern
repräsentieren.
Der Analysator erzeugt ein Maß der subjektiven
Auswirkung der Verzerrungen aufgrund der Telekommunikationsvorrichtung.
-
Ein
Problem bei einem solchen bekannten System besteht jedoch darin,
daß eine
Kombination einer einzelnen Menge von Parametern für alle Proben
nicht effektiv ist, wenn es viele verschiedene Arten von Verzerrungen
gibt; die auftreten können.
-
Die
Erfinder haben entdeckt, daß für die meisten
Proben eine bestimmte Art von Verzerrungen vorherrscht – zum Beispiel
ein niedriges Signal/Rausch-Verhältnis,
Teile des Signals fehlen, Codierungsverzerrungen, abnormale Rauscheigenschaften,
oder es sind akustische Verzerrungen präsent.
-
Gemäß der Erfindung
wird ein Verfahren zum Trainieren eines Qualitätsbestimmungswerkzeugs bereitgestellt,
mit den folgenden Schritten: Aufteilen einer Datenbank, die mehrere
Proben umfaßt,
jeweils mit einer assoziierten mittleren Meinungsbewertung, in mehrere
Verzerrungsmengen von Proben gemäß einem
Verzerrungskriterium; und Trainieren eines verzerrungsspezifischen
Bestimmungs-Handlers
für jede
Verzerrungsmenge dergestalt, daß eine
Anpassung zwischen einem aus einer verzerrungsspezifischen Vielzahl
von Parametern für eine
Probe erzeugten verzerrungsspezifischen Qualitätsmaß für eine Probe und der mit der
Probe assoziierten mittleren Meinungsbewertung optimiert wird.
-
Das
Qualitätsbestimmungswerkzeug
kann weiter verbessert werden, wenn nichtverzerrungsspezifische
Parameter mit dem verzerrungsspezifischen Qualitätsmaß als ein weiterer Parameter
kombiniert und dann das Werkzeug trainiert wird, um eine Anpassung
zwischen diesen Parametern und den mittleren Meinungsbewertungen
zu optimieren.
-
Das
Verfahren umfaßt
deshalb vorteilhafter Weise ferner die folgenden Schritte: Trainieren
des Qualitätsbestimmungswerkzeugs
dergestalt, daß eine
Anpassung zwischen einem aus einer nicht- verzerrungsspezifischen
Vielzahl von Parametern zusammen mit einem verzerrungsspezifischen
Qualitätsmaß für eine Probe
erzeugten Qualitätsmaß und der
mit der Probe assoziierten mittleren Meinungsbewertung optimiert
wird.
-
Gemäß einem
zweiten Aspekt der Erfindung wird außerdem ein Verfahren zur Bestimmung
der Sprachqualität
in einem Telekommunikationsnetz mit den folgenden Schritten bereitgestellt:
Empfangen
eines Signals, das eine Sprachprobe umfaßt;
Auswählen eines
dominanten Verzerrungstyps für die
Probe aus einer Vielzahl möglicher
Verzerrungstypen;
Auswählen
eines verzerrungsspezifischen Bestimmungs-Handlers in Abhängigkeit von dem dominanten
Verzerrungstyp;
Verwenden des verzerrungsspezifischen Bestimmungs-Handlers zur Bereitstellung
eines verzerrungsspezifischen Qualitätsmaßes für die Probe; und
Erzeugen
eines Qualitätsmaßes in Abhängigkeit
von dem verzerrungsspezifischen Qualitätsmaß.
-
Vorzugsweise
umfaßt
der Erzeugungsschritt den Teilschritt des Kombinierens einer nichtverzerrungsspezifischen
Vielzahl von Parametern mit dem verzerrungsspezifischen Qualitätsmaß, um das
Qualitätsmaß bereitzustellen.
-
Gemäß einem
dritten Aspekt der Erfindung wird eine Vorrichtung zur Bestimmung
der Sprachqualität
in einem Telekommunikationsnetz bereitgestellt, umfassend:
einen
Empfänger
zum Empfangen eines Signals, das eine Sprachprobe umfaßt;
Mittel
zum Auswählen
eines dominanten Verzerrungstyps für die Probe aus einer Vielzahl
möglicher Verzerrungstypen;
Mittel
zum Auswählen
eines Dominante-Verzerrung-Handlers,
abhängig
von dem dominanten Verzerrungstyp, wobei der Dominante-Verzerrung-Handler
im Betrieb zum Bereitstellen eines verzerrungsspezifischen Qualitätsmaßes für die Probe ausgelegt
ist: und
Mittel zum Erzeugen eines Qualitätsmaßes in Abhängigkeit von dem verzerrungsspezifischen
Qualitätsmaß.
-
Bei
einer bevorzugten Ausführungsform
umfassen die Erzeugungsmittel Mittel zum Kombinieren einer nichtverzerrungsspezifischen
Vielzahl von Parametern mit dem verzerrungsspezifischen Qualitätsmaß, um das
Qualitätsmaß bereitzustellen.
-
Gemäß einem
weiteren Aspekt der Erfindung wird eine Vorrichtung zum Trainieren
eines Qualitätsbestimmungswerkzeugs
bereitgestellt, umfassend: Mittel zum Auf teilen einer Datenbank,
die eine Vielzahl von Proben, jeweils mit einer assoziierten mittleren
Meinungsbewertung umfaßt,
in eine Vielzahl von Verzerrungsmengen von Proben gemäß einem
Verzerrungskriterium; und Mittel zum Trainieren eines verzerrungsspezifischen
Bestimmungs-Handlers für
jede Verzerrungsmenge dergestalt, daß eine Anpassung zwischen einem
aus einer verzerrungsspezifischen Vielzahl von Parametern für eine Probe
erzeugten verzerrungsspezifischen Qualitätsmaß und und der mit der Probe
assoziierten mittleren Meinungsbewertung optimiert wird.
-
Vorzugsweise
umfaßt
die Vorrichtung ferner Mittel zum Trainieren des Qualitätsbestimmungswerkzeugs
dergestalt, daß eine
Anpassung zwischen einem aus einer nicht-verzerrungsspezifischen
Vielzahl von Parametern zusammen mit einem verzerrungsspezifischen
Qualitätsmaß für eine Probe
erzeugten Qualitätsmaß und der
mit der Probe assoziierten mittleren Meinungsbewertung optimiert
wird.
-
Vorzugsweise
repräsentieren
die Proben über
ein Telekommunikationsnetz übertragene
Sprache, und bei dem das Qualitätsmaß die von
einem durchschnittlichen Benutzer wahrgenommene Qualität der Sprache
repräsentiert.
-
Es
werden nun Ausführungsformen
der Erfindung lediglich als Beispiel mit Bezug auf die beigefügten Zeichnungen
beschrieben. Es zeigen:
-
1 eine
schmematische Darstellung eines nicht-intrusiven Qualitätsbestimmungssystems;
-
2 eine
schmematische Darstellung möglicher
nicht-intrusiver Überwachungspunkte
in einem Netz;
-
3 ein
Flußdiagramm
des Trainierens eines Qualitätsbestimmungswerkzeugs
gemäß der vorliegenden
Erfindung;
-
4 ein
Flußdiagramm,
das das Training eines Qualitätsbestimmungswerkzeugs
gemäß der vorliegenden
Erfindung weiter illustriert;
-
5 ein
Flußdiagramm,
das die Funktionsweise eines Bestimmungswerkzeugs der vorliegenden
Erfindung darstellt.
-
Mit
Bezug auf 1 ist ein nicht-intrusives Qualitätsbestimmungssystem 1 über eine
Schnittstelle 3 mit einem Kommunikationskanal 2 verbunden.
Die Schnittstelle 3 stellt eine etwaige zwischen den überwachten
Daten und dem Qualitätsbestimmungssystem 1 erforderliche
Datenumsetzung bereit. Das Qualitätsbestimmungssystem analysiert, wie
später
beschrieben wird, ein Datensignal und die resultierende Qualitätsprädiktion
wird in einer Datenbank 4 gespeichert. Details bezüglich der
Datensignale, die analysiert wurden, werden auch zur späteren Bezugnahme
gespeichert. Es werden weitere Datensignale analysiert und die Qualitätsprädiktion aktualisiert,
so daß über einen
Zeitraum hinweg die Qualitätsprädiktion
eine Vielzahl analysierter Datensignale betrifft.
-
Die
Datenbank 4 kann Qualitätsprädiktionsergebnisse
aus einer Vielzahl verschiedener Abfangpunkte speichern. Die Datenbank 4 kann
aus der Ferne durch einen Benutzer über ein Benutzerterminal 5, das
Analyse und Visualisierung der in der Datenbank 4 gespeicherten
Qualitätsprädiktionsergebnisse
bereitstellt, abgefragt werden.
-
2 ist
ein Blockschaltbild eines beispielhaften Telekommunikationsnetzes
mit möglichen
Abfangpunkten, an denen die nicht-intrusive Qualitätsbestimmung
verwendet werden kann.
-
Das
in 2 gezeigte Telekommunikationsnetze umfaßt ein Betreibernetz 20,
das mit einem Mobilnetz 22 des Globalen Systems für Mobilkommunikation
(GSM), einem Mobilnetz 24 der dritten Generation (3G) und
einem Netzwerk 26 mit Internet-Protokoll (IP) verbunden
ist. Kunden greifen über Hauptverteilungsanlagen 28, 28', die möglicherweise über eine
abgesetzte Konzentratoreinheit (RCU) 32 mit einer digitalen
Ortsvermittlung (DLE) 30 verbunden sind, auf das Netz 20 des
Betreibers zu. Anrufe werden durch digitale Multiplex-Vermittlungseinheiten
(DMSU) 34, 34', 34'' geroutet und können über eine internationale Vermittlungsstelle
(ISC) 38 zu dem IP-Netzwerk 26 über ein
Voice-Over-IP-Gateway 40 zu
dem GSM-Netzwerk 22 über
eine Gateway-Mobil-Vermittlungsstelle
(GMSC) 42 oder zu dem 3G-Netzwerk 24 über ein
Gateway 44 zu einem entsprechenden Netzwerk 36 geroutet
werden. Das IP-Netzwerk 26 umfaßt eine Vielzahl von IP-Routern, von
denen ein IP-Router 46 gezeigt
ist. Das GSM-Netz 22 umfaßt eine Vielzahl von Mobilvermittlungsstellen
(MSCs), von denen eine MSC 48 gezeigt ist, die mit einer
Vielzahl von Basis-Sender-/-Empfängerstationen
(BTS) verbunden sind, von denen eine BTS 50 gezeigt ist.
Das 3G-Netz 24 umfaßt
eine Vielzahl von Knoten, von denen ein Knoten 52 gezeigt ist.
-
Die
nicht-intrusive Qualitätsbestimmung kann
zum Beispiel an den folgenden Punkten durchgeführt werden:
- • An der
DLE 30 können
ankommende Anrufe an einen spezifischen Kunden, die von einer Vermittlung
ausgegeben werden, gewertet werden.
- • In
den DMSU 34, 34', 34'' können Strecken zwischen DMUs
und Verbindungen mit anderen Betreibern gewertet werden.
- • In
der ISC 38 kann die internationale Strecke gewertet werden.
- • In
dem Voice-Over-IP-Gateway 40 kann die Schnittstelle mit
einem IP-Netzwerk gewertet werden.
- • In
der MSC 48 können
Anrufe zu und von dem Mobilnetz gewertet werden.
- • In
dem IP-Router 46 können
Anrufe zu und von dem IP-Netzwerk gewertet werden.
- • In
dem Media-Gateway 44 können
Anrufe zu und von dem 3G-Netz gewertet werden.
-
Man
kann vielfältige
Testregimes und Konfigurationen verwenden, um einer bestimmten Anwendung
gerecht zu werden, wodurch Qualitätsmaße für Auswahlen von Anrufen auf
der Basis- der Anforderungen des Benutzers bereitgestellt werden.
Dazu könnten
verschiedene Prüfablaufpläne und Routenauswahlen
gehören.
Mit mehreren Bewertungspunkten in einem Netzwerk ist es möglich, Ergebnisse zwischen
Bewertungspunkten zu vergleichen. Dadurch kann man die Leistungsfähigkeit
spezifischer Strecken oder Netzwerk-Subsysteme überwachen. Verringerungen der
von Kunden wahrgenommenen Qualität
können
dann spezifischen Umständen
oder Fehlern zugeordnet werden.
-
Die
in der Datenbank 4 gespeicherten Daten können für eine Anzahl
von Anwendungen verwendet werden, wie zum Beispiel:
- •Netzwerk-Integritätsprüfungen
- • Netzwerk-Optimierung
- • Geräte-Versuchsbetrieb/Kommissionierung
- • Echtzeit-Routing
- •Interoperabilitätsvereinbarungsüberwachung
- • Netzwerk-Problembehebung
- • Alarmerzeugung
auf Routen
- • Mobilfunk-Planung/Optimierung
-
Nunmehr
mit Bezug auf 3 wird ein Verfahren zum Trainieren
eines nicht-intrusiven Qualitätsbestimmungssystems
gemäß der vorliegenden Erfindung
beschrieben. Es versteht sich, daß dieses Verfahren durch Software
ausgeführt
werden kann, die einen Vielzweckcomputer steuert.
-
Eine
Datenbank 60 enthält
verzerrte Sprachproben, die eine diverse Vielfalt von Bedingungen und
Technologien enthalten. Diese wurden von Teams von Zuhörerpersonen
bewertet, um auf bekannte Weise eine MOS bereitzustellen. Jede Sprachprobe
weist somit eine von subjektiven Tests abgeleitete assoziierte MOS
auf:
-
Bei 61 wird
jede Probe vorverarbeitet, um den Signalpegel zu normieren und etwaige
Filterungseffekte des Netzwerks, über das die Sprachprobe gesammelt
wurde, zu berücksichtigen.
Die Sprachprobe wird gefiltert, bezüglich Pegel ausgerichtet und
ein etwaiges Gleichstrom-Offset wird entfernt. Der Grad der angewendeten
Verstärkung
oder Dämpfung
wird zur späteren
Verwendung gespeichert.
-
Im
Schritt 62 wird für
jede Probe eine Tondetektion durchgeführt, um zu bestimmen, ob es
sich bei der Probe um Sprache, Daten handelt oder ob sie DTMF- oder
Musiktöne
enthält.
Wenn bestimmt wird, daß es
sich bei der Probe nicht um Sprache handelt, wird die Probe verworfen,
und nicht zum Trainieren des Qualitätsbestimmungswerkzeugs verwendet.
-
Im
Schritt 63 wird jede Sprachprobe kommentiert, um Perioden
der Sprachaktivität
und Stille/Rauschen anzuzeigen. Man erreicht dies durch Verwendung
eines Sprachaktivitätsdetektors
(VAD) zusammen mit einem Diskriminator für stimmhafte/nicht stimmhafte
Sprache.
-
Im
Schritt 64 wird jede Sprachprobe kommentiert, um unter
Verwendung eines zeitlichen/spektralen Tonhöhenextraktionsverfahrens Positionen
der Tonhöhenzyklen
anzuzeigen. Dadurch kann man Parameter auf tonhöhensynchrone Weise extrahieren,
was dabei hilft, Parameter bereitzustellen, die von dem bestimmten
Sprecher unabhängig sind.
Als Teil der später
beschriebenen Sprachparameterisierung werden Mund-/Rachenraumdeskriptoren
extrahiert und müssen
den stimmhaften Abschnitten der Sprachdatei entnommen werden. Eine letzte
Tonhöhenzykluskennung
wird zur Bereitstellung von Grenzen für diese Extraktion verwendet.
Außerdem
wird eine Charakterisierung der Eigenschaften der Tonhöhenstruktur über die
Zeit hinweg an den Schritt 65 weitergeleitet, um Teil der
Sprachparameter zu bilden.
-
Der
Parameterisierungsschritt 65 ist dafür ausgelegt, die zu verarbeitende
Datenmenge zu reduzieren, während
für die
in der Sprachprobe präsenten
Verzerrungen relevante Informationen erhalten werden.
-
Bei
dieser Ausführungsform
der Erfindung werden über
300 Parameterkandidaten berechnet, darunter die folgenden:
- • Rauschpegel
- • Signal/Rauschen-Verhältnis
- • mittlere
Tonhöhe
des Sprechers
- • Tonhöhenschwankungsdeskriptoren
– Längenschwankungen
– Inhaltsschwankungen
von Rahmen zu Rahmen
- • momentane
Pegelfluktuationen
-
Deskriptoren
des Mund-Rachenraums:
Zusätzlich
zu dem obigen werden verschiedene Beschreibungen der Parameter des
Mund-Rachenraums berechnet. Sie erfassen die Gesamtanpassung des
Modells des Mund-Rachenraums, momentane unwahrscheinliche Schwankungen
und illegale Sequenzen. Außerdem
werden als Basisparameter mittlere Werte und Statistiken für individuelle
Elemente des Modells des Mund-Rachenraums über die Zeit hinweg aufgenommen.
Siehe zum Beispiel die Internationale Patentanmeldung Nr. WO 01/35393.
-
Im
Schritt 66 werden die mit jeder Probe assoziierten Parameter
verarbeitet, um die dominante Verzerrung zu identifizieren, die
in dieser Probe präsent
ist, und bei dieser konkreten Ausführungsform umfassen die verwendeten
dominanten Verzerrungstypen die folgenden: niedriges Signal/Rausch-Verhältnis, fehlende
Teile des Signals, Codierungsverzerrung, abnorme Rauscheigenschaften,
akustische Verzerrungen. Dadurch können die Proben der Datenbank 60 abhängig von
den in jeder Probe präsenten
dominanten Verzerrungen in eine Vielzahl von Verzerrungsmengen 67, 67' ... 67n aufgeteilt werden.
-
Der
dominante Verzerrungstyp jeder Sprachprobe bestimmt, welche verzerrungsspezifische
Bestimmungs-Handler-Abbildung
mit dieser Sprachprobe trainiert werden wird. In einem der Schritte 68, 68' ... 68n wird unter Verwendung der Proben in
einer einzigen Verzerrungsmenge 67, 67' ... 67n eine Abbildung 76, 76' ... 76n für
jeden Verzerrungs-Handler trainiert. Nachdem die optimale Abbildung
zwischen den Parametern für
jede Sprachprobe der Verzerrungsmenge und der mit jeder Sprachprobe
assoziierten MOS (durch die Datenbank 60 bereitgestellt) für die Proben
dieser Verzerrungsmenge bestimmt wurde, wird in einem der Schritte 69, 69' ... 69n eine Charakterisierung der Abbildung
abgespeichert, die eine Identifikation der bestimmten Parameter
enthält, die
zu der optimalen Abbildung geführt
haben.
-
Bei
dieser Ausführungsform
ist die Abbildung eine lineare Abbildung zwischen den gewählten Parametern
und den MOS und die optimale Abbildung wird durch Verwendung einer
linearen Regressionsanalyse dergestalt bestimmt, daß, nachdem
jeder verzerrungsspezifische Bestimmungs-Handler in einem der Schritte 68, 68' ... 68n trainiert wurde, die verzerrungsspezifische
Abbildung 76, 76' ... 76n durch eine Menge von bei der bestimmten
Abbildung verwendeten Parametern zusammen mit einem Gewicht für jeden
Parameter charakterisiert wird.
-
Nachdem
die Abbildungen 76, 76' ... 76n für jeden
der verzerrungsspezifischen Bestimmungs-Handler in den Schritten 68, 68' ... 68n trainiert wurden, wird die Gesamtabbildung
für das
Qualitätsbestimmungswerkzeug
trainiert, wie nun mit Bezug auf 4 beschrieben
werden wird.
-
Proben
aus der Sprachdatenbank 60 werden in Schritt 70 verarbeitet,
der die Schritte 61–64 von 3 wie
zuvor mit Bezug auf 3 beschrieben repräsentiert.
-
Im
Schritt 65 werden die Sprachproben wie zuvor beschrieben
parameterisiert. Im Schritt 66 wird wie zuvor beschrieben
der dominante Verzerrungstyp identifiziert. Nachdem der dominante
Verzerrungstyp für
eine bestimmte Probe identifiziert wurde, wird dann der mit diesem
Verzerrungstyp assoziierte verzerrungsspezifische Bestimmungs-Handler
ausgewählt,
um diese Probe weiterzuverarbeiten. Wenn zum Beispiel der Verzerrungs-Handler 72n ausgewählt wird, verwendet der Verzerrungs-Handler 72n die assoziierte zuvor trainierte 76n , deren Eigenschaften im Schritt 69n abgespeichert wurden (3).
-
Die
von dem Verzerrungs-Handler 72n erzeugte
MOS wird zusammen mit den in Schritt 65 erzeugten Sprachparametern
für diese
bestimmte Probe verwendet, um die Gesamtabbildung des Qualitätsbestimmungswerkzeugs
im Schritt 73 auf ähnliche
Weise wie bei dem zuvor beschriebenen Training der verzerrungsspezifischen
Bestimmungs-Handler zu trainieren. In Schritt 79 werden
die Eigenschaften der Gesamtabbildung 77 zur Verwendung
in dem Qualitätsbestimmungswerkzeug
abgespeichert.
-
Die
Funktionsweise des nicht-intrusiven Qualitätsbestimmungswerkzeugs nach
abgeschlossenem Training wird nun mit Bezug auf 5 beschrieben.
-
Die
Schritte für
die Funktionsweise des Qualitätsbestimmungswerkzeugs
sind den in 4 gezeigten Schritten ähnlich,
die während
des Trainings der Gesamtabbildung für das Qualitätsbestimmungswerkzeug
ausgeführt
werden.
-
In
diesem Fall wird jedoch nur eine Probe auf einmal und nur ein verzerrungsspezifischer
Bestimmungs-Handler verwendet. Schritt 73 (Abbildung Trainieren)
und Schritt 74 (Abbildungscharakterisierung Abspeichern)
werden durch Schritt 75 ersetzt. Im Schritt 75 werden
die zuvor abgespeicherten Abbildungseigenschaften 77 zur
Bestimmung der MOS für
diese Probe verwendet.
-
Offensichtlich
ist es nicht notwendig, tatsächlich
Parameter für
eine Probe zu berechnen, wenn sie nicht von dem ausgewählten verzerrungsspezifischer
Bestimmungs-Handler oder zur Bestimmung der MOS im Schritt 75 zur
Auswahl des dominanten Verzerrungstyps verwendet werden sollen.
Deshalb kann es möglich
sein, das in 5 gezeigte Verfahren zu optimieren,
indem im Schritt 65 nur die Parameter berechnet werden,
die zum Identifizieren des dominanten Verzerrungstyps in Schritt 66 oder
für die Gesamtbestimmung
der MOS in Schritt 75 notwendig sind. Danach werden andere
Parameter nur dann berechnet, wenn sie von dem gewählten Dominante-Verzerrung-Bestimmungs-Handler
benötigt
werden.
-
Für Fachleute
ist erkennbar, daß die
oben beschriebenen Verfahren auf einem herkömmlichen progammierbaren Computer
implementiert werden können
und daß ein
Computerprogramm, das Anweisungen zur Steuerung des programmierbaren
Computers zur Ausführung
der obigen Verfahren auf einem computerlesbaren Medium bereitgestellt
werden können.
-
Es
versteht sich, daß,
obwohl der obige Prozeß mit
spezifischer Bezugnahme auf Sprachsignale beschrieben wurde, die
Prozesse gleichermaßen
für andere
Arten von Signalen, wie zum Beispiel Videosignale, gelten.