DE4440598C1

DE4440598C1 - Durch gesprochene Worte steuerbares Hypertext-Navigationssystem, Hypertext-Dokument für dieses Navigationssystem und Verfahren zur Erzeugung eines derartigen Dokuments

Info

Publication number: DE4440598C1
Application number: DE4440598A
Authority: DE
Inventors: Darin Edward Krasle
Original assignee: Siemens AG; Siemens Corp
Current assignee: Siemens AG; Siemens Corp
Priority date: 1994-11-14
Filing date: 1994-11-14
Publication date: 1996-05-23
Anticipated expiration: 2014-11-15
Also published as: US6859777B2; US20010002466A1; US6029135A

Description

Hypertext-Systemen kommt eine rasch wachsende Bedeutung in vielen Bereichen der Daten- und Kommunikationstechnik zu. Wichtige, bereits verwirklichte Beispiele sind

- typische Hypertext-Hilfesysteme und Hypertext-Dokumentatio nen für Software-Anwendungen (z. B. unter graphischen Be triebssystemen für Personal Computer), bei denen der Benutzer gewöhnlich innerhalb einzelner Hypertext-Dokumente, die als Dateien auf einem einzigen Rechner gespeichert sind, navigie ren kann, sowie
- das World Wide Web (WWW), ein weltumspannendes Hypertext- Netzwerk auf der Grundlage des Internet, welches dem Benutzer die Navigation durch eine Vielzahl miteinander verknüpfter, sich gegenseitig zitierender (d. h. aufeinander verweisender) Hypertext-Dokumente ermöglicht, die im allgemeinen auf einer großen Zahl weit voneinander entfernter Rechner im Netzwerk gespeichert sind. Hypertext-Dokumente enthalten dabei im all gemeinen Informationen in Form von Text, digitalen Bildern oder Audio- oder Video-Daten, oder Kombinationen davon.

Ein wesentliches, charakteristisches Merkmal aller Hypertext- Systeme ist die Möglichkeit der Navigation. Ein Hypertext-Do kument enthält neben dem eigentlichen Text besondere Zeichen folgen, die auch Bestandteil des eigentlichen Texts sein kön nen, welche gewöhnlich als Links oder Hyper-Links bezeichnet werden, und zur Hypertext-Navigation dienen. Normalerweise sind diese Zeichenfolgen besonders markiert, werden z. B. in einer anderen Farbe oder auf andere Weise hervorgehoben ange zeigt. Wählt ein Benutzer eines Hypertext-Systems einen sol chen Link - gewöhnlich durch einen kurzen Klick mit der Maus - aus, reagiert das Hypertext-System auf diese Anweisung, in dem es einen mit dieser Zeichenfolge (Link) assoziierten Teil desselben Hypertext-Dokuments oder eines anderen Hypertext- Dokuments zur Anzeige bringt. Andere mögliche Reaktionen sind das Eröffnen einer Verbindung zu einem anderen Rechner, z. B. zu einer Online-Datenbank, das Starten eines weiteren Anwen dungsprogramms, das Öffnen einer anderen Datei, das Anstoßen eines Datenverarbeitungsprozesses oder eine Kombination aus derartigen möglichen Reaktionen.

Daneben führen Hypertext-Systeme gewöhnlich noch andere Be fehle aus, die nicht mit Zeichenfolgen (Links) in Hypertext- Dokumenten assoziiert sind, wie z. B. das Blättern durch be reits gezeigte Dokumente oder Dokumentteile (z. B. Seiten), das Speichern von Hypertext-Seiten in sogenannten Hotlists, das Aufrufen oder Durchblättern von in Hotlists gespeicherten Seiten, das Nachladen von Bildern, etc. Diese Befehle werden normalerweise in der für graphische Benutzeroberflächen typi schen Weise - z. B. mit der Maus - eingegeben.

Hypertext-Dokumente können auf vielfältige Weise organisiert und strukturiert sein. Neben der eigentlichen Hypertext- Struktur kommen auch noch hierarchische Strukturen oder Li sten-Strukturen in Betracht. Andere Hypertext-Dokumente ste hen mit Datenbanken in Verbindung, dienen diesen z. B. als Ein- und/oder Ausgabe-Formulare. Diese Strukturen können sich auch innerhalb eines Hypertext-Dokuments überlagern. Dabei kann ein einziges Hypertext-Dokument nur wenige oder aber mehrere Tausend Links enthalten. Dokumente im World Wide Web sind repräsentative Beispiele für die Vielfalt möglicher Hy pertext-Dokumente.

Es gibt eine Reihe von Anwendungsmöglichkeiten hypertext-ba sierter Systeme, bei denen die herkömmliche Art der Eingabe von Befehlen oder Aktivierung von Links als störend empfunden wird, unerwünscht oder gar unmöglich ist. Dies ist z. B. dann der Fall, wenn der Benutzer behindert ist, seine Hände mit der Bewältigung anderer Aufgaben beschäftigt sind, oder wenn die Umgebungsbedingungen die Verwendung herkömmlicher Einga begeräte verbieten. Die Spracherkennung bietet sich hier als einfache, natürliche Art der Eingabe an, die weniger Übung seitens des Benutzers als andere Eingabemittel voraussetzt.

In der EP 0 607 615 A1 ist ein herkömmliches System zur Er kennung gesprochener Sprache detailliert beschrieben. Der In tegration herkömmlicher akustischer Spracherkennungssysteme, d. h. Systeme zur Erkennung gesprochener Sprache, mit Hy pertext-Systemen, die auch als "Viewer" oder "Browser" be kannt sind, stehen jedoch technische Schwierigkeiten im Wege. Das Spracherkennungssystem muß nämlich in der Lage sein, je des Wort, welches in einem Hypertext-Dokument als Link auf treten könnte, zu erkennen. Weil praktisch jedes Wort im Text auch ein Hyper-Link sein könnte, wären hierzu sehr große Le xika erforderlich, die die Verarbeitungsgeschwindigkeit und die Erkennungsleistung dieser Systeme auf ein unvertretbares Maß reduzieren würden. Selbst wenn die Verwendung sehr großer Lexika möglich wäre, könnten auch damit nicht die zahllosen Wortneuschöpfungen und Eigennamen erkannt werden, die für viele Hypertext-Anwendungen, namentlich aber für Hypertext- Netzwerke wie das World Wide Web so typisch sind. Beispiels weise aus dem US-Buch "Muller, M.J., Daniel, J.E.: Toward a Definition of Voice Documents, in Proc. of COIS, 1990, S. 174-183", ist ein durch gesprochenen Worte steuerbares Hy pertext-System bekannt, bei dem der Benutzer jedoch nicht Hy per-Links ausspricht und dadurch das System steuert (navigiert), sondern bei dem der Benutzer Systembefehle aus spricht, die von der Spracherkennungseinrichtung erkannt wer den, woraufhin entsprechende Aktionen des Systems ausgeführt werden.

Der Erfindung liegt daher die Aufgabe zugrunde, ein durch gesprochene Worte steuerbares Hypertext-Navigationssystem, das in der Lage ist, die in abgerufenen Hypertext-Dokumenten enthaltenen Hyper-Links als gesprochene Worte mit einer brauchbaren Erkennungsleistung bei vertretbarem technischen Aufwand zu erkennen, sowie ein Hypertext-Dokument für dieses Navigationssystem und ein Verfahren zur Erzeugung eines der artigen Dokuments anzugeben.

Diese Aufgaben werden erfin dungsgemäß durch ein durch gesprochene Worte steuerbares Hy pertext-Navigationssystem mit Merkmalen nach einem der An sprüche 1 oder 2, ein Hypertextdokument nach Anspruch 6 bzw. durch ein Verfahren zur Erzeugung eines derartigen Dokuments nach Anspruch 8 gelöst.

Gemäß der vorliegenden Erfindung sind eine Einrichtung zur Erkennung gesprochener Sprache und Mit tel zur Adaption dieser Spracherkennungseinrichtung an In halte von Hypertext-Dokumenten vorgesehen. Durch die Adaption der Spracherkennungseinrichtung an Inhalte von Hypertext-Do kumenten werden große Lexika entbehrlich und die Erkennbar keit beliebiger, auch unvorhergesehener Worte in Hypertext- Dokumenten grundsätzlich sichergestellt.

Auf dem erfindungsgemäßen Lösungsprinzip beruhen auch die Hypertext-Dokumente gemäß einem der Ansprüche 6 oder 7. Mit diesen sind nämlich Zusatzdaten verknüpft, welche eine Einrichtung zur Erkennung gesprochener Sprache bei der Erkennung der vom Anwender ausgesprochenen Hyper-Links des Dokuments unterstützen. Diese Zusatzdaten bestehen dabei bevorzugt aus einem Lexikon und einem Wahrscheinlichkeitsmodell, wobei das Lexikon zur Hypertext-Navigation dienende Zeichenfolgen (Links) dieses Hypertext-Dokuments und ihnen zugeordnete Pho nemfolgen als Einträge enthält, und wobei das Wahrscheinlich keitsmodell einem System zur Erkennung gesprochener Sprache ermöglicht, einem gesprochenen Wort oder einer Folge von ge sprochenen Worten einen Eintrag des Lexikons zuzuordnen.

Diese erfindungsgemäßen Hypertext-Dokumente können aus her kömmlichen Hypertext-Dokumenten mit Hilfe eines Verfahrens nach einem der Ansprüche 8 oder 9 erzeugt werden.

Vorteilhafte Weiterbildungen der Erfindung sollen mit Hilfe von Unteransprüchen unter Schutz gestellt werden.

Im folgenden wird die Erfindung anhand bevorzugter Ausfüh rungsbeispiele näher beschrieben.

Gemäß der vorliegenden Erfindung werden die Probleme durch Mittel zur Adaption einer Spracherkennungseinrichtung an In halte von Hypertext-Dokumenten gelöst. Diese Mittel bestehen vorzugsweise aus Zusatzdaten, die einem Hypertext-Dokument zugeordnet sind, und welche ein System zur Erkennung gespro chener Sprache bei der Erkennung von gesprochenen Worten un terstützen, die zur Hypertext-Navigation dienenden Zeichen folgen, also den Hyper-Links, dieses Hypertext-Dokuments ent sprechen.

Gemäß einer bevorzugten Ausführungsform der vorliegenden Er findung bestehen diese Zusatzdaten aus einem Lexikon und ei nem Wahrscheinlichkeitsmodell, wobei das Lexikon zur Hy pertext-Navigation dienende Zeichenfolgen, also die Links dieses Hypertext-Dokuments und ihnen zugeordnete Phonemfolgen als Einträge enthält, und wobei das Wahrscheinlichkeitsmodell einem System zur Erkennung gesprochener Sprache ermöglicht, einem gesprochenen Wort oder einer Folge von gesprochenen Worten einen Eintrag des Lexikons zuzuordnen.

Diese Zusatzdaten zu einem Hypertext-Dokument oder zu ei nem Teil eines solchen können gemäß einer bevorzugten Ausfüh rungsform der Erfindung erzeugt werden, wenn ein Anwender dieses Dokument oder diesen Teil öffnet oder anfordert. Diese Ausführungsform der Erfindung, bei der die Daten zur Adaption des Spracherkennungssystems also erst zur Laufzeit (at run time) und im System des Anwenders erzeugt werden, soll im folgenden als "Laufzeit-Variante" der Erfindung bezeichnet werden. Ein Teil eines Dokuments im Sinne dieser Darstellung kann dabei z. B. eine Seite eines Hypertext-Dokuments sein, oder eine Folge eng zusammengehöriger Seiten eines größeren Dokuments. Grundsätzlich gilt, daß Hypertext-Dokumente oder Seiten häufig nicht gleich vollständig zum Anwender übertra gen werden, sondern daß bestimmte Dokumentteile, z. B. Bilder, Audio- oder Video-Sequenzen wegen ihrer großen Datenfülle nur auf gesonderte Anforderung seitens des Anwenders an diesen übermittelt werden. Wichtig ist die Vorstellung, daß die Zusatzdaten im Sinne dieser Erfindung bei der Laufzeit-Vari ante erst im Anwender-System, und zwar erst dann und nur in dem Umfang erzeugt werden, wie sie vom Anwender tatsächlich oder voraussichtlich benötigt werden, damit eine Navigation durch lautes Aussprechen der Links, die in dem betreffenden Teil des Hypertext-Dokuments enthalten sind, ermöglicht wird.

Bei einer anderen Ausführungsform der Erfindung, der "Offline-Variante", werden die Zusatzdaten zu einem Hy pertext-Dokument bereits vom Ersteller oder Anbieter dieses Dokuments (offline, nicht zur Laufzeit) erzeugt, jedenfalls zusammen mit dem eigentlichen Hypertext-Dokument zum Laden oder zur Übertragung bereitgestellt.

Zur Erzeugung der Zusatzdaten, also des Lexikons bzw. der Lexika und des Wahrscheinlichkeitsmodells, werden gemäß der vorliegenden Erfindung bei beiden Varianten die Links in dem zugehörigen Hypertext-Dokument gesucht und aus dem Quelltext des Hypertext-Dokuments extrahiert. Jeder einem Link entspre chenden Zeichenfolge wird eine Phonemfolge oder auch mehrere, z. B. alternativen Aussprachemöglichkeiten entsprechende Pho nemfolgen zugeordnet. Zeichenfolgen und Phonemfolgen werden in eine Liste eingetragen, welche ein Lexikon im Sinne der Erfindung bildet. Bei der Laufzeit-Variante der Erfindung werden die Phonemfolgen im Anwendersystem vorzugsweise mit Hilfe allgemeingültiger, für eine bestimmte Sprache spezifi scher Ausspracheregeln erzeugt. Dies kann im Falle wenig be kannter Worte von Vorteil sein, da so die tatsächliche Aus sprache dieser Worte durch eine Mehrzahl der Benutzer besser angenähert werden wird, als bei Verwendung der (korrekten) Phonemfolgen eines Wörterbuchs.

In jedem Fall ist die "Laufzeit-Variante" dann von großem Vorteil, wenn die Zahl der Links sehr groß ist, weil anson sten erheblich mehr Daten zu übertragen sein werden als bei herkömmlichen Hypertext-Dokumenten. Fehler bei der Erkennung gesprochener Links werden zwar bei diesem Verfahren gelegent lich auftreten, sind aber nicht mit großen Nachteilen verbun den, da ein Navigationsfehler durch eine einfaches zusätzli ches Kommando, z. B. durch ein "UnDo"-Kommando stets rückgän gig gemacht werden kann. Ferner hat die Laufzeit-Variante den Vorteil, daß der Ersteller oder Anbieter eines Dokuments die Ausspracheregeln eines Benutzers nicht kennen muß. Sie ist daher auch dann anwendbar, wenn gleiche Zeichenfolgen durch unterschiedliche Anwender unterschiedlich ausgesprochen wer den könnten, solange die Anwender-Systeme die "richtigen" Ausspracheregeln verwenden. Ein weiterer Vorteil der Lauf zeit-Variante ist darin zu sehen, daß bei der Erzeugung des Lexikons die Befehle und zugehörigen Phonemfolgen des Anwen ders bzw. der Anwender nicht bekannt sein müssen. Hierdurch wird die Verwendung unterschiedlicher Software-Produkte mit abweichenden Befehlssätzen gleichermaßen möglich.

Die Offline-Variante bringt hauptsächlich dann Vorteile, wenn mit Hilfe allgemeingültiger Aussprachemodelle keine Phonem folgen hinreichend guter Qualität erzeugt werden können. Dies wird vor allem auf Anwendungsfeldern der Fall sein, bei denen der Verringerung von Erkennungsfehlern eine hohe Priorität zukommt. Der Fachmann erkennt anhand der vorliegenden Dar stellungen sofort, daß auch Mischformen der beiden beschrie benen Ausführungsformen vorteilhaft sein können, bei denen ein Teil der weiteren Daten eines Hypertext-Dokuments offline, also vom Ersteller oder Anbieter eines Dokuments, erzeugt werden, wogegen andere Teile "zur Laufzeit", also beim Anwender erzeugt werden. So könnten etwa Phonemfolgen zu besonders kritischen Links einem Dokument schon vom Author mitgegeben werden, wogegen beispielsweise die Phonemfolgen der Systembefehle eines "Web-Browsers" in einer Datei auf dem Anwender-System gehalten werden.

Die Extraktion der Links aus einem Hypertext-Dokument könnte z. B. von einer hierfür geschriebene Software - nennen wir sie "Manager" - geleistet werden, welche den Quelltext eines Do kuments vom "Viewer" erhält. Der Quelltext kann z. B. - wie im World Wide Web üblich - in der Hypertext Markup Language HTML geschrieben sein. Der Manager bearbeitet den Quelltext nach Art eines Parsers und extrahiert die Links. Textuelle HTML- Links bestehen gewöhnlich aus wenigstens zwei Teilen: aus ei ner Zeichenfolge, die dem Anwender normalerweise vom Viewer gezeigt wird, und aus einem Uniform Resource Locator (URL), der im WWW normalerweise die syntaktische Form

http://host.domain/path/file

annimmt. Dabei bezeichnet "host" einen Wirtsrechner in einer durch "domain" bezeichneten Netzwerk-Domäne. Auf diesem Rech ner gibt es (hoffentlich) unter dem Pfad "path" eine Datei "file", die in den meisten Fällen ein HTML-Dokument ist, näm lich dasjenige HTML-Dokument, auf welches der Link mit diesem URL verweist. Beispiele für URLs wären etwa

http://www.sni.de/pub/docs/mydoc.html,

mit dem auf ein HTML-File "mydoc.html" im Unterverzeichnis "/docs" des Verzeichnisses "/pub" auf dem deutschen WWW-Ser ver "www.sni.de" verwiesen würde, oder

http://sunsite.unc.edu/patents/intropat.html,

ein Verweis auf die Titelseite (Homepage) "intropat.html" ei ner nicht-kommerziellen Datenbank für US-Patente an der Uni versität von North Carolina (UNC). Der URL enthält also die eigentliche Information über den Aufbewahrungsort des Doku ments oder Dokumententeils, auf welches der Link mit der vom Viewer gezeigten Zeichenfolge verweist.

Der Manager erzeugt nun zu jeder Zeichenfolge eines jeden Links mindestens eine Phonemfolge, die die vermutete(n) Aus sprache(n) der Zeichenfolge charakterisieren, und trägt die Zeichenfolgen zusammen mit den Phonemfolgen in ein Lexikon ein. Das Lexikon ist also eine Zuordnung zwischen Zeichenfol gen und Phonemfolgen. Daraufhin wird eine statistische Ana lyse der Worte in dem Lexikon durchgeführt, und es wird ein Wahrscheinlichkeitsmodell erzeugt, welches die Wahrschein lichkeit von Wortkombinationen in dem Lexikon bestimmt. Das Lexikon und das Wahrscheinlichkeitsmodell werden zur Konfigu ration und damit zur Adaption eines Spracherkennungsystems verwendet, welches den vom Anwender gesprochenen Worten Zei chenfolgen des Lexikons und damit Links des Hypertext-Doku ments zuordnen soll. Das Spracherkennungssystem wird damit speziell auf die Erkennung der in dem Hypertext-Dokument ent haltenen Links adaptiert, wodurch seine diesbezügliche Erken nungsleistung dramatisch verbessert wird. Erkannte Zeichen folgen werden in Hypertext-Navigationsbefehle umgesetzt. Wurde ein Link erkannt, wird der diesem Link assoziierte URL aktiviert, oder es wird eine andere diesem Link zugeordnete Reaktion des Systems ausgelöst. Wurde ein Systemkommando er kannt, wird dieses an den Viewer weitergegeben und von diesem ausgeführt. Nach dem Laden eines einem URL entsprechenden HTML-Files beginnt der Extraktionsprozeß von neuem.

Es ist nach der Lektüre dieser Darstellung klar, daß es ge wöhnlich von Vorteil ist, die Lexika und Wahrscheinlichkeits modelle der letzten Seiten oder Dokumente oder besonders wichtiger Dokumente für den Fall auf dem Anwender-System vor rätig zu halten, daß diese Seiten erneut geladen werden (Cash-Speicher für weitere Daten). Viele Viewer halten die HTML-Quelltexte der letzten HTML-Seiten vorrätig oder erlau ben es dem Benutzer, diese oder ihre URLs z. B. in Hotlists abzuspeichern, um diese Seiten später schneller aufrufen zu können oder wiederzufinden. Ähnliche Verfahren bieten sich für die weiteren Daten im Sinne der vorliegenden Erfindung, also die Lexika und Wahrscheinlichkeitsmodelle, an, so daß diese nicht in jedem Fall neu erzeugt werden müssen.

Häufig ist es vorteilhaft, wenn die Navigation auch noch auf herkömmliche Weise möglich ist. Die herkömmliche Bedienung des Hypertext-Navigationssystems z. B. mit der Maus wird daher in vielen Fällen zusätzlich zur Sprachsteuerung möglich sein.

Neben der Navigation kann die Sprachsteuerung natürlich auch zur Steuerung anderer Elemente eines Hypertext-Systems ver wendet werden, wie etwa dem Nachladen von Bildern, dem Aufruf von Programmen, der Aktivierung von "Buttons", etc. Voraus setzung dafür ist lediglich, daß diesen Steuerungselementen aussprechbare Zeichfolgen, die dem Anwender zugänglich sind, und welche in Lexika aufgenommen werden können, zugeordnet sind.

Claims

1. Ein durch gesprochene Worte steuerbares Hypertext-Naviga tionssystem mit einer Einrichtung zur Erkennung gesprochener Sprache und Mitteln zur Adaption dieser Spracherkennungsein richtung an Inhalte von abgerufenen Hypertext-Dokumenten, wo bei diese Mittel mit einem abgerufenen Hypertext-Dokument verknüpfte Zusatzdaten auswerten, welche die Erkennung der vom Anwender ausgesprochenen Hyper-Links des abgerufenen Hypertext-Dokuments unterstützen.

2. Ein durch gesprochene Worte steuerbares Hypertext-Navigations system mit einer Einrichtung zur Erkennung gesprochener Sprache und Mitteln zur Adaption dieser Spracherkennungseinrichtung an Inhalte von abgerufenen Hypertext-Dokumenten, wobei diese Mittel jeweils nach dem Empfang eines abgerufenen Hypertext-Dokuments mit Hilfe allgemeingültiger Ausspracheregeln die Spracherkennungseinrichtung für die Erkennung der vom Anwender ausgesprochenen Hyper-Links des abgerufenen Hypertext-Dokuments einrichten.

3. Ein durch gesprochene Worte steuerbares Hypertext-Naviga tionssystem nach Anspruch 1 oder 2 mit fol genden Merkmalen:

a) die Einrichtung zur Erkennung gesprochener Sprache kann einem gesprochenen Wort oder einer Folge von gesprochenen Worten Einträge eines Lexikons oder mehrerer Lexika zuordnen;
b) wenigstens ein erstes Lexikon enthält Hyper-Links ei nes Hypertext-Dokuments und ihnen zugeordnete Phonemfolgen als Einträge;
c) wenigstens ein zweites Lexikon, das auch mit dem ersten Lexikon vereinigt oder ein Teil von diesem sein kann, enthält Befehle des Hypertext-Navigationssystems als Einträge.

4. Ein durch gesprochene Worte steuerbares Hypertext-Naviga tionssystem nach einem der vorhergehenden Ansprüche, welches auch auf herkömmliche Weise gesteuert werden kann.

5. Ein durch gesprochene Worte steuerbares Hypertext-Naviga tionssystem nach einem der vorhergehenden Ansprüche, bei dem nach Maßgabe des Benutzers Lexika und Wahrscheinlichkeitsmo delle, die für bereits angezeigte oder teilweise angezeigte Hypertext-Dokumente oder Teile von solchen erstellt worden sind, gespeichert werden können, damit im Falle einer erneu ten Anzeige dieser Hypertext-Dokumente oder von Teilen von solchen auf diese zurückgegriffen werden kann.

6. Hypertext-Dokument, mit dem Zusatzdaten verknüpft sind, welche eine Einrichtung zur Erkennung gesprochener Sprache bei der Erkennung der vom Anwender ausgesprochenen Hyper-Links des Dokuments unterstützen.

7. Hypertext-Dokument nach Anspruch 6, bei dem die Zusatzda ten aus einem Lexikon und einem Wahrscheinlichkeitsmodell be stehen, wobei das Lexikon Hyper-Links und ihnen zugeord nete Phonemfolgen als Einträge enthält, und wobei das Wahr scheinlichkeitsmodell einer Einrichtung zur Erkennung gespro chener Sprache ermöglicht, einem gesprochenen Wort oder einer Folge von gesprochenen Worten einen Eintrag des Lexikons zu zuordnen.

8. Verfahren zur Erzeugung eines Hypertext-Dokuments mit Merkmalen nach einem der Ansprüche 6 oder 7 aus einem her kömmlichen Hypertext-Dokument mit folgenden Schritten:

a) der Quelltext des herkömmlichen Hypertext-Dokuments wird nach Zeichenfolgen, die als Hyper-Links dienen, unter sucht; diese Zeichenfolgen werden aus dem Quelltext extra hiert;
b) diesen Zeichenfolgen werden Phonemfolgen zugeordnet; Zei chenfolgen und zugehörige Phonemfolgen werden in ein Lexikon eingetragen;
c) zu den Einträgen des Lexikons wird ein Wahrscheinlich keitsmodell für eine Einrichtung zur Erkennung gesprochener Sprache erstellt.

9. Verfahren nach Anspruch 8, bei dem zusätzlich zu den Zei chenfolgen, die als Hyper-Links dienen, auch Befehle des Hypertext-Navigationssystems, zusammen mit ihnen entsprechen den Phonemfolgen, in ein Lexikon eingetragen werden.