JP3016864B2

JP3016864B2 - 書込みを有するオーディオ・ビジュアルワーク、オーディオ・ビジュアルワークにおいて連続的に口頭発音と書込みとを有意味に結合する方法、及び線形及び会話応用のための装置

Info

Publication number: JP3016864B2
Application number: JP7510385A
Authority: JP
Inventors: ウィリアムイーカークシー; カイルエスモーリス
Original assignee: リードスピークインコーポレイテッド
Priority date: 1993-09-24
Filing date: 1994-09-23
Publication date: 2000-03-06
Anticipated expiration: 2015-03-06
Also published as: EP0721727A4; DE69430434D1; US5741136A; CN1134210A; JPH09505671A; AU7842394A; ES2176259T3; ATE216549T1; DK0721727T3; WO1995009506A3; WO1995009506A2; CA2172606A1; EP0721727A1; EP0721727B1; DE69430434T2; BR9407649A

Description

【発明の詳細な説明】発明の背景従来のオーディオ・ビジュアル表示は、サブタイトル
（米国特許第3,199,115号及び米国特許第5,097,349号）
またはバルーン型説明文（米国特許第1,240,774号及び
米国特許第2,524,276号）の配置を含んでおり、これら
は全て表示の口頭部分の言語通訳を援助するものであ
る。

従来のサブタイトルは、異なる言語の単一のワード
（語）が話されるのと時には一致するが、この一致の出
現は偶然であり、そう屡々ではなく、そして一連の音と
一連の書込みの特定の結合（association）を達成する
のに制御されたパターンを用いていない。更に、サブタ
イトルワードの位置は映像の動作から離れていた。

各々があるワードを表示する従来のフラッシュカード
は、強制され、そして不自然な練習を反復することによ
って読みを教えることを意図している。最終的にある効
果は認められるが、これらのカードを使用することは学
習に長い期間と、読み書きの個別指導者（それが母親で
あろうと、学校の教師であろうと）がその場に存在する
ことと必要とする。またこれらのカードは、読み書きを
教える成分の外の学生の興味をそそる物語風オーディオ
・ビジュアル媒体内に指示対象を供給する本発明が与え
る結合の強さを提供するものではない。

米国特許第5,241,671号は、若干のワードが字下線を
有し、若干のワードが字下線を有していない記事のテキ
ストをコンピュータ画面上に表示することを開示してい
る。ユーザがテキストからあるワードを選択すると、画
面上の窓の中にその定義が現れ、そのワードのオーディ
オの発音が発生する。オーディオ音アイコンも表示する
ことができる。

クローズドキャプションド（耳の不自由な人のための
字幕）ワークは、ワードの群を表示する分離した領域ま
たは隣接するボックスを表示する。クローズドキャプシ
ョンシステムは、画面の下側に沿って、または話す人ま
たは動作する人から離れた他の遠隔位置にワードの群を
表示する。クローズドキャプションワードは、異なる背
景（通常は白）を有する視覚映像シーンの横、下、また
は上に現れる。耳の不自由な人を援助するためのオーデ
ィオ・ビジュアルを有する手話記号も分離した隣接する
ボックス内に表示される。これらのボックスの表示技術
は、見る人にとって邪魔であるかも知れない。

従来から個別指導オーディオ・ビジュアルは同報され
ており、これは指導者がカメラに向かってワードを話す
と、対応する書かれたワードが話した通りに話す人の前
に表示されるようになっている。見る人／聞く人、特に
若い見る人／聞く人は、このような個人指導フォーマッ
トでは飽きてしまい、表示される内容に対する関心を失
うようになる。

発明の概要要約すれば、本発明はオーディオ・ビジュアルワー
ク、及びその作成方法からなる。本発明は、一般に見ら
れるワークの自然な環境を使用する。ワークの普通のそ
して共通の一連の映像フレームまたはセグメントは、話
し言葉（スピーチ）及び他の口頭発音と共に表示され
る。更に、これらのワークはそれらの上の一連の書込み
をも有し、これらの書込みは見る人／聞く人によって順
次に聞かれる一連の発音に結合されている、即ちそれら
に対応付けられている。本明細書では、これを“ユーセ
ティック（euthetic）”（適所に配置された）キャプシ
ョニングと呼ぶことにする。話されたワード及び書かれ
たワードは、もしそれらが同一のワードであれば一致す
る。また、１つの言語で話されたワードと、同一の意味
を有する別の言語で書かれたワードは結合されたワード
である。

本発明の若干の実施例によれば、書かれたワード、話
されたワード、及び付随する顔、唇、及び頭の動きの表
面が見る人／聞く人によって同時に観察できるように、
またワードを口の付近に、そして口と整列させてワード
が口から発したような効果を作り出すように、各書込み
が発音者の頭付近に、頭の上に、または頭に結合されて
現われることが特色である。他の実施例によれば、各書
込みは、手話を使用する人の片方、又は両方の手付近
に、手の上に、または手に結合されて現われる。本発明
の他の実施例によれば、発音者が話したワードとブライ
ユ点字での書込みとが結合され、分離した装置上に“表
示”される。

本発明は、通常は演芸、広報のような、または読み書
きを目的としない他の目的のために作成された非個人指
導用オーディオ・ビジュアルと共に使用される。または
本発明は、新製品の要素としても、または先に作成され
たオーディオ・ビジュアルの改良としても、このような
資料と共に使用することができる。更に本発明は、読み
書きを教える目的を持ち、本発明の応用のために設計さ
れ、新たに作成された資料に対して使用することもでき
る。本発明によれば、これらを新たに作成され、読み書
きを目的とする本発明を実施する資料は、現在の読み書
きを目的とするオーディオ・ビジュアル資料よりもうん
ざりさせる度合いが少なく、脅迫感を与える程度も少な
い。

本発明のオーディオ・ビジュアルワークは、付加的な
命令を発生するように、見る人／聞く人によって会話式
に動作可能なワークを作成するために、プログラミング
及びマルチメディアプラットフォームの使用によって線
形に表示または結合できることが特色である。

本方法の別の特色は、十分なワークを読み書きさせる
会社努力に効用を有することである。以下に説明するよ
うに、オーディオ・ビジュアル上に表示されるワードは
ある言葉の基本的なワードを使用し、これらのワードを
読んだ時にこれらのワードを認識することをある集団の
一部に教えるために、その集団に対してワークを繰り返
し同報またはその他により提示する。

図面の簡単な説明図１は、従来の技術である。

図２は、話す人の一連の側面図であって、書かれたワ
ードが異なる面内の話す人の口のところに現れている。

図３は、話す人の一連の側面図であって、書かれたワ
ードが全て同一の面内の話す人の口のところに現れてい
る。

図４は、本発明に使用される階段及び装置を示す流れ
図である。

図５は、本発明に同時オーディオ・ビジュアル発話・
書込みを含む会話ワークの作り方を示す別の流れ図であ
る。

図６は、本発明に使用されるさならる階段及び装置を
示す流れ図である。

図７は、音及び書込みの調整を援助するためのオーデ
ィオ・ビジュアルのオーディオ部分を拡張する方法を示
す流れ図である。

図８は、話す人の前面図であって、口の付近にワード
が示されている。

図９は、図８の部分概略平面図であって、対話面が示
されている。

図10は、話す人が種々の位置をとっているテレビジョ
ンセット画面の斜視図である。

図11は、別の話す人の別の斜視図である。

図12a−ｂは、本発明によるユーセティックキャプシ
ョニングを遂行する方法の流れ図である。

図13a−ｂは、本発明によるユーセティックキャプシ
ョニングを遂行する別のシステム及び方法の流れ図であ
る。

図14は、本発明によるユーセティックキャプショニン
グを遂行する別のシステム及び方法の流れ図である。

図15a−ｂは、本発明の１つの面による波形拡張を示
す図である。

図16は、本発明によるユーセティックキャプショニン
グを遂行する別のシステム及び方法の流れ図である。

図17は、図16に示すシステム及び方法の中のコンピュ
ータワークステーションに関する更に詳細な流れ図であ
る。

図18は、図17に示すコンピュータワークステーション
のさらなる詳細を示す流れ図である。

図19a−ｄは、ユーセティックキャプショニングの適
用を表す図である。

図20a−ｂは、本発明によるユーセティックキャプシ
ョニングによって達成される４象限配置を表す図であ
る。

図21は、本発明によるユーセティックキャプショニン
グの直観的適用を示す流れ図である。

図22は、本発明によるマルチメディアプラットフォー
ムの概要図である。

図23は、本発明による会話能力の流れ図である。

図24は、図23に示す会話ワード発音の流れ図である。

図25は、本発明によるブロックアウトゾーンの概要図
である。

図26は、手話を使用する本発明の１実施例の概要図で
ある。

好ましい実施例の説明図１は典型的なオーディオ・ビジュアル映像２（陰影
領域）を表示している従来技術の画面１を示している。
この画面１は、ワード“家の中（in the house）”を有
する映像２内の従来技術のクローズドキャプションドボ
ックス３、映像内の従来技術の手話ボックス４、及びワ
ード“11時に（at eleven）”を有する映像内の下側の
細長いワード追跡領域５を有している。領域５は、矢印
Ａの方向に移動するワードを表示している。殆ど部分内
の映像２に関連する対話を含む音は音源領域６から発し
たように見える。

ワードまたは本発明による他の記号は、通常は音源領
域６内のオーディオ・ビジュアルの映像部分上に配置さ
れるが、ある動作が存在（その動作の位置が音源に一致
しようと、しまいと）する場合のように、聞く人／見る
人が関心を示していることによってその人の注意がオー
ディオ・ビジュアルに向けられている場合には、映像２
の部分上にワードを重ね合わせることができる。

好ましい実施例の一つにおいて本発明は、オーディオ
・ビジュアル内の話す人の参照をフレーム（即ち、見て
いる画面の面のフレームに平行ではない面）内にワード
を配置する。見る人の参照のフレームは見ている画面の
面であるから、このような面から動作する人の世界内へ
移動したワードは、見る人に三次元物体としてより容易
に且つ有意味に見られ、現れる。

図２−３を参照する。オーディオ・ビジュアルワーク
の話す人Ｓは、頭Ｈと口Ｍを有し、ワード“look"が話
されると、書かれたワードが口から面P₁内に現れる。面
P₁は耳の不自由な人の耳（図示してない）を通る線に対
してほぼ垂直である。各ワードは、そのワードが話され
るか、または発音されてから短時間の間現れることが好
ましいが、そのワードの出現が先に話された、または爾
後に話されるワード及び音に干渉しないならば、そのワ
ードが話される直前に及び直後に現れるようにすること
ができる。その基準は、各ワードが話されるにつれて結
合された対応する書かれたワード即ち書込みを発生させ
るようになっている。本発明は話されたワード（もしく
は他の発音）の有意味のシーケンスを、書かれたワード
の調整されたシーケンス、数または他の書込みと共に表
示して、１時に１つの話されたワードまたは発音と書込
みとの結合を見る人／聞く人の記憶の中に達成する。

一度に１つ、複数の書かれたワード即ち書込みの表示
と、対応する話されたワードとを調整する目的は、見る
人／聞く人に音及び光景を覚えさせ、音または光景の何
れかが将来提示された時、見る人／聞く人の以前の記憶
が呼び覚まされるように音及び光景を自然な環境で結合
する機会を見る人／聞く人に与えることである。この目
的は、読み書き、外国語の勉強及び教育のためのもので
あるが、本発明の別の長所は、見る人／聞く人が、オー
ディオ・ビジュアルワークを表示する装置に対する彼ま
たは彼女の能力、集中力または位置に依存して口授で、
または視覚的に、もしくは両方の刺激でワードを受けて
理解できるので、理解の明確さが増すことである。第２
の長所は口もしくは口の付近に書かれた翻訳の位置がも
たらす高い理解力で外国サウンドトラックが翻訳される
ことであり、第３の長所は２つの書込みが表示される
（即ち一方は発言者の言語で、そして他方は胃なる言語
で表示され、両方が発音と同時に表面される）ことによ
って同時二カ国語書込み表示が達成されることである。
発音が迅速に連続供給され、書込みとの視覚調整が困難
な場合には、理解可能なように結合させるために、その
ように影響を受けるオーディオ・ビジュアル媒体のその
部分をデジタルまたはアナログの何れかの手段によって
音に関してデジタル的に拡張し、視覚的に拡張すること
ができる。

オーディオ・ビジュアルワークのサウンドトラックの
言葉を聞けない、または話せない人、及び単一のワード
の表示が早過ぎる人に理解させることが目的である場合
には、二重字、三重字または四重字（２、３ワードシー
ケンス、または４ワードシーケンスでさえも）を同時に
表示させることができる。この場合、ワードの数は最少
数のワードとすべきであるが、それでも当該フレーズの
ために十分な読取り理解時間窓を与えるようにする。こ
のアプローチは、目的が物語の理解またはプログラムを
楽しませることに限定される場合には、クローズドキャ
プションまたは外国映画のサブタイトルに置換される。
これは発音との結合とは対照的である。

本発明の別の実施例によれば、１もしくはそれ以上の
ワードは、これらのワードと単一の手話要素との間に対
応が存在するように、手話を話している人の片手または
両手に関連して位置決めされる。このようにすると、見
る人／聞く人にこれらのワードを自然な環境で結合する
機会が与えられ、これらのワードをその手話要素と結合
して覚えることができる。

本発明の更に別の実施例によれば、特別な読取り装置
を使用しながら見り人だけがワードを見ることができる
ように、ワードをオーディオ・ビジュアルワーク上に配
置することができる。これは見る人が特別の型の眼鏡を
装着した場合にだけ三次元表示を見ることができるのに
似ている。実際、特別な型の眼鏡は、この実施例を遂行
する好ましい方法である。

本発明のワードは、ワークの映像シーンの一体部分と
して、そしてこのシーンに重ね合わせて表示される。映
像シーンは、人の指、家具、空、背景都市風景等のよう
な成分を含む。ワードは１もしくはそれ以上の映像成分
上に重ね合わせることができるが、その結果映像成分の
一部が見えなくなるか、または書かれたワードが透明、
また半透明であるか、もしくはワードがワイヤフレーム
文字からなる場合には映像成分の一部が部分的に見えな
くなる。

複数のワードが話されるにつれて、１時に１より多い
書かれたワードが見る人／聞く人に表示されるので、正
しい音をその対応する書かれたワードに正確に結合する
ことは不可能ではないにしても困難であるから、聞く人
／見る人が２つの要素を容易に結合できるような技法
で、各音及びその対応する書かれたワードを利用可能に
することが重要である。注意力の散漫及び混乱を回避す
るためには、各話されたワードには単独の書かれたワー
ドだけを添えるべきである。可能性ある例外には、その
ワードの付加された絵文字、そのワードの手話表現、ま
たはそのワードの外国語翻訳がある。これらの書かれた
１または複数のワードは、先行ワードまたは後続ワード
が話されている間は表示がなされないならば、そのワー
ドが話される前、話されている間、及び話された後に表
示することができる。

各ワード及び信号を発音に結合させることを条件とし
て、１より多いワードまたは記号を発音中に表示させる
ことができる。例えば、もしワード“有り難う”と話し
たのであれば、ワード“thank−you"及びワード“merc
i"を同時に表示させることができる。

オーディオ・ビジュアル表示中、ワードを話す話し時
間期間と、それらの間の話さない時間期間とが存在す
る。本発明の１時に１ワード手順では、書かれたワード
は、（１）前のワードの話しに続く話されない期間、
（２）そのワードの話し、及び（３）次のワードが話さ
れる前のそのワードの話しに続く話されない期間からな
る期間中だけ表示される。

映像内のアルファベットをベースとするワードを表示
することによって、これらのワードを学力のない学生に
記憶として覚えさせることは、丁度フィルムが感光して
写真を作るように、全体の視覚画像を記録する脳の部分
を使用して記憶される語標（ロゴグラム）である。話さ
れた、または絵文字指示対象の何れか、もしくは両方と
共に、同時にアルファベットワードをセグメントで表示
すると、書かれたワード（“通常”はスクリプトされる
が、語標として視覚される）と同時に表示される１また
は複数の指示対象との間で回復可能な結合を学生の記憶
の中に作る。何回か繰り返した後にそのアルファベット
をベースとするワード（語標）を表示すると、そ（れ
ら）の指示対象、即ち話されたワードが学生の記憶を呼
び覚ます。勿論、これは読みの行為を限定するが、その
能力を悟らせることが本発明の目的である。

話されたワードと書かれたワードとを対にするこのプ
ロセスによって教育すると、逆に、ある言語に学力があ
る学生はそれを話すことができるようになる。この場
合、指示対象は書かれたワードまたは語標であり、学習
目標は話されたワードである。

学習、特に幼児の学習を向上させる鍵は、子供が話し
方を学習する環境に似た“自然”は環境で結合を表示す
ることである。普通は、そして一般的には形式的な話し
方のレッスンを含まない子供が話し方を学習する環境
は、本発明がオーディオ・ビジュアル的に与えるものと
同一の型の環境である。本発明の好ましい線形実施例で
は、オーディオを見る人には、読み書きを教えることを
主目的としない物語または他の表示の環境が与えられ
る。ある人が話すことを学習する場合、その人はその学
習の環境（同時に行われる発音との結合を達成する指示
対象として役立つ）内の仲介手段（例えば両親）によっ
てそれぞれ明示または暗示される視覚画像または動作を
見せられる。本発明の環境は、学習者（即ち子供）の環
境内の仲介手段（両親のような）によってそれぞれ視覚
画像または動作が明示または暗示され、同時に行われる
発音との結合を達成する指示対象として役立つような環
境である。このような環境は、学習者の環境内の仲介手
段がランダムな発音を行わない限り、有意味に連続する
発音を含む。このような自然言語学習状況は典型的な映
画に見出される。映画では自然な通信状況が描かれ、フ
ィルム上映中の自然な再現を通して同一のワードを繰り
返し聞かされる。自然環境及び映画の模倣は、共に、動
作及び対象とそれらの対応する記述的発音とを結合す
る。本発明は自然環境をオーディオ・ビジュアルで模倣
し、結合機会を書かれたワードまたは拡張するものであ
る。

本方法は、あるワードの音節（シラブル）または文字
から区別されたワード全体を学生に見せることによって
読みを教えることができる。全ワードを見て覚えるの
は、描の絵または漢字のような記号を見て学ぶのと同じ
ように、そのワード全体が人の脳によって処理されるも
のと考えられる。各ワードを全体として見る（または、
即解する）ことによって結合が得られ、覚えるようにな
る。これらはアルファベットをベースとする読み、音節
的な読み、または音声の読みを必要とする人の脳による
解析を通してではなく、視覚的に記憶され、結合を通し
て回復されるのである。

一方が書込まれた形状であり、他方が絵で表された形
状の２つの書込みを、単一の話されたワードに対応して
表示させる場合、これら２つの書込みを互いに併合させ
たり、またはさせなかったりして、これら２つの書込み
が結合されていることを、または同一のものであること
さえも指示することができる。例えば、ビデオ内の人が
ワード“cat（猫）”と話した時に、猫の絵文字を、書
かれたワード“ｃ−ａ−t"に変化させることができる。

本発明により作成される結合が、現在のオーディオ・
ビジュアルに関係しようとも、もしくは本発明によって
作成されようとも、本発明により作成される結合は通常
の、自然な映像環境で発生する。例えばこれらの結合
は、刑事と容疑者とが会話するような劇映画のシーン
で、歌手が歌を歌うようなビデオで、または予報士が話
しながら地図を指すようなTVニュース放送で発生する可
能性がある。これらの全ての場合、目的を必ずしも読み
書きを含むものではない。

本発明は、発音が行われると、また書込みが表示され
ると、ワークの視覚部分の一部として見ることができる
唇の動きが同時に行われるような読唇術の教育にも適用
可能である。

表示された映像の領域内に関連する源に、またはその
付近に、ワードを位置決めする長所の一つは、それが行
われた時に、見る人がワーク内の動作を注視しながら容
易にワードを聞き、ワードを見ることができることであ
る。目は、見ている画面の周辺の縁、または描かれた領
域の外側に位置決めされている左程重要ではないワード
を見ることはできるが、オーディオ・ビジュアルワーク
の動作要素に特に注視しながらそれらを読むには困難を
伴う。本発明が特にクローズドキャプショニングに優っ
ているのは、これが理由である。クローズドキャプショ
ニングは１時に１つ以上のワードを表示するが、これが
１つのワードに１つの音を結合することを妨げる。更
に、本発明はワードを、話す人に次元的な関係で表示す
るが、これは押しつけがましさを減少させ、書かれたワ
ードが占有する画面の面積を最小にする。

２人の人が対面して、もしくは対面せずに会話する場
合、書かれたワードを表示する面として、２人の人の間
の単一の面を役立たせることができる。この技術は、話
す人の１人がカメラから外れていて、カメラから外れた
その話す人の相対位置を聴衆が気づいているような場合
にも使用することができる。

各書かれたワードの文字の色、形状及び他の特徴は、
控え目になるように設計される。例えば、もしワードを
重ね合わせる背景映像成分が紺青であれば、ワードの文
字を淡青または他の青の色調にすることができる。また
背景ビジュアルを部分的に連続して見ることができるよ
うに、書かれたワードを透明または半透明にすることも
できる。更に、ワードはその源に対する色、フォント、
その他にコーディングすることもできる。

再度図２−３を参照する。話す人（Ｓ）の頭（Ｈ）が
回されると、話す人の耳を通る線にほぼ垂直な面P₁は３
つの付加的な位置P₂−P₄へ移動する。ワード“AT"が話
されるとそれは面P₂に遠近法（パースペクティブ）で現
れ、ワード“SPOT"が話されるとそれは面P₃にこれもま
た遠近法で現れ、そして最後に“GO"が話されるとそれ
は面P₄に現れる。各ワードは頭に、または頭の付近に、
もしくは頭上にさえ配置されるが、好ましくはそれを話
している発音者の口（Ｍ）に、またはその付近に位置決
めする。話す人（Ｓ）の頭（Ｈ）が回ると、それが顎先
を上げるように傾くことを注目されたい（面P₄参照）。
書込みの向きは頭の横方向及び上下方向の向きを反映す
ることが好ましい。

図３において、全ての話されたワードは、オーディオ
・ビジュアルが表示される画面内の、またはそれに平行
な面PP内に現れる。

図４に示すオーディオ・ビジュアルワークを作成する
装置は、オペレータステーションと、所望の書込み（ワ
ード“look"のような）を生成するビデオテキストジェ
ネレータと、未だ書込まれていないワークを供給するオ
ーディオ・ビジュアルワーク入力手段と、テキストとオ
ーディオ・ビジュアルワークとを組合わせて本発明の発
音／書込み調整を適切な面の向きで供給するデジタル光
学マニプレータ供給手段とを含んでいる。この操作（マ
ニプレーション）は本発明のオーディオ・ビジュアルワ
ークを作成するものであり、ワークを通して調整を行
い、その表示を中断させることなく見聞きすることを可
能にしてこの実施例を本発明の線形実施例にするのであ
る。

文字の群はワークが話された時に最も見られると思わ
れる映像の部分の上に添えられ、刻印され、重ねられ、
またはその他によって配置される。発音者の頭が見える
場合には、そのワードが口から発せられたことを示唆す
るように、位置は一般的に口またはその付近にすべきで
ある。このシーケンスは、ワーク全体に関して、もしく
は、望むならば、ワークのあるセグメントに関して全て
の、もしくは実質的な数の発音について継続させる。文
字はどのようなサイズ、フォント、または色であっても
よく、また背景の色、及び各発音の感情的なそして意図
する内容を反映するような何等かの他の図形属性を選択
する。背景に関して言えば、各書かれたワードは省略時
（default）半透明、透明、ワイヤフレームまたは背景
色の色調の色（但し、ワードが消えた後に網膜のハロー
またはゴースト像を残さずに可視性を保つように背景色
から十分に区別される色）とすべきである。感情、意図
または意味に関して言えば、例えば怒ったワードは鋭い
縁の書体を有する赤のブラッシングを有し、また子守歌
の歌詞は柔らかい筆記体の書体を有するパステル調の色
である。感情的に自然なワードは省略時の色で表示され
る。図形属性の目的は、音量、音声、ピッチ、または他
の音声属性の変数を通してもたらされる発音のニュアン
スと同時に現れるダイナミック図形を見る人／聞く人に
提供し、それによって、近い従来に記憶が呼び覚まされ
て回復できる結合の目的を協調することである。

自然通信状況は、オーディオ・ビジュアルワーク内に
満ちている。これらの状況には、上述したような刑事が
容疑者を追及していることが含まれる。自然通信環境を
含むシーン上にワードを配置すると、見る人／聞く人は
ワークを自然通信を注視し続けながら、所望の音及び書
込みの結合を作成する手段が得られる。

次に図５を参照する。本発明の線形実施例は、見る人
／聞く人がオーディオ・ビジュアル表示を停止させ、ワ
ードの定義、構文及び文の文脈用法、または他の情報を
選択によって供給するメニューを、オーディオ・ビジュ
アルが表示されている画面上で見ることができるように
コンピュータプログラムを作成することによって、会話
式実施例を作成するのに使用される。会話式のワーク
は、このようなプログラムを使用してワークを表示する
プログラム可能な教育装置を使用し、ワークを停止させ
て選択された書込みを見て、この書込みに関連する付加
的な情報を入手する。

図６を参照する。オーディオ・ビジュアルワークは、
コンピュータ図形設計者のワークステーションによって
作られる。ワークのビデオ信号（アナログ形状またはデ
ジタル形状）は設計者のワークステーション画面上に表
示されている。フレーム（１秒の1/30の絵画のシーケン
ス）で作業する場合には、設計者はコンピュータ図形ま
たはテキスト（即ちワード）を作り、そのワードを話す
のに要する時間の長さに依存してそれを１または複数の
フレームのビデオ信号に重畳する。あるワードを話すの
に要する時間の長さは、１秒の1/60乃至1/2を要する日
常英語（または他の言語）会話内の多数のワードにつれ
て変化する。アニメーションを使用し、絵の具箱ソフト
ウェアを使用することによって、付加的な文字にワード
内の文字のフォントと、選択された面内のワードの向き
とを与えることができる。

図７は、関連する書かれたワードをより長く表示する
ために、オーディオ・ビジュアル内でワードが話される
時間を伸長する方法を示す。このワードが聞かれる時間
の伸長または拡張は、ワードの音をハードディスク上に
波形としてデジタル化し、次いでその波形を再構成する
ことによって達成される。この技術は、ピッチまたは音
色を歪ませることがない。

図８の頭（Ｈ′）は、破線起線（SL）で示すように、
見る人から見て右を向いている。起線（SL）は、話す人
の参照対話面（P₅）（図示してない）内に存在してい
る。話す人の垂直参照面（Ａ）は見る人には１本の線に
見える。この面は固定されたままである。線（SL）はバ
ーベキューの串のようにワード“WOW"を通過している。

話す人の頭（Ｈ′）から始まるワード（WOW）の長さ
（距離）は、鼻（Ｎ）を有する話す人の顔（Ｆ）の幅
（d₁）の２倍の距離（d₂）以内であることが好ましい。
ワード（WOW）の位置の範囲を2d₁にすると、話す人の頭
がクローズアップ位置にある場合のシーンでは良好な結
果が得られる。頭がロングショットの距離にある場合に
は、ワードは頭よりは大きくすることができるが、それ
でも頭（Ｈ′）に接して、または見る人の関係対象へ移
動させる。この場合、距離（d₂）は距離（d₁）の３また
は４倍にすることができる。

図９は、ダイアローグ平面（P₅）平面Ａ（180゜視聴
者基準平面）およびＢ、90゜平面を示す平面略図であ
る。内部にソースライン（SL）を有するダイアローグ平
面（P₅）は、かかる向きに現れる単語「WOW」を含む。
視聴者平面（Ａ）である180゜視聴者基準平面から25゜
の他のダイアローグ平面（P₆）および（P₇）に現れる単
語は読み取り可能であるが、視聴者基準平面（Ａ）（ビ
ジョンのうちの視聴者基本平面）により近いダイアロー
グ平面内の単語は読み取りが困難であるので、本発明を
実施するには（このブロックアウト領域に）かかる位置
決めをすることほとんど行われない。

図10は制御ノブ22、23を備えたセット21のテレビスク
リーン20を示す。話し手の頭／顔の位置は図２に示され
たマルチ画像に示されている。スクリーン20の左側の画
像は頭（Ｈ）、顔（Ｆ）、かかる平面内にソースライン
（SL₁）を備えたダイアローグ平面（P₁）を示す。顔の
平面（FP₁）はダイアローグ平面（P₁）に垂直であり、
ソースライン（SL₁）は顔の平面（FP₁）に垂直であり、
話し手が直立または座っている位置にあるとき、顔の平
面は水平線に垂直な平面内にほぼ位置する。ソースライ
ン（SL₁）は単語「look」をリニアに二分する。それぞ
れのダイアローグ平面（P₂）、（P₃）および（P₄）にあ
る他のソースライン（SL₂）、（SL₃）および（SL₄）が
示されており、これらソースラインの各々はそれぞれの
単語をリニアに二分している。

最後に、図11は頭（H₃）、顔（F₃）および口（Ｍ）を
備えた話し手（S₂）を示す。顔平面（FP₂）は（この図
には示されていない）ダイアローグ平面に垂直である。
（図示していない）ダイアローグ平面内にあるソースラ
イン（SL₃）は単語「fast」を二分する。頭（H₃）は話
し手（S₂）が背中を視聴者側に回転する際にいずれの向
きにも移動できるので、かかる向きの頭（H₃）によって
話されているソースライン（SL₃）上の単語はその都度
ダイアローグ平面内に入れられるが、入れられる単語が
視聴者に読みにくいようなダイアローグ平面の向きとな
っている場合はこの限りでない。例えば話し手（S₂）が
直立位置にあり、視聴者に対して後ろ向きとなっている
場合、ダイアローグ平面内に入れた場合の単語「fast」
は視聴者にとって読みにくい角度となる。かかる読みに
くさをなくすため、単語「fast」が読みにくい場合、で
きるだけダイアローグ平面に近い平面に単語を入れる。
かかる場合、単語「fast」が頭（H₃）から離れるような
感じを与えるよう、かかる選択した平面において単語
「fast」をそれぞれの向きに示すこととなる。

時間的に可能であれば、単語「fast」が口（Ｍ）の一
部を不明瞭によるような位置に最初に表示されるように
し、次にダイアローグ平面のライン（SL₅）に沿って迅
速に移動させてもよい。これとは異なり、例えばスクリ
ーン上に1000分の0.024秒の間、この単語を表示する場
合、口（Ｍ）上にこの単語を0.008秒現し、次に0.008秒
の間、ライン（SL₃）に沿って移動し、最後に消える前
0.008秒ライン上に停止させてもよい。

ソースライン（SL）の上に単語をのせ、本発明書に述
べたそれぞれの平面に単語をのせる目的は、単語が口か
ら出て、その後オーディオビジュアルスクリーンの三次
元空間内の対象として生じさせることである。文字で表
示された単語は１つの対象として他の対象が受けるのと
同じ物理的な規則を受ける。従って、本発明を使用する
オーディオビジュアル作品中で話し手の前方をだれかが
歩く場合、話し手のスピーチを聞こえにくくし、文字で
表示された単語の画像の一部または全体を一時的にブロ
ックすることができる。本発明のかかる特徴の目的は単
語を実際の対象として見えるようにすることであり、こ
のコンセプトが抽象的なものではなく、むしろユーザー
フレンドリーなものとして特に見る若者のフィーリング
に極めて受け入れられるようにすることである。

単語の文字のサイズが大きくなったり小さくなったり
する（左のｗはｏよりも小さく、次にｏは右側のｗより
も小さくなっている図８を参照）単語を斜視図で表すよ
うに位置させる。傾斜図内の単語はかかる方向に移動す
る用に見える方向を有するように見える。話し手の口の
近くにおける斜視図内の単語は、口から出ているように
見える。単語はコミュニケーションの一部である話し手
の顔の表情を妨害することなく、できるだけ口の近くに
位置される。

作品中で話される単語のすべてはディスプレイされる
文字にされた単語に対応する必要はない。この理由は、
作品の所定の上映時間によりキャプション（字幕）化に
特別な問題を与えることがあったり、または他の理由か
らキャプションを作成する必要がないことがあるからで
る。

本発明の好ましい用途としては、テープ、フィルム、
コンピュータディスク、CD−ROMまたは他のメディアに
おいて、上記のようにテープ、フィルム、CD−ROMまた
はコンピュータディスクの話されている内容に連動す
る、意味のあるシーケンスで単語、アルファニューメリ
ックの記号または他のラインティングを入れることであ
る。かかるシーケンス化は最初から最後までフィルムま
たはテープ全体にわたって続くことができる。本発明の
オーディオビジュアル作品は、娯楽または他の文脈上意
味のある主題および内容を有することが好ましい。視聴
者はこの娯楽または他の主題を楽しむ際に、自ら特別な
努力をすることなく学習がされる。

本発明は作品の画像領域内に話された各単語が、大き
さ、色、フォントおよび他の特徴を有する点で可視的で
あるかのような印象を与える。単語の大きさとは、ディ
スプレイスクリーンの平面またはかかる平面に対し所定
角度の平面における単語の向きであり、かかる向きの単
語は画像の他の成分と同じように三次元的である。

ライティングとしては、文字、単語、像または他の信
号をふくむことができる。

本発明の別の実施例によれば、人（例えば視覚障害
者）がオーディオプログラムを聞きながら使用できる、
好ましくは別個の装置で、文字を点字で表示する。他の
実施例と同様に、点字と話し単語の間に時間的な対応が
確立され、よって文字が発声に関連していることを思い
出させる目的でかかる文字を自然の設定により関連させ
る機会がユーザーに与えられる。

実施例プレイヤーにピクトグラム（絵文字）の指示物のイン
ベントリーが利用できる娯楽ビデオゲームが使用され
る。ピクトグラムとはドラッグ可能なカーソルである。
指示物をマウスでクリックすると、その結果、ボイスオ
ーバーまたはトーキングヘッドが単語を発声する間、単
語に均等なもの（ロゴグラム）の中に指示物がフェード
イン（モルフィング）することとなる。

このゲームの目的は、意味のある配列を生じさせる絵
文字の指示物の列を生じさせることである。プレイヤー
がかかる列を一旦配列した後、マウスをダブルクリック
する結果、指示物は１度に１回ずつ左から右に文字とし
て書かれた単語（ロゴグラム）内にモルフィングし、同
時に適当にな示物が発音される。次に、意味のある配列
は発声者により左から右へ大きく繰り返され、各単語の
背景として指示物が急に表示される。

ゲームを行う際、ドラッグにより意味のない連続であ
る指示物の配列が形成されるが、この配列はダブルクリ
ックを行い、得点がない場合には結論とならない。

ダイアローグの意味のある表現の自然の流れに従っ
て、色およびフォントグラフィックのニュアンスを変え
ることができる。これにより、本発明の全有機的な見方
により、新規で標準化された感情的なグラフィックボキ
ャブラリーが形成される。例えば、次の感情に対し、次
の色およびグラフィックを使用できる。

感情色グラフィック幸福白またはピンクキラキラ悲しい青または黒ゴシック怒り赤太文字セクシー紫波形自然に見られるような物理的現実に関連させるのに、
フォントおよび色のニュアンスも変えることができる。

物理的色グラフィック低温灰色／水色氷形状高温オレンジ／赤炎湿気乳白色滴状かかる関連化は、一般的な感覚および／または人の感
情に対する色、質感等の関連するグラフィック効果をリ
ンクする、予め存在する研究および学識に基づくもので
ある。更に、追加関連インパクトを与えることができる
よう、視覚的現象、例えばグローイングおよび放射を含
む現在のグラフィックコンピュータソフトウェアの能力
を階層化できる。

本発明に係わるナレーションコンテストにおけるユー
セティックキャプショニング（字幕化）を多数の方法で
実行できる。図12a−ｂにマニュアルでユーセティック
キャプショニングを実行するための工程を示す。

図13a−ｂはユーセティックキャプションを適用する
ビデオダイレクトシステムおよび方法を示す。

図14は、ピッチまたはトーンを喪失することなく、か
つ明らかなひずみを起こすことなく、ダウン発声をスロ
ーにするシステムおよび方法を示す。図15a−ｂは、図1
4に示されたシステムおよび方法により伸長された単語
「future」のそれぞれの正常な波形および伸長波形図で
ある。図15bの波形は、波形の振幅を一定にしながら波
形を伸長させているので、図15aの波形と同じピッチで
ある。

全数乗算器と異なり、分数乗算器により波形を伸長す
る際に本発明の別の実施例が有効である。例えば、波形
の長さを２倍（100％増加）することと異なり、1.5倍
（50％増加）することが好ましい場合、公知の方法は、
どの部分を伸長させるかをランダムに選択する。本発明
の特徴によれば、波形部分のランダム選択は母音部分だ
けに限定される。これは当業者に公知の手段で行うこと
ができる。図16は、単語を位置決めする公知のキャラク
ターアニメソフトウェアを使用するユーセティックキャ
プショニングを利用するデジタルシステムおよび方法を
示す。

図17−21は、直感的ユーセティックキャプショニング
のためのシステムおよび方法である本発明の別の実施例
に関連するものである。図17は、本発明のこの実施例に
従い、ユーセティックキャプショニングソフトウェアを
利用する図16に示されたシステムおよび方法を示す。図
18は、図16および17に示されたシステムおよび方法で使
用されるコンピュータワークステーションの細部を示す
フロー図である。

図19a−ｄは、本発明に係わるユーセティックキャプ
ショニングの実施の詳細を示す。図20a−ｂは、ユーセ
ティックキャプション単語が存在するように見えるバー
チャル三次元世界の４つの象限を示す。図21はバーチャ
ル三次元世界の任意の象限において最適な向きにユーセ
ティックキャプション単語を配置するためのソフトウェ
アモジュールのフローチャートである。このソフトウェ
アはコンピュータワークステーションシステムで実行す
ることが好ましい。当業者に公知の多数の入力装置を使
用できるが、ユーザーは象限を指定し、マウスによりソ
ースラインを引き、キーボードで入力することが好まし
い。ソフトウェアモジュールを実行するこのコンピュー
タシステムは、ソースライン上に単語を自動的に位置決
めし、よって（ｘ高さ）としてタイポグラファーに知ら
れている小文字の本体の中心、例えば文字ｅの水平線を
ソースラインが通過するようにすることが好ましい。シ
ステムおよびソフトウェアが単語を置くと、このソース
ラインは削除される。

図22は、本発明に係わる相互会話式ユーセティックキ
ャプション作品を創造するための相互会話式マルチメデ
ィアコンピュータワークステーションを内蔵するマルチ
メディアプラットホームを示す略図である。図23は、相
互会話能力を実行するためのソフトウェアのフローチャ
ートである。

図24は、図23に示された相互会話式発音のフローチャ
ートである。本発明の特徴によれば、ユーザーが特定の
単語でのユーセティックキャプションオーディオビジュ
アル作品を停止すると、ユーザは発音レッスンを受ける
ことができる。ユーザーは、ユーザーの単語の発音から
生じた波形とコンピュータファイルに記憶されている正
しい波形の標準波形とを比較する音声波形解析ソフトウ
ェアを含むコンピュータに接続されたマイクに向かって
話すことが好ましい。次にコンピュータは、正しい発音
（例えば「good enough」または「excellent」）を確認
するか、またはユーザーが単語を再び発音するようにさ
せるフィードバックをユーザーに行う。

図23に示された別の選択案は、ユーザーが選択できる
相互会話アプリケーションのメニューとして提示され
る。例えばユーザーは単語をタイピングするか、または
手書き認識ソフトウェアに対する出力を発声する電子タ
ブレットに単語を書き込むことにより表示される単語
を、ユーザーがまねすることができるようにするライテ
ィングアプリケーションをユーザーが選択できる。この
会話式システムは単語が正しくタイプされたか、または
書かれたかをユーザーに知らせるようフィードバックす
ることが好ましい。

図25は、図９に示された前方の「ブロックアウトゾー
ン」内に単語を置くことを表示する。話し手の口から単
語が出ているように見える１つの方法として、図25のラ
インＡ−Ａを通過する平面におけるこのゾーンに単語を
任意に置くことができる。単語と１つの手話要素とが対
応するよう、手話を使用する人の手に関連して１つ以上
の単語を置くこともできる。図26には、本発明のこの実
施例の一例が示されており、図26は、手話同時通訳をす
る人の手を備えたはめ込みボックスおよびTVスクリーン
上の話し手を示す。話し手が単語「Future」を話し、手
話通訳者がその単語をサインする際に、その単語の手話
要素と連動してはめ込みボックス内に「Future」が表示
される。

───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号３１０，４５８ (32)優先日平成６年９月22日(1994．9．22) (33)優先権主張国米国（ＵＳ） (72)発明者モーリスカイルエスアメリカ合衆国ニューヨーク州 10016 ニューヨークイーストトゥエンティセヴンスストリート 200 スイート１シー (56)参考文献米国特許5111409（ＵＳ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G09B 17/00 G09B 5/02

Claims

(57)【特許請求の範囲】

【請求項１】テリトリー内で話される言語の、文字で書
かれた単語のグループを、メンバーからなる母集団が知
覚できるようにする方法であって、（ａ）作品の各々が各セグメントと共に一連の発音を含
む複数の絵のセグメントを含み、自然のコミュニケーシ
ョン状況を備え、非教育的シーンを含む複数のオーディ
オビジュアル作品を発声させること、（ｂ）各発音及び各文字で書かれた単語が関連するよう
に、かかる発音に対し１度に１つずつ対応するよう、文
字で書かれた単語をかかるセグメントに重ねること、（ｃ）文字で書かれた単語のグループ内の各単語に対
し、前記作品内に少なくとも１つのセグメントを提供す
ること、（ｄ）テリトリー内に所定の時間、所定の程度、かかる
作品を放送または他の方法で導入すること、を備え、よって母集団に言語のかかる文字で書かれた単
語を知覚させる方法。
【請求項２】学習者に教える方法において、（ａ）自然のコミュニケーション状況を含む１つ以上の
オーディオビジュアル作品であり、各作品がかかる状況
中に対応するライティングと同時に複数の発音の表示を
含み、各オーディオビジュアルが学習者が自然に注意を
向けるエリアを含み、該エリアが（ｉ）発音が発せられ
るか、又は発音の意味の導入によって学習者の目が向け
られる第１部分及び（ii）発音と対応するライティング
との間に関連が生じ得るよう、各発音と同時に前記ライ
ティングをディスプレイする第２部分を含む該作品を作
成すること、（ｂ）かかる作品を学習者が利用できるようにするこ
と、（ｃ）所定の発音がかかる所定のライティングに対応す
ることを学習するのを助けることができる充分な回数だ
け、対応するライティングを見ながら学習者が複数の発
音の各々を聞くまで時間を延長して、かかる学習者が視
聴のための配列を選択できるようにすること、を備えた方法。
【請求項３】第１部分および第２部分がオーバーラップ
している請求項２記載の方法。
【請求項４】視聴者に対するプレゼンテーションを行
う、自然のコミュニケーション状況を備えた画像シーン
を含むオーディオビジュアル作品であって、（ａ）かかるシーンのプレゼンテーションにおける人ま
たは他の発声者による一連の発音と、（ｂ）かかる一連の発音に関連した一連のライティン
グ、を備え、１つのライティングが画像シーン内に位置し、
各発音およびライティングが視聴者の感情内で関連する
ように聞かれる発音に対応する、視聴者にプレゼンテー
ションするための、自然のコミュニケーション状況を備
えた画像シーンを含むオーディオビジュアル作品。
【請求項５】発音する者が耳を有し、発音者の耳を通過
するラインにほぼ垂直に通過するダイアローグ平面内に
ライティングが生じる請求項４記載のオーディオビジュ
アル作品。
【請求項６】ライティングが第１の平面内又はかかる平
面に所定の角度で生じる平面内にあるフラットスクリー
ンに提示される請求項４記載のオーディオビジュアル作
品。
【請求項７】各ライティングが発音者の頭部に密に関連
する請求項４記載のオーディオビジュアル作品。
【請求項８】娯楽的な内容を有する請求項４記載のオー
ディオビジュアル作品。
【請求項９】教育的な内容を有する請求項４記載のオー
ディオビジュアル作品。
【請求項１０】所定時に視聴者に対し１つのライティン
グしか表示されない請求項４記載のオーディオビジュア
ル作品。
【請求項１１】１度に２つのライティングが表示され、
ライティングの各々が発音に関連する請求項４記載のオ
ーディオビジュアル作品。
【請求項１２】発声がなされる際に画像、フレーム又は
セグメントは、人または無生物の発声者または発声物を
有し、オーディオビジュアルプレゼンテーションの画
像、フレーム又はセグメントに一連のライティングを位
置決めする方法であって、（ａ）ビデオテキスト手段を含む機器のオペレータによ
って制御されるユニットを選択すること、（ｂ）各単語が検索のための種々のサイズ、形状及び配
列を有する複数の単語を、かかるビデオテキスト手段が
ディスプレイするようにさせること、（ｃ）ユニットのオペレータによって見ることができる
よう、一連の画像の各々を位置決めすること、（ｄ）ディスプレイされた単語を選択するようにビデオ
テキスト手段を作動させること、および（ｅ）永久的な位置決めのために選択された画像、フレ
ームまたはセグメントに所定の単語を移動すること、を備え、よって単語の発音に局部的、かつ一時的に関連
させてセグメントに単語を表示する一連のライティング
を位置決めする方法。
【請求項１３】発声者の頭部の近くに単語を位置させる
請求項12記載の方法。
【請求項１４】請求項４のオーディオビジュアル作品を
ディスプレイし、更に他の教育的な情報をディスプレイ
する制御可能なディスプレイ手段を含む教育装置。
【請求項１５】一連の発音が発音されない期間だけ分離
された一連の話し単語であり、各話し単語に関連すべき
各ライティングが、単語が話されている期間およびかか
る話されている期間の前後の話されていない期間を含む
時間の間ディスプレイされる請求項４記載のオーディオ
ビジュアル作品。
【請求項１６】画像シーンが非教育的シーンに重ねられ
たかかるライティングを備えた、非教育的シーンを含む
請求項４記載のオーディオビジュアル作品。
【請求項１７】斜視図内のかかる第１の平面に単語が表
示され、第１の平面がかかる平らなスクリーン平面から
少なくとも60度傾斜する請求項６記載のオーディオビジ
ュアル作品。
【請求項１８】画像シーンが注意を向ける動作の領域を
有し、かかる領域にライティングが位置される請求項４
記載のオーディオビジュアル作品。
【請求項１９】画像シーンが音源領域を有し、かかる領
域にライティングが位置する請求項４記載のオーディオ
ビジュアル作品。
【請求項２０】前記所定の角度で生じる平面内にあるソ
ースラインを更に有し、斜視図内のかかるソースライン
に単語が表示される請求項６記載のオーディオビジュア
ル作品。
【請求項２１】各セグメントを備えた発音を含む複数の
画像セグメントのユーセティックキャンプションを表示
するためのコンピュータに基づくデータ処理システムで
あって、（ａ）データを処理するためのコンピュータプロセッサ
手段と、（ｂ）データを記憶するための記憶手段と、（ｃ）各セグメントを備えた発音を含む複数の画像セグ
メントを表示するデータに、各発音および各文字で表示
された単語が関連するように、かかる発音に一度に１つ
ずつ対応する文字で書かれた単語を表示するデータを重
ねるための手段と、を備えた、コンピュータをベースとするデータ処理シス
テム。
【請求項２２】データを重ねるための手段が、（ａ）第１アナログビデオ信号を入力するための手段
と、（ｂ）アナログビデオ信号をビデオデジタルデータに変
換するための手段と、（ｃ）一度にフレームずつビデオデジタルデータをディ
スプレイするための手段と、（ｄ）ユーザーから単語データおよび象限データを入力
するための手段と、（ｅ）象限データおよび他の所定の基準に従い、単語デ
ータをビデオデジタルデータに挿入するための手段と、（ｆ）ビデオデジタルデータを第２アナログビデオ信号
に変換するための手段と、（ｇ）第２アナログビデオ信号を出力するための手段
と、を備えた請求項21記載のシステム。
【請求項２３】ユーザーから単語データおよび象限デー
タを入力するための手段が、（ａ）ユーザーが象限を選択できるようにするための手
段と、（ｂ）ユーザーがソースラインを引くことができる手段
と、（ｃ）ソースラインに対する角度を計算するための手段
と、（ｄ）ユーザーが単語データを入力することができるよ
うにするための手段と、（ｅ）ソースラインに沿って単語を自動的に位置決めす
るための手段と、を備えた請求項22記載のシステム。
【請求項２４】ユーザーが相互会話式にユーセティック
なキャプション（字幕）付きオーディオビジュアル作品
を操作できるようにするための、コンピュータをベース
とするシステムであって、（ａ）オーディオビジュアル作品をディスプレイするた
めの手段と、（ｂ）オーディオビジュアル作品のディスプレイを休止
させるための手段と、（ｃ）ユーザーが単語を指定できるための手段と、（ｄ）ユーザーによって指定された単語に関する別のデ
ータを処理するための手段と、を備えたコンピュータをベースとするシステム。
【請求項２５】ユーザーが単語を指定できるようにする
ための手段はオーディオビジュアル作品のディスプレイ
が休止された際にディスプレイされている単語をユーザ
ーが指定できるようにする請求項24記載のシステム。
【請求項２６】単語に関する別のデータを処理するたの
手段が、（ａ）複数の単語のための正しい発音を表示する標準デ
ータを記憶するための手段と、（ｂ）単語のユーザーの発音を表示するデータを、ユー
ザーの声から入力するための手段と、（ｃ）音声データと単語の標準データとを比較するため
の手段と、（ｂ）単語のユーザーの発音が正しいかどうかをユーザ
ーに表示するよう、音声データを比較するための手段に
応答自在な手段と、を備えた請求項24記載のシステム。