WO2003032191A1

WO2003032191A1 - Translation system

Info

Publication number: WO2003032191A1
Application number: PCT/JP2001/008814
Authority: WO
Inventors: Seiji Okura; Akira Ushioda
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2001-10-05
Filing date: 2001-10-05
Publication date: 2003-04-17
Anticipated expiration: 2004-04-05
Also published as: JPWO2003032191A1; US20040186732A1; JP3879929B2

Description

明細書翻訳システム技術分野

本発明は、文書の機械翻訳の技術に関し、特に、機械翻訳により生成された翻訳文に対して人が行なう校正作業を支援する技術に関する。背景技術

近年、機械翻訳の性能の向上は目覚ましいものがあり、特に翻訳の速度という点においては人による翻訳を充分に上回っているといえよう。しかしながら、翻訳精度の点で機械翻訳を人による翻訳と比較すると、その差は以前よりは縮まってきたとはいえ、未だに人による翻訳の方が遥かに良質である。

このような機械翻訳の特徴を踏まえ、翻訳前の原文を機械翻訳システムにまず翻訳させ、生成された翻訳文に対して人（翻訳者）が校正を行なうようにすることによって、質の高い翻訳を短期間で提供する翻訳サービスが広く行なわれている。

この翻訳サービスにおける校正作業では、翻訳者が機械翻訳システムで作成された翻訳文を翻訳前の原文と照らし合わせ、翻訳文の誤りや不明な部分を逐次修正するという作業が行なわれる。ここで、翻訳者はマウスやキーボード等を操作してこの修正作業を行なう。その作業の一例を更に具体的に説明すると、表示装置に表示されている翻訳文中で修正を行なう対象とする部分をまず特定し、この部分にあてはめる訳語をキーボードから入力するなどといった作業が行なわれる。

最近の機械翻訳システムでは、このような翻訳者による校正作業を支援するための機能を装備しているものがある。その一例を説明すると、前述したように翻訳文中から修正を行なう対象とする部分を特定すると、この部分について先に行なった機械翻訳処理において選択されなかった翻訳候補の一覧を表示するようにし、この翻訳候補の中に適切な訳語があればそれを翻訳者が選択するだけでその部分の修正が完了するというものがある。この機能によれば、修正のために翻訳者が訳語を入力する手間が省かれるので、修正作業の効率が向上するというものである。発明の開示

しかしながら、上述した校正作業の支援機能の例では、機械翻訳処理において選択されなかった翻訳候補が多数存在したときには、それらの中から翻訳者が適切な訳語を探す作業が発生してしまい、この作業が校正作業で必要となる時間の短縮を阻む要因のひとつとなる場合があった。

本発明は、機械翻訳により生成された翻訳文に対して人が行なう校正作業の効率を向上させることを課題とする。

ここで図 1について説明する。同図は本発明の原理構成を示している。

図 1 ( a ) は本発明の第一の基本構成を示している。同図は原文を翻訳して翻訳文を作成するシステムを示しており、 1は翻訳手段、 2は音声認識手段、 3は修正手段である。

翻訳手段 1は、入力された原文を構成している各語句に対応する複数の訳語から各々ひとつずつ訳語を選択し、該選択された訳語を組み合わせることによつて該原文についての翻訳文を作成する。

音声認識手段 2は、入力された音声に対応する語を、上記語句に対応する訳語であって翻訳手段 1によって選択されなかった該訳語から選択し、該選択された訳語を該音声の認識の結果として出力する。修正手段 3は、翻訳手段 1により作成された翻訳文を、音声認識手段 2から出力された訳語を用いて修正する。

この構成によれば、翻訳手段 1によって作成された翻訳文に用いられている不適切な訳語を適切なものに修正する作業を、翻訳者がその適切な訳語を発声するのみで行なえる。しかも、音声認識手段 2で行なわれる音声認識は、その認識の対象が原文を構成する各語句に対応付けられている訳語に限定された条件で行なわれるので、不特定の語を認識の対象とする音声認識と比べて高い認識率を得ることができる。

なお、上述した本発明の第一の基本構成において、原文で用いられる語句と該語句についての訳語とが対応付けられて登録されている訳語辞書ファイルが格納される訳語辞書ファイル格納手段と、翻訳手段 1に入力された原文を構成している語句の各々に対応付けられている訳語を訳語辞書ファイルから抽出する抽出手段とを更に有し、翻訳手段 1は、作成する翻訳文に用いる訳語を訳語抽出手段によって抽出された訳語から選択し、音声認識手段 2は、入力された音声に対応する語を、前記訳語抽出手段によって抽出された訳語であって前記翻訳手段によって選択されなかった該訳語から選択するように構成することができ、上述したものと同様の作用効果が得られる。

また、前述した本発明の第一の基本構成において、翻訳手段 1により作成された翻訳文を構成する一部の語句に対して修正を行なう力、、あるいは該翻訳文の全文に渡る修正を行なうかを示す指示が入力される指示入力手段を更に有し、音声認識手段 2は、翻訳手段 1により作成された翻訳文の全文に渡る修正を行なうことを示す指示が指示入力手段に入力されたときには、入力された音声を表現する情報を分割し、該分割された情報の各々に対応する語を、該翻訳文を構成する語句に対応する訳語であって翻訳手段 1によって選択されなかった該訳語から選択するように構成することもできる。この構成は、翻訳手段 1により作成された翻訳文がその文全体に渡って不適切であると翻訳者が判断したときには、訳語単位での修正を行なうのではなく、文全体の一括修正を行なえるようにするものであり、翻訳者による発声は文であることを示す指示が翻訳者によって指示入力手段に入力されることにより、認識対象が文であるとの前提の下での音声認識の処理が行なえるようになるので、そのような指示がなされない場合と比べて良好な認識精度を得ることができる。

また、前述した本発明の第一の基本構成において、修正手段 3は、前記語句に対応する訳語であって翻訳手段 1によって選択されなかった該訳語に音声認識手段 2から出力された訳語と関連するものがあるときには、翻訳手段 1によつて選択されなかった訳語、及び音声認識手段 2から出力された訳語を共に用いて翻訳手段 1により作成された翻訳文を修正するように構成することもできる。

この構成によれば、翻訳者は翻訳手段 1により作成された翻訳文のうちの一部の訳語に対して異なる訳語を用いるように修正する指示を行なうだけで、修正の指示を行なっていない他の訳語までもがその異なる訳語を使用するのに適切なものへと修正された翻訳文が自動的に作成されるので、翻訳者による修正の作業が軽減される。

また、前述した本発明の第一の基本構成において、修正手段 3は、音声認識手段 2から出力された訳語の品詞と、前記修正において該訳語へと置き換えられる対象である修正前の訳語の品詞とが異なるときに、音声認識手段 2に入力された訳語を用いて翻訳手段 1に入力された原文の全体の再翻訳を行なって前記翻訳文を修正するように構成することもできる。

この構成では、翻訳手段 1により作成された翻訳文のうちの一部の訳語に対して異なる訳語を用いるように修正する指示が翻訳者によって行なわれたときに、その修正された後の訳語の品詞が修正前のものと異なるものであるときには、翻訳手段 1において行なわれた原文の分析に誤りがあつたとみなし、その修正された後の訳語を用いた翻訳文が改めて作成されるというものである。この構成によれば、翻訳者は翻訳手段 1により作成された翻訳文のうちの一部の訳語に対して異なる訳語を用いるように修正する指示を行なうだけで、その修正された後の訳語の品詞が修正前のものと異なるものであるときにはその訳語を用いての翻訳文が自動的に作成されるので、翻訳者による修正の作業が軽減される。

なお、このときにおいて、修正手段 3は、音声認、識手段 2から出力された訳語の品詞と、前記修正において該訳語へと置き換えられる対象である修正前の訳語の品詞とがー致するときには、翻訳手段 1によって作成された翻訳文を構成する一部の訳語を音声認識手段 2から出力された訳語に置き換える部分的な修正を行なうように構成することもできる。こうすることにより、その修正された後の訳語の品詞が修正前のものと一致するものであるときには翻訳文の部分修正が行なわれるので、改めて翻訳文を作成するときよりも修正に要する時間が短くなる。

また、前述した本発明の第一の基本構成において、修正手段 3によって行なわれた修正の内容から、翻訳手段 1に入力された原文が話題としている分野を判定する分野判定手段を更に有し、翻訳手段 1は、新たに入力される原文についての翻訳文を作成するときには、分野判定手段によって判定された分野で用いられる頻度の高い訳語を優先して用いるように構成することもできる。

この構成は、翻訳手段 1によつて作成された翻訳文に対して翻訳者が修正した訳語が、例えば経済 ·金融分野、通信技術分野、法律分野などといったどのような分野で用いられるのかを示す情報を取得し、その後に翻訳手段 1によつて行なわれる翻訳ではその分野で用いられる訳語を優先的に使用して翻訳文の作成を行なうようにしたものであり、こうすることにより翻訳手段 1による機械翻訳の精度を向上させることができる。

なお、このときにおいて、原文で用いられる語句についての訳語が用いられる頻度の高い分野を示す情報が登録されている訳語分野情報フアイルが格納される訳語分野情報ファイル格納手段を更に有し、分野判定手段は、修正手段 3 が翻訳手段 1によって作成された翻訳文を修正したときに該翻訳文に加えた訳語が用いられる頻度の高い分野を、訳語分野情報ファイルに登録されている情報に基づいて判定するように構成することができ、上述したものと同様の作用効果が得られる。

図 1 ( b ) は本発明の第二の基本構成を示している。同図は原文を翻訳して翻訳文を作成するシステムを示しており、 4は翻訳手段、 5は訳語入力手段、 6は修正手段である。

翻訳手段 4は、入力された原文を翻訳して翻訳文を作成する。

訳語入力手段 5は、翻訳手段 4によって作成された翻訳文で用いられている訳語を他の訳語へと置き換える修正を行なうときの該他の訳語が入力される。修正手段 6は、訳語入力手段 5に入力された前記他の訳語の品詞と、前記修正において該訳語へと置き換えられる対象である修正前の訳語の品詞とが異なるときに、訳語入力手段 5に入力された該他の訳語を用いて前記原文の全体の再翻訳を行なつて翻訳手段 4によって作成された翻訳文を修正する。

この構成では、翻訳手段 4により作成された翻訳文のうちの一部の訳語に対して異なる訳語を用いるように修正する指示が翻訳者によって行なわれたときに、その修正された後の訳語の品詞が修正前のものと異なるものであるときには、翻訳手段 4において行なわれた原文の分析に誤りがあつたとみなし、その修正された後の訳語を用いた翻訳文が改めて作成されるというものである。この構成によれば、翻訳者は翻訳手段 4により作成された翻訳文のうちの一部の訳語に対して異なる訳語を用いるように修正する指示を訳語入力手段 5に入力するだけで、その修正された後の訳語の品詞が修正前のものと異なるものであるときにはその訳語を用いての翻訳文が自動的に作成されるので、翻訳者による修正の作業が軽減される。

なお、上述した本発明の第二の基本構成において、修正手段 6は、訳語入力手段 5に入力された前記他の訳語の品詞と、前記修正において該他の訳語へと置き換えられる対象である修正前の訳語の品詞とがー致するときには翻訳手段 4によって作成された翻訳文を構成する一部の訳語を訳語入力手段 5に入力された該他の訳語に置き換える部分的な修正を行なうように構成することもできる。

この構成によれば、修正された後の訳語の品詞が修正前のものと一致するものであるときには翻訳文の部分修正が行なわれるので、改めて翻訳文を作成するときよりも修正に要する時間が短くなる。

図 1 ( c ) は本発明の第三の基本構成を示している。同図は文書を翻訳するシステムを示しており、 7は翻訳手段、 8は修正手段、 9は分野判定手段である。

翻訳手段 7は、文書を構成する原文を翻訳して翻訳文を作成する。

修正手段 8は、翻訳手段 7によって作成された翻訳文の修正を行なう。

分野判定手段 9は、修正手段 8によって行なわれた修正の内容から、原文が話題としている分野を判定する。

そして、この構成において、翻訳手段 7は、文書を構成する未翻訳の原文を翻訳するときに、分野判定手段 9によって判定された分野で用いられる頻度の高い訳語を優先して使用するようにする。

この構成は、翻訳手段 7によつて作成された翻訳文に対して翻訳者が修正した訳語が、例えば経済 '金融分野、通信技術分野、法律分野などといったどのような分野で用いられるのかを示す情報を取得し、その後に翻訳手段 7によつて行なわれる翻訳ではその分野で用いられる訳語を優先的に使用して翻訳文の作成を行なうようにしたものであり、こうすることにより翻訳手段 7による機械翻訳の精度を向上させることができ、結果として翻訳者による修正の作業が軽減される。

なお、上述した本発明の第三の基本構成において、原文で用いられる語句についての訳語が用いられる頻度の高い分野を示す情報が登録されている訳語分野情報フアイルが格納される訳語分野情報ファィル格納手段を更に有し、分野判定手段 9は、修正手段 8が翻訳文を修正したときに該翻訳文に加えた訳語が用いられる頻度の高い分野を、訳語分野情報ファイルに登録されている情報に基づいて判定するように構成することもでき、こうすることによつても上述したものと同様の作用効果が得られる。

あるいは、原文で用いられる語句と該語句についての訳語とが対応付けられて登録されており、更に該訳語が用いられる頻度の高い分野を示す情報が登録されている訳語辞書ファィルが格納される訳語辞書ファィル格納手段を更に有し、翻訳手段 7は、訳語辞書ファイルに登録されている訳語のうち、入力された原文に用いられている語句に対応するものであって且つ分野判定手段 9によつて判定された分野で用いられる頻度の高いことを示す情報が訳語辞書フアイルに登録されているものを用いて前記文書を構成する未翻訳の原文の翻訳を行なうように構成することもでき、こうすることによつても上述したものと同様の作用効果が得られる。図面の簡単な説明

本発明は、後述する詳細な説明を、下記の添付図面と共に参照すればより明らかになるであろう。図 1は、本発明の原理構成を示す図である。

図 2は、本発明を実施する翻訳システムの構成を示す図である。

図 3は、 C PUによって行なわれる制御処理の処理内容を示すフローチヤ一トである。

図 4は、校正支援処理の第二の例の処理内容を示すフローチャートである。図 5は、校正支援処理の第三の例の処理内容を示すフローチャートである。図 6は、校正支援処理の第四の例の処理內容を示すフローチャートである。図 7は、校正支援処理の第五の例の処理内容を示すフローチャートである。図 8は、記録させたプログラムをコンピュータで読み取ることの可能な記録媒体の例を示す図である。発明を実施するための最良の形態

まず図 2について説明する。同図は本発明を実施する翻訳システムの構成を示している。同図において、 1 1は CPU、 1 2は ROM、 1 3は RAM、 1 4はハードディスク装置、 1 5は音声入力部、 1 6は操作入力部、 1 7は表示装置、 1 8は入出力装置、 1 9はバスである。そして、 CPU 1 1、 ROM1

2、 RAMI 3、ハードディスク装置 14、音声入力部 1 5、操作入力部 1 6

、表示装置 1 7、及び入出力装置 18はいずれもバス 1 9に接続されており、相互にデータの授受が行なえる。

CPU (Central Processing Unit ) 1 1はこの翻訳システム全体の動作制御を司る中央処理装置である。

ROM (Read Only Memory) 1 2は、 CPU 1 1によって実行される制御プログラムが予め格納されているメモリであり、 CPU 1 1がこの制御プロダラムを実行することによって本装置全体の動作の制御が行なわれる。

RAM (Random Access Memory) 1 3は、各種のデータの一時的な格納領域として、また R OM 1 2に格納されている制御プログラムを C P U 1 1が実行するときにワークメモリとして必要に応じて使用されるメモリである。

ハードディスク装置 1 4は、翻訳処理のために用いられる、翻訳前の原文の言語の語句と翻訳文の言語におけるその語句についての訳語とが対応付けられて格納されている訳語辞書ファイルが予め記憶されている。なお、この訳語辞書ファイルには、各訳語の品詞を示す情報や、訳語と訳語との間の結び付きの強さを示す情報も格納されており、更に、その訳語が、例えば経済 ·金融分野、通信技術分野、法律分野などといったどのような分野（カテゴリ）での文章でこの語句が用いられたときの翻訳の際に用いられるかを示す情報も格納されている。

なお、前述した制御プログラムを R OM 1 2に格納しておく代わりにこのハ一ドディスク装置 1 4に予め記憶させておき、この翻訳システムが起動されたときに C P U 1 1がこの制御プログラムをハードディスク装置 1 4から読み出して R AM I 3に一旦格納し、その後 R AM I 3からその制御プログラムを読み出して実行するようにしてこの翻訳システム全体の動作の制御を行なうようにしてもよい。

音声入力部 1 5は、この翻訳システムを使用して翻訳作業を行なう翻訳者の発する音声を取得してその声を表現する声データに変換する。

操作入力部 1 6はこの翻訳システムを使用する翻訳者によつて操作されるキ一ボートやマウス等の入力装置を有し、これらの入力装置に対して行なわれた操作の状況を取得する。

表示装置 1 7は C P U 1 1から指示された表示を行なうものであり、例えば C R T (Cathode Ray Tube) や L C D (Liquid Crystal Display) を用いた装置である。

入出力装置 1 8は、外部から入力される情報、例えば翻訳の対象である原文が記述されている文書データを受け取って CPU 1 1にその情報を送付し、あるいは CPU 1 1からの出力、例えば翻訳結果である翻訳文の出力を行なうものである。入出力装置 1 8は、 FD (Flexible Disk )、 CD-ROM (Compact Disc-ROM)、 D V D - R OM (Digital Versatile Disc-ROM)、 M O ( Magneto-Optics) ディスクなどといった可搬型の記録媒体の読み出し及び書き込み装置を備えて構成される。また、通信ネットワークを介して他の機器との間でこれらの入出力情報を交換するためのインタフェース装置を入出力装置 1 8として備えるようにしてもよい。更に、 CPU 1 1からの出力の内容を用紙に印刷するプリンタ装置を入出力装置 18として備えるようにしてもよい。本装置は以上の各構成要素を備えて構成される。

なお、図 2に示す翻訳システムの構成は標準的な構成のコンピュータシステムの多くが備えているものであり、従ってこのようなコンピュータシステムで本発明を実施することも可能である。

次に、図 2に示した翻訳システムにおける C PU 1 1によって行なわれる制御処理について説明する。なお、これより説明する各処理は、いずれもこの翻訳システムを制御するための制御プログラムを C PU 1 1が実行することによつて実現される。

まず図 3について説明する。同図は、 CPU 1 1によって行なわれる制御処理の処理内容を示すフローチャートである。同図に示す処理を CPU 1 1が行なうことによってこの翻訳システムで翻訳が行なわれる。

まず、メインフローである、図 3 (a) のフローチャートを説明する。

まず、 S 101では翻訳対象である原文を取得する処理が実行される。この処理では、入出力装置 18に入力された原文を表現するデータを RAMI 3に一時的に記憶させる。

S 102では機械翻訳処理が実行される。この機械翻訳処理の詳細な処理内容を示すフローチャートは図 3 ( b ) に示されており、この処理内容は後述する。

S 1 0 3では校正支援処理が実行される。この校正支援処理の詳細な処理内容を示すフローチャートは図 3 ( c ) に示されており、この処理内容も後述する。 S 1 0 3の処理が完了するとこのメインフローは終了する。

次に、図 3 ( b ) に示されている、前述した S 1 0 2の処理である機械翻訳処理の処理内容を示すフローチャートを説明する。

まず、 S 1 1 1では原文を解析して語句に分解する処理が実行される。この処理では、前述した S 1 0 1の処理によって R AM I 3に記憶されているデータで表現されている原文が語句に分解される。なお、ここで行なう原文の解析には周知の解析手法、例えば形態素解析などを利用して行なえばよレ、。

S 1 1 2では語句に対応する訳語を訳語辞書から取得する処理が実行される。この処理では、ハードディスク装置 1 4に記憶されている訳語辞書ファイルが参照され、その訳語辞書ファイルにおいて S 1 1 1の処理によって原文が分解されて得られた各語句にそれぞれ対応付けられている 1以上の訳語が取得される。

S 1 1 3では訳語を組み合わせて翻訳文を作成する処理が実行される。この処理では、まず、 S 1 1 2の処理によって取得された各訳語から翻訳文に用いる訳語を選択する処理が行なわれる。なお、ここでの訳語の選択方法は機械翻訳技術の分野で周知の手法を利用することができ、例えば過去の翻訳作業の統計データを訳語辞書ファイルに登録しておき、翻訳作業において最も選択される頻度の高い訳語を選択するといつた手法でもよい。そして、この処理によつて選択された訳語が組み合わされることによって翻訳文が作成される。この訳語の組み合わせの処理も機械翻訳技術の分野で周知の手法を利用することができる。 S 1 1 4では翻訳文を表示する処理が実行される。この処理では、 S 1 1 2 の処理によって作成された翻訳文を表示させる指示が表示装置 1 7に与えられ、表示装置 1 7はこの指示に応じてその翻訳文を表示する。

この S 1 1 4の処理を終えると S 1 0 2の処理が終了し、図 3 ( a ) に示すフローチャートへ処理が戻る。

次に、図 3 ( c ) に示されている、前述した S 1 0 3の処理である校正支援処理の処理内容を示すフローチャートを説明する。この処理によって実現される翻訳文の校正を支援する手法は、翻訳文に用いられている不適切な訳語を適切なものに修正する作業を、翻訳者がその適切な訳語を発声するのみで行なえるようにするというものである。

まず、 S 1 2 1では校正作業を行なうか否かの判定処理が実行される。この処理では、表示装置 1 7に表示されている機械翻訳による翻訳文をこの翻訳システムを使用している翻訳者が参照し、この翻訳文が適切であるかどうかを翻訳者が判断する。そして、この判断結果に基づいて、校正作業を行なうか否かを示す操作が翻訳者によって操作入力部 1 6に対して行なわれる。 C P U 1 1 は、操作入力部 1 6に対して行なわれたこの操作の内容に基づき、校正作業を行なうか否かの判定を行なうというものである。

そして、この S 1 2 1の判定処理の結果が Y e s、すなわち校正作業を行なうのであれば S 1 2 2に処理が進み、一方、この S 1 2 1の判定処理の結果が N o、すなわち校正作業を行なわないのであれば S 1 2 7に処理が進む。

S 1 2 2では音声入力がなされたか否かの判定処理が行なわれる。この処理では、訳語を発声する翻訳者の音声が音声入力部 1 5で取得されたか否かが判定される。そして、この判定処理の結果が Y e sとなるまで、すなわち音声入力がなされたと判定されるまでこの S 1 2 2の判定処理が繰り返される。

S 1 2 3では音声認識処理が実行され、音声入力部 1 5から出力される、翻訳者の音声を表現する声データが分析され、翻訳者による発音の内容を特定する処理が行なわれる。

S 1 2 4では、前述した機械翻訳処理において訳語辞書ファイルから取得された全ての訳語から、翻訳者による発音の内容に対応するものを選択する処理が実行される。この処理では、図 3 ( b ) の S 1 1 2によってハードディスク装置 1 4に記憶されている訳語辞書ファイルから取得された、原文を構成する各語句に対応付けられている全ての訳語のそれぞれの発音と、 S 1 2 3の処理によって特定された翻訳者による発音の内容とを比較し、両者間で最も相関の高い訳語が選択される。このように、本実施の形態で行なわれる音声認識は、その認識の対象が原文を構成する各語句に対応付けられている訳語に限定されているので、不特定の語を認識の対象とする音声認識と比べて高い認識率を得ることができる。

S 1 2 5では翻訳文を修正する処理が行なわれる。この処理では、まず、ハ一ドディスク装置 1 4に記憶されている訳語辞書ファイルにおいて S 1 2 4の処理によって選択された訳語に対応付けられている語句が取得される。そして、その語句の翻訳となっている訳語が表示装置 1 7に表示されている翻訳文から除去され、その翻訳文に残された訳語とその代わりに S 1 2 4の処理によつて選択された訳語とが改めて組み合わされて新たな翻訳文が作成される。こうすることによって、翻訳者は、表示装置 1 7に表示されている機械翻訳による翻訳文における修正を要する部分を特定するための指示操作を行なうことなく、その翻訳文の修正を行なうことができる。なお、修正後の翻訳文は表示装置 1 7に表示させるようにする。

S 1 2 6では校正作業が終了したか否かの判定処理が実行される。この処理では、表示装置 1 7に表示されている修正後の翻訳文をこの翻訳システムを使用している翻訳者が参照し、この翻訳文が適切であるかどうかを翻訳者が判断する。そして、この判断結果に基づいて、校正作業を更に続けるか否かを示す操作が翻訳者によって操作入力部 1 6に対して行なわれる。 C P U 1 1は、操作入力部 1 6に対して行なわれたこの操作の内容に基づき、校正作業が終了したか否かの判定を行なうというものである。なお、翻訳者による校正作業を更に続けるか否かの意思表示を翻訳者が発声し、その発声の内容を音声認識することで C P U 1 1が翻訳者の意思を認識するようにしてもよレ、。

この S 1 2 6の判定処理の結果が Y e s、すなわち校正作業を終了するのであれば S 1 2 7に処理が進み、一方、この S 1 2 6の判定処理の結果が N o、すなわち校正作業を継続するのであれば S 1 2 2へ処理が戻って上述した処理が繰り返される。

S 1 2 7では翻訳文を出力する処理が実行される。この処理では、表示装置 1 7に現在表示されている翻訳文を表現するデータを入出力装置 1 8に送り、そのデータを各種の記録媒体に記録し、その翻訳文を用紙に印字し、あるいはそのデータを他の機器に宛てて通信ネットワークに送出するなどの処理を入出力装置 1 8に行なわせる。

この S 1 2 7の処理を終えると S 1 0 3の処理が終了し、図 3 ( a ) に示すフローチヤ一トへ処理が戻る。

以上の処理が C P U 1 1によって行なわれることによって、この翻訳システムを利用した翻訳が行なわれる。ここで、この翻訳システムを利用して実際に翻訳が行なわれる様子を、英語から日本語への翻訳を例に挙げて説明する。今、翻訳対象である原文が "I saved Money. " であるとする。

まず、 S 1 0 2の機械翻訳処理が実行される。この機械翻訳処理における S 1 1 2の処理によって、ハードディスク装置 1 4に記憶されている訳語辞書フ了ィルから以下に示す訳語が取得されたとする。

"I" 「私」 "save " 「救う」

save " 「節約する」

"save " 「保存する」

"money 「金」

ここで、 S 1 1 3の処理によって原文 "I saved Money. " 力 S 「私は金を救つた。」に翻訳され、表示装置 1 7に表示されたとする。翻訳者がこの翻訳文を参照して校正の必要があると判断し、操作入力部 1 6を操作して校正作業を行なう旨の指示をこの翻訳システムに与えると、 S 1 2 1の判定処理の結果は Y e sとなり、校正支援の処理が開始される。

次に、翻訳者が、 ' setsuyaku shita ' と発声すると、この声は音声入力部 1 5で取得され、 S 1 2 3の音声認識処理が実行される。そして、 S 1 2 4において、先の S I 1 2の処理によって取得された訳語「私」、「救う」、「節約する J、「保存する」、「金」力ら、翻訳者による発声に最も近い訳語「節約する」が選択される。

そして、 S 1 2 5において、「節約する」に対応付けられている原文の語句 " save" のそれまでの訳語であった「救う」が翻訳文の作成候補から除外され、訳語「私」、「節約する」、「金」より「私は金を節約した。」なる翻訳文が作成される。こうして校正作業が終了し、適切な翻訳の結果が出力される。

次に、図 2に示した翻訳システムにおける C P U 1 1によって行なわれる制御処理の他の例について説明する。

図 4は、図 3 ( a ) の S 1 0 3の処理である校正支援処理の第二の例の処理内容を示すフローチャートである。この処理は、例えば機械翻訳により作成された翻訳文がその文全体に渡って不適切であると翻訳者が判断したときには、前述した校正支援処理のように訳語単位での修正を行なうのではなく、文全体の一括修正を行なえるようにするものである。なお、これより説明する校正支援処理を図 3 (c) に示したものとを区別するために、図 3 (c) に示した処理を校正支援処理の第一の例と称することとする。

図 4において、図 3 (c) に示した校正支援処理の第一の例と同様の処理が行なわれる処理ステップには同一の符号を付すようにし、それらの処理ステツプの説明は省略する。

図 4と図 3 (c) とを比較すれば分かるように、図 4に示したフローチヤ一トは図 3 (c) に示したフローチャートにおける S 1 23の処理と S 1 24の処理との間に S 1 31の判定処理が挿入され、この判定処理の結果によって S 1 24及び S 1 25の処理の代わりに S 1 32及び S 1 33の処理が実行されるというものである。これらの処理について説明する。

S 1 23の音声認識処理に続く S 1 3 1では、翻訳者の発声が修正翻訳文の文全体を発声したものであるか否かの判定処理が実行される。この処理では、翻訳者の発した声が修正翻訳文の文全体を発声したものであるかどうかを示す操作が翻訳者自身によって操作入力部 1 6に対して行なわれ、 CPU1 1は、操作入力部 16に対して行なわれたこの操作の内容に基づきこの判定を行なうというものである。

そして、この S 13 1の判定処理の結果が Ye s、すなわち修正翻訳文の文全体を発声したものであるときには S 1 32に処理が進む。一方、この S 1 3 1の判定処理の結果が No、すなわち訳語の発声をしたものであるときには S 1 24に処理が進み、以降は図 3 (c) に示されているものと同様の処理が実行される。

S 132では翻訳者による発音の内容に対応する訳語を複数選択する処理が実行される。この処理では、翻訳者による発音の内容の一部分と、図 3 (b ) の S 1 1 2によってハードディスク装置 14に記憶されている訳語辞書フアイルから取得された、原文を構成する各語句に対応付けられている全ての訳語のそれぞれの発音とを比較し、両者間の相関が最も高く且つ所定の相関値以上となる訳語が選択される。ここで、所定の相関値以上となる訳語が存在しなかつたときには、比較の対象としていた発音の内容の一部分に含ませた範囲を変化させて再度比較が行なわれ、所定の相関値以上となる訳語があればそれが選択される。訳語が選択されたときには、比較の対象とする翻訳者による発音の内容のうちの残された部分における一部分について同様の比較及び選択が行なわれる。この比較及び選択が繰り返されることによって、翻訳者の発声された修正翻訳文に用いられている全ての訳語が選択される。

S 1 3 3では翻訳文を作成する処理が行なわれる。この処理では、 S 1 3 2 の処理によつて選択された訳語が組み合わされて新たな翻訳文が作成される。なお、修正後の翻訳文は表示装置 1 7に表示させるようにする。

S 1 3 3の処理を終えた後には処理が S 1 2 6に進み、以降は図 3 ( c ) に示されているものと同様の処理が実行される。

以上のように、翻訳者による発声は文であることが翻訳者によってこの翻訳システムに指示されることにより、認識対象が文であるときの音声認識の処理が行なえるようになるので、そのような指示がなされなレ、場合と比べて良好な認識精度を得ることができる。

図 4に示す校正支援処理が C P U 1 1によって実行されるときに実際に翻訳が行なわれる様子を、英語から日本語への翻訳を例に挙げて説明する。

今、翻訳対象である原文が "Time fl ies like an arrow. " であり、 S 1 0 2の機械翻訳処理による翻訳結果が「光陰矢のごとし。」であったにも拘らず、実際の翻訳文は、原文の前後の文章の流れより、「時蝇は矢が好きである。」するほうが適切である場合を考える。なお、このとき、ハードディスク装置 1 4 に記憶されている訳語辞書ファイルには、 time 「時」

'fly " 「蝇」

'l ike" 「好きである」 arrow 「矢」

'Time fl ies like an arrow. " 「光陰矢のごとし。」が登録されているものとする。

このとき、翻訳者は、 ' tokihae wa ya ga sukidearu と発声し、更に操作入力部 1 6を操作してこの発声は修正翻訳文の文全体であることを指示する。 C P U 1 1は S 1 3 1の判定処理を Y e sと判定し、続く S 1 3 2の処理によつて翻訳者の発声の内容から訳語「時」、「蝇」、「矢」、「好きである」が選択され、 S 1 3 3の処理によって「時蝇は矢が好きである。」なる翻訳文が作成される次に図 5について説明する。同図は図 3 ( a ) の S 1 0 3の処理である校正支援処理の第三の例の処理内容を示すフローチャートである。この処理は、機械翻訳により作成された翻訳文のうちの一部の訳語に対して異なる訳語を用いるようにして修正する指示が行なわれると、その異なる訳語を用いた翻訳文が改めて機械翻訳により作成されるというものである。

図 5において、図 3 ( c ) に示した校正支援処理の第一の例と同様の処理が行なわれる処理ステップには同一の符号を付すようにし、それらの処理ステツプの説明は省略する。

図 5と図 3 ( c ) とを比較すれば分かるように、図 5に示したフローチヤ一トは図 3 ( c ) に示したフローチャートにおける S 1 2 5の処理が S 1 4 1の処理へと置き換えられたものである。この処理について説明する。

S 1 2 4の処理によって、前述した機械翻訳処理において訳語辞書ファイルから取得された全ての訳語から、翻訳者による発音の内容に対応するものが選択された後、 S 1 4 1では機械翻訳による再翻訳処理が実行される。

この S 1 4 1の処理では、図 3 ( b ) の S 1 1 3の処理と同様に、まず、 S 1 1 2の処理によって取得された各訳語から翻訳文に用いる訳語を選択する処理が行なわれるのであるが、このとき、 S 1 2 4の処理によって選択された訳語との間で強い結び付きのあることを示す情報が訳語辞書ファィルに格納されているものを優先して選択する。そして、この処理によって選択された訳語が組み合わされることによって翻訳文が作成される。

S 1 4 1の処理を終えた後には処理が S 1 2 6に進み、以降は図 3 ( c ) に示されているものと同様の処理が実行される。

以上の処理が行なわれることによって、翻訳者は機械翻訳により作成された翻訳文のうちの一部の訳語に対して異なる訳語を用いるように修正する指示を行なうだけで、修正の指示を行なっていない他の訳語までもがその異なる訳語を使用するのに適切なものへと修正された翻訳文が改めて機械翻訳により作成されるので、翻訳者による修正の作業が軽減される。

図 5に示す校正支援処理が C P U 1 1によって実行されるときに実際に翻訳が行なわれる様子を、英語から日本語への翻訳を例に挙げて説明する。

今、翻訳対象である原文が "The bank cut interest rates. " であり、 S 1 0 2の機械翻訳処理による翻訳結果が「銀行は興味率を切った。」であった場合を考える。なお、このとき、ハードディスク装置 1 4に記憶されている訳語辞：は、

'bank …- 「銀行」

cut ·· · · 「切る」

cut · · · · 「削減する」

interest 「興味」

rate · · · · 「率」 "interest rate " ··· 「金禾 lj」

が登録されているものとし、更に訳語「金利」と「削減する」とは強い結び付きのある、すなわち翻訳文中で同時に用いられる頻度の高いことを示す情報が登録されているものとする。

このとき、翻訳者が ' kin-ri' と発声すると、この声は音声入力部 1 5で取得され、 S 1 2 3の音声認識処理が実行される。そして、 S 1 2 4において、先の S I 1 2の処理によって取得された訳語「銀行」、「切る」、「削減する」、「興味」、「率」、「金利」から、翻訳者による発声に最も近い訳語「金利」が選択される。

そして、 S 1 2 5において、「金利」に対応付けられている原文の語句 " interest rate " のそれまでの訳語であった「興味」及び「率」が翻訳文の作成候補から除外され、続く S 1 4 1において、訳語「金利」と強い結び付きのあることを示す情報が訳語辞書ファイルに登録されている訳語「削減する」が語句 "cut " の訳語として「切る」に代わって優先的に選択され、こうして選択された訳語「金利」及び「削減する」と、訳語「銀行」とから「銀行は金利を削減した。」なる翻訳文が作成される。こうして校正作業が終了し、適切な翻訳の結果が出力される。

次に図 6について説明する。同図は図 3 ( a ) の S 1 0 3の処理である校正支援処理の第四の例の処理内容を示すフローチャートである。この処理は、機械翻訳により作成された翻訳文のうちの一部の訳語に対して異なる訳語を用いるように修正する指示が行なわれたとき、その修正された後の訳語の品詞が修正前のものと異なるものであるときには、機械翻訳において行なわれた原文の分析に誤りがあつたとみなし、その修正された後の訳語を用いた翻訳文が改めて機械翻訳により作成されるというものである。

図 6において、図 3 ( c ) に示した校正支援処理の第一の例と同様の処理が行なわれる処理ステップには同一の符号を付すようにし、それらの処理ステツプの説明は省略する。

図 6と図 3 ( c ) とを比較すれば分かるように、図 6に示したフローチヤ一トは図 3 ( c ) に示したフローチャートにおける S 1 2 4の処理と S 1 2 5のとの処理の間に S 1 5 1なる判定処理が挿入され、この判定の結果に応じ、 S 1 2 5の処理の代わりに S 1 5 2なる処理が実行されるというものである。この処理について説明する。

S 1 2 4の処理によって、前述した機械翻訳処理において訳語辞書ファイルから取得された全ての訳語から、翻訳者による発音の内容に対応するものが選択された後、 S 1 5 1では、その選択された訳語の品詞が修正対象の訳語と異なるか否かの判定処理が実行される。この処理では、 S 1 2 4の処理で選択された訳語の品詞が訳語辞書ファイルを参照することによって取得され、更に、先に作成されていた翻訳文においてその選択された訳語に対応付けられている語句の翻訳となっている訳語についてもその品詞が訳語辞書ファイルを参照することによって取得される。そして、この両者の品詞が異なるか否かの判定が行なわれる。

この S 1 5 1の判定処理の結果が Y e s、すなわち、 S 1 2 4の処理によつて選択された訳語の品詞が修正対象の訳語と異なるのであれば処理が S 1 5 2 に進む。一方、この S 1 5 1の判定処理の結果が N o、すなわち、 S 1 2 4の処理によって選択された訳語の品詞が修正対象の訳語と同じであれば処理が S 1 2 5に進み、以降は図 3 ( c ) に示されているものと同様の処理が実行される。

S 1 5 2では機械翻訳による再翻訳処理が実行される。

この S 1 5 2の処理では、図 3 ( b ) の S 1 1 3の処理と同様に、まず、 S 1 1 2の処理によって取得された各訳語から翻訳文に用いる訳語を選択する処理が行なわれるのであるが、このとき、 S 1 2 4の処理によって選択された訳語が優先的に選択される。そして、この処理によって選択された訳語が組み合わされることによって翻訳文が作成される。

S 1 5 2の処理を終えた後には処理が S 1 2 6に進み、以降は図 3 ( c ) に示されているものと同様の処理が実行される。

以上の処理が行なわれることによって、翻訳者は機械翻訳により作成された翻訳文のうちの一部の訳語に対して異なる訳語を用いるように修正する指示を行なうだけで、その修正された後の訳語の品詞が修正前のものと異なるものであるときにはその訳語を用いての翻訳文が機械翻訳によって作成されるので、翻訳者による修正の作業が軽減される。

図 6に示す校正支援処理が C P U 1 1によって実行されるときに実際に翻訳が行なわれる様子を、英語から日本語への翻訳を例に挙げて説明する。

ここでは、翻訳対象である原文を、前述した第二の例におけるものと同様の "Time fl ies like an arrow. " であり、 S 1 0 2の機械翻訳処理による翻訳結果が「光陰矢のごとし。」であったにも拘らず、実際の翻訳文は、原文の前後の文章の流れより、「時蝇は矢が好きである。」するほうが適切である場合を考える。また、このとき、ハードディスク装置 1 4に記憶されている訳語辞書フアイルに登録されている英語の語句と日本語の訳語も前述したものと同様であるとする。そして、訳語辞書ファイルには、訳語「好きである」の品詞は動詞であることを示す情報、及び訳語「光陰矢のごとし。」における "l ike" の訳語の品詞は前置詞であることを示す情報が登録されているものとする。

このとき、翻訳者は ' sukidearu' と発声すると、この声は音声入力部 1 5で取得され、 S 1 2 3の音声認識処理が実行される。そして、 S 1 2 4において、先の S 1 1 2の処理によって取得された訳語「時」、「蝇」、「好きである」、「矢」、「光陰矢のごとし。」から、翻訳者による発声に最も近い訳語「好きである J が選択される。

ここで、 S I 5 1において、訳語「好きである」の品詞と、先に作成されていた翻訳文「光陰矢のごとし。」において訳語「好きである」に対応付けられている語句 "like" の訳語の品詞が訳語辞書ファイルを参照することによって取得され、この両者の品詞が異なるか否かの判定が行なわれる。ここでは、この両者の品詞が動詞及び前置詞であり、異なっているので、 S 1 5 1の判定処理の結果は Y e sとなり、処理が S 1 5 2に進む。そして、訳語「好きである」力 S 「光陰矢のごとし」に代わって選択され、訳語「好きである」と、訳語「時」、「蝇」、及び「矢」とから「時蝇は矢が好きである。」なる翻訳文が作成される。こうして校正作業が終了し、適切な翻訳の結果が出力される。

次に図 7について説明する。同図は図 3 ( a ) の S 1 0 3の処理である校正支援処理の第五の例の処理内容を示すフローチャートである。この処理は、翻訳文に対して翻訳者が修正した訳語が例えば経済 ·金融分野、通信技術分野、法律分野などといったどのような分野で用いられるのかを示す情報を取得し、その後に行なわれる機械翻訳ではその分野で用いられる訳語を優先的に使用した翻訳文の作成を行なうようすることで、機械翻訳の精度を向上させるというものである。

図 7において、図 3 ( c ) に示した校正支援処理の第一の例と同様の処理が行なわれる処理ステップには同一の符号を付すようにし、それらの処理ステツプの説明は省略する。

図 7と図 3 ( c ) とを比較すれば分かるように、図 7に示したフローチヤ一トは図 3 ( c ) に示したフローチャートにおける S 1 2 7の処理に続けて S 1 6 1及び 1 6 2の処理が実行されるというものである。この処理について説明する。

翻訳文を出力する S 1 2 7の処理に続いて実行される S 1 6 1では、修正された訳語の用いられる分野を示す情報を取得する処理が実行される。この処理では、前述した S 1 2 4の処理によって選択された訳語の用いられる分野がハ一ドディスク装置 1 4に記憶されている訳語辞書ファイルから取得される。続く S 1 6 2では、 S 1 6 1の処理によって取得された分野の優先化処理が実行される。この処理では、 S 1 6 1の処理によって取得された分野を示す情報を R AM I 3の所定の領域に記憶させる。後に続けて実行される図 3 ( b ) の機械翻訳処理では、 S 1 1 3の翻訳文の作成処理で行なわれる訳語の選択の際にこの R AM I 3に記憶させた情報を参照するようにし、 S 1 6 1の処理によって取得された分野で用いられる訳語を優先して選択するようにする。

この S 1 6 2の処理を終えると S 1 0 3の処理が終了し、図 3 ( a ) に示すフローチヤ一トへ処理が戻る。

以上の処理が行なわれることによって、翻訳者が翻訳文に対して訳語の修正を行なうと、その後の機械翻訳においては、例えば経済 ·金融分野、通信技術分野、法律分野などといったどのような分野で用いられることの多レ、訳語を優先的に使用して翻訳文の作成を行なうようになり、機械翻訳の精度が向上するので、その後の翻訳の修正作業のための労力が軽減される。

図 7に示す校正支援処理が C P U 1 1によって実行されるときに実際に翻訳が行なわれる様子を、英語から日本語への翻訳を例に挙げて説明する。

今、翻訳対象である原文が "The bank cut interest rates. " であり、翻訳者からなされた訳語「金利」を使用する旨の指示に応じて翻訳文の修正処理が行なわれた結果、翻訳文「銀行は金利を削減した。」が得られた場合を考える。なお、このとき、ハードディスク装置 1 4に記憶されている訳語辞書ファイルには、訳語「金利」が経済 '金融分野で用いられる者であることが示されていたとする。

ここで、次の翻訳対象である原文が "Japan relaxed regulations. " であつたとする。このとき、ハードディスク装置 1 4に記憶されている訳語辞書ファィルには、

Japan 「日本」

relax 「リラックスする」

relax 「緩和する」

regulation 「規則」

regulation 「規制」

が登録されているものとし、これらの訳語のうち、「緩和する」及び「規制」の訳語は経済 ·金融分野でよく用いられるものであることを示す情報が登録されているものとする。更に、 "interest rate " の訳語「金利」が経済 '金融分野でよく用いられるものであることを示す情報が登録されているものとする。このとき、 S 1 6 1の処理によって、修正された訳語「金利」の用いられる分野が調べられ、この訳語が経済 ·金融分野で用いられるものであることを示す情報が訳語辞書ファイルから取得される。そして、続く S 1 6 2の処理によつて、取得された情報が R AM I 3の所定の領域に記憶される。その後の" Japan relaxed regulations. " の機械翻訳の処理における S 1 1 3の翻訳文の作成処理で行なわれる訳語の選択では、 R AM I 3の記憶内容に応じ、経済 '金融分野でよく用いられる訳語である「緩和する」及び「規制」力 S 「リラックスする」及び「規則」よりも優先されて選択される。こうして選択された訳語「緩和する」及び「規制」と訳語「日本」とより、「日本は規則をリラックスした」よりも適切な「日本は規制を緩和した。」なる翻訳文が作成される。こうして校正作業が終了し、適切な翻訳の結果が出力される。

なお、本発明を標準的なコンピュータで実施するには、以上までに説明した本発明の実施形態における翻訳システムの有する C P U 1 1が行なっていたものと同様の処理をそのコンピュータに行なわせるための制御プログラムを作成し、その制御プログラムをコンピュータに読み込ませて実行させることにより可能となる。

また、このような制御プログラムをコンピュータで読み取り可能な記録媒体に記録させ、そのプログラムを記録媒体からコンピュータに読み出させて実行させることによって本発明をコンピュータで実施することも可能である。

記録させた制御プログラムをコンピュータで読み取ることの可能な記録媒体の例を図 8に示す。同図において、 2 1はコンピュータ、 2 2はメモリ、 2 3 は可搬型記録媒体、 2 4は通信回線、 2 5はプログラムサーバ、 2 6は記憶装置である。

図 8に示すように、記録媒体としては、例えば、コンピュータ 2 1に内蔵若しくは外付けの付属装置として備えられる R OMやハードディスク装置などのメモリ 2 2、あるいは F D (フレキシブルディスク）、 MO (光磁気ディスク）、 C D - R OM, D V D— R OMなどといった可搬型記録媒体 2 3等が利用できる。また、記録媒体は回線 2 4を介してコンピュータ 2 1と接続される、プログラムサーバ 2 5として機能するコンピュータが備えている記憶装置 2 6であってもよい。この場合には、制御プログラムを表現するデータ信号で搬送波を変調して得られる伝送信号を、プログラムサーバ 2 5から伝送媒体である通信回線 2 4を通じて伝送するようにし、コンピュータ 2 1では受信した伝送信号を復調して制御プログラムを再生することで当該制御プログラムを実行できるようになる。

以上、本発明の幾つかの実施形態について説明したが、本発明は、上述した実施形態に限定されることなく、種々の改良 ·変更が可能である。

以上のように、本発明の態様のひとつによれば、原文を翻訳して翻訳文を作成する作業を支援するために、入力された原文を構成している各語句に対応する複数の訳語の中から各々ひとつずつ訳語を選択して該選択された訳語を組み合わせることによって該原文についての翻訳文を作成して機械翻訳の結果とし、入力された音声に対応する語を、該語句に対応する訳語であって該選択によつては選択されなかつた該訳語から選択して該選択された訳語を該音声の認識の結果とし、該機械翻訳の結果として作成された翻訳文を、該音声の認識の結果である訳語を用いて修正するようにすることにより、翻訳者は機械翻訳により作成された翻訳文のうちの一部の訳語に対して異なる訳語を用いるように修正する指示を行なうだけで、修正の指示を行なっていない他の訳語までもがその異なる訳語を使用するのに適切なものへと修正された翻訳文が自動的に作成されるので、翻訳者による修正の作業が軽減される。

あるいは、本発明の別の態様のひとつによれば、入力された原文を翻訳して翻訳文を作成し、作成された翻訳文で用いられている訳語を他の訳語へと変更する修正を行なうために入力される該他の訳語の品詞と、該他の訳語に置き換えられる対象である修正前の訳語の品詞とが異なるかどうかを判定し、両訳語の品詞が異なると判定されたときに、該入力された訳語を用いて該原文の全体の再翻訳を行なって前記翻訳文の修正を行なうようにすることにより、翻訳者は機械翻訳により作成された翻訳文のうちの一部の訳語に対して異なる訳語を用いるように修正する指示を行なうだけで、その修正された後の訳語の品詞が修正前のものと異なるものであるときにはその訳語を用いての翻訳文が自動的に作成されるので、翻訳者による修正の作業が軽減される。

あるいは、本発明の更なる別の態様のひとつによれば、文書を翻訳する作業を支援するために、過去に作成された該文書を構成する原文についての翻訳文に対して施された修正の内容から、該原文が話題としている分野を判定し、該文書を構成する未翻訳の原文について機械翻訳を行なわせるときに、該分野で用いられる頻度の高い訳語を優先して使用させて該原文の翻訳文を作成させるようにすることにより、機械翻訳の精度を向上させることができ、結果として翻訳者による修正の作業が軽減される。

以上のように、本発明のいずれの態様によっても、機械翻訳により生成された翻訳文に対して人が行なう校正作業の効率を向上させることができる。産業上の利用の可能性

本発明は文書翻訳作業を支援するシステムでの利用に好適である。

Claims

請求の範囲

1 . 原文を翻訳して翻訳文を作成するシステムであって、

入力された原文を構成している各語句に対応する複数の訳語から各々ひとつずつ訳語を選択し、該選択された訳語を組み合わせることによって該原文につレ、ての翻訳文を作成する翻訳手段と、

入力された音声に対応する語を、前記語句に対応する訳語であって前記翻訳手段によつて選択されなかった該訳語から選択し、該選択された訳語を該音声の認識の結果として出力する音声認識手段と、

前記翻訳手段により作成された翻訳文を、前記音声認識手段から出力された訳語を用いて修正する修正手段と、

を有することを特徴とする翻訳システム。

2 . 原文で用いられる語句と該語句についての訳語とが対応付けられて登録されている訳語辞書フアイルが格納される訳語辞書フアイル格納手段と、前記翻訳手段に入力された原文を構成している語句の各々に対応付けられている訳語を前記訳語辞書ファイルから抽出する抽出手段と、

を更に有し、

前記翻訳手段は、作成する翻訳文に用いる訳語を前記訳語抽出手段によって抽出された訳語から選択し、

前記音声認識手段は、入力された音声に対応する語を、前記訳語抽出手段によって抽出された訳語であって前記翻訳手段によつて選択されなかった該訳語から選択する、

ことを特徴とする請求の範囲第 1項に記載の翻訳システム。

3 . 前記翻訳手段により作成された翻訳文を構成する一部の語句に対して修正を行なう力 \ あるいは該翻訳文の全文に渡る修正を行なうかを示す指示が入力される指示入力手段を更に有し、

前記音声認識手段は、前記翻訳手段により作成された翻訳文の全文に渡る修正を行なうことを示す指示が前記指示入力手段に入力されたときには、入力された音声を表現する情報を分割し、該分割された情報の各々に対応する語を、前記語句に対応する訳語であって前記翻訳手段によって選択されなかつた該訳語から選択する、

4 . 前記修正手段は、前記語句に対応する訳語であって前記翻訳手段によつて選択されなかつた該訳語に前記音声認識手段から出力された訳語と関連するものがあるときには、該翻訳手段によって選択されなかった訳語、及び前記音声認識手段から出力された訳語を共に用レ、て該翻訳手段により作成された翻訳文を修正することを特徴とする請求の範囲第 1項に記載の翻訳システム。

5 . 前記訳語辞書ファイルには、該訳語辞書ファイルに登録されている訳語の間で関連があるときに、その旨を示す情報が更に登録されており、

前記修正手段は、前記語句に対応する訳語であって前記翻訳手段によって選択されなかった該訳語が前記音声認識手段から出力された訳語と関連することを示す情報が前記訳語辞書ファイルに登録されているときには、該翻訳手段によって選択されなかった訳語、及び前記音声認識手段から出力された訳語を共に用いて該翻訳手段により作成された翻訳文を修正する、

ことを特徴とする請求の範囲第 2項に記載の翻訳システム。

6 . 前記修正手段は、前記音声認識手段から出力された訳語の品詞と、前記修正において該訳語へと置き換えられる対象である修正前の訳語の品詞とが異なるときに、該音声認識手段に入力された訳語を用いて前記翻訳手段に入力された原文の全体の再翻訳を行なって前記翻訳文を修正することを特徴とする請求の範囲第 1項に記載の翻訳システム。

7 . 前記修正手段は、前記音声認識手段から出力された訳語の品詞と、前記修正において該訳語へと置き換えられる対象である修正前の訳語の品詞とが一致するときには、前記翻訳手段によって作成された翻訳文を構成する一部の訳語を該音声認識手段から出力された訳語に置き換える部分的な修正を行なうことを特徴とする請求の範囲第 6項に記載の翻訳システム。

8 . 前記修正手段によって行なわれた修正の内容から、前記翻訳手段に入力された原文が話題としている分野を判定する分野判定手段を更に有し、前記翻訳手段は、新たに入力される原文についての翻訳文を作成するときには、前記分野判定手段によって判定された分野で用いられる頻度の高い訳語を優先して用いる、

9 . 原文で用いられる語句についての訳語が用いられる頻度の高い分野を示す情報が登録されている訳語分野情報ファイルが格納される訳語分野情報ファィゾレ格納手段を更に有し、

前記分野判定手段は、前記修正手段が前記翻訳文を修正したときに該翻訳文に加えた訳語が用いられる頻度の高い分野を、前記訳語分野情報ファイルに登録されている情報に基づいて判定する、

ことを特徴とする請求の範囲第 8項に記載の翻訳システム。

1 0 . 前記修正手段によって行なわれた修正の内容から、前記翻訳手段に入力された原文が話題としている分野を判定する分野判定手段を更に有し、前記訳語辞書ファイルには、該訳語辞書ファイルに登録されている訳語が用いられる頻度の高い分野を示す情報が更に登録されており、

前記分野判定手段は、前記修正手段が前記翻訳文を修正したときに該翻訳文に加えた訳語が用いられる頻度の高い分野を、前記訳語辞書ファイルに登録されている情報に基づいて判定し、前記翻訳手段は、新たに入力される原文についての翻訳文を作成するときには、前記訳語辞書ファイルに登録されている訳語のうち、入力された原文に用いられている語句に対応するものであって且つ前記分野判定手段によって判定された分野で用いられる頻度の高いことを示す情報が該訳語辞書ファイルに登録されているものを優先して用いる、

1 1 . 入力された原文を翻訳して翻訳文を作成する翻訳手段と、

前記翻訳手段によって作成された翻訳文で用いられている訳語を他の訳語へと置き換える修正を行なうときの該他の訳語が入力される訳語入力手段と、前記訳語入力手段に入力された前記他の訳語の品詞と、前記修正において該訳語へと置き換えられる対象である修正前の訳語の品詞とが異なるときに、該訳語入力手段に入力された該他の訳語を用いて前記原文の全体の再翻訳を行なつて前記翻訳文を修正する修正手段と、

を有することを特徴とする翻訳システム。

1 2 . 前記修正手段は、前記訳語入力手段に入力された前記他の訳語の品詞と、前記修正において該他の訳語へと置き換えられる対象である修正前の訳語の品詞とがー致するときには前記翻訳手段によつて作成された翻訳文を構成する一部の訳語を該訳語入力手段に入力された該他の訳語に置き換える部分的な修正を行なうことを特徴とする請求の範囲第 1 1項に記載の翻訳システム。

1 3 . 文書を翻訳するシステムであって、

前記文書を構成する原文を翻訳して翻訳文を作成する翻訳手段と、前記翻訳手段によって作成された翻訳文の修正を行なう修正手段と、前記修正手段によって行なわれた修正の内容から、前記原文が話題としている分野を判定する分野判定手段と、

を有し、前記翻訳手段は、前記文書を構成する未翻訳の原文を翻訳するときに、前記分野判定手段によって判定された分野で用いられる頻度の高い訳語を優先して使用する、

ことを特徴とする翻訳システム。

1 4 . 原文で用いられる語句についての訳語が用いられる頻度の高い分野を示す情報が登録されている訳語分野情報フアイルが格納される訳語分野情報フアイル格納手段を更に有し、

ことを特徴とする請求の範囲第 1 3項に記載の翻訳システム。

1 5 . 原文で用いられる語句と該語句についての訳語とが対応付けられて登録されており、更に該訳語が用いられる頻度の高い分野を示す情報が登録されている訳語辞書ファイルが格納される訳語辞書フアイル格納手段を更に有し、前記翻訳手段は、前記訳語辞書ファイルに登録されている訳語のうち、入力された原文に用いられている語句に対応するものであって且つ前記分野判定手段によって判定された分野で用いられる頻度の高いことを示す情報が該訳語辞書ファイルに登録されているものを用いて前記文書を構成する未翻訳の原文の翻訳を行なう、

1 6 . 原文を翻訳して翻訳文を作成する作業を支援する方法であって、入力された原文を構成している各語句に対応する複数の訳語の中から各々ひとつずつ訳語を選択して該選択された訳語を組み合わせることによつて該原文についての翻訳文を作成して機械翻訳の結果とし、

入力された音声に対応する語を、前記語句に対応する訳語であって前記選択によっては選択されなかつた該訳語から選択して該選択された訳語を該音声の認識の結果とし、

前記機械翻訳の結果として作成された翻訳文を、前記音声の認識の結果である訳語を用いて修正する、

ことを特徴とする翻訳支援方法。

1 7 . 入力された原文を翻訳して翻訳文を作成し、

作成された翻訳文で用いられている訳語を他の訳語へと変更する修正を行なうために入力される該他の訳語の品詞と、該他の訳語に置き換えられる対象である修正前の訳語の品詞とが異なるかどうかを判定し、

両訳語の品詞が異なると判定されたときに、前記入力された訳語を用いて前記原文の全体の再翻訳を行なって前記翻訳文の修正を行なう、

ことを特徴とする翻訳支援方法。

1 8 . 文書を翻訳する作業を支援する方法であって、

過去に作成された前記文書を構成する原文についての翻訳文に対して施された修正の内容から、該原文が話題としている分野を判定し、

前記文書を構成する未翻訳の原文について機械翻訳を行なわせるときに、前記分野で用いられる頻度の高い訳語を優先して使用させて該原文の翻訳文を作成させる、

ことを特徴とする翻訳支援方法。

1 9 . 原文を翻訳して翻訳文を作成する処理をコンピュータに行なわせるためのプログラムであって、

入力された原文を構成している各語句に対応する複数の訳語から各々ひとつずつ訳語を選択し、該選択された訳語を組み合わせることによって該原文についての翻訳文を作成する翻訳処理と、

入力された音声に対応する語を、前記語句に対応する訳語であって前記翻訳処理の実行によって選択されなかった該訳語から選択し、該選択された訳語を該音声の認識の結果として出力する音声認識処理と、

前記翻訳処理の実行により作成された翻訳文を、前記音声認識手段から出力された訳語を用いて修正する修正処理と、

を該コンピュータに行なわせるためのプログラム。

2 0 . 入力された原文を翻訳させて翻訳文を作成する翻訳処理と、

前記翻訳処理の実行によって作成された翻訳文で用いられている訳語を他の訳語へと置き換える修正を行なうときの該他の訳語を取得する訳語取得処理と前記訳語取得処理の実行によって取得された前記他の訳語の品詞と、前記修正において該訳語へと置き換えられる対象である修正前の訳語の品詞とが異なるときに、前記訳語取得処理の実行によって取得された該他の訳語を用いて前記原文の全体の再翻訳を行なって前記翻訳文の修正を行なう修正処理と、をコンピュータに行なわせるためのプログラム。

2 1 . 文書を翻訳する作業の支援をコンピュータに行なわせるためのプログラムであって、

過去に作成された前記文書を構成する原文についての翻訳文に対して施された修正の内容から、該原文が話題としている分野を判定する判定処理と、前記文書を構成する未翻訳の原文についての翻訳文を、前記分野で用いられる頻度の高い訳語を優先して使用して作成する翻訳処理と、

を該コンピュータに行なわせるためのプログラム。