[go: up one dir, main page]

WO2003032191A1 - Translation system - Google Patents

Translation system Download PDF

Info

Publication number
WO2003032191A1
WO2003032191A1 PCT/JP2001/008814 JP0108814W WO03032191A1 WO 2003032191 A1 WO2003032191 A1 WO 2003032191A1 JP 0108814 W JP0108814 W JP 0108814W WO 03032191 A1 WO03032191 A1 WO 03032191A1
Authority
WO
WIPO (PCT)
Prior art keywords
translation
translated
word
sentence
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2001/008814
Other languages
English (en)
French (fr)
Inventor
Seiji Okura
Akira Ushioda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003535088A priority Critical patent/JP3879929B2/ja
Priority to PCT/JP2001/008814 priority patent/WO2003032191A1/ja
Publication of WO2003032191A1 publication Critical patent/WO2003032191A1/ja
Priority to US10/813,135 priority patent/US20040186732A1/en
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Definitions

  • the present invention relates to a technique for machine translation of a document, and more particularly to a technique for supporting a proofreading operation performed by a person on a translation generated by machine translation.
  • the original text before translation is first translated into a machine translation system, and the generated translated text is proofread by a human (translator), resulting in high quality.
  • Translation services that provide high-quality translations in a short period of time are widely used.
  • the translator compares the translated text created by the machine translation system with the original text before translation and sequentially corrects errors and unknown parts of the translated text.
  • the translator performs this correction by operating a mouse, a keyboard, and the like.
  • An example of the work will be described more specifically. First, a portion to be corrected in the translation displayed on the display device is specified, and a translation word to be applied to this portion is input from a keyboard. It is.
  • Modern machine translation systems support such translators' proofreading work. Some are equipped with functions for: As an example, as described above, when a portion to be corrected is specified from the translated sentence, a list of translation candidates not selected in the machine translation process performed earlier for this portion is displayed. In some translation candidates, if there is an appropriate translation, the translator simply selects it and the modification of that part is completed. According to this function, the translator does not need to input the translated word for the correction, thereby improving the efficiency of the correction work. Disclosure of the invention
  • An object of the present invention is to improve the efficiency of a proofreading operation performed by a human on a translated sentence generated by machine translation.
  • FIG. 1 shows the principle configuration of the present invention.
  • FIG. 1A shows a first basic configuration of the present invention.
  • FIG. 1 shows a system for translating an original sentence to create a translated sentence.
  • 1 is a translation unit
  • 2 is a speech recognition unit
  • 3 is a correction unit.
  • the translation means 1 selects a translation from each of a plurality of translations corresponding to each of the phrases constituting the input original, and creates a translation of the original by combining the selected translations. I do.
  • the speech recognition means 2 selects a word corresponding to the input speech from the translations corresponding to the above-mentioned phrases and not selected by the translation means 1, and selects the selected translation in the speech. Output as the result of recognition.
  • the correction means 3 corrects the translated sentence created by the translation means 1 using the translated word output from the speech recognition means 2.
  • the work of correcting an inappropriate translation used in the translation created by the translation means 1 can be performed only by the translator uttering the appropriate translation.
  • the speech recognition performed by the speech recognition means 2 is performed under conditions limited to the translation corresponding to each phrase constituting the original sentence. It is possible to obtain a higher recognition rate than speech recognition.
  • a translation word dictionary file storing means for storing a translation word dictionary file in which words used in the original text and translation words of the words are registered in association with each other, Extracting means for extracting, from the translation word dictionary file, a translation word associated with each of the words constituting the original sentence input to the means 1, wherein the translation means 1 comprises: Is selected from the translated words extracted by the translated word extracting means, and the speech recognition means 2 selects a word corresponding to the input voice as the translated word extracted by the translated word extracting means and not selected by the translating means. It can be configured to select from translated words, and the same effects as those described above can be obtained.
  • the voice recognition means 2 further has an instruction input means for inputting an instruction indicating whether or not to perform the correction.
  • the voice recognition means 2 receives an instruction indicating that the entire sentence of the translation created by the translation means 1 is to be corrected.
  • the information expressing the input speech is divided, and the word corresponding to each of the divided information is a translation word corresponding to a phrase constituting the translation, and is not selected by the translation means 1. It may be configured to select from the translation.
  • the translator when the translator determines that the translated sentence created by the translating means 1 is inappropriate over the entire sentence, the translator can make a batch correction of the entire sentence instead of making corrections in translation units.
  • An instruction indicating that the utterance of the translator is a sentence is input to the instruction input means by the translator, thereby performing the speech recognition under the assumption that the recognition target is a sentence. Since processing can be performed, better recognition accuracy can be obtained as compared with a case where such an instruction is not given.
  • the correction means 3 includes a translation corresponding to the phrase and not selected by the translation means 1 and a translation output from the speech recognition means 2.
  • the translation that was not selected by the translation unit 1 and the translation that was output from the speech recognition unit 2 are used together to correct the translation created by the translation unit 1. You can do it.
  • the translator only gives an instruction to correct a part of the translation prepared by the translation means 1 so that a different translation is used, but does not give an instruction for the correction. Corrected translations are automatically created for other translations that are appropriate for using the different translations, thereby reducing translators' correction work.
  • the correcting means 3 includes a part of speech of the translated word output from the speech recognition means 2 and a translated word before the correction which is to be replaced with the translated word in the correction.
  • the translation sentence input to the speech recognition means 2 may be used to re-translate the entire original sentence input to the translation means 1 to correct the translated sentence.
  • the translator when the translator gives an instruction to correct some of the translations created by the translation means 1 to use different translations.
  • the part of speech of the translated word after the correction is different from that before the correction, it is deemed that the analysis of the original sentence performed by the translation means 1 had an error, and the translated word after the correction is The translation used is created anew.
  • the translator merely instructs some of the translations of the translation created by the translation means 1 to use different translations, and the When the part of speech of the translated word is different from that before the correction, a translation using the translated word is automatically created, so that the translator's correction work is reduced.
  • the correcting means 3 matches the part of speech of the translated word output from the voice recognition and recognition means 2 with the part of speech of the translated word before the correction which is to be replaced with the translated word in the correction.
  • the part of speech of the translated word after the correction is the same as that before the correction, the translation is partially corrected, so that the correction is required more than when a new translation is created. The time will be shorter.
  • the translation means 1 may be configured to preferentially use a translation frequently used in the field determined by the field determination means when creating a translation of the newly input original text. it can.
  • This configuration is used to determine in what fields, for example, the economic and financial fields, the telecommunications field, and the legal field, the translated words created by the translator and translated by the translator 1 are used. In the translation performed by the translation means 1 after obtaining the information shown in the In this way, the accuracy of machine translation by the translation means 1 can be improved.
  • the system further includes a translation field information file storing means for storing a translation field information file in which information indicating a field in which the translation of the phrase used in the original text is frequently used is registered.
  • the judging means determines the field in which the translation added to the translation is frequently used when the modifying means 3 modifies the translation created by the translation means 1 in the information registered in the translation word field information file. And the same operation and effect as those described above can be obtained.
  • FIG. 1B shows a second basic configuration of the present invention.
  • the figure shows a system that translates the original text and creates a translated sentence.
  • 4 is a translation means
  • 5 is a translated word input means
  • 6 is a correction means.
  • the translation means 4 translates the input original sentence to create a translated sentence.
  • the translated word input means 5 receives the other translated word when performing a correction for replacing the translated word used in the translation created by the translation means 4 with another translated word.
  • the correcting means 6 The translation unit 4 corrects the translated sentence created by the translation means 4 by retranslating the entire original sentence using the other translated word input in 5.
  • the translator when a translator instructs to use a different translation for some of the translations created by the translation means 4, the translated translation after the modification is issued. If the part-of-speech is different from that before the correction, it is deemed that there was an error in the analysis of the original sentence performed by the translation means 4, and a translated sentence using the corrected translated word is created again That is.
  • the translator can use a part of the translated text created by the translation means 4. By simply inputting an instruction to correct the translated word to use a different translated word into the translated word input means 5, if the part of speech of the corrected translated word is different from that before correction, the translated word is used. Since the translated text is automatically created, the work of the translator for correction is reduced.
  • the correcting means 6 includes a part of speech of the other translated word input to the translated word inputting means 5 and a correction to be replaced with the other translated word in the correction.
  • a partial correction that replaces a part of the translated word constituting the translation created by the translating means 4 with the other translated word inputted to the translated word inputting means 5 is performed.
  • FIG. 1C shows a third basic configuration of the present invention.
  • the figure shows a system for translating a document, 7 is a translation means, 8 is a correction means, and 9 is a field determination means.
  • the translation means 7 translates the original sentence constituting the document to create a translated sentence.
  • the correction means 8 corrects the translation created by the translation means 7.
  • the field determining means 9 determines the field in which the original text is a topic from the contents of the correction performed by the correcting means 8.
  • the translation means 7 when translating the untranslated original text constituting the document, the translation means 7 preferentially uses a translation frequently used in the field determined by the field determination means 9 .
  • the translation translated by the translator to the translation created by the translation means 7 may be used, for example, in economic, financial, communication technology, and legal fields. Information that indicates whether it is used in such a field is acquired, and then the translation performed by the translation means 7 creates a translated sentence by giving priority to the translated word used in that field By doing so, the accuracy of machine translation by the translation means 7 can be improved, and as a result, the work of correction by the translator is reduced.
  • translated word field information in which a translated word field information file in which information indicating a field in which a translated word is frequently used in the original text is registered is stored.
  • a file storage unit wherein the domain determination unit 9 registers, in the translation word field information file, a field in which the translation added to the translation is frequently used when the correction unit 8 corrects the translation. It is also possible to adopt a configuration in which the determination is made based on the information. With this configuration, the same operation and effect as those described above can be obtained.
  • a translation word that stores a translation dictionary file in which words used in the original text and translations of the words are registered in association with each other, and information indicating fields in which the translation is frequently used is registered.
  • the translation file 7 further includes a dictionary file storage unit, and the translation unit 7 corresponds to a phrase used in the input original sentence among the translation words registered in the translation word dictionary file, and It is also possible to configure so as to translate the untranslated original text making up the document using information registered in the translation word dictionary file that indicates that the information is frequently used in the determined field. By doing so, the same operation and effect as described above can be obtained.
  • FIG. 1 is a diagram showing the principle configuration of the present invention.
  • FIG. 2 is a diagram showing a configuration of a translation system that implements the present invention.
  • FIG. 3 is a flowchart showing the contents of control processing performed by the CPU.
  • FIG. 4 is a flowchart showing the processing content of the second example of the calibration support processing.
  • FIG. 5 is a flowchart showing the processing content of the third example of the calibration support processing.
  • FIG. 6 is a flowchart showing the processing contents of a fourth example of the calibration support processing.
  • FIG. 7 is a flowchart showing the processing content of the fifth example of the calibration support processing.
  • FIG. 8 is a diagram illustrating an example of a recording medium on which a recorded program can be read by a computer. BEST MODE FOR CARRYING OUT THE INVENTION
  • FIG. 1 shows the configuration of a translation system that embodies the present invention.
  • 11 is a CPU
  • 12 is a ROM
  • 13 is a RAM
  • 14 is a hard disk drive
  • 15 is a voice input unit
  • 15 is an operation input unit
  • 16 is an operation input unit
  • 17 is a display device
  • 18 is input / output.
  • the device, 19, is a bus.
  • CPU 1 1, ROM1 ROM1
  • RAMI hard disk drive
  • audio input unit operation input unit 16
  • the display device 17 and the input / output device 18 are all connected to the bus 19 and can exchange data with each other.
  • the CPU (Central Processing Unit) 11 is a central processing unit that controls the operation of the entire translation system.
  • a ROM (Read Only Memory) 12 is a memory in which a control program executed by the CPU 11 is stored in advance, and the CPU 11 executes the control program to control the operation of the entire apparatus. Is performed.
  • RAM (Random Access Memory) 13 is a temporary storage area for various data The memory is used as necessary as a work memory when the CPU 11 executes the control program stored in the ROM 12.
  • the hard disk device 14 stores in advance a translated word dictionary file that is used for the translation process and stores words in the language of the original sentence before translation and translated words in the language of the translated sentence in association with each other. ing.
  • the translated word dictionary file also stores information indicating the part of speech of each translated word and information indicating the strength of the connection between the translated word and the translated word. Also stored is information indicating in which field (category), such as the communication technology field and the legal field, the phrase is used for translation when used in sentences.
  • control program instead of storing the above-described control program in ROM 12, it is stored in advance in this hard disk drive 14, and when this translation system is activated, CPU 11 stores this control program. By reading from the hard disk device 14 and temporarily storing it in the RAM I 3, the control program is then read from the RAM I 3 and executed to control the operation of the entire translation system. Is also good.
  • the voice input unit 15 uses this translation system to acquire the voice uttered by the translator who performs the translation work and converts it into voice data expressing the voice.
  • the operation input unit 16 has input devices such as a keyboard and a mouse operated by a translator using the translation system, and acquires the status of operations performed on these input devices.
  • the display device 17 performs a display specified by the CPU 11 and is, for example, a device using a CRT (Cathode Ray Tube) or an LCD (Liquid Crystal Display).
  • CRT Cathode Ray Tube
  • LCD Liquid Crystal Display
  • the input / output device 18 is used for information input from outside, for example, the original text to be translated. It receives document data in which is described, and sends that information to the CPU 11, or outputs data from the CPU 11, for example, outputs a translated sentence that is a translation result.
  • the input / output device 18 is a portable recording medium such as an FD (Flexible Disk), a CD-ROM (Compact Disc-ROM), a DVD-ROM (Digital Versatile Disc-ROM), and an MO (Magneto-Optics) disk. It is configured with a read and write device. Further, an interface device for exchanging such input / output information with another device via a communication network may be provided as the input / output device 18. Further, a printer device for printing the content of the output from the CPU 11 on paper may be provided as the input / output device 18.
  • the present device is configured to include the above-described components.
  • FIG. 4 is a flowchart showing the contents of the control processing performed by the CPU 11. The translation is performed by this translation system when the processing shown in FIG.
  • processing for analyzing the original text and decomposing it into words is executed.
  • the original sentence represented by the data stored in RAM 13 is decomposed into words by the above-described process of S101.
  • the analysis of the original sentence performed here may be performed using a well-known analysis method, for example, morphological analysis.
  • a process of acquiring a translated word corresponding to the phrase from the translated word dictionary is executed.
  • the translated word dictionary file stored in the hard disk device 14 is referred to, and the translated word dictionary file is associated with each word obtained by decomposing the original sentence by the process of S111.
  • One or more translations are obtained.
  • a process of creating a translation by combining translated words is executed.
  • the method of selecting the translation here can use a method well known in the field of machine translation technology. For example, the statistical data of the past translation work is registered in the translation dictionary file, and Any technique that selects a translation that is frequently selected may be used.
  • a translation is created by combining the translations selected by this process. Processing of this combination of translations can use a method well known in the field of machine translation technology.
  • processing for displaying a translation is executed. In this process, an instruction to display the translated text created by the process of S112 is given to the display device 17, and the display device 17 displays the translated text according to the instruction.
  • FIG. 3C which is the processing of S103 described above.
  • the method of supporting translation proofreading realized by this process requires that the translator merely correct the inappropriate translation used in the translation by uttering the appropriate translation. It is to make it.
  • a process of determining whether or not to perform a calibration operation is performed.
  • the translator using this translation system refers to the translation by machine translation displayed on the display device 17, and the translator determines whether or not this translation is appropriate. Then, based on the result of this determination, an operation indicating whether or not to perform a proofreading operation is performed on the operation input unit 16 by the translator.
  • the CPU 11 determines whether or not to perform a calibration operation based on the content of the operation performed on the operation input unit 16.
  • a determination process is performed to determine whether a voice input has been made. In this process, it is determined whether or not the voice of the translator who utters the translated word has been acquired by the voice input unit 15. Then, the determination process of S122 is repeated until the result of the determination process becomes Yes, that is, until it is determined that the voice input has been performed.
  • the speech recognition process is executed, and the translation output from the speech input unit 15 is performed.
  • Voice data expressing the translator's voice is analyzed, and processing for specifying the content of pronunciation by the translator is performed.
  • a process is executed to select, from all the translated words obtained from the translated word dictionary file in the above-described machine translation process, one corresponding to the content of pronunciation by the translator.
  • the pronunciation is compared with the pronunciation of the translator identified by the processing of S123, and the translation having the highest correlation between the two is selected.
  • the recognition target is limited to the translated word associated with each phrase constituting the original sentence, an unspecified word is targeted for recognition. A higher recognition rate can be obtained compared to speech recognition.
  • a process of correcting the translation is performed.
  • the phrase associated with the translation selected by the process of S124 in the translation dictionary file stored in the hard disk device 14 is acquired.
  • the translated word which is a translation of the phrase is removed from the translated sentence displayed on the display device 17, and the translated word left in the translated sentence is replaced by the processing of S124.
  • the selected translation is recombined to create a new translation.
  • the translator can correct the translated sentence without performing an instruction operation for specifying a portion of the translated sentence by machine translation displayed on the display device 17 that needs to be corrected. .
  • the translated text after the correction is displayed on the display device 17.
  • a process of determining whether or not the calibration work has been completed is executed.
  • the translator using this translation system refers to the corrected translation displayed on the display device 17, and determines whether this translation is appropriate. I do. Then, based on the result of this determination, an operation indicating whether or not to continue the proofreading operation is performed on the operation input unit 16 by the translator.
  • the CPU 11 determines whether or not the calibration work has been completed based on the content of this operation performed on the operation input unit 16. It should be noted that the translator may utter an indication of whether or not to continue the proofreading work by the translator, and the CPU 11 may recognize the translator's intention by recognizing the content of the utterance. Les ,.
  • the process proceeds to S 127, while the result of the S 126 determination process is No, that is, the calibration is completed. If the work is to be continued, the process returns to S122 and the above process is repeated.
  • a process of outputting a translation is executed.
  • data representing the translation currently displayed on the display device 17 is sent to the input / output device 18, the data is recorded on various recording media, and the translation is printed on paper, or
  • the input / output device 18 performs a process such as sending the data to another device to the communication network.
  • the above processing is performed by the CPU 11 so that translation using this translation system is performed.
  • how the translation is actually performed using this translation system will be described using an example of translating from English to Japanese. Now, assume that the original text to be translated is "I saved Money.”
  • FIG. 4 is a flowchart showing the processing content of a second example of the calibration support processing, which is the processing of S103 in FIG. 3 (a).
  • the translator determines that the translated sentence created by machine translation is inappropriate over the entire sentence, for example, it is necessary to perform correction in translation units as in the proofreading support process described above. Instead, it allows for batch correction of the entire sentence.
  • the processing shown in FIG. 3 (c) will be referred to as a first example of the calibration support processing in order to distinguish the proofreading support processing described below from that shown in FIG. 3 (c). .
  • a determination process is performed to determine whether or not the translator's utterance utters the entire corrected translation.
  • the translator performs an operation on the operation input unit 16 to indicate whether or not the voice uttered by the translator utters the entire sentence of the corrected translation. This determination is made based on the contents of this operation performed on the unit 16.
  • a process of selecting a plurality of translated words corresponding to the content of pronunciation by the translator is executed.
  • a part of the content of the pronunciation by the translator and the translated word dictionary file stored in the hard disk drive 14 by S112 in FIG. Of all the translations associated with each phrase that composes the original sentence obtained from the original sentence, and the translation having the highest correlation between the two and having a predetermined correlation value or more is selected. .
  • the range included in a part of the pronunciation content which is the comparison target is changed, and the comparison is performed again. If there is a translation, it is selected.
  • a similar comparison and selection is made for a part of the remaining part of the pronunciation by the translator to be compared. By repeating this comparison and selection, all the translation words used in the corrected translation sentenced by the translator are selected.
  • S133 a process of creating a translation is performed.
  • the translation selected in the process of S132 is combined to create a new translation.
  • the translated text after the correction is displayed on the display device 17.
  • the speech recognition processing can be performed when the recognition target is a sentence. It is possible to obtain better recognition accuracy as compared with the case where no special instructions are given.
  • the translated word dictionary file stored in the hard disk device 14 includes time "time”
  • FIG. 5 This flowchart is a flowchart showing the contents of a third example of the calibration support processing, which is the processing of S103 in FIG. 3 (a). In this process, when an instruction is given to correct some of the translations created by machine translation so that different translations are used, the translation using the different translation is renewed. It is created by translation.
  • FIG. 5 As can be seen by comparing FIG. 5 with FIG. 3 (c), the flow chart shown in FIG. 5 is obtained by replacing the processing of S125 in the flowchart shown in FIG. 3 (c) with the processing of S141. Is replaced by This processing will be described.
  • the translator only issues an instruction to correct some of the translations created by machine translation so that different translations are used, and gives the instruction for correction.
  • the previous translations of the original phrase "interest rate” associated with "interest” and “interest” and “rate” are excluded from the translation candidate.
  • the translation “reduce” registered in the translation dictionary file contains information indicating that there is a strong connection with the translation “interest”, which takes precedence over “cut” as a translation of the phrase “cut” From the translations “interest rate” and “reduce” thus selected and the translation “bank”, a translation of “bank reduced interest rate” is created. This completes the proofreading work and outputs the appropriate translation results.
  • FIG. 6 is a flowchart showing the contents of a fourth example of the calibration support processing which is the processing of S103 in FIG. 3 (a).
  • the part of speech of the translated word after the modification is modified. If it is different from the previous one, it is considered that there was an error in the analysis of the original sentence performed in the machine translation, and a translation using the translated word after the correction is newly created by machine translation It is.
  • FIG. 6 the same processing as the first example of the calibration support processing shown in FIG.
  • the same reference numerals are given to the processing steps to be performed, and the description of those processing steps will be omitted.
  • FIG. 6 shows the difference between the processing of S124 and the processing of S125 in the flowchart shown in FIG. 3 (c).
  • a determination process of S 15 1 is inserted between the processes, and a process of S 152 is executed instead of the process of S 125 according to the result of the determination. This processing will be described.
  • the one corresponding to the content of the pronunciation by the translator is selected.
  • a determination process is performed to determine whether the part of speech of the selected translation is different from the translation to be corrected.
  • the part of speech of the translation selected in the processing of S124 is acquired by referring to the translation dictionary file, and is further associated with the selected translation in the previously created translation.
  • the parts of speech of the translated words are also obtained by referring to the translation dictionary file. Then, it is determined whether or not these two parts of speech are different.
  • the translator By performing the above processing, the translator merely instructs some of the translations created by machine translation to use different translations, and the translator after the correction is used. If the part of speech of the translated word is different from the one before the correction, a translation using the translated word is created by machine translation, so that the translator's correction work is reduced.
  • the original text to be translated is “Time flags like an arrow.” Similar to that in the second example described above, and the translation result of the machine translation process of S 102 is “ Despite this, consider the case where it is more appropriate for an actual translated sentence to say "I like arrows at times" than the flow of sentences before and after the original sentence. At this time, it is also assumed that the English words and Japanese translation words registered in the translation word dictionary file stored in the hard disk device 14 are the same as those described above. Then, the translated word dictionary file contains information indicating that the part of speech of the translated word "I like” is a verb, and that the part of speech of the translated word "l ike” in the translated word "Kotoyaga no Itoshi” is a preposition. It is assumed that the information shown is registered.
  • the part of speech of " is obtained by referring to the translation dictionary file, and it is determined whether or not the two parts of speech are different.
  • the result of the determination processing of S 15 1 is Y e s, and the processing proceeds to S 15 2.
  • the translation “I like” the force S “Like a shadow”
  • FIG. 7 is a flowchart showing the contents of a fifth example of the calibration support processing which is the processing of S103 in FIG. 3 (a).
  • This processing involves acquiring information that indicates in which fields the translated word translated by the translator is used, for example, in the economic and financial fields, the communication technology field, the legal field, and so on.
  • Translation is intended to improve the accuracy of machine translation by creating translations that preferentially use translations used in the field.
  • FIG. 7 As can be seen by comparing FIG. 7 with FIG. 3 (c), the flow chart shown in FIG. 7 follows the processing of S127 in the flow chart shown in FIG. The processing of 162 is executed. This processing will be described.
  • the translator corrects the translation for the translated sentence, and in the subsequent machine translation, in any field such as the economics and finance field, the communication technology field, the legal field, etc. Since translations are created using the translated words preferentially, the accuracy of machine translation is improved, and the labor required for subsequent translation correction work is reduced.
  • the original text to be translated is "The bank cut interest rates.”
  • the translated text is corrected according to the instruction from the translator to use the translated word "interest rate”.
  • the bank has cut interest rates.”
  • the translated word dictionary file stored in the hard disk device 14 indicates that the translated word "interest” is a person used in the economic and financial fields.
  • the original text to be translated next is "Japan relaxed regulations.”
  • the translation dictionary file stored in the hard disk device 14 contains
  • the present invention can be implemented by a computer by causing such a control program to be recorded on a computer-readable recording medium and causing the computer to read the program from the recording medium and executing the program.
  • Fig. 8 shows an example of a recording medium on which a computer can read the recorded control program.
  • 21 is a computer
  • 22 is a memory
  • 23 is a portable recording medium
  • 24 is a communication line
  • 25 is a program server
  • 26 is a storage device.
  • the recording medium for example, a memory 22 such as a ROM or a hard disk device provided as an internal or external accessory device in the computer 21 or an FD (flexible disk), MO ( Portable recording media 23 such as a magneto-optical disk, a CD-ROM, and a DVD-ROM can be used.
  • the recording medium may be a storage device 26 provided in a computer functioning as a program server 25, which is connected to the computer 21 via the line 24.
  • a transmission signal obtained by modulating a carrier with a data signal representing a control program is transmitted from the program server 25 through a communication line 24 as a transmission medium, and the computer 21 receives the transmission signal.
  • the control program can be executed.
  • a plurality of phrases corresponding to each word constituting the input original sentence are provided. Select a translation from the translations, and combine the selected translations.
  • a translated sentence of the original sentence is created by combining the translated sentences and the result of the machine translation, and a word corresponding to the input speech is translated into the translated word corresponding to the phrase and not selected by the selection. And making the selected translated word the result of the speech recognition, and correcting the translated sentence created as a result of the machine translation using the translated word that is the result of the speech recognition.
  • the translator can only give instructions to correct some of the translations created by machine translation to use different translations, but do not issue other translations that do not give instructions for correction. Even so, a translation that is corrected to the one that is appropriate for using the different translation is automatically created, reducing the work of the translator for correction.
  • a translation is created by translating an input original sentence, and a correction is performed to change a translation used in the created translation into another translation. Is determined whether the part-of-speech of the other translated word is different from the part-of-speech of the translated word that is to be replaced with the other translated word, and that the two parts of the translated word are different.
  • the translator can obtain a part of the translated sentence created by the machine translation. Just instruct the user to modify the translated word to use a different translation. If the part of speech of the translated word after the revision is different from that before the revision, the translation using the translated word is automatically Will be created on the translator Work of correction is reduced that.
  • a correction made to a translation of an original text constituting the document created in the past is performed. From the contents, the field in which the original text is discussed is determined, and when the untranslated original text making up the document is subjected to machine translation, the frequently used translation words used in the relevant field are preferentially used, and the original text is used.
  • the accuracy of the machine translation can be improved, and as a result, The work of translator corrections is reduced.
  • the present invention is suitable for use in a system that supports a document translation operation.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Description

明 細 書 翻訳システム 技術分野
本発明は、 文書の機械翻訳の技術に関し、 特に、 機械翻訳により生成された 翻訳文に対して人が行なう校正作業を支援する技術に関する。 背景技術
近年、 機械翻訳の性能の向上は目覚ましいものがあり、 特に翻訳の速度とい う点においては人による翻訳を充分に上回っているといえよう。 しかしながら 、 翻訳精度の点で機械翻訳を人による翻訳と比較すると、 その差は以前よりは 縮まってきたとはいえ、 未だに人による翻訳の方が遥かに良質である。
このような機械翻訳の特徴を踏まえ、 翻訳前の原文を機械翻訳システムにま ず翻訳させ、 生成された翻訳文に対して人 (翻訳者) が校正を行なうようにす ることによって、 質の高い翻訳を短期間で提供する翻訳サービスが広く行なわ れている。
この翻訳サービスにおける校正作業では、 翻訳者が機械翻訳システムで作成 された翻訳文を翻訳前の原文と照らし合わせ、 翻訳文の誤りや不明な部分を逐 次修正するという作業が行なわれる。 ここで、 翻訳者はマウスやキーボード等 を操作してこの修正作業を行なう。 その作業の一例を更に具体的に説明すると 、 表示装置に表示されている翻訳文中で修正を行なう対象とする部分をまず特 定し、 この部分にあてはめる訳語をキーボードから入力するなどといった作業 が行なわれる。
最近の機械翻訳システムでは、 このような翻訳者による校正作業を支援する ための機能を装備しているものがある。 その一例を説明すると、 前述したよう に翻訳文中から修正を行なう対象とする部分を特定すると、 この部分について 先に行なった機械翻訳処理において選択されなかった翻訳候補の一覧を表示す るようにし、 この翻訳候補の中に適切な訳語があればそれを翻訳者が選択する だけでその部分の修正が完了するというものがある。 この機能によれば、 修正 のために翻訳者が訳語を入力する手間が省かれるので、 修正作業の効率が向上 するというものである。 発明の開示
しかしながら、 上述した校正作業の支援機能の例では、 機械翻訳処理におい て選択されなかった翻訳候補が多数存在したときには、 それらの中から翻訳者 が適切な訳語を探す作業が発生してしまい、 この作業が校正作業で必要となる 時間の短縮を阻む要因のひとつとなる場合があった。
本発明は、 機械翻訳により生成された翻訳文に対して人が行なう校正作業の 効率を向上させることを課題とする。
ここで図 1について説明する。 同図は本発明の原理構成を示している。
図 1 ( a ) は本発明の第一の基本構成を示している。 同図は原文を翻訳して 翻訳文を作成するシステムを示しており、 1は翻訳手段、 2は音声認識手段、 3は修正手段である。
翻訳手段 1は、 入力された原文を構成している各語句に対応する複数の訳語 から各々ひとつずつ訳語を選択し、 該選択された訳語を組み合わせることによ つて該原文についての翻訳文を作成する。
音声認識手段 2は、 入力された音声に対応する語を、 上記語句に対応する訳 語であって翻訳手段 1によって選択されなかった該訳語から選択し、 該選択さ れた訳語を該音声の認識の結果として出力する。 修正手段 3は、 翻訳手段 1により作成された翻訳文を、 音声認識手段 2から 出力された訳語を用いて修正する。
この構成によれば、 翻訳手段 1によって作成された翻訳文に用いられている 不適切な訳語を適切なものに修正する作業を、 翻訳者がその適切な訳語を発声 するのみで行なえる。 しかも、 音声認識手段 2で行なわれる音声認識は、 その 認識の対象が原文を構成する各語句に対応付けられている訳語に限定された条 件で行なわれるので、 不特定の語を認識の対象とする音声認識と比べて高い認 識率を得ることができる。
なお、 上述した本発明の第一の基本構成において、 原文で用いられる語句と 該語句についての訳語とが対応付けられて登録されている訳語辞書ファイルが 格納される訳語辞書ファイル格納手段と、 翻訳手段 1に入力された原文を構成 している語句の各々に対応付けられている訳語を訳語辞書ファイルから抽出す る抽出手段とを更に有し、 翻訳手段 1は、 作成する翻訳文に用いる訳語を訳語 抽出手段によって抽出された訳語から選択し、 音声認識手段 2は、 入力された 音声に対応する語を、 前記訳語抽出手段によって抽出された訳語であって前記 翻訳手段によって選択されなかった該訳語から選択するように構成することが でき、 上述したものと同様の作用効果が得られる。
また、 前述した本発明の第一の基本構成において、 翻訳手段 1により作成さ れた翻訳文を構成する一部の語句に対して修正を行なう力、、 あるいは該翻訳文 の全文に渡る修正を行なうかを示す指示が入力される指示入力手段を更に有し 、 音声認識手段 2は、 翻訳手段 1により作成された翻訳文の全文に渡る修正を 行なうことを示す指示が指示入力手段に入力されたときには、 入力された音声 を表現する情報を分割し、 該分割された情報の各々に対応する語を、 該翻訳文 を構成する語句に対応する訳語であって翻訳手段 1によって選択されなかった 該訳語から選択するように構成することもできる。 この構成は、 翻訳手段 1により作成された翻訳文がその文全体に渡って不適 切であると翻訳者が判断したときには、 訳語単位での修正を行なうのではなく 、 文全体の一括修正を行なえるようにするものであり、 翻訳者による発声は文 であることを示す指示が翻訳者によって指示入力手段に入力されることにより 、 認識対象が文であるとの前提の下での音声認識の処理が行なえるようになる ので、 そのような指示がなされない場合と比べて良好な認識精度を得ることが できる。
また、 前述した本発明の第一の基本構成において、 修正手段 3は、 前記語句 に対応する訳語であって翻訳手段 1によって選択されなかった該訳語に音声認 識手段 2から出力された訳語と関連するものがあるときには、 翻訳手段 1によ つて選択されなかった訳語、 及び音声認識手段 2から出力された訳語を共に用 いて翻訳手段 1により作成された翻訳文を修正するように構成することもでき る。
この構成によれば、 翻訳者は翻訳手段 1により作成された翻訳文のうちの一 部の訳語に対して異なる訳語を用いるように修正する指示を行なうだけで、 修 正の指示を行なっていない他の訳語までもがその異なる訳語を使用するのに適 切なものへと修正された翻訳文が自動的に作成されるので、 翻訳者による修正 の作業が軽減される。
また、 前述した本発明の第一の基本構成において、 修正手段 3は、 音声認識 手段 2から出力された訳語の品詞と、 前記修正において該訳語へと置き換えら れる対象である修正前の訳語の品詞とが異なるときに、 音声認識手段 2に入力 された訳語を用いて翻訳手段 1に入力された原文の全体の再翻訳を行なって前 記翻訳文を修正するように構成することもできる。
この構成では、 翻訳手段 1により作成された翻訳文のうちの一部の訳語に対 して異なる訳語を用いるように修正する指示が翻訳者によって行なわれたとき に、 その修正された後の訳語の品詞が修正前のものと異なるものであるときに は、 翻訳手段 1において行なわれた原文の分析に誤りがあつたとみなし、 その 修正された後の訳語を用いた翻訳文が改めて作成されるというものである。 こ の構成によれば、 翻訳者は翻訳手段 1により作成された翻訳文のうちの一部の 訳語に対して異なる訳語を用いるように修正する指示を行なうだけで、 その修 正された後の訳語の品詞が修正前のものと異なるものであるときにはその訳語 を用いての翻訳文が自動的に作成されるので、 翻訳者による修正の作業が軽減 される。
なお、 このときにおいて、 修正手段 3は、 音声認、識手段 2から出力された訳 語の品詞と、 前記修正において該訳語へと置き換えられる対象である修正前の 訳語の品詞とがー致するときには、 翻訳手段 1によって作成された翻訳文を構 成する一部の訳語を音声認識手段 2から出力された訳語に置き換える部分的な 修正を行なうように構成することもできる。 こうすることにより、 その修正さ れた後の訳語の品詞が修正前のものと一致するものであるときには翻訳文の部 分修正が行なわれるので、 改めて翻訳文を作成するときよりも修正に要する時 間が短くなる。
また、 前述した本発明の第一の基本構成において、 修正手段 3によって行な われた修正の内容から、 翻訳手段 1に入力された原文が話題としている分野を 判定する分野判定手段を更に有し、 翻訳手段 1は、 新たに入力される原文につ いての翻訳文を作成するときには、 分野判定手段によって判定された分野で用 いられる頻度の高い訳語を優先して用いるように構成することもできる。
この構成は、 翻訳手段 1によつて作成された翻訳文に対して翻訳者が修正し た訳語が、 例えば経済 ·金融分野、 通信技術分野、 法律分野などといったどの ような分野で用いられるのかを示す情報を取得し、 その後に翻訳手段 1によつ て行なわれる翻訳ではその分野で用いられる訳語を優先的に使用して翻訳文の 作成を行なうようにしたものであり、 こうすることにより翻訳手段 1による機 械翻訳の精度を向上させることができる。
なお、 このときにおいて、 原文で用いられる語句についての訳語が用いられ る頻度の高い分野を示す情報が登録されている訳語分野情報フアイルが格納さ れる訳語分野情報ファイル格納手段を更に有し、 分野判定手段は、 修正手段 3 が翻訳手段 1によって作成された翻訳文を修正したときに該翻訳文に加えた訳 語が用いられる頻度の高い分野を、 訳語分野情報ファイルに登録されている情 報に基づいて判定するように構成することができ、 上述したものと同様の作用 効果が得られる。
図 1 ( b ) は本発明の第二の基本構成を示している。 同図は原文を翻訳して 翻訳文を作成するシステムを示しており、 4は翻訳手段、 5は訳語入力手段、 6は修正手段である。
翻訳手段 4は、 入力された原文を翻訳して翻訳文を作成する。
訳語入力手段 5は、 翻訳手段 4によって作成された翻訳文で用いられている 訳語を他の訳語へと置き換える修正を行なうときの該他の訳語が入力される。 修正手段 6は、 訳語入力手段 5に入力された前記他の訳語の品詞と、 前記修 正において該訳語へと置き換えられる対象である修正前の訳語の品詞とが異な るときに、 訳語入力手段 5に入力された該他の訳語を用いて前記原文の全体の 再翻訳を行なつて翻訳手段 4によって作成された翻訳文を修正する。
この構成では、 翻訳手段 4により作成された翻訳文のうちの一部の訳語に対 して異なる訳語を用いるように修正する指示が翻訳者によって行なわれたとき に、 その修正された後の訳語の品詞が修正前のものと異なるものであるときに は、 翻訳手段 4において行なわれた原文の分析に誤りがあつたとみなし、 その 修正された後の訳語を用いた翻訳文が改めて作成されるというものである。 こ の構成によれば、 翻訳者は翻訳手段 4により作成された翻訳文のうちの一部の 訳語に対して異なる訳語を用いるように修正する指示を訳語入力手段 5に入力 するだけで、 その修正された後の訳語の品詞が修正前のものと異なるものであ るときにはその訳語を用いての翻訳文が自動的に作成されるので、 翻訳者によ る修正の作業が軽減される。
なお、 上述した本発明の第二の基本構成において、 修正手段 6は、 訳語入力 手段 5に入力された前記他の訳語の品詞と、 前記修正において該他の訳語へと 置き換えられる対象である修正前の訳語の品詞とがー致するときには翻訳手段 4によって作成された翻訳文を構成する一部の訳語を訳語入力手段 5に入力さ れた該他の訳語に置き換える部分的な修正を行なうように構成することもでき る。
この構成によれば、 修正された後の訳語の品詞が修正前のものと一致するも のであるときには翻訳文の部分修正が行なわれるので、 改めて翻訳文を作成す るときよりも修正に要する時間が短くなる。
図 1 ( c ) は本発明の第三の基本構成を示している。 同図は文書を翻訳する システムを示しており、 7は翻訳手段、 8は修正手段、 9は分野判定手段であ る。
翻訳手段 7は、 文書を構成する原文を翻訳して翻訳文を作成する。
修正手段 8は、 翻訳手段 7によって作成された翻訳文の修正を行なう。
分野判定手段 9は、 修正手段 8によって行なわれた修正の内容から、 原文が 話題としている分野を判定する。
そして、 この構成において、 翻訳手段 7は、 文書を構成する未翻訳の原文を 翻訳するときに、 分野判定手段 9によって判定された分野で用いられる頻度の 高い訳語を優先して使用するようにする。
この構成は、 翻訳手段 7によつて作成された翻訳文に対して翻訳者が修正し た訳語が、 例えば経済 '金融分野、 通信技術分野、 法律分野などといったどの ような分野で用いられるのかを示す情報を取得し、 その後に翻訳手段 7によつ て行なわれる翻訳ではその分野で用いられる訳語を優先的に使用して翻訳文の 作成を行なうようにしたものであり、 こうすることにより翻訳手段 7による機 械翻訳の精度を向上させることができ、 結果として翻訳者による修正の作業が 軽減される。
なお、 上述した本発明の第三の基本構成において、 原文で用いられる語句に ついての訳語が用いられる頻度の高い分野を示す情報が登録されている訳語分 野情報フアイルが格納される訳語分野情報ファィル格納手段を更に有し、 分野 判定手段 9は、 修正手段 8が翻訳文を修正したときに該翻訳文に加えた訳語が 用いられる頻度の高い分野を、 訳語分野情報ファイルに登録されている情報に 基づいて判定するように構成することもでき、 こうすることによつても上述し たものと同様の作用効果が得られる。
あるいは、 原文で用いられる語句と該語句についての訳語とが対応付けられ て登録されており、 更に該訳語が用いられる頻度の高い分野を示す情報が登録 されている訳語辞書ファィルが格納される訳語辞書ファィル格納手段を更に有 し、 翻訳手段 7は、 訳語辞書ファイルに登録されている訳語のうち、 入力され た原文に用いられている語句に対応するものであって且つ分野判定手段 9によ つて判定された分野で用いられる頻度の高いことを示す情報が訳語辞書フアイ ルに登録されているものを用いて前記文書を構成する未翻訳の原文の翻訳を行 なうように構成することもでき、 こうすることによつても上述したものと同様 の作用効果が得られる。 図面の簡単な説明
本発明は、 後述する詳細な説明を、 下記の添付図面と共に参照すればより明 らかになるであろう。 図 1は、 本発明の原理構成を示す図である。
図 2は、 本発明を実施する翻訳システムの構成を示す図である。
図 3は、 C PUによって行なわれる制御処理の処理内容を示すフローチヤ一 トである。
図 4は、 校正支援処理の第二の例の処理内容を示すフローチャートである。 図 5は、 校正支援処理の第三の例の処理内容を示すフローチャートである。 図 6は、 校正支援処理の第四の例の処理內容を示すフローチャートである。 図 7は、 校正支援処理の第五の例の処理内容を示すフローチャートである。 図 8は、 記録させたプログラムをコンピュータで読み取ることの可能な記録 媒体の例を示す図である。 発明を実施するための最良の形態
まず図 2について説明する。 同図は本発明を実施する翻訳システムの構成を 示している。 同図において、 1 1は CPU、 1 2は ROM、 1 3は RAM、 1 4はハードディスク装置、 1 5は音声入力部、 1 6は操作入力部、 1 7は表示 装置、 1 8は入出力装置、 1 9はバスである。 そして、 CPU 1 1、 ROM1
2、 RAMI 3、 ハードディスク装置 14、 音声入力部 1 5、 操作入力部 1 6
、 表示装置 1 7、 及び入出力装置 18はいずれもバス 1 9に接続されており、 相互にデータの授受が行なえる。
CPU (Central Processing Unit ) 1 1はこの翻訳システム全体の動作制 御を司る中央処理装置である。
ROM (Read Only Memory) 1 2は、 CPU 1 1によって実行される制御プ ログラムが予め格納されているメモリであり、 CPU 1 1がこの制御プロダラ ムを実行することによって本装置全体の動作の制御が行なわれる。
RAM (Random Access Memory) 1 3は、 各種のデータの一時的な格納領域 として、 また R OM 1 2に格納されている制御プログラムを C P U 1 1が実行 するときにワークメモリとして必要に応じて使用されるメモリである。
ハードディスク装置 1 4は、 翻訳処理のために用いられる、 翻訳前の原文の 言語の語句と翻訳文の言語におけるその語句についての訳語とが対応付けられ て格納されている訳語辞書ファイルが予め記憶されている。 なお、 この訳語辞 書ファイルには、 各訳語の品詞を示す情報や、 訳語と訳語との間の結び付きの 強さを示す情報も格納されており、 更に、 その訳語が、 例えば経済 ·金融分野 、 通信技術分野、 法律分野などといったどのような分野 (カテゴリ) での文章 でこの語句が用いられたときの翻訳の際に用いられるかを示す情報も格納され ている。
なお、 前述した制御プログラムを R OM 1 2に格納しておく代わりにこのハ 一ドディスク装置 1 4に予め記憶させておき、 この翻訳システムが起動された ときに C P U 1 1がこの制御プログラムをハードディスク装置 1 4から読み出 して R AM I 3に一旦格納し、 その後 R AM I 3からその制御プログラムを読 み出して実行するようにしてこの翻訳システム全体の動作の制御を行なうよう にしてもよい。
音声入力部 1 5は、 この翻訳システムを使用して翻訳作業を行なう翻訳者の 発する音声を取得してその声を表現する声データに変換する。
操作入力部 1 6はこの翻訳システムを使用する翻訳者によつて操作されるキ 一ボートやマウス等の入力装置を有し、 これらの入力装置に対して行なわれた 操作の状況を取得する。
表示装置 1 7は C P U 1 1から指示された表示を行なうものであり、 例えば C R T (Cathode Ray Tube) や L C D (Liquid Crystal Display) を用いた装 置である。
入出力装置 1 8は、 外部から入力される情報、 例えば翻訳の対象である原文 が記述されている文書データを受け取って CPU 1 1にその情報を送付し、 あ るいは CPU 1 1からの出力、 例えば翻訳結果である翻訳文の出力を行なうも のである。 入出力装置 1 8は、 FD (Flexible Disk )、 CD-ROM (Compact Disc-ROM)、 D V D - R OM (Digital Versatile Disc-ROM)、 M O ( Magneto-Optics) ディスクなどといった可搬型の記録媒体の読み出し及び書き 込み装置を備えて構成される。 また、 通信ネットワークを介して他の機器との 間でこれらの入出力情報を交換するためのインタフェース装置を入出力装置 1 8として備えるようにしてもよい。 更に、 CPU 1 1からの出力の内容を用紙 に印刷するプリンタ装置を入出力装置 18として備えるようにしてもよい。 本装置は以上の各構成要素を備えて構成される。
なお、 図 2に示す翻訳システムの構成は標準的な構成のコンピュータシステ ムの多くが備えているものであり、 従ってこのようなコンピュータシステムで 本発明を実施することも可能である。
次に、 図 2に示した翻訳システムにおける C PU 1 1によって行なわれる制 御処理について説明する。 なお、 これより説明する各処理は、 いずれもこの翻 訳システムを制御するための制御プログラムを C PU 1 1が実行することによ つて実現される。
まず図 3について説明する。 同図は、 CPU 1 1によって行なわれる制御処 理の処理内容を示すフローチャートである。 同図に示す処理を CPU 1 1が行 なうことによってこの翻訳システムで翻訳が行なわれる。
まず、 メインフローである、 図 3 (a) のフローチャートを説明する。
まず、 S 101では翻訳対象である原文を取得する処理が実行される。 この 処理では、 入出力装置 18に入力された原文を表現するデータを RAMI 3に 一時的に記憶させる。
S 102では機械翻訳処理が実行される。 この機械翻訳処理の詳細な処理内 容を示すフローチャートは図 3 ( b ) に示されており、 この処理内容は後述す る。
S 1 0 3では校正支援処理が実行される。 この校正支援処理の詳細な処理内 容を示すフローチャートは図 3 ( c ) に示されており、 この処理内容も後述す る。 S 1 0 3の処理が完了するとこのメインフローは終了する。
次に、 図 3 ( b ) に示されている、 前述した S 1 0 2の処理である機械翻訳 処理の処理内容を示すフローチャートを説明する。
まず、 S 1 1 1では原文を解析して語句に分解する処理が実行される。 この 処理では、 前述した S 1 0 1の処理によって R AM I 3に記憶されているデー タで表現されている原文が語句に分解される。 なお、 ここで行なう原文の解析 には周知の解析手法、 例えば形態素解析などを利用して行なえばよレ、。
S 1 1 2では語句に対応する訳語を訳語辞書から取得する処理が実行される 。 この処理では、 ハードディスク装置 1 4に記憶されている訳語辞書ファイル が参照され、 その訳語辞書ファイルにおいて S 1 1 1の処理によって原文が分 解されて得られた各語句にそれぞれ対応付けられている 1以上の訳語が取得さ れる。
S 1 1 3では訳語を組み合わせて翻訳文を作成する処理が実行される。 この 処理では、 まず、 S 1 1 2の処理によって取得された各訳語から翻訳文に用い る訳語を選択する処理が行なわれる。 なお、 ここでの訳語の選択方法は機械翻 訳技術の分野で周知の手法を利用することができ、 例えば過去の翻訳作業の統 計データを訳語辞書ファイルに登録しておき、 翻訳作業において最も選択され る頻度の高い訳語を選択するといつた手法でもよい。 そして、 この処理によつ て選択された訳語が組み合わされることによって翻訳文が作成される。 この訳 語の組み合わせの処理も機械翻訳技術の分野で周知の手法を利用することがで きる。 S 1 1 4では翻訳文を表示する処理が実行される。 この処理では、 S 1 1 2 の処理によって作成された翻訳文を表示させる指示が表示装置 1 7に与えられ 、 表示装置 1 7はこの指示に応じてその翻訳文を表示する。
この S 1 1 4の処理を終えると S 1 0 2の処理が終了し、 図 3 ( a ) に示す フローチャートへ処理が戻る。
次に、 図 3 ( c ) に示されている、 前述した S 1 0 3の処理である校正支援 処理の処理内容を示すフローチャートを説明する。 この処理によって実現され る翻訳文の校正を支援する手法は、 翻訳文に用いられている不適切な訳語を適 切なものに修正する作業を、 翻訳者がその適切な訳語を発声するのみで行なえ るようにするというものである。
まず、 S 1 2 1では校正作業を行なうか否かの判定処理が実行される。 この 処理では、 表示装置 1 7に表示されている機械翻訳による翻訳文をこの翻訳シ ステムを使用している翻訳者が参照し、 この翻訳文が適切であるかどうかを翻 訳者が判断する。 そして、 この判断結果に基づいて、 校正作業を行なうか否か を示す操作が翻訳者によって操作入力部 1 6に対して行なわれる。 C P U 1 1 は、 操作入力部 1 6に対して行なわれたこの操作の内容に基づき、 校正作業を 行なうか否かの判定を行なうというものである。
そして、 この S 1 2 1の判定処理の結果が Y e s、 すなわち校正作業を行な うのであれば S 1 2 2に処理が進み、 一方、 この S 1 2 1の判定処理の結果が N o、 すなわち校正作業を行なわないのであれば S 1 2 7に処理が進む。
S 1 2 2では音声入力がなされたか否かの判定処理が行なわれる。 この処理 では、 訳語を発声する翻訳者の音声が音声入力部 1 5で取得されたか否かが判 定される。 そして、 この判定処理の結果が Y e sとなるまで、 すなわち音声入 力がなされたと判定されるまでこの S 1 2 2の判定処理が繰り返される。
S 1 2 3では音声認識処理が実行され、 音声入力部 1 5から出力される、 翻 訳者の音声を表現する声データが分析され、 翻訳者による発音の内容を特定す る処理が行なわれる。
S 1 2 4では、 前述した機械翻訳処理において訳語辞書ファイルから取得さ れた全ての訳語から、 翻訳者による発音の内容に対応するものを選択する処理 が実行される。 この処理では、 図 3 ( b ) の S 1 1 2によってハードディスク 装置 1 4に記憶されている訳語辞書ファイルから取得された、 原文を構成する 各語句に対応付けられている全ての訳語のそれぞれの発音と、 S 1 2 3の処理 によって特定された翻訳者による発音の内容とを比較し、 両者間で最も相関の 高い訳語が選択される。 このように、 本実施の形態で行なわれる音声認識は、 その認識の対象が原文を構成する各語句に対応付けられている訳語に限定され ているので、 不特定の語を認識の対象とする音声認識と比べて高い認識率を得 ることができる。
S 1 2 5では翻訳文を修正する処理が行なわれる。 この処理では、 まず、 ハ 一ドディスク装置 1 4に記憶されている訳語辞書ファイルにおいて S 1 2 4の 処理によって選択された訳語に対応付けられている語句が取得される。 そして 、 その語句の翻訳となっている訳語が表示装置 1 7に表示されている翻訳文か ら除去され、 その翻訳文に残された訳語とその代わりに S 1 2 4の処理によつ て選択された訳語とが改めて組み合わされて新たな翻訳文が作成される。 こう することによって、 翻訳者は、 表示装置 1 7に表示されている機械翻訳による 翻訳文における修正を要する部分を特定するための指示操作を行なうことなく 、 その翻訳文の修正を行なうことができる。 なお、 修正後の翻訳文は表示装置 1 7に表示させるようにする。
S 1 2 6では校正作業が終了したか否かの判定処理が実行される。 この処理 では、 表示装置 1 7に表示されている修正後の翻訳文をこの翻訳システムを使 用している翻訳者が参照し、 この翻訳文が適切であるかどうかを翻訳者が判断 する。 そして、 この判断結果に基づいて、 校正作業を更に続けるか否かを示す 操作が翻訳者によって操作入力部 1 6に対して行なわれる。 C P U 1 1は、 操 作入力部 1 6に対して行なわれたこの操作の内容に基づき、 校正作業が終了し たか否かの判定を行なうというものである。 なお、 翻訳者による校正作業を更 に続けるか否かの意思表示を翻訳者が発声し、 その発声の内容を音声認識する ことで C P U 1 1が翻訳者の意思を認識するようにしてもよレ、。
この S 1 2 6の判定処理の結果が Y e s、 すなわち校正作業を終了するので あれば S 1 2 7に処理が進み、 一方、 この S 1 2 6の判定処理の結果が N o、 すなわち校正作業を継続するのであれば S 1 2 2へ処理が戻って上述した処理 が繰り返される。
S 1 2 7では翻訳文を出力する処理が実行される。 この処理では、 表示装置 1 7に現在表示されている翻訳文を表現するデータを入出力装置 1 8に送り、 そのデータを各種の記録媒体に記録し、 その翻訳文を用紙に印字し、 あるいは そのデータを他の機器に宛てて通信ネットワークに送出するなどの処理を入出 力装置 1 8に行なわせる。
この S 1 2 7の処理を終えると S 1 0 3の処理が終了し、 図 3 ( a ) に示す フローチヤ一トへ処理が戻る。
以上の処理が C P U 1 1によって行なわれることによって、 この翻訳システ ムを利用した翻訳が行なわれる。 ここで、 この翻訳システムを利用して実際に 翻訳が行なわれる様子を、 英語から日本語への翻訳を例に挙げて説明する。 今、 翻訳対象である原文が "I saved Money. " であるとする。
まず、 S 1 0 2の機械翻訳処理が実行される。 この機械翻訳処理における S 1 1 2の処理によって、 ハードディスク装置 1 4に記憶されている訳語辞書フ 了ィルから以下に示す訳語が取得されたとする。
"I" 「私」 "save " 「救う」
save " 「節約する」
"save " 「保存する」
"money 「金」
ここで、 S 1 1 3の処理によって原文 "I saved Money. " 力 S 「私は金を救つ た。」 に翻訳され、 表示装置 1 7に表示されたとする。 翻訳者がこの翻訳文を参 照して校正の必要があると判断し、 操作入力部 1 6を操作して校正作業を行な う旨の指示をこの翻訳システムに与えると、 S 1 2 1の判定処理の結果は Y e sとなり、 校正支援の処理が開始される。
次に、 翻訳者が、 ' setsuyaku shita ' と発声すると、 この声は音声入力部 1 5で取得され、 S 1 2 3の音声認識処理が実行される。 そして、 S 1 2 4にお いて、 先の S I 1 2の処理によって取得された訳語 「私」、 「救う」、 「節約する J、 「保存する」、 「金」 力 ら、 翻訳者による発声に最も近い訳語 「節約する」 が 選択される。
そして、 S 1 2 5において、 「節約する」 に対応付けられている原文の語句 " save" のそれまでの訳語であった 「救う」 が翻訳文の作成候補から除外され、 訳語 「私」、 「節約する」、 「金」 より 「私は金を節約した。」 なる翻訳文が作成さ れる。 こうして校正作業が終了し、 適切な翻訳の結果が出力される。
次に、 図 2に示した翻訳システムにおける C P U 1 1によって行なわれる制 御処理の他の例について説明する。
図 4は、 図 3 ( a ) の S 1 0 3の処理である校正支援処理の第二の例の処理 内容を示すフローチャートである。 この処理は、 例えば機械翻訳により作成さ れた翻訳文がその文全体に渡って不適切であると翻訳者が判断したときには、 前述した校正支援処理のように訳語単位での修正を行なうのではなく、 文全体 の一括修正を行なえるようにするものである。 なお、 これより説明する校正支援処理を図 3 (c) に示したものとを区別す るために、 図 3 (c) に示した処理を校正支援処理の第一の例と称することと する。
図 4において、 図 3 (c) に示した校正支援処理の第一の例と同様の処理が 行なわれる処理ステップには同一の符号を付すようにし、 それらの処理ステツ プの説明は省略する。
図 4と図 3 (c) とを比較すれば分かるように、 図 4に示したフローチヤ一 トは図 3 (c) に示したフローチャートにおける S 1 23の処理と S 1 24の 処理との間に S 1 31の判定処理が挿入され、 この判定処理の結果によって S 1 24及び S 1 25の処理の代わりに S 1 32及び S 1 33の処理が実行され るというものである。 これらの処理について説明する。
S 1 23の音声認識処理に続く S 1 3 1では、 翻訳者の発声が修正翻訳文の 文全体を発声したものであるか否かの判定処理が実行される。 この処理では、 翻訳者の発した声が修正翻訳文の文全体を発声したものであるかどうかを示す 操作が翻訳者自身によって操作入力部 1 6に対して行なわれ、 CPU1 1は、 操作入力部 16に対して行なわれたこの操作の内容に基づきこの判定を行なう というものである。
そして、 この S 13 1の判定処理の結果が Ye s、 すなわち修正翻訳文の文 全体を発声したものであるときには S 1 32に処理が進む。 一方、 この S 1 3 1の判定処理の結果が No、 すなわち訳語の発声をしたものであるときには S 1 24に処理が進み、 以降は図 3 (c) に示されているものと同様の処理が実 行される。
S 132では翻訳者による発音の内容に対応する訳語を複数選択する処理が 実行される。 この処理では、 翻訳者による発音の内容の一部分と、 図 3 (b ) の S 1 1 2によってハードディスク装置 14に記憶されている訳語辞書フアイ ルから取得された、 原文を構成する各語句に対応付けられている全ての訳語の それぞれの発音とを比較し、 両者間の相関が最も高く且つ所定の相関値以上と なる訳語が選択される。 ここで、 所定の相関値以上となる訳語が存在しなかつ たときには、 比較の対象としていた発音の内容の一部分に含ませた範囲を変化 させて再度比較が行なわれ、 所定の相関値以上となる訳語があればそれが選択 される。 訳語が選択されたときには、 比較の対象とする翻訳者による発音の内 容のうちの残された部分における一部分について同様の比較及び選択が行なわ れる。 この比較及び選択が繰り返されることによって、 翻訳者の発声された修 正翻訳文に用いられている全ての訳語が選択される。
S 1 3 3では翻訳文を作成する処理が行なわれる。 この処理では、 S 1 3 2 の処理によつて選択された訳語が組み合わされて新たな翻訳文が作成される。 なお、 修正後の翻訳文は表示装置 1 7に表示させるようにする。
S 1 3 3の処理を終えた後には処理が S 1 2 6に進み、 以降は図 3 ( c ) に 示されているものと同様の処理が実行される。
以上のように、 翻訳者による発声は文であることが翻訳者によってこの翻訳 システムに指示されることにより、 認識対象が文であるときの音声認識の処理 が行なえるようになるので、 そのような指示がなされなレ、場合と比べて良好な 認識精度を得ることができる。
図 4に示す校正支援処理が C P U 1 1によって実行されるときに実際に翻訳 が行なわれる様子を、 英語から日本語への翻訳を例に挙げて説明する。
今、 翻訳対象である原文が "Time fl ies like an arrow. " であり、 S 1 0 2の機械翻訳処理による翻訳結果が 「光陰矢のごとし。」 であったにも拘らず、 実際の翻訳文は、 原文の前後の文章の流れより、 「時蝇は矢が好きである。」 す るほうが適切である場合を考える。 なお、 このとき、 ハードディスク装置 1 4 に記憶されている訳語辞書ファイルには、 time 「時」
'fly " 「蝇」
'l ike" 「好きである」 arrow 「矢」
'Time fl ies like an arrow. " 「光陰矢のごとし。」 が登録されているものとする。
このとき、 翻訳者は、 ' tokihae wa ya ga sukidearu と発声し、 更に操作入 力部 1 6を操作してこの発声は修正翻訳文の文全体であることを指示する。 C P U 1 1は S 1 3 1の判定処理を Y e sと判定し、 続く S 1 3 2の処理によつ て翻訳者の発声の内容から訳語 「時」、 「蝇」、 「矢」、 「好きである」 が選択され 、 S 1 3 3の処理によって 「時蝇は矢が好きである。」 なる翻訳文が作成される 次に図 5について説明する。 同図は図 3 ( a ) の S 1 0 3の処理である校正 支援処理の第三の例の処理内容を示すフローチャートである。 この処理は、 機 械翻訳により作成された翻訳文のうちの一部の訳語に対して異なる訳語を用い るようにして修正する指示が行なわれると、 その異なる訳語を用いた翻訳文が 改めて機械翻訳により作成されるというものである。
図 5において、 図 3 ( c ) に示した校正支援処理の第一の例と同様の処理が 行なわれる処理ステップには同一の符号を付すようにし、 それらの処理ステツ プの説明は省略する。
図 5と図 3 ( c ) とを比較すれば分かるように、 図 5に示したフローチヤ一 トは図 3 ( c ) に示したフローチャートにおける S 1 2 5の処理が S 1 4 1の 処理へと置き換えられたものである。 この処理について説明する。
S 1 2 4の処理によって、 前述した機械翻訳処理において訳語辞書ファイル から取得された全ての訳語から、 翻訳者による発音の内容に対応するものが選 択された後、 S 1 4 1では機械翻訳による再翻訳処理が実行される。
この S 1 4 1の処理では、 図 3 ( b ) の S 1 1 3の処理と同様に、 まず、 S 1 1 2の処理によって取得された各訳語から翻訳文に用いる訳語を選択する処 理が行なわれるのであるが、 このとき、 S 1 2 4の処理によって選択された訳 語との間で強い結び付きのあることを示す情報が訳語辞書ファィルに格納され ているものを優先して選択する。 そして、 この処理によって選択された訳語が 組み合わされることによって翻訳文が作成される。
S 1 4 1の処理を終えた後には処理が S 1 2 6に進み、 以降は図 3 ( c ) に 示されているものと同様の処理が実行される。
以上の処理が行なわれることによって、 翻訳者は機械翻訳により作成された 翻訳文のうちの一部の訳語に対して異なる訳語を用いるように修正する指示を 行なうだけで、 修正の指示を行なっていない他の訳語までもがその異なる訳語 を使用するのに適切なものへと修正された翻訳文が改めて機械翻訳により作成 されるので、 翻訳者による修正の作業が軽減される。
図 5に示す校正支援処理が C P U 1 1によって実行されるときに実際に翻訳 が行なわれる様子を、 英語から日本語への翻訳を例に挙げて説明する。
今、 翻訳対象である原文が "The bank cut interest rates. " であり、 S 1 0 2の機械翻訳処理による翻訳結果が 「銀行は興味率を切った。」 であった場合 を考える。 なお、 このとき、 ハードディスク装置 1 4に記憶されている訳語辞 :は、
'bank …- 「銀行」
cut ·· · · 「切る」
cut · · · · 「削減する」
interest 「興味」
rate · · · · 「率」 "interest rate " ··· 「金禾 lj」
が登録されているものとし、 更に訳語 「金利」 と 「削減する」 とは強い結び付 きのある、 すなわち翻訳文中で同時に用いられる頻度の高いことを示す情報が 登録されているものとする。
このとき、 翻訳者が ' kin-ri' と発声すると、 この声は音声入力部 1 5で取 得され、 S 1 2 3の音声認識処理が実行される。 そして、 S 1 2 4において、 先の S I 1 2の処理によって取得された訳語 「銀行」、 「切る」、 「削減する」、 「 興味」、 「率」、 「金利」 から、 翻訳者による発声に最も近い訳語 「金利」 が選択 される。
そして、 S 1 2 5において、 「金利」 に対応付けられている原文の語句 " interest rate " のそれまでの訳語であった 「興味」 及び 「率」 が翻訳文の作 成候補から除外され、 続く S 1 4 1において、 訳語 「金利」 と強い結び付きの あることを示す情報が訳語辞書ファイルに登録されている訳語 「削減する」 が 語句 "cut " の訳語として 「切る」 に代わって優先的に選択され、 こうして選 択された訳語 「金利」 及び 「削減する」 と、 訳語 「銀行」 とから 「銀行は金利 を削減した。」 なる翻訳文が作成される。 こうして校正作業が終了し、 適切な翻 訳の結果が出力される。
次に図 6について説明する。 同図は図 3 ( a ) の S 1 0 3の処理である校正 支援処理の第四の例の処理内容を示すフローチャートである。 この処理は、 機 械翻訳により作成された翻訳文のうちの一部の訳語に対して異なる訳語を用い るように修正する指示が行なわれたとき、 その修正された後の訳語の品詞が修 正前のものと異なるものであるときには、 機械翻訳において行なわれた原文の 分析に誤りがあつたとみなし、 その修正された後の訳語を用いた翻訳文が改め て機械翻訳により作成されるというものである。
図 6において、 図 3 ( c ) に示した校正支援処理の第一の例と同様の処理が 行なわれる処理ステップには同一の符号を付すようにし、 それらの処理ステツ プの説明は省略する。
図 6と図 3 ( c ) とを比較すれば分かるように、 図 6に示したフローチヤ一 トは図 3 ( c ) に示したフローチャートにおける S 1 2 4の処理と S 1 2 5の との処理の間に S 1 5 1なる判定処理が挿入され、 この判定の結果に応じ、 S 1 2 5の処理の代わりに S 1 5 2なる処理が実行されるというものである。 こ の処理について説明する。
S 1 2 4の処理によって、 前述した機械翻訳処理において訳語辞書ファイル から取得された全ての訳語から、 翻訳者による発音の内容に対応するものが選 択された後、 S 1 5 1では、 その選択された訳語の品詞が修正対象の訳語と異 なるか否かの判定処理が実行される。 この処理では、 S 1 2 4の処理で選択さ れた訳語の品詞が訳語辞書ファイルを参照することによって取得され、 更に、 先に作成されていた翻訳文においてその選択された訳語に対応付けられている 語句の翻訳となっている訳語についてもその品詞が訳語辞書ファイルを参照す ることによって取得される。 そして、 この両者の品詞が異なるか否かの判定が 行なわれる。
この S 1 5 1の判定処理の結果が Y e s、 すなわち、 S 1 2 4の処理によつ て選択された訳語の品詞が修正対象の訳語と異なるのであれば処理が S 1 5 2 に進む。 一方、 この S 1 5 1の判定処理の結果が N o、 すなわち、 S 1 2 4の 処理によって選択された訳語の品詞が修正対象の訳語と同じであれば処理が S 1 2 5に進み、 以降は図 3 ( c ) に示されているものと同様の処理が実行され る。
S 1 5 2では機械翻訳による再翻訳処理が実行される。
この S 1 5 2の処理では、 図 3 ( b ) の S 1 1 3の処理と同様に、 まず、 S 1 1 2の処理によって取得された各訳語から翻訳文に用いる訳語を選択する処 理が行なわれるのであるが、 このとき、 S 1 2 4の処理によって選択された訳 語が優先的に選択される。 そして、 この処理によって選択された訳語が組み合 わされることによって翻訳文が作成される。
S 1 5 2の処理を終えた後には処理が S 1 2 6に進み、 以降は図 3 ( c ) に 示されているものと同様の処理が実行される。
以上の処理が行なわれることによって、 翻訳者は機械翻訳により作成された 翻訳文のうちの一部の訳語に対して異なる訳語を用いるように修正する指示を 行なうだけで、 その修正された後の訳語の品詞が修正前のものと異なるもので あるときにはその訳語を用いての翻訳文が機械翻訳によって作成されるので、 翻訳者による修正の作業が軽減される。
図 6に示す校正支援処理が C P U 1 1によって実行されるときに実際に翻訳 が行なわれる様子を、 英語から日本語への翻訳を例に挙げて説明する。
ここでは、 翻訳対象である原文を、 前述した第二の例におけるものと同様の "Time fl ies like an arrow. " であり、 S 1 0 2の機械翻訳処理による翻訳 結果が 「光陰矢のごとし。」 であったにも拘らず、 実際の翻訳文は、 原文の前後 の文章の流れより、 「時蝇は矢が好きである。」 するほうが適切である場合を考 える。 また、 このとき、 ハードディスク装置 1 4に記憶されている訳語辞書フ アイルに登録されている英語の語句と日本語の訳語も前述したものと同様であ るとする。 そして、 訳語辞書ファイルには、 訳語 「好きである」 の品詞は動詞 であることを示す情報、 及び訳語 「光陰矢のごとし。」 における "l ike" の訳語 の品詞は前置詞であることを示す情報が登録されているものとする。
このとき、 翻訳者は ' sukidearu' と発声すると、 この声は音声入力部 1 5で 取得され、 S 1 2 3の音声認識処理が実行される。 そして、 S 1 2 4において 、 先の S 1 1 2の処理によって取得された訳語 「時」、 「蝇」、 「好きである」、 「 矢」、 「光陰矢のごとし。」 から、 翻訳者による発声に最も近い訳語 「好きである J が選択される。
ここで、 S I 5 1において、 訳語 「好きである」 の品詞と、 先に作成されて いた翻訳文 「光陰矢のごとし。」 において訳語 「好きである」 に対応付けられて いる語句 "like" の訳語の品詞が訳語辞書ファイルを参照することによって取 得され、 この両者の品詞が異なるか否かの判定が行なわれる。 ここでは、 この 両者の品詞が動詞及び前置詞であり、 異なっているので、 S 1 5 1の判定処理 の結果は Y e sとなり、 処理が S 1 5 2に進む。 そして、 訳語 「好きである」 力 S 「光陰矢のごとし」 に代わって選択され、 訳語 「好きである」 と、 訳語 「時 」、 「蝇」、 及び 「矢」 とから 「時蝇は矢が好きである。」 なる翻訳文が作成され る。 こうして校正作業が終了し、 適切な翻訳の結果が出力される。
次に図 7について説明する。 同図は図 3 ( a ) の S 1 0 3の処理である校正 支援処理の第五の例の処理内容を示すフローチャートである。 この処理は、 翻 訳文に対して翻訳者が修正した訳語が例えば経済 ·金融分野、 通信技術分野、 法律分野などといったどのような分野で用いられるのかを示す情報を取得し、 その後に行なわれる機械翻訳ではその分野で用いられる訳語を優先的に使用し た翻訳文の作成を行なうようすることで、 機械翻訳の精度を向上させるという ものである。
図 7において、 図 3 ( c ) に示した校正支援処理の第一の例と同様の処理が 行なわれる処理ステップには同一の符号を付すようにし、 それらの処理ステツ プの説明は省略する。
図 7と図 3 ( c ) とを比較すれば分かるように、 図 7に示したフローチヤ一 トは図 3 ( c ) に示したフローチャートにおける S 1 2 7の処理に続けて S 1 6 1及び 1 6 2の処理が実行されるというものである。 この処理について説明 する。
翻訳文を出力する S 1 2 7の処理に続いて実行される S 1 6 1では、 修正さ れた訳語の用いられる分野を示す情報を取得する処理が実行される。 この処理 では、 前述した S 1 2 4の処理によって選択された訳語の用いられる分野がハ 一ドディスク装置 1 4に記憶されている訳語辞書ファイルから取得される。 続く S 1 6 2では、 S 1 6 1の処理によって取得された分野の優先化処理が 実行される。 この処理では、 S 1 6 1の処理によって取得された分野を示す情 報を R AM I 3の所定の領域に記憶させる。 後に続けて実行される図 3 ( b ) の機械翻訳処理では、 S 1 1 3の翻訳文の作成処理で行なわれる訳語の選択の 際にこの R AM I 3に記憶させた情報を参照するようにし、 S 1 6 1の処理に よって取得された分野で用いられる訳語を優先して選択するようにする。
この S 1 6 2の処理を終えると S 1 0 3の処理が終了し、 図 3 ( a ) に示す フローチヤ一トへ処理が戻る。
以上の処理が行なわれることによって、 翻訳者が翻訳文に対して訳語の修正 を行なうと、 その後の機械翻訳においては、 例えば経済 ·金融分野、 通信技術 分野、 法律分野などといったどのような分野で用いられることの多レ、訳語を優 先的に使用して翻訳文の作成を行なうようになり、 機械翻訳の精度が向上する ので、 その後の翻訳の修正作業のための労力が軽減される。
図 7に示す校正支援処理が C P U 1 1によって実行されるときに実際に翻訳 が行なわれる様子を、 英語から日本語への翻訳を例に挙げて説明する。
今、 翻訳対象である原文が "The bank cut interest rates. " であり、 翻訳 者からなされた訳語 「金利」 を使用する旨の指示に応じて翻訳文の修正処理が 行なわれた結果、 翻訳文 「銀行は金利を削減した。」 が得られた場合を考える。 なお、 このとき、 ハードディスク装置 1 4に記憶されている訳語辞書ファイル には、 訳語 「金利」 が経済 '金融分野で用いられる者であることが示されてい たとする。
ここで、 次の翻訳対象である原文が "Japan relaxed regulations. " であつ たとする。 このとき、 ハードディスク装置 1 4に記憶されている訳語辞書ファ ィルには、
Japan 「日本」
relax 「リラックスする」
relax 「緩和する」
regulation 「規則」
regulation 「規制」
が登録されているものとし、 これらの訳語のうち、 「緩和する」 及び 「規制」 の 訳語は経済 ·金融分野でよく用いられるものであることを示す情報が登録され ているものとする。 更に、 "interest rate " の訳語 「金利」 が経済 '金融分野 でよく用いられるものであることを示す情報が登録されているものとする。 このとき、 S 1 6 1の処理によって、 修正された訳語 「金利」 の用いられる 分野が調べられ、 この訳語が経済 ·金融分野で用いられるものであることを示 す情報が訳語辞書ファイルから取得される。 そして、 続く S 1 6 2の処理によ つて、取得された情報が R AM I 3の所定の領域に記憶される。その後の" Japan relaxed regulations. " の機械翻訳の処理における S 1 1 3の翻訳文の作成処 理で行なわれる訳語の選択では、 R AM I 3の記憶内容に応じ、 経済 '金融分 野でよく用いられる訳語である 「緩和する」 及び 「規制」 力 S 「リラックスする 」 及び 「規則」 よりも優先されて選択される。 こうして選択された訳語 「緩和 する」 及び 「規制」 と訳語 「日本」 とより、 「日本は規則をリラックスした」 よ りも適切な 「日本は規制を緩和した。」 なる翻訳文が作成される。 こうして校正 作業が終了し、 適切な翻訳の結果が出力される。
なお、 本発明を標準的なコンピュータで実施するには、 以上までに説明した 本発明の実施形態における翻訳システムの有する C P U 1 1が行なっていたも のと同様の処理をそのコンピュータに行なわせるための制御プログラムを作成 し、 その制御プログラムをコンピュータに読み込ませて実行させることにより 可能となる。
また、 このような制御プログラムをコンピュータで読み取り可能な記録媒体 に記録させ、 そのプログラムを記録媒体からコンピュータに読み出させて実行 させることによって本発明をコンピュータで実施することも可能である。
記録させた制御プログラムをコンピュータで読み取ることの可能な記録媒体 の例を図 8に示す。 同図において、 2 1はコンピュータ、 2 2はメモリ、 2 3 は可搬型記録媒体、 2 4は通信回線、 2 5はプログラムサーバ、 2 6は記憶装 置である。
図 8に示すように、 記録媒体としては、 例えば、 コンピュータ 2 1に内蔵若 しくは外付けの付属装置として備えられる R OMやハードディスク装置などの メモリ 2 2、 あるいは F D (フレキシブルディスク)、 MO (光磁気ディスク) 、 C D - R OM, D V D— R OMなどといった可搬型記録媒体 2 3等が利用で きる。 また、 記録媒体は回線 2 4を介してコンピュータ 2 1と接続される、 プ ログラムサーバ 2 5として機能するコンピュータが備えている記憶装置 2 6で あってもよい。 この場合には、 制御プログラムを表現するデータ信号で搬送波 を変調して得られる伝送信号を、 プログラムサーバ 2 5から伝送媒体である通 信回線 2 4を通じて伝送するようにし、 コンピュータ 2 1では受信した伝送信 号を復調して制御プログラムを再生することで当該制御プログラムを実行でき るようになる。
以上、 本発明の幾つかの実施形態について説明したが、 本発明は、 上述した 実施形態に限定されることなく、 種々の改良 ·変更が可能である。
以上のように、 本発明の態様のひとつによれば、 原文を翻訳して翻訳文を作 成する作業を支援するために、 入力された原文を構成している各語句に対応す る複数の訳語の中から各々ひとつずつ訳語を選択して該選択された訳語を組み 合わせることによって該原文についての翻訳文を作成して機械翻訳の結果とし 、 入力された音声に対応する語を、 該語句に対応する訳語であって該選択によ つては選択されなかつた該訳語から選択して該選択された訳語を該音声の認識 の結果とし、 該機械翻訳の結果として作成された翻訳文を、 該音声の認識の結 果である訳語を用いて修正するようにすることにより、 翻訳者は機械翻訳によ り作成された翻訳文のうちの一部の訳語に対して異なる訳語を用いるように修 正する指示を行なうだけで、 修正の指示を行なっていない他の訳語までもがそ の異なる訳語を使用するのに適切なものへと修正された翻訳文が自動的に作成 されるので、 翻訳者による修正の作業が軽減される。
あるいは、 本発明の別の態様のひとつによれば、 入力された原文を翻訳して 翻訳文を作成し、 作成された翻訳文で用いられている訳語を他の訳語へと変更 する修正を行なうために入力される該他の訳語の品詞と、 該他の訳語に置き換 えられる対象である修正前の訳語の品詞とが異なるかどうかを判定し、 両訳語 の品詞が異なると判定されたときに、 該入力された訳語を用いて該原文の全体 の再翻訳を行なって前記翻訳文の修正を行なうようにすることにより、 翻訳者 は機械翻訳により作成された翻訳文のうちの一部の訳語に対して異なる訳語を 用いるように修正する指示を行なうだけで、 その修正された後の訳語の品詞が 修正前のものと異なるものであるときにはその訳語を用いての翻訳文が自動的 に作成されるので、 翻訳者による修正の作業が軽減される。
あるいは、 本発明の更なる別の態様のひとつによれば、 文書を翻訳する作業 を支援するために、 過去に作成された該文書を構成する原文についての翻訳文 に対して施された修正の内容から、 該原文が話題としている分野を判定し、 該 文書を構成する未翻訳の原文について機械翻訳を行なわせるときに、 該分野で 用いられる頻度の高い訳語を優先して使用させて該原文の翻訳文を作成させる ようにすることにより、 機械翻訳の精度を向上させることができ、 結果として 翻訳者による修正の作業が軽減される。
以上のように、 本発明のいずれの態様によっても、 機械翻訳により生成され た翻訳文に対して人が行なう校正作業の効率を向上させることができる。 産業上の利用の可能性
本発明は文書翻訳作業を支援するシステムでの利用に好適である。

Claims

請 求 の 範 囲
1 . 原文を翻訳して翻訳文を作成するシステムであって、
入力された原文を構成している各語句に対応する複数の訳語から各々ひとつ ずつ訳語を選択し、 該選択された訳語を組み合わせることによって該原文につ レ、ての翻訳文を作成する翻訳手段と、
入力された音声に対応する語を、 前記語句に対応する訳語であって前記翻訳 手段によつて選択されなかった該訳語から選択し、 該選択された訳語を該音声 の認識の結果として出力する音声認識手段と、
前記翻訳手段により作成された翻訳文を、 前記音声認識手段から出力された 訳語を用いて修正する修正手段と、
を有することを特徴とする翻訳システム。
2 . 原文で用いられる語句と該語句についての訳語とが対応付けられて登録 されている訳語辞書フアイルが格納される訳語辞書フアイル格納手段と、 前記翻訳手段に入力された原文を構成している語句の各々に対応付けられて いる訳語を前記訳語辞書ファイルから抽出する抽出手段と、
を更に有し、
前記翻訳手段は、 作成する翻訳文に用いる訳語を前記訳語抽出手段によって 抽出された訳語から選択し、
前記音声認識手段は、 入力された音声に対応する語を、 前記訳語抽出手段に よって抽出された訳語であって前記翻訳手段によつて選択されなかった該訳語 から選択する、
ことを特徴とする請求の範囲第 1項に記載の翻訳システム。
3 . 前記翻訳手段により作成された翻訳文を構成する一部の語句に対して修 正を行なう力 \ あるいは該翻訳文の全文に渡る修正を行なうかを示す指示が入 力される指示入力手段を更に有し、
前記音声認識手段は、 前記翻訳手段により作成された翻訳文の全文に渡る修 正を行なうことを示す指示が前記指示入力手段に入力されたときには、 入力さ れた音声を表現する情報を分割し、 該分割された情報の各々に対応する語を、 前記語句に対応する訳語であって前記翻訳手段によって選択されなかつた該訳 語から選択する、
ことを特徴とする請求の範囲第 1項に記載の翻訳システム。
4 . 前記修正手段は、 前記語句に対応する訳語であって前記翻訳手段によつ て選択されなかつた該訳語に前記音声認識手段から出力された訳語と関連する ものがあるときには、 該翻訳手段によって選択されなかった訳語、 及び前記音 声認識手段から出力された訳語を共に用レ、て該翻訳手段により作成された翻訳 文を修正することを特徴とする請求の範囲第 1項に記載の翻訳システム。
5 . 前記訳語辞書ファイルには、 該訳語辞書ファイルに登録されている訳語 の間で関連があるときに、 その旨を示す情報が更に登録されており、
前記修正手段は、 前記語句に対応する訳語であって前記翻訳手段によって選 択されなかった該訳語が前記音声認識手段から出力された訳語と関連すること を示す情報が前記訳語辞書ファイルに登録されているときには、 該翻訳手段に よって選択されなかった訳語、 及び前記音声認識手段から出力された訳語を共 に用いて該翻訳手段により作成された翻訳文を修正する、
ことを特徴とする請求の範囲第 2項に記載の翻訳システム。
6 . 前記修正手段は、 前記音声認識手段から出力された訳語の品詞と、 前記 修正において該訳語へと置き換えられる対象である修正前の訳語の品詞とが異 なるときに、 該音声認識手段に入力された訳語を用いて前記翻訳手段に入力さ れた原文の全体の再翻訳を行なって前記翻訳文を修正することを特徴とする請 求の範囲第 1項に記載の翻訳システム。
7 . 前記修正手段は、 前記音声認識手段から出力された訳語の品詞と、 前記 修正において該訳語へと置き換えられる対象である修正前の訳語の品詞とが一 致するときには、 前記翻訳手段によって作成された翻訳文を構成する一部の訳 語を該音声認識手段から出力された訳語に置き換える部分的な修正を行なうこ とを特徴とする請求の範囲第 6項に記載の翻訳システム。
8 . 前記修正手段によって行なわれた修正の内容から、 前記翻訳手段に入力 された原文が話題としている分野を判定する分野判定手段を更に有し、 前記翻訳手段は、 新たに入力される原文についての翻訳文を作成するときに は、 前記分野判定手段によって判定された分野で用いられる頻度の高い訳語を 優先して用いる、
ことを特徴とする請求の範囲第 1項に記載の翻訳システム。
9 . 原文で用いられる語句についての訳語が用いられる頻度の高い分野を示 す情報が登録されている訳語分野情報ファイルが格納される訳語分野情報ファ ィゾレ格納手段を更に有し、
前記分野判定手段は、 前記修正手段が前記翻訳文を修正したときに該翻訳文 に加えた訳語が用いられる頻度の高い分野を、 前記訳語分野情報ファイルに登 録されている情報に基づいて判定する、
ことを特徴とする請求の範囲第 8項に記載の翻訳システム。
1 0 . 前記修正手段によって行なわれた修正の内容から、 前記翻訳手段に入 力された原文が話題としている分野を判定する分野判定手段を更に有し、 前記訳語辞書ファイルには、 該訳語辞書ファイルに登録されている訳語が用 いられる頻度の高い分野を示す情報が更に登録されており、
前記分野判定手段は、 前記修正手段が前記翻訳文を修正したときに該翻訳文 に加えた訳語が用いられる頻度の高い分野を、 前記訳語辞書ファイルに登録さ れている情報に基づいて判定し、 前記翻訳手段は、 新たに入力される原文についての翻訳文を作成するときに は、 前記訳語辞書ファイルに登録されている訳語のうち、 入力された原文に用 いられている語句に対応するものであって且つ前記分野判定手段によって判定 された分野で用いられる頻度の高いことを示す情報が該訳語辞書ファイルに登 録されているものを優先して用いる、
ことを特徴とする請求の範囲第 2項に記載の翻訳システム。
1 1 . 入力された原文を翻訳して翻訳文を作成する翻訳手段と、
前記翻訳手段によって作成された翻訳文で用いられている訳語を他の訳語へ と置き換える修正を行なうときの該他の訳語が入力される訳語入力手段と、 前記訳語入力手段に入力された前記他の訳語の品詞と、 前記修正において該 訳語へと置き換えられる対象である修正前の訳語の品詞とが異なるときに、 該 訳語入力手段に入力された該他の訳語を用いて前記原文の全体の再翻訳を行な つて前記翻訳文を修正する修正手段と、
を有することを特徴とする翻訳システム。
1 2 . 前記修正手段は、 前記訳語入力手段に入力された前記他の訳語の品詞 と、 前記修正において該他の訳語へと置き換えられる対象である修正前の訳語 の品詞とがー致するときには前記翻訳手段によつて作成された翻訳文を構成す る一部の訳語を該訳語入力手段に入力された該他の訳語に置き換える部分的な 修正を行なうことを特徴とする 請求の範囲第 1 1項に記載の翻訳システム。
1 3 . 文書を翻訳するシステムであって、
前記文書を構成する原文を翻訳して翻訳文を作成する翻訳手段と、 前記翻訳手段によって作成された翻訳文の修正を行なう修正手段と、 前記修正手段によって行なわれた修正の内容から、 前記原文が話題としてい る分野を判定する分野判定手段と、
を有し、 前記翻訳手段は、 前記文書を構成する未翻訳の原文を翻訳するときに、 前記 分野判定手段によって判定された分野で用いられる頻度の高い訳語を優先して 使用する、
ことを特徴とする翻訳システム。
1 4 . 原文で用いられる語句についての訳語が用いられる頻度の高い分野を 示す情報が登録されている訳語分野情報フアイルが格納される訳語分野情報フ アイル格納手段を更に有し、
前記分野判定手段は、 前記修正手段が前記翻訳文を修正したときに該翻訳文 に加えた訳語が用いられる頻度の高い分野を、 前記訳語分野情報ファイルに登 録されている情報に基づいて判定する、
ことを特徴とする請求の範囲第 1 3項に記載の翻訳システム。
1 5 . 原文で用いられる語句と該語句についての訳語とが対応付けられて登 録されており、 更に該訳語が用いられる頻度の高い分野を示す情報が登録され ている訳語辞書ファイルが格納される訳語辞書フアイル格納手段を更に有し、 前記翻訳手段は、 前記訳語辞書ファイルに登録されている訳語のうち、 入力 された原文に用いられている語句に対応するものであって且つ前記分野判定手 段によって判定された分野で用いられる頻度の高いことを示す情報が該訳語辞 書ファイルに登録されているものを用いて前記文書を構成する未翻訳の原文の 翻訳を行なう、
ことを特徴とする請求の範囲第 1 3項に記載の翻訳システム。
1 6 . 原文を翻訳して翻訳文を作成する作業を支援する方法であって、 入力された原文を構成している各語句に対応する複数の訳語の中から各々ひ とつずつ訳語を選択して該選択された訳語を組み合わせることによつて該原文 についての翻訳文を作成して機械翻訳の結果とし、
入力された音声に対応する語を、 前記語句に対応する訳語であって前記選択 によっては選択されなかつた該訳語から選択して該選択された訳語を該音声の 認識の結果とし、
前記機械翻訳の結果として作成された翻訳文を、 前記音声の認識の結果であ る訳語を用いて修正する、
ことを特徴とする翻訳支援方法。
1 7 . 入力された原文を翻訳して翻訳文を作成し、
作成された翻訳文で用いられている訳語を他の訳語へと変更する修正を行な うために入力される該他の訳語の品詞と、 該他の訳語に置き換えられる対象で ある修正前の訳語の品詞とが異なるかどうかを判定し、
両訳語の品詞が異なると判定されたときに、 前記入力された訳語を用いて前 記原文の全体の再翻訳を行なって前記翻訳文の修正を行なう、
ことを特徴とする翻訳支援方法。
1 8 . 文書を翻訳する作業を支援する方法であって、
過去に作成された前記文書を構成する原文についての翻訳文に対して施され た修正の内容から、 該原文が話題としている分野を判定し、
前記文書を構成する未翻訳の原文について機械翻訳を行なわせるときに、 前 記分野で用いられる頻度の高い訳語を優先して使用させて該原文の翻訳文を作 成させる、
ことを特徴とする翻訳支援方法。
1 9 . 原文を翻訳して翻訳文を作成する処理をコンピュータに行なわせるた めのプログラムであって、
入力された原文を構成している各語句に対応する複数の訳語から各々ひとつ ずつ訳語を選択し、 該選択された訳語を組み合わせることによって該原文につ いての翻訳文を作成する翻訳処理と、
入力された音声に対応する語を、 前記語句に対応する訳語であって前記翻訳 処理の実行によって選択されなかった該訳語から選択し、 該選択された訳語を 該音声の認識の結果として出力する音声認識処理と、
前記翻訳処理の実行により作成された翻訳文を、 前記音声認識手段から出力 された訳語を用いて修正する修正処理と、
を該コンピュータに行なわせるためのプログラム。
2 0 . 入力された原文を翻訳させて翻訳文を作成する翻訳処理と、
前記翻訳処理の実行によって作成された翻訳文で用いられている訳語を他の 訳語へと置き換える修正を行なうときの該他の訳語を取得する訳語取得処理と 前記訳語取得処理の実行によって取得された前記他の訳語の品詞と、 前記修 正において該訳語へと置き換えられる対象である修正前の訳語の品詞とが異な るときに、 前記訳語取得処理の実行によって取得された該他の訳語を用いて前 記原文の全体の再翻訳を行なって前記翻訳文の修正を行なう修正処理と、 をコンピュータに行なわせるためのプログラム。
2 1 . 文書を翻訳する作業の支援をコンピュータに行なわせるためのプログ ラムであって、
過去に作成された前記文書を構成する原文についての翻訳文に対して施され た修正の内容から、 該原文が話題としている分野を判定する判定処理と、 前記文書を構成する未翻訳の原文についての翻訳文を、 前記分野で用いられ る頻度の高い訳語を優先して使用して作成する翻訳処理と、
を該コンピュータに行なわせるためのプログラム。
PCT/JP2001/008814 2001-10-05 2001-10-05 Translation system Ceased WO2003032191A1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2003535088A JP3879929B2 (ja) 2001-10-05 2001-10-05 翻訳システム
PCT/JP2001/008814 WO2003032191A1 (en) 2001-10-05 2001-10-05 Translation system
US10/813,135 US20040186732A1 (en) 2001-10-05 2004-03-31 Translation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2001/008814 WO2003032191A1 (en) 2001-10-05 2001-10-05 Translation system

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US10/813,135 Continuation US20040186732A1 (en) 2001-10-05 2004-03-31 Translation system

Publications (1)

Publication Number Publication Date
WO2003032191A1 true WO2003032191A1 (en) 2003-04-17

Family

ID=11737814

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2001/008814 Ceased WO2003032191A1 (en) 2001-10-05 2001-10-05 Translation system

Country Status (3)

Country Link
US (1) US20040186732A1 (ja)
JP (1) JP3879929B2 (ja)
WO (1) WO2003032191A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4058057B2 (ja) * 2005-04-26 2008-03-05 株式会社東芝 日中機械翻訳装置、日中機械翻訳方法および日中機械翻訳プログラム
US8498857B2 (en) * 2009-05-19 2013-07-30 Tata Consultancy Services Limited System and method for rapid prototyping of existing speech recognition solutions in different languages
TWI383376B (zh) * 2009-08-14 2013-01-21 Kuo Ping Yang 語音溝通方法及應用該方法之系統
TW201217997A (en) * 2010-10-28 2012-05-01 Inventec Corp Input correction system based on translation searching and method thereof
US10068569B2 (en) * 2012-06-29 2018-09-04 Rosetta Stone Ltd. Generating acoustic models of alternative pronunciations for utterances spoken by a language learner in a non-native language
US10296968B2 (en) 2012-12-07 2019-05-21 United Parcel Service Of America, Inc. Website augmentation including conversion of regional content
US9965466B2 (en) * 2014-07-16 2018-05-08 United Parcel Service Of America, Inc. Language content translation
JP6744025B2 (ja) * 2016-06-21 2020-08-19 日本電気株式会社 作業支援システム、管理サーバ、携帯端末、作業支援方法およびプログラム
KR101861006B1 (ko) * 2016-08-18 2018-05-28 주식회사 하이퍼커넥트 통역 장치 및 방법
IL252071A0 (en) * 2017-05-03 2017-07-31 Google Inc Contextual language translation
US20240185856A1 (en) * 2021-09-03 2024-06-06 Apple Inc. Gaze based dictation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10269220A (ja) * 1997-03-25 1998-10-09 Toshiba Corp 辞書管理方法および辞書管理システムおよび翻訳方法および翻訳システム
JP2001100973A (ja) * 1999-10-01 2001-04-13 Nec Software Kobe Ltd コンピュータディクテーション方法及びコンピュータディクテーション装置及びコンピュータディクテーションプログラムを格納した記録媒体

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6067520A (en) * 1995-12-29 2000-05-23 Lee And Li System and method of recognizing continuous mandarin speech utilizing chinese hidden markou models
JPH10198680A (ja) * 1997-01-07 1998-07-31 Hitachi Ltd 分散辞書管理方法及びそれを用いた機械翻訳方法
JP3822990B2 (ja) * 1999-01-07 2006-09-20 株式会社日立製作所 翻訳装置、記録媒体
JP2001100781A (ja) * 1999-09-30 2001-04-13 Sony Corp 音声処理装置および音声処理方法、並びに記録媒体
US20020156816A1 (en) * 2001-02-13 2002-10-24 Mark Kantrowitz Method and apparatus for learning from user self-corrections, revisions and modifications

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10269220A (ja) * 1997-03-25 1998-10-09 Toshiba Corp 辞書管理方法および辞書管理システムおよび翻訳方法および翻訳システム
JP2001100973A (ja) * 1999-10-01 2001-04-13 Nec Software Kobe Ltd コンピュータディクテーション方法及びコンピュータディクテーション装置及びコンピュータディクテーションプログラムを格納した記録媒体

Also Published As

Publication number Publication date
JPWO2003032191A1 (ja) 2005-01-27
US20040186732A1 (en) 2004-09-23
JP3879929B2 (ja) 2007-02-14

Similar Documents

Publication Publication Date Title
US7904291B2 (en) Communication support apparatus and computer program product for supporting communication by performing translation between languages
US11734514B1 (en) Automated translation of subject matter specific documents
US20070198245A1 (en) Apparatus, method, and computer program product for supporting in communication through translation between different languages
EP1422692A2 (en) Automatic insertion of non-verbalized punctuation in speech recognition
US20080208597A1 (en) Apparatus, method, and computer program product for processing input speech
WO2010046782A2 (en) Hybrid machine translation
JP2008108274A (ja) コーパスの中のテキストを構文解析するコンピュータ・プログラムおよび記録媒体
US7328404B2 (en) Method for predicting the readings of japanese ideographs
WO2003032191A1 (en) Translation system
CN116806338A (zh) 确定和利用辅助语言熟练度量度
JP2010079647A (ja) 音声翻訳装置、方法、およびプログラム
US20120029903A1 (en) Method and apparatus for enhancing interactive translation and dialogue systems
JP3961010B2 (ja) 翻訳システム
JP2000259635A (ja) 翻訳装置及び翻訳方法並びに翻訳プログラムを記録した記録媒体
JP3961009B2 (ja) 翻訳システム
JP5185343B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JPWO2009038209A1 (ja) 機械翻訳システム、機械翻訳方法及び機械翻訳プログラム
JP3737817B2 (ja) 表現変換方法及び表現変換装置
JP7479249B2 (ja) 未知語検出方法及び未知語検出装置
US12118304B2 (en) Difference extraction device, method and program
JP2001092821A (ja) 文章校正装置及び文章校正処理プログラムを記録したコンピュータ読取可能な記録媒体
Volkov et al. Automated Transcription of Unfamiliar Words to Improve Recognition of Terms in the Subject Domain
Waxman et al. Speech Recognition for Composite Languages with Low-Density Components
CN120431918A (zh) 一种混合语种的离线语音识别方法及系统
WO2021205832A1 (ja) 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): JP

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2003535088

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 10813135

Country of ref document: US