[go: up one dir, main page]

KR19980031976A - English Long Segmentation Method for English-Korean Machine Translation System - Google Patents

English Long Segmentation Method for English-Korean Machine Translation System Download PDF

Info

Publication number
KR19980031976A
KR19980031976A KR1019960051848A KR19960051848A KR19980031976A KR 19980031976 A KR19980031976 A KR 19980031976A KR 1019960051848 A KR1019960051848 A KR 1019960051848A KR 19960051848 A KR19960051848 A KR 19960051848A KR 19980031976 A KR19980031976 A KR 19980031976A
Authority
KR
South Korea
Prior art keywords
sentence
english
split point
split
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
KR1019960051848A
Other languages
Korean (ko)
Inventor
오기은
권철중
김정수
Original Assignee
김광호
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김광호, 삼성전자 주식회사 filed Critical 김광호
Priority to KR1019960051848A priority Critical patent/KR19980031976A/en
Publication of KR19980031976A publication Critical patent/KR19980031976A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

영한 기계 번역 시스템의 성공률 및 번역 속도를 향상시키기 위한 영어 장문 분할 방법에 관한 것이다. 본 발명에 따른 영한 기계 번역 시스템을 위한 영어 장문 분할 방법은 입력 문장으로부터 등위 접속사, 종속 접속사, 관계 대명사, 구두점 등의 가능한 분할점 후보들을 추출하는 분할점 추출 과정; 분할점 후보와 후보 사이를 문장 세그먼트로 분할하는 과정; 분할된 문장 세그먼트의 문장 종류를 결정하는 과정; 미리 수집된 대량의 문장들로부터 각 분할점 후보가 실제 문장 분할점이 되기 위해 좌우에 가져야 하는 문장 종류 및 품사, 단어 등을 기 정의된 표기법을 사용하여 기술한 패턴들의 집합인 분할 패턴 데이터 베이스를 로딩하고, 입력 분장이 가지는 각 분할점 후보의 분할 패턴을 분할 패턴 데이터 베이스로부터 추출하여 패턴 매칭을 시도하고 매칭 성공 여부에 따라 문장 분할점으로의 결정 여부를 판단하는 과정;및 상기 패턴 매칭 과정이 성공할 경우 분할점 후보를 분할점으로 결정하고, 분할점 전후의 문장 세그먼트에 매칭에 성공한 패턴에 명시된 대치어들을 삽입하여 분할된 불완전한 문장을 완전한 문장으로 복원하는 과정을 포함함을 특징으로 한다. 본 발명에 따른 영어 장문 분할 방법은 영어 장문을 영한 기계 번역 시스템이 성공적으로 번역할 수 있는 단문들로 분할하여 줌으로써 번역 시스템의 번역 성공률 및 번역률을 제고시키는 효과를 가진다.The English long sentence segmentation method for improving the success rate and translation speed of the English-Korean machine translation system. The English long sentence segmentation method for an English-Korean machine translation system according to the present invention comprises: a split point extraction process of extracting possible split point candidates such as equivalence conjunctions, subordinate conjunctions, relative pronouns, punctuation marks, etc. from input sentences; Dividing the split point candidate and the candidate into sentence segments; Determining a sentence type of the divided sentence segment; Loads a partition pattern database, which is a set of patterns that describe sentence types, parts of speech, and words that each split point candidate should have on the left and right to become actual sentence split points, from a large amount of sentences collected in advance. And attempting pattern matching by extracting a split pattern of each split point candidate of the input makeup from a split pattern database, and determining whether to determine a sentence split point according to whether the match is successful. In this case, the method includes determining a split point candidate as a split point, and inserting replacement words specified in a pattern that successfully matches the sentence segments before and after the split point to restore the divided incomplete sentence to a complete sentence. The English long sentence segmentation method according to the present invention has the effect of improving the translation success rate and the translation rate by dividing the English long sentence into short sentences that can be successfully translated by the English-Korean machine translation system.

Description

영한 기계 번역 시스템을 위한 영어 장문 분할 방법English Long Segmentation Method for English-Korean Machine Translation System

본 발명은 영한 기계 번역 시스템에 관한 것으로서 더욱 상세하게는 번역 시스템번역 성공률 향상 및 번역 속도를 빠르게 하기 위한 영어 장문 분할 방법에 관한 것이다.The present invention relates to an English-Korean machine translation system, and more particularly, to an English long sentence segmentation method for improving translation system success rate and speeding up translation speed.

일반적인 변환(transfer) 방식의 영한 기계 번역 시스템은 해석, 변환, 생성의 3단계로 구성된다. 해석 단계는 영어 형태소 분석, 구문 분석, 의미 분석 과정을 포함하고, 생성 단계는 한국어 구문 생성, 한국어 형태소 생성 과정을 포함한다.The English-Korean machine translation system of the general transfer method consists of three stages of interpretation, transformation and generation. The interpretation step includes English morpheme analysis, syntax analysis, and semantic analysis process, and the generation step includes Korean phrase generation and Korean morpheme generation process.

이러한 기계 번역 시스템의 성능 즉, 번역 성공률 및 번역 속도 등은 영어 문장이 길어지게 되는 경우에는 매우 낮아지게 된다. 영어 장문은 번역 과정의 복잡성을 증가시켜 번역이 실패하거나 잘못된 번역 결과를 낳게 한다. 구체적으로는 해석 단계에서의 영어 장문에 대한 구문 분석 실패 및 오류가 번역 실패 및 잘못된 번역을 야기하게 된다.The performance of the machine translation system, that is, the translation success rate and the translation speed, becomes very low when the English sentence becomes longer. English long texts increase the complexity of the translation process, causing translations to fail or produce incorrect translations. Specifically, parsing failures and errors for English texts in the interpretation phase cause translation failures and incorrect translations.

이러한 문제점을 해결하기 위해서는 영어 장문을 단문으로 분할하는 것이 필요하다.In order to solve this problem, it is necessary to divide the English text into short sentences.

본 발명은 상기의 요구에 부응하기 위하여 안출된 것으로서 영한 기계 번역 시스템의 성능 향상을 위해 영어 장문을 성공적으로 번역 가능한 단문으로 분할하는 방법을 제공하는 것을 그 목적으로 한다.An object of the present invention is to provide a method for dividing an English long sentence into a short sentence that can be successfully translated to improve the performance of the English-Korean machine translation system.

도 1은 본 발명에 따른 영어 장문 분할 방법을 적용한 영한 기계 번역 시스템의 동작 과정을 흐름도이다.1 is a flowchart illustrating an operation process of an English-Korean machine translation system to which the English long sentence segmentation method according to the present invention is applied.

도 2는 도 1에 도시된 문장 분할 과정에서의 문장 분할 방법을 상세히 설명하는 흐름도이다.FIG. 2 is a flowchart illustrating a sentence division method in the sentence division process illustrated in FIG. 1.

도 3은 문장 분할의 예를 보이는 것이다.3 shows an example of sentence division.

도 4는 문장 종류 구분을 위한 유한 상태 오토마타의 일 예를 보이는 것이다.4 shows an example of a finite state automata for sentence type classification.

상기의 목적을 달성하는 본 발명에 따른 영한 기계 번역 시스템의 영어 장문 분할 방법은 영한 기계 번역 시스템의 영어 장문 분할 방법은 입력 문장으로부터 등위 접속사, 종속 접속사, 관계 대명사, 구두점 등의 가능한 분할점 후보들을 추출하는 분할점 추출 과정; 분할점 후보와 후보 사이를 문장 세그먼트로 분할하는 과정; 분할된 문장 세그먼트의 문장 종류를 결정하는 과정; 미리 수집된 대량의 문장들로부터 각 분할점 후보가 실제 문장 분할점이 되기 위해 좌우에 가져야 하는 문장 종류 및 품사, 단어 등을 기 정의된 표기법을 사용하여 기술한 패턴들의 집합인 분할 패턴 데이터 베이스를 로딩하고, 입력 분장이 가지는 각 분할점 후보의 분할 패턴을 분할 패턴 데이터 베이스로부터 추출하여 패턴 매칭을 시도하고 매칭 성공 여부에 따라 문장 분할점으로의 결정 여부를 판단하는 과정; 및 상기 패턴 매칭 과정이 성공할 경우 분할점 후보를 분할점으로 결정하고, 분할점 전후의 문장 세그먼트에 매칭에 성공한 패턴에 명시된 대치어들을 삽입하여 분할된 불완전한 문장을 완전한 문장으로 복원하는 과정을 포함함을 특징으로 한다. 이하 첨부된 도면을 참조하여 본 발명을 상세히 설명한다.The English long sentence segmentation method of the English-Korean machine translation system according to the present invention achieves the above object. A split point extraction process for extracting; Dividing the split point candidate and the candidate into sentence segments; Determining a sentence type of the divided sentence segment; Loads a partition pattern database, which is a set of patterns that describe sentence types, parts of speech, and words that each split point candidate should have on the left and right to become actual sentence split points, from a large amount of sentences collected in advance. Extracting a split pattern of each split point candidate of the input makeup from a split pattern database, attempting pattern matching, and determining whether to determine a sentence split point according to whether the matching is successful; And when the pattern matching process is successful, determining a split point candidate as a split point, and inserting replacement words specified in a pattern that successfully matches the sentence segment before and after the split point, and restoring the partitioned incomplete sentence into a complete sentence. It is characterized by. Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명에 따른 영어 장문 분할 방법을 적용한 시스템의 동작 과정을 보이는 흐름도이다.1 is a flowchart illustrating an operation process of a system to which an English palmprint splitting method according to the present invention is applied.

먼저 102단계에서는 입력된 영어 문장(S)에 대하여 형태소 해석을 수행하여 적당한 품사열을 결정한다.First, in step 102, a proper part-of-speech sequence is determined by performing a morpheme analysis on the input English sentence S.

104단계에서는 본 발명에 따른 장문 분할 방법으로 형태소 해석 과정(102단계)의 결과인 품사열에 대해 문장 분할을 수행한다. 예를 들면, 입력된 영어 문장(S)은 분할문S1,S2,S3,,,으로 분할된다.In step 104, the sentence division is performed on the part-of-speech sequence that is the result of the morpheme analysis process (step 102) by the long sentence segmentation method according to the present invention. For example, the input English sentence S is divided into split statements S1, S2, S3, ....

106단계에서는 분할문S1,S2,S3,,, 각각에 대해 구문에 합당한 가를 검사하며, 합당한 경우 그 분석 구조를 보여 주는 파싱 트리(parsing tree)를 만들어 준다.Step 106 checks whether the statements S1, S2, S3,, and the like are valid, and creates a parsing tree showing the analysis structure if appropriate.

108단계에서는 영어 구문 분석의 결과인 파싱 트리가 갖는 의미를 분석하여 준다. 이를 위하여 의미 분석 단계에서는 파싱 트리의 각 노드를 찾아다니면서 분기된 형태 및 내용에 따라 그에 상응하는 약속된 의미를 부여하게 된다.Step 108 analyzes the meaning of the parse tree, which is the result of English parsing. For this purpose, the semantic analysis step searches each node of the parsing tree and assigns the corresponding semantic meanings according to the branched form and contents.

110단계에서는 영어와 한국어 사이의 어휘적 차이 및 구조적 차이를 해소하기 위한 변환 규칙을 적용하여 중간적인 표현으로의 변환을 수행한다.In step 110, the conversion to the intermediate expression is performed by applying a conversion rule for resolving lexical and structural differences between English and Korean.

112단계에서는 생성 과정(110단계)의 결과인 중간 표현으로부터 한국어 구문을 생성한다.In step 112, a Korean phrase is generated from an intermediate expression that is a result of the generation process (step 110).

114단계에서는 구문 생성 과정(112단계)의 결과에 대해 형태소를 생성하여 분할문 S1,S2,S3,,,에 대한 최종 번역문 K1,K2,K3,,,를 출력한다.In step 114, a morpheme is generated on the result of the syntax generation process (step 112), and the final translations K1, K2, K3 ,, for the sentence S1, S2, S3 ,, are output.

도 2는 104단계에서의 문장 분할 방법을 상세히 설명하는 흐름도이다.2 is a flowchart illustrating a sentence division method in step 104.

202단계에서는 입력 문장 S를 처음부터 끝까지 읽으면서 가능한 분할점 후보들을 모두 추출한다. 여기서, 사용된 분할점 후보들은 다음과 같다.In step 202, all possible split point candidates are extracted while reading the input sentence S from the beginning to the end. Here, the split point candidates used are as follows.

-등위접속사:and, but, for,,,-Nominated conjunctions: and, but, for ,,,

-부사절을 이끄는 종속접속사:when, before, after, because, since, as, if, unless, though,,,Dependent conjunctions that lead to adverb clauses: before, after, after, because, since, as, if, unless, though ,,,

-관계 대명사:who, which, that, what, whose, whom,,,-Relative pronouns: who, which, that, what, whose, whom ,,,

-comma, 인용부호,,,-comma, quotation marks ,,,

204단계는 분할점 후보와 후보 사이를 분할한다. 각각의 분할된 구간을 문장 세그먼트라 한다. 도 3은 문장 분할의 예를 보이는 것이다. 예를 들면 분할점 후보들인 BP3와 BP4 사이에 문장 세그먼트 SEG3이 정의됨을 알 수 있다.Step 204 divides the split point candidate and the candidate. Each divided section is called a sentence segment. 3 shows an example of sentence division. For example, it can be seen that the sentence segment SEG3 is defined between the split point candidates BP3 and BP4.

206단계는 각각의 문장 세그먼트에 대해 유한 상태 오토마타(finite state automata)를 이용하여 문장 종류를 결정한다. 도 4는 종장 종류 구분을 위한 유한 상태 오토마타의 일 예를 보이는 것이다. 도 4에 있어서 NP_cat, VP_cat, PP_cat는 각각 명사구, 동사구, 전치사구에 속하는 품사들의 집합이다.In step 206, a sentence type is determined using a finite state automata for each sentence segment. Figure 4 shows an example of a finite state automata for different types of length. In FIG. 4, NP_cat, VP_cat, and PP_cat are sets of parts of speech belonging to noun phrases, verb phrases, and prepositional phrases, respectively.

208단계는 입력 문장의 각 분할점 후보에 대해 분할 패턴 데이터 베이스를 탐색하고 패턴 매칭을 수행하여 문장 분할 여부를 결정한다. 구체적으로는 미리 샘플링된 문장들 및 이에 해당하는 번역 예문을 참조하여 분할점 전후에 나타나는 문장 종류와 유사한 문장을 탐색하고, 유사한 문장이 있을 경우 탐색된 문장에 대한 번역 예문을 참조하여 분할점 전후에 삽입될 문자열(대치어)을 획득하는 과정이다.In step 208, the partition pattern database is searched for each split point candidate of the input sentence, and pattern matching is performed to determine whether to split the sentence. Specifically, a sentence similar to a sentence type appearing before and after a split point is searched by referring to pre-sampled sentences and a translation example corresponding thereto, and when there is a similar sentence, the sentence is searched before and after the split point by referring to a translation example of the searched sentence. This is the process of obtaining a string to be inserted.

다음은 208단계에서 사용하는 데이터 베이스를 구성하는 분할 후보점들의 분할 패턴을 기술하기 위해 사용한 표기법을 설명한 것이다. 먼저, 대상이 되는 분할점 후보를 명시하고 left에는 분할점 왼쪽에 나타날 수 있는 단어, 문장 종류 및 품사를 기술하고, right에는 분할점 오른쪽에 나타날 수 있는 단어, 문장 종류 및 품사를 기술한다. left 대치어는 패턴 매칭에 성공한 경우 분할점 앞의 문장 세그먼트 끝에 삽입될 대치어를 기술하고, right 대치어는 분할점 뒤의 문장 세그먼트 앞에 삽입할 대치어를 기술한다.The following describes the notation used to describe the partition pattern of the partition candidate points constituting the database used in step 208. First, the target split point candidate is specified, and on the left, the word, sentence type, and part of speech that may appear on the left of the split point are described, and on the right, the word, sentence type, and part of speech that may appear on the right of the split point are described. The left substitution describes the substitution to be inserted at the end of the sentence segment before the split point when the pattern matching succeeds, and the right substitution describes the substitution to be inserted before the sentence segment after the split point.

-분할점 후보의 분할 패턴 표기법Split Pattern Notation for Split-Point Candidates

{분할점 후보 leftrightleft대치어right대치어}{Split point candidate leftrightleft replace right replace}

-leftright표기법-leftright notation

no mark word: 단어no mark word: words

%문장종류:(wf,ws)[cat_wf,cat_ws]% SentenceType: (w f , w s ) [cat_w f , cat_w s ]

@품사종류:(feature value,,,/feature value)Part of article: (feature value ,,, / feature value)

wf: 문장 세그먼트의 처음 단어w f : First word of sentence segment

ws: 문장 세그먼트의 마지막 단어w s : last word of sentence segment

cat_wf:wf의 품사cat_w f : part of w f

cat_ws:ws의 품사cat_w s : part of w s

문장 종류:S, NP, VP, VP_ing, VP_ed, PPSentence type: S, NP, VP, VP_ing, VP_ed, PP

품사 종류:ADJ(형용사), ADV(부사), DET(한정사), NOUN(명사), PREP(전치사), PRON(대명사), AUXI(조동사), VERB(동사), CONJ(접속사), PUNCT(분리기호)Part of speech: ADJ (adjective), ADV (adverb), DET (definitive), NOUN (noun), PREP (preposition), PRON (pronoun), AUXI (verb), VERB (verb), CONJ (adverb), PUNCT ( Separator)

-left대치어right대치어표기법left-right replacement

NO_MARKNO_MARK

IS(가주어), IS+동사,IS (provisional), IS + verb,

IO(가목적어)IO (target term)

-분할 패턴 데이터 베이스에 있는 분할점 후보의 패턴과 그 적용 예Patterns of Split Point Candidates in a Split Pattern Database and Their Applications

(1) 접속사 and의 예; {and %S @VERB:(FORM pres ed) IS}(1) an example of the conjunction and; {and% S @VERB: (FORM pres ed) IS}

입력된 문장;I was a student and studied hard.I typed a sentence; I was a student and studied hard.

SEG1=S ^ SEG2=VPSEG1 = S ^ SEG2 = VP

분할된 문장;I was a student. IS studied hard.Split sentence; I was a student. IS studied hard.

설명; 분할점 후보 and는 왼쪽 문장 세그먼트를 S로 가지고, 분할점 후보 바로 다음 단어의 품사가 동사(이때 FORM이라는 자질은 pres나 ed라는 값을 가져야 한다)일 경우 분할점이 된다. 이때 왼쪽 문장 세그먼트에 대한 대치어는 없고, 오른쪽 문장 세그먼트 앞에 IS라는 가주어를 삽입한다.Explanation; The split point candidate and has the left sentence segment as S, and is a split point when the part of the word immediately after the split point candidate is a verb (the FORM feature must have a value of pres or ed). At this time, there is no substitute for the left sentence segment, and the word IS is inserted before the right sentence segment.

(2) commaa의 분할 패턴 예; {comma including IS is}(2) an example of the split pattern of commaa; {comma including IS is}

입력된 문장; Republicans would limit the right, including food stamps and Medicaid.Input sentences; Republicans would limit the right, including food stamps and Medicaid.

SEG1=S ^ SEG2=VP_ingSEG1 = S ^ SEG2 = VP_ing

분할된 문장; Republicans would limit the right IS is food stamps and Medicaid.Segmented sentences; Republicans would limit the right IS is food stamps and Medicaid.

설명; 분할점 후보 comma는 왼쪽 문장 세그먼트에 어떤 것이 오든지 상관없이 분할점 후보 바로 다음 단어가 including일 경우 분할점이 된다. 이때 오른쪽 문장 세그먼트의 앞에 가주어 IS와 동사 is를 삽입한다.Explanation; The split point candidate comma becomes the split point when the word immediately after the split point candidate is including, regardless of what comes to the left sentence segment. Insert IS and the verb is in front of the right sentence segment.

210단계는 208단계에서 수행한 패턴 매칭이 성공할 경우 분할점 후보를 분할점으로 결정하고, 분할점 전후의 문장 세그먼트에 성공한 패턴에 명시된 left 대치어와 right 대치어를 삽입하여 완전한 분할문으로 복원한다.In step 210, if the pattern matching performed in step 208 succeeds, the split point candidate is determined as the split point, and the left and right substitute words specified in the successful pattern are inserted into the sentence segment before and after the split point, and then restored to a complete split statement.

상술한 바와 같이 본 발명에 따른 장문 분할 방법은 영어 장문을 기계 번역 시스템이 성공적으로 번역할 수 있는 단문들로 분할하여 줌으로써 번역 시스템의 번역 성공률 및 번역률을 제고시키는 효과를 가진다.As described above, the long text segmentation method according to the present invention has the effect of improving the translation success rate and the translation rate by dividing the English long text into short sentences that the machine translation system can successfully translate.

또한, 원문의 분할문을 번역함으로써 부분적으로 잘못된 문법을 사용하는 문장에 대해서도 견고한 구문 분석 및 번역이 가능하다는 이점도 있다.In addition, by translating the fragments of the original text, there is an advantage that it is possible to perform a robust parsing and translation even for a sentence that uses a partly wrong grammar.

Claims (1)

영한 기계 번역 시스템을 위한 영어 장문 분할 방법에 있어서,In English long sentence segmentation method for English-Korean machine translation system, 영한 기계 번역 시스템의 영어 장문 분할 방법은The English long sentence segmentation method of the English-Korean machine translation system 영한 기계 번역 시스템의 영어 장문 분할 방법은 입력 문장으로부터 등위 접속사, 종속 접속사, 관계 대명사, 구두점 등의 가능한 분할점 후보들을 추출하는 분할점 추출 과정;The English long sentence segmentation method of the English-Korean machine translation system includes a segmentation point extraction process of extracting possible segmentation point candidates such as equalized conjunctions, dependent conjunctions, relative pronouns, punctuation marks, etc. from input sentences; 분할점 후보와 후보 사이를 문장 세그먼트로 분할하는 과정; 분할된 문장 세그먼트의 문장 종류를 결정하는 과정;Dividing the split point candidate and the candidate into sentence segments; Determining a sentence type of the divided sentence segment; 미리 수집된 대량의 문장들로부터 각 분할점 후보가 실제 문장 분할점이 되기 위해 좌우에 가져야 하는 문장 종류 및 품사, 단어 등을 기 정의된 표기법을 사용하여 기술한 패턴들의 집합인 분할 패턴 데이터 베이스를 로딩하고, 입력 분장이 가지는 각 분할점 후보의 분할 패턴을 분할 패턴 데이터 베이스로부터 추출하여 패턴 매칭을 시도하고 매칭 성공 여부에 따라 문장 분할점으로의 결정 여부를 판단하는 과정;및Loads a partition pattern database, which is a set of patterns that describe sentence types, parts of speech, and words that each split point candidate should have on the left and right to become actual sentence split points, from a large amount of sentences collected in advance. And attempting pattern matching by extracting a split pattern of each split point candidate of the input makeup from a split pattern database and determining whether to determine a sentence split point according to whether the matching is successful; and 상기 패턴 매칭 과정이 성공할 경우 분할점 후보를 분할점으로 결정하고, 분할점 전후의 문장 세그먼트에 매칭에 성공한 패턴에 명시된 대치어들을 삽입하여 분할된 불완전한 문장을 완전한 문장으로 복원하는 과정을 포함하는 영어 장문의 분할 방법.If the pattern matching process is successful, the method includes determining a split point candidate as a split point, and inserting replacement words specified in a pattern that successfully matches the sentence segment before and after the split point to restore the incomplete fragmented sentence into a complete sentence. Long way of dividing.
KR1019960051848A 1996-10-31 1996-10-31 English Long Segmentation Method for English-Korean Machine Translation System Withdrawn KR19980031976A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960051848A KR19980031976A (en) 1996-10-31 1996-10-31 English Long Segmentation Method for English-Korean Machine Translation System

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960051848A KR19980031976A (en) 1996-10-31 1996-10-31 English Long Segmentation Method for English-Korean Machine Translation System

Publications (1)

Publication Number Publication Date
KR19980031976A true KR19980031976A (en) 1998-07-25

Family

ID=66519396

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960051848A Withdrawn KR19980031976A (en) 1996-10-31 1996-10-31 English Long Segmentation Method for English-Korean Machine Translation System

Country Status (1)

Country Link
KR (1) KR19980031976A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100398344B1 (en) * 2000-05-13 2003-09-19 주식회사 전유시스템 Sequential Interpreting Type English-Korean Translation System By Means Of Parsing Expression
KR100399582B1 (en) * 1999-09-10 2003-09-26 한국전자통신연구원 Korean Syntactic Analyzer
KR100420474B1 (en) * 2000-12-27 2004-03-02 한국전자통신연구원 Apparatus and method of long sentence translation using partial sentence frame
KR100422809B1 (en) * 2000-12-27 2004-03-12 한국전자통신연구원 Long sentence partition method for machine translation
KR100805190B1 (en) * 2006-09-07 2008-02-21 한국전자통신연구원 English sentence separation device and method
KR101449898B1 (en) * 2014-02-12 2014-10-13 문성원 An audio file generating method for english listening education

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100399582B1 (en) * 1999-09-10 2003-09-26 한국전자통신연구원 Korean Syntactic Analyzer
KR100398344B1 (en) * 2000-05-13 2003-09-19 주식회사 전유시스템 Sequential Interpreting Type English-Korean Translation System By Means Of Parsing Expression
KR100420474B1 (en) * 2000-12-27 2004-03-02 한국전자통신연구원 Apparatus and method of long sentence translation using partial sentence frame
KR100422809B1 (en) * 2000-12-27 2004-03-12 한국전자통신연구원 Long sentence partition method for machine translation
KR100805190B1 (en) * 2006-09-07 2008-02-21 한국전자통신연구원 English sentence separation device and method
KR101449898B1 (en) * 2014-02-12 2014-10-13 문성원 An audio file generating method for english listening education

Similar Documents

Publication Publication Date Title
JP3971373B2 (en) Hybrid automatic translation system that mixes rule-based method and translation pattern method
Oflazer Error-tolerant finite state recognition with applications to morphological analysis and spelling correction
Chiang et al. Parsing arabic dialects
US8121829B2 (en) Method and apparatus for constructing translation knowledge
Xu et al. Do we need Chinese word segmentation for statistical machine translation?
KR100413784B1 (en) Device for translating english-korean having clause unit separator and method for the same
Tennage et al. Transliteration and byte pair encoding to improve tamil to sinhala neural machine translation
KR19980031976A (en) English Long Segmentation Method for English-Korean Machine Translation System
Sheremetyeva On extracting multiword NP terminology for MT
Hasan et al. Reranking translation hypotheses using structural properties
Hanneman et al. Automatic category label coarsening for syntax-based machine translation
Alshawi et al. Learning phrase-based head transduction models for translation of spoken utterances.
Shirai et al. Automatic rewriting method for internal expressions in Japanese to English MT and its effects
Doermann et al. Translation lexicon acquisition from bilingual dictionaries
KR100420474B1 (en) Apparatus and method of long sentence translation using partial sentence frame
Kempen et al. Author environments: Fifth generation text processors
KR100204068B1 (en) How to Automatically Correct the Syntax of Concept-Based Multilingual Translation System
Samir et al. Training and evaluation of TreeTagger on Amazigh corpus
KR100422809B1 (en) Long sentence partition method for machine translation
Choi et al. Customizing an English-Korean machine translation system for patent translation
Kirschner et al. APAC—An experiment in machine translation
Khoroshilov et al. Introduction of Phrase Structures into the Example-Based Machine Translation System
Manojkumar et al. Role of NLP in Indian regional languages
Dash Morphological processing of words in bangla corpus
Tambouratzis et al. Expanding the Language model in a low-resource hybrid MT system

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 19961031

PG1501 Laying open of application
PC1203 Withdrawal of no request for examination
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid