JP2013061371A - 発音辞書作成装置、発音辞書の生産方法、およびプログラム - Google Patents
発音辞書作成装置、発音辞書の生産方法、およびプログラム Download PDFInfo
- Publication number
- JP2013061371A JP2013061371A JP2011197883A JP2011197883A JP2013061371A JP 2013061371 A JP2013061371 A JP 2013061371A JP 2011197883 A JP2011197883 A JP 2011197883A JP 2011197883 A JP2011197883 A JP 2011197883A JP 2013061371 A JP2013061371 A JP 2013061371A
- Authority
- JP
- Japan
- Prior art keywords
- pronunciation
- information
- word
- entry
- word information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004519 manufacturing process Methods 0.000 title claims description 4
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000009825 accumulation Methods 0.000 claims description 6
- 238000000034 method Methods 0.000 description 48
- 230000008569 process Effects 0.000 description 34
- 230000008859 change Effects 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000033764 rhythmic process Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000000877 morphologic effect Effects 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 6
- 241000711981 Sais Species 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000029058 respiratory gaseous exchange Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Abstract
【解決手段】一の言語の単語情報と、当該単語情報の単語情報群内における位置示す分類フラグと、単語の発音情報とを有する1以上の発音エントリを格納し得る発音辞書と、単語情報群と発音情報群との組である情報群を1組以上格納し、1以上の単語情報群を単語に分割し、単語の位置を特定する分類フラグを決定し、単語情報に対応付ける分類部と、単語情報と分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択して、前記発音辞書に蓄積するエントリ決定部とを具備する発音辞書作成装置により、多様な発音変化、特に単語の位置に依存して生起する発音変化に対応できる発音辞書を作成できる。
【選択図】図1
Description
は後続する単語によって発音が「/han-gug/」のように変化する。一方、例文3では前後の単語の影響を受けず、発音の変化は生じない。
(1)語節内においては、前後の単語の影響で様々な発音変化が生じる。
(2)話し言葉などで語節間にポーズが生起しない場合に限り語節間の発音変化が生じる。
(3)語節間で生じる発音変化は、先行する単語の影響による重複閉鎖や後続単語によるリエゾンなどの発音変化に限られる。なお、韓国語の閉鎖音には平音・激音・濃音の3項対立があり、平音は無気音、激音は有気音、濃音は喉頭の緊張を伴う無気音である。平音が音節境界で連続した場合、内破+外破として実現され、破裂の際は喉頭の緊張を伴う濃音として実現される(/VC.C'V/)。これが表記上の重複閉鎖である。また、重複閉鎖の詳細について、論文(http://www.lang.nagoya-u.ac.jp/nichigen/issue/pdf/3/3-14.pdf#search='重複閉鎖')に説明がある。
(実施の形態1)
(具体例1)
(以下、当該語節を語節Aという。)が存在する場合、分類部13を構成する分割手段131は、語節Aを2つの単語A1と単語A2に分ける。
なお、単語A1は、
単語A2は、
である。
次に、単語位置決定手段132は、単語A1に対して、単語情報群内における位置を、「語節頭に生起する」と判断する。次に、フラグ付与手段133は、単語A1に対して、分類フラグ「L」を付与し、「単語A1_L」を得る。そして、分類部13は、語節A中の単語A1に対する発音情報を得て、当該発音情報と「単語A1_L」とを有する発音エントリを構成する。
(以下、当該語節を語節Bという。)が存在する場合、分類部13を構成する分割手段131は、当該語節Bは、2以上の単語に分割できない、と判断する。次に、単語位置決定手段132は、語節Bと一致する単語B1に対して、単語情報群内における位置を、「1単語で語節を構成している」と判断する。次に、フラグ付与手段133は、単語B1に対して、分類フラグ「S」を付与し、「単語B1_S」を得る。そして、分類部13は、語節Bの中の単語B1に対する発音情報を得て、当該発音情報と「単語B1_S」とを有する発音エントリを構成する。
を例にとり、説明する。
以下の例文1では、語節Bは1単語から構成され、単語B1は後続の単語の影響を受けず、
となる。
(例文1)
一方、以下の例文2では、語節
(語節Cという。)
は単語C1と単語C2の2単語から構成される。
なお、単語C1は、
単語C2は、
である。
そして、語節Cにおいて、単語C1は後続の単語C2の影響で、「/han-gug/」の発音となる。
(例文2)
また、以下の例文3では、語節
(語節Dという。)
は単語D1と単語D2と単語D3の3単語から構成される。
なお、単語D1は、
単語D2は、
単語D3は、
である。
そして、語節Dにおいて、単語D1は後続の単語D2の影響で、「/han-gug/」の発音となる。
(例文3)
また、以下は単語
(単語Eという)(教育)の発音変化例である。つまり、単語Eは、前後の単語の影響により「kyo-yug」「gyo-yuk」「kyo-yukh」「kyo-yun」「kkyo-yug」「kkyo-yuk」「gyo-yun」のように発音が変化することがある。
(「「単語A1_L」,「han-guk」」、「「単語A1_L」,「han-gug」」、「「単語A1_R」,「han-guk」」、「「単語A1_C」,「han-guk」」、「「単語A1_C」,「han-gug」」、「「単語A1_S」,「han-guk」」、と同意義である)を得る。
(実験)
(具体例2)
なお、同様の現象は英語においても存在し、文節や意味の切れ目で息継ぎをする場合は、その切れ目の前後では、前後の単語による音の変化は生じない。
以下の例文1を「When a family moved in」と「a different family came」の間に息継ぎを入れて発声した場合、「in」は後続の単語の影響を受けず「/in/」と発声する
(例文1)
When a family moved in, a different family came.
一方、以下の例文2において、「it was in a different way.」を、息継ぎをせず発声する場合は、「in」の音は後続の単語「a」の影響を受け「/in n/」のような発音となる。
(例文2)
If you slipped in, it was in a different way.
2 音声認識装置
11 発音辞書
12 情報群格納部
13 分類部
14 エントリ決定部
15 発音エントリ選択部
61 音響モデル
62 言語モデル
63 音声受付部
64 音声認識部
65 認識結果出力部
131 分割手段
132 単語位置決定手段
133 フラグ付与手段
141 選択条件格納手段
142 頻度算出手段
143 判断手段
144 発音エントリ蓄積手段
Claims (6)
- 一の言語の単語を示す単語情報、当該単語情報の単語情報群内における位置を特定する情報である分類フラグ、および当該単語の発音を示す発音情報を有する1以上の発音エントリを格納し得る発音辞書と、
1以上の単語情報を有する単語情報群と、前記1以上の各単語情報に対応する1以上の発音情報を有する発音情報群との組である情報群を1組以上、格納し得る情報群格納部と、
前記1組以上の情報群が有する1以上の単語情報群を、1以上の単語に分割し、単語の単語情報群内における位置を特定する分類フラグを決定し、当該分類フラグを前記単語情報に対応付ける分類部と、
前記単語情報と前記分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択して、前記発音辞書に蓄積するエントリ決定部とを具備する発音辞書作成装置。 - 前記エントリ決定部は、
前記分類フラグごとに、発音エントリを選択する条件である選択条件を格納している選択条件格納手段と、
前記単語情報と前記分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出する頻度算出手段と、
前記分類フラグに対応する選択条件を前記選択条件格納手段から取得し、前記頻度算出手段が算出した頻度が前記取得した選択条件に合致するか判断する判断手段と、
前記判断手段が選択条件に合致すると判断した発音情報を有する発音エントリを前記発音辞書に蓄積する発音エントリ蓄積手段とを具備する請求項1記載の発音辞書作成装置。 - 前記エントリ決定部が選択した1以上の発音エントリに対して、各発音エントリが有する単語情報の前記情報群格納部における出現頻度を算出し、出現頻度が所定の条件を満たすほど多い発音エントリのみを選択する発音エントリ選択部をさらに具備し、
前記エントリ決定部は、
前記発音エントリ選択部が選択した発音エントリのみを、前記発音辞書に蓄積する請求項1または請求項2記載の発音辞書作成装置。 - 前記一の言語は、韓国語であり、
前記単語情報群は、語節である請求項1から請求項3いずれか記載の発音辞書作成装置。 - 記録媒体に、
一の言語の単語を示す単語情報、当該単語情報の単語情報群内における位置を特定する情報である分類フラグ、および当該単語の発音を示す発音情報を有する1以上の発音エントリを含む発音辞書と、
1以上の単語情報を有する単語情報群と、前記1以上の各単語情報に対応する1以上の発音情報を有する発音情報群との組である情報群を1組以上、格納しており、
分類部、およびエントリ決定部により実現される発音辞書の生産方法であって、
前記分類部が、前記1組以上の情報群が有する1以上の単語情報群を、1以上の単語に分割し、単語の単語情報群内における位置を特定する分類フラグを決定し、当該分類フラグを前記単語情報に対応付ける分類ステップと、
前記エントリ決定部が、前記単語情報と前記分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択して、前記発音辞書に蓄積するエントリ決定ステップとを具備する発音辞書の生産方法。 - 記録媒体に、
一の言語の単語を示す単語情報、当該単語情報の単語情報群内における位置を特定する情報である分類フラグ、および当該単語の発音を示す発音情報を有する1以上の発音エントリを含む発音辞書と、
1以上の単語情報を有する単語情報群と、前記1以上の各単語情報に対応する1以上の発音情報を有する発音情報群との組である情報群を1組以上、格納しており、
コンピュータを、
前記1組以上の情報群が有する1以上の単語情報群を、1以上の単語に分割し、単語の単語情報群内における位置を特定する分類フラグを決定し、当該分類フラグを前記単語情報に対応付ける分類部と、
前記単語情報と前記分類フラグごとに、当該単語情報と当該分類フラグとに対応する各発音情報の頻度を算出し、頻度が予め決められた条件を満たすほど高い発音情報を有する発音エントリを選択して、前記発音辞書に蓄積するエントリ決定部として機能させるためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011197883A JP5888723B2 (ja) | 2011-09-12 | 2011-09-12 | 発音辞書作成装置、発音辞書の生産方法、およびプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011197883A JP5888723B2 (ja) | 2011-09-12 | 2011-09-12 | 発音辞書作成装置、発音辞書の生産方法、およびプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2013061371A true JP2013061371A (ja) | 2013-04-04 |
| JP5888723B2 JP5888723B2 (ja) | 2016-03-22 |
Family
ID=48186113
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2011197883A Expired - Fee Related JP5888723B2 (ja) | 2011-09-12 | 2011-09-12 | 発音辞書作成装置、発音辞書の生産方法、およびプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5888723B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015026054A (ja) * | 2013-07-29 | 2015-02-05 | 韓國電子通信研究院Electronics and Telecommunications Research Institute | 自動通訳装置及び方法 |
| KR20180025559A (ko) * | 2016-09-01 | 2018-03-09 | 에스케이텔레콤 주식회사 | 발음 사전 학습 방법 및 장치 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004170887A (ja) * | 2002-11-22 | 2004-06-17 | Canon Inc | データ処理システム及びデータ格納方法 |
| JP2009529704A (ja) * | 2006-03-10 | 2009-08-20 | インフィニティー テレコム カンパニー リミテッド | 移動通信端末装置を利用した通訳サービス方法 |
| JP2010139745A (ja) * | 2008-12-11 | 2010-06-24 | National Institute Of Information & Communication Technology | 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム |
| JP2010176103A (ja) * | 2009-02-02 | 2010-08-12 | Nippon Hoso Kyokai <Nhk> | 発音辞書修正装置、音声認識装置、およびコンピュータプログラム |
-
2011
- 2011-09-12 JP JP2011197883A patent/JP5888723B2/ja not_active Expired - Fee Related
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004170887A (ja) * | 2002-11-22 | 2004-06-17 | Canon Inc | データ処理システム及びデータ格納方法 |
| JP2009529704A (ja) * | 2006-03-10 | 2009-08-20 | インフィニティー テレコム カンパニー リミテッド | 移動通信端末装置を利用した通訳サービス方法 |
| JP2010139745A (ja) * | 2008-12-11 | 2010-06-24 | National Institute Of Information & Communication Technology | 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム |
| JP2010176103A (ja) * | 2009-02-02 | 2010-08-12 | Nippon Hoso Kyokai <Nhk> | 発音辞書修正装置、音声認識装置、およびコンピュータプログラム |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015026054A (ja) * | 2013-07-29 | 2015-02-05 | 韓國電子通信研究院Electronics and Telecommunications Research Institute | 自動通訳装置及び方法 |
| KR20150014235A (ko) * | 2013-07-29 | 2015-02-06 | 한국전자통신연구원 | 자동 통역 장치 및 방법 |
| KR102069697B1 (ko) * | 2013-07-29 | 2020-02-24 | 한국전자통신연구원 | 자동 통역 장치 및 방법 |
| KR20180025559A (ko) * | 2016-09-01 | 2018-03-09 | 에스케이텔레콤 주식회사 | 발음 사전 학습 방법 및 장치 |
| KR102615290B1 (ko) | 2016-09-01 | 2023-12-15 | 에스케이텔레콤 주식회사 | 발음 사전 학습 방법 및 장치 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP5888723B2 (ja) | 2016-03-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110675855B (zh) | 一种语音识别方法、电子设备及计算机可读存储介质 | |
| JP6493866B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
| US20180137109A1 (en) | Methodology for automatic multilingual speech recognition | |
| CN109686383B (zh) | 一种语音分析方法、装置及存储介质 | |
| US20120221339A1 (en) | Method, apparatus for synthesizing speech and acoustic model training method for speech synthesis | |
| CN106297800B (zh) | 一种自适应的语音识别的方法和设备 | |
| US20080177543A1 (en) | Stochastic Syllable Accent Recognition | |
| CN113327574A (zh) | 一种语音合成方法、装置、计算机设备和存储介质 | |
| CN112651247B (zh) | 对话系统、对话处理方法、翻译装置和翻译方法 | |
| JP2014232268A (ja) | 音声認識における読み精度を改善するシステム、方法、およびプログラム | |
| WO2018192186A1 (zh) | 语音识别方法及装置 | |
| CN112397056A (zh) | 语音评测方法及计算机存储介质 | |
| KR101068122B1 (ko) | 음성인식기에서 가비지 및 반단어 모델 기반의 거절 장치 및 방법 | |
| US9129596B2 (en) | Apparatus and method for creating dictionary for speech synthesis utilizing a display to aid in assessing synthesis quality | |
| WO2012164835A1 (ja) | 韻律生成装置、音声合成装置、韻律生成方法および韻律生成プログラム | |
| JP5688761B2 (ja) | 音響モデル学習装置、および音響モデル学習方法 | |
| CN103035244A (zh) | 一种可实时反馈用户朗读进度的语音跟踪方法 | |
| KR101097186B1 (ko) | 대화체 앞뒤 문장정보를 이용한 다국어 음성합성 시스템 및 방법 | |
| CN113421587A (zh) | 语音评测的方法、装置、计算设备及存储介质 | |
| Mabokela et al. | An integrated language identification for code-switched speech using decoded-phonemes and support vector machine | |
| CN111489742B (zh) | 声学模型训练方法、语音识别方法、装置及电子设备 | |
| JP5888723B2 (ja) | 発音辞書作成装置、発音辞書の生産方法、およびプログラム | |
| Chu et al. | A concatenative Mandarin TTS system without prosody model and prosody modification. | |
| Manjunath et al. | Development of phonetic engine for Indian languages: Bengali and Oriya | |
| JP6002598B2 (ja) | 強調位置予測装置、その方法、およびプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140905 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150730 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150817 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160127 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160210 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5888723 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |