KR100486735B1 - 최적구획 분류신경망 구성방법과 최적구획 분류신경망을이용한 자동 레이블링방법 및 장치 - Google Patents
최적구획 분류신경망 구성방법과 최적구획 분류신경망을이용한 자동 레이블링방법 및 장치 Download PDFInfo
- Publication number
- KR100486735B1 KR100486735B1 KR10-2003-0012700A KR20030012700A KR100486735B1 KR 100486735 B1 KR100486735 B1 KR 100486735B1 KR 20030012700 A KR20030012700 A KR 20030012700A KR 100486735 B1 KR100486735 B1 KR 100486735B1
- Authority
- KR
- South Korea
- Prior art keywords
- neural network
- phoneme
- optimal
- classification
- automatic labeling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Machine Translation (AREA)
- Image Analysis (AREA)
- Feedback Control In General (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
| 방 법 | RMSE(msec) | MAE(msec) | <20msec(%) | |
| 종래기술 1 | HMM 단독 | 12.51 | 8.91 | 91.99 |
| 종래기술 2 | HMM + 단일 신경망 | 12.20 | 7.70 | 91.73 |
| 종래기술 3 | HMM + 음소군조합별 신경망 | 10.50 | 6.68 | 94.37 |
| 본 발명 | HMM + 최적구획 분류신경망 | 10.13 | 6.23 | 95.17 |
Claims (18)
- (a) 좌, 우 음소의 이름으로 이루어지는 L개의 음소조합을 수동 레이블링에 의해 얻어진 음소경계를 이용하여 획득하는 단계;(b) 입력변수를 포함하는 학습데이터로부터 다층 퍼셉트론 구조의 K개의 신경망 집합을 생성하는 단계;(c) 상기 신경망 집합 또는 갱신된 신경망 집합으로부터 상기 L개의 음소조합 각각에 대하여 최소오차를 갖는 신경망을 탐색하고, 상기 L개의 음소조합을 동일한 신경망으로 탐색된 K개의 음소조합 그룹으로 분류하는 단계;(d) 상기 (c) 단계에서 분류된 K개의 음소조합 그룹별로, 상기 K개의 신경망에 대하여 해당하는 학습데이터로 학습하여 가중치를 각 신경망의 개별 오차가 수렴할 때까지 갱신하는 단계; 및(e) 상기 (d) 단계에서 개별 오차가 수렴된 K개의 신경망의 전체 오차합이 수렴할 때까지 상기 개별 오차가 수렴된 K개의 신경망에 대하여 상기 (c) 내지 (e) 단계를 반복수행하고, 전체 오차합이 수렴하는 시점에서 얻어지는 K개의 신경망을 최적구획 분류신경망 집합으로 구성하는 단계를 포함하는 최적구획 분류신경망 구성방법.
- 제1 항에 있어서, 상기 입력변수는 멜 주파수 켑스트럼 계수, 단구간 영교차율, 스펙트럼 특징변수 변화율 및 대칭 Kullback-leibler 거리를 포함하는 최적구획 분류신경망 구성방법.
- 제2 항에 있어서, 상기 입력변수는 (n-1), (n), (n+1), (n+2) 번째 프레임에 해당하는 상기 멜 주파수 켑스트럼 계수, (n), (n+1) 번째 프레임에서 계산된 단구간 영교차율, 스펙트럼 특징변수 변화율 및 대칭 Kullback-leibler 거리를 포함하는 최적구획 분류신경망 구성방법.
- 제1 항에 있어서, 상기 신경망의 출력값은 음소의 경계에 해당하는 부분에는 1, 그렇지 않은 부분에는 0을 설정하고, 음소경계로부터 좌, 우 1 프레임 만큼 떨어진 부분에는 0.5를 설정하는 최적구획 분류신경망 구성방법.
- 수동 레이블 파일에 대하여 자동 레이블링을 수행하여 생성된 1차 레이블 파일의 음소경계를 수정하기 위한 자동 레이블링방법에 있어서,(a) 초기에 생성되거나 갱신된 K개의 신경망 집합으로부터 L개의 음소조합 각각에 대하여 최소오차를 갖는 신경망을 탐색하고, 동일한 신경망으로 탐색된 K개의 음소조합 그룹별로 상기 K개의 신경망을 학습하여 가중치를 갱신하고, 개별 오차가 수렴된 K개의 신경망의 전체 오차합이 수렴하는 시점에서 얻어지는 K개의 신경망을 최적구획 분류신경망 집합으로 구성하는 단계; 및(b) 상기 (a) 단계에서 제공되는 음소조합 그룹 분류결과 및 최적구획 분류신경망 집합을 이용하여 상기 1차 레이블 파일의 음소경계를 수정하고, 수정 결과를 반영한 최종 레이블 파일을 생성하는 단계를 포함하는 최적구획 분류신경망을 이용한 자동 레이블링방법.
- 제5 항에 있어서, 상기 입력변수는 멜 주파수 켑스트럼 계수, 단구간 영교차율, 스펙트럼 특징변수 변화율 및 대칭 Kullback-leibler 거리를 포함하는 최적구획 분류신경망을 이용한 자동 레이블링방법.
- 제6 항에 있어서, 상기 입력변수는 (n-1), (n), (n+1), (n+2) 번째 프레임에 해당하는 상기 멜 주파수 켑스트럼 계수, (n), (n+1) 번째 프레임에서 계산된 단구간 영교차율, 스펙트럼 특징변수 변화율 및 대칭 Kullback-leibler 거리를 포함하는 최적구획 분류신경망을 이용한 자동 레이블링방법.
- 제5 항에 있어서, 상기 신경망의 출력값은 음소의 경계에 해당하는 부분에는 1, 그렇지 않은 부분에는 0을 설정하고, 음소경계로부터 좌, 우 1 프레임 만큼 떨어진 부분에는 0.5를 설정하는 최적구획 분류신경망을 이용한 자동 레이블링방법.
- 제5 항에 있어서, 상기 (b) 단계에서의 음소경계 수정영역은 상기 음소조합의 좌, 우 음소의 지속시간 중 소정 영역으로 설정하는 것을 특징으로 하는 최적구획 분류신경망을 이용한 자동 레이블링방법.
- 제9 항에 있어서, 상기 소정영역은 상기 좌, 우 음소의 지속시간을 각각 3 등분하고, 상기 1차 레이블 파일의 각 음소경계 부근에서 좌, 우로 1/3 분할한 길이로 설정하는 것을 특징으로 하는 최적구획 분류신경망을 이용한 자동 레이블링방법.
- 수동 레이블 파일에 대하여 자동 레이블링을 수행하여 1차 레이블 파일을 생성하는 레이블링부;초기에 생성되거나 갱신된 K개의 신경망 집합으로부터 L개의 음소조합 각각에 대하여 최소오차를 갖는 신경망을 탐색하고, 동일한 신경망으로 탐색된 K개의 음소조합 그룹별로 상기 K개의 신경망을 학습하여 가중치를 갱신하고, 개별 오차가 수렴된 K개의 신경망의 전체 오차합이 수렴하는 시점에서 얻어지는 K개의 신경망을 최적구획 분류신경망 집합으로 구성하는 최적구획 분류신경망 구성부; 및상기 최적구획 분류신경망 구성부로부터 제공되는 음소조합 분류결과 및 최적구획 분류신경망 집합을 이용하여 상기 1차 레이블 파일의 음소경계를 수정하고, 수정 결과를 반영한 최종 레이블 파일을 생성하는 음소경계 수정부를 포함하는 최적구획 분류신경망을 이용한 자동 레이블링장치.
- 제11 항에 있어서, 상기 최적구획 분류신경망 구성부는음향특징변수와 부가변수를 포함한 입력변수와 수동 레이블 파일을 저장하는 훈련 코퍼스;상기 훈련코퍼스에 저장된 입력변수와 수동 레이블 파일로부터 얻어지는 음소경계를 이용하여 좌, 우 음소의 이름으로 이루어지는 L개의 음소조합을 생성하고, 초기에 생성되거나 갱신된 K개의 신경망 집합으로부터 상기 L개의 음소조합 각각에 대하여 최소오차를 갖는 신경망을 탐색하고, 상기 L개의 음소조합을 동일한 신경망으로 탐색된 K개의 음소조합 그룹으로 분류하는 최소오차 분류부; 및상기 최소오차 분류부에서 분류된 K개의 음소조합 그룹별로 상기 K개의 신경망에 대하여 해당하는 학습데이터로 학습하여 가중치를 각 신경망의 개별 오차가 수렴할 때까지 갱신하고, 개별 오차가 수렴된 K개의 신경망의 전체 오차합이 수렴하도록 재훈련시키는 재훈련부를 포함하는 최적구획 분류신경망을 이용한 자동 레이블링장치.
- 제11 항에 있어서, 상기 입력변수는 멜 주파수 켑스트럼 계수, 단구간 영교차율, 스펙트럼 특징변수 변화율 및 대칭 Kullback-leibler 거리를 포함하는 최적구획 분류신경망을 이용한 자동 레이블링장치.
- 제13 항에 있어서, 상기 입력변수는 (n-1), (n), (n+1), (n+2) 번째 프레임에 해당하는 상기 멜 주파수 켑스트럼 계수, (n), (n+1) 번째 프레임에서 계산된 단구간 영교차율, 스펙트럼 특징변수 변화율 및 대칭 Kullback-leibler 거리를 포함하는 최적구획 분류신경망을 이용한 자동 레이블링장치.
- 제11 항에 있어서, 상기 신경망의 출력값은 음소의 경계에 해당하는 부분에는 1, 그렇지 않은 부분에는 0을 설정하고, 음소경계로부터 좌, 우 1 만큼 떨어진 부분에는 0.5를 설정하는 최적구획 분류신경망을 이용한 자동 레이블링장치.
- 제11 항에 있어서, 상기 음소경계 수정부의 음소경계 수정영역은 상기 좌, 우 음소의 지속시간 중 소정 영역으로 설정하는 것을 특징으로 하는 최적구획 분류신경망을 이용한 자동 레이블링장치.
- 제16 항에 있어서, 상기 소정영역은 상기 좌, 우 음소의 지속시간을 각각 3 등분하고, 상기 1차 레이블 파일의 각 음소경계 부근에서 좌, 우로 1/3 분할한 길이로 설정하는 것을 특징으로 하는 최적구획 분류신경망을 이용한 자동 레이블링장치.
- 제1 항 내지 제10 항 중 어느 한 항에 기재된 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
Priority Applications (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR10-2003-0012700A KR100486735B1 (ko) | 2003-02-28 | 2003-02-28 | 최적구획 분류신경망 구성방법과 최적구획 분류신경망을이용한 자동 레이블링방법 및 장치 |
| DE602004027566T DE602004027566D1 (de) | 2003-02-28 | 2004-02-27 | Verfahren zur Bildung eines optimal partitionierten, klassifierten neuralen Netzes, und Verfahren und Vorrichtung zur automatischen Kennzeichnung unter Verwendung eines optimal partitionierten, klassifierten neuralen Netzes |
| EP04251145A EP1453037B1 (en) | 2003-02-28 | 2004-02-27 | Method of setting optimum-partitioned classified neural network and method and apparatus for automatic labeling using optimum-partitioned classified neural network |
| US10/788,301 US7444282B2 (en) | 2003-02-28 | 2004-03-01 | Method of setting optimum-partitioned classified neural network and method and apparatus for automatic labeling using optimum-partitioned classified neural network |
| JP2004056726A JP4545456B2 (ja) | 2003-02-28 | 2004-03-01 | 最適区画の分類神経網の構成方法、最適区画の分類神経網を用いた自動ラベリング方法、並びに装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR10-2003-0012700A KR100486735B1 (ko) | 2003-02-28 | 2003-02-28 | 최적구획 분류신경망 구성방법과 최적구획 분류신경망을이용한 자동 레이블링방법 및 장치 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20040077227A KR20040077227A (ko) | 2004-09-04 |
| KR100486735B1 true KR100486735B1 (ko) | 2005-05-03 |
Family
ID=32768619
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR10-2003-0012700A Expired - Fee Related KR100486735B1 (ko) | 2003-02-28 | 2003-02-28 | 최적구획 분류신경망 구성방법과 최적구획 분류신경망을이용한 자동 레이블링방법 및 장치 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US7444282B2 (ko) |
| EP (1) | EP1453037B1 (ko) |
| JP (1) | JP4545456B2 (ko) |
| KR (1) | KR100486735B1 (ko) |
| DE (1) | DE602004027566D1 (ko) |
Families Citing this family (46)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7088872B1 (en) * | 2002-02-14 | 2006-08-08 | Cogent Systems, Inc. | Method and apparatus for two dimensional image processing |
| US7266497B2 (en) * | 2002-03-29 | 2007-09-04 | At&T Corp. | Automatic segmentation in speech synthesis |
| US8793127B2 (en) * | 2002-10-31 | 2014-07-29 | Promptu Systems Corporation | Method and apparatus for automatically determining speaker characteristics for speech-directed advertising or other enhancement of speech-controlled devices or services |
| US7616788B2 (en) * | 2004-11-12 | 2009-11-10 | Cogent Systems, Inc. | System and method for fast biometric pattern matching |
| US8131477B2 (en) | 2005-11-16 | 2012-03-06 | 3M Cogent, Inc. | Method and device for image-based biological data quantification |
| KR100744288B1 (ko) * | 2005-12-28 | 2007-07-30 | 삼성전자주식회사 | 음성 신호에서 음소를 분절하는 방법 및 그 시스템 |
| KR100908121B1 (ko) * | 2006-12-15 | 2009-07-16 | 삼성전자주식회사 | 음성 특징 벡터 변환 방법 및 장치 |
| US8275179B2 (en) * | 2007-05-01 | 2012-09-25 | 3M Cogent, Inc. | Apparatus for capturing a high quality image of a moist finger |
| TWI319563B (en) * | 2007-05-31 | 2010-01-11 | Cyberon Corp | Method and module for improving personal speech recognition capability |
| US8504361B2 (en) * | 2008-02-07 | 2013-08-06 | Nec Laboratories America, Inc. | Deep neural networks and methods for using same |
| US20100014755A1 (en) * | 2008-07-21 | 2010-01-21 | Charles Lee Wilson | System and method for grid-based image segmentation and matching |
| EP2221805B1 (en) * | 2009-02-20 | 2014-06-25 | Nuance Communications, Inc. | Method for automated training of a plurality of artificial neural networks |
| US8412525B2 (en) * | 2009-04-30 | 2013-04-02 | Microsoft Corporation | Noise robust speech classifier ensemble |
| JP5498252B2 (ja) * | 2010-05-17 | 2014-05-21 | 日本電信電話株式会社 | 音声データ区分方法、音声データ区分装置、及びプログラム |
| WO2013003772A2 (en) * | 2011-06-30 | 2013-01-03 | Google Inc. | Speech recognition using variable-length context |
| JP5979146B2 (ja) * | 2011-07-11 | 2016-08-24 | 日本電気株式会社 | 音声合成装置、音声合成方法および音声合成プログラム |
| US10453479B2 (en) * | 2011-09-23 | 2019-10-22 | Lessac Technologies, Inc. | Methods for aligning expressive speech utterances with text and systems therefor |
| US9536517B2 (en) | 2011-11-18 | 2017-01-03 | At&T Intellectual Property I, L.P. | System and method for crowd-sourced data labeling |
| US9235799B2 (en) * | 2011-11-26 | 2016-01-12 | Microsoft Technology Licensing, Llc | Discriminative pretraining of deep neural networks |
| US8700552B2 (en) | 2011-11-28 | 2014-04-15 | Microsoft Corporation | Exploiting sparseness in training deep neural networks |
| US8527276B1 (en) * | 2012-10-25 | 2013-09-03 | Google Inc. | Speech synthesis using deep neural networks |
| US9336771B2 (en) * | 2012-11-01 | 2016-05-10 | Google Inc. | Speech recognition using non-parametric models |
| US9477925B2 (en) | 2012-11-20 | 2016-10-25 | Microsoft Technology Licensing, Llc | Deep neural networks training for speech and pattern recognition |
| US10311865B2 (en) * | 2013-10-14 | 2019-06-04 | The Penn State Research Foundation | System and method for automated speech recognition |
| US9858922B2 (en) | 2014-06-23 | 2018-01-02 | Google Inc. | Caching speech recognition scores |
| US9547471B2 (en) * | 2014-07-03 | 2017-01-17 | Microsoft Technology Licensing, Llc | Generating computer responses to social conversational inputs |
| BR112017003893A8 (pt) | 2014-09-12 | 2017-12-26 | Microsoft Corp | Rede dnn aluno aprendiz via distribuição de saída |
| US9299347B1 (en) | 2014-10-22 | 2016-03-29 | Google Inc. | Speech recognition using associative mapping |
| US9659578B2 (en) * | 2014-11-27 | 2017-05-23 | Tata Consultancy Services Ltd. | Computer implemented system and method for identifying significant speech frames within speech signals |
| US10460720B2 (en) | 2015-01-03 | 2019-10-29 | Microsoft Technology Licensing, Llc. | Generation of language understanding systems and methods |
| CN105046323B (zh) * | 2015-04-29 | 2017-03-22 | 西北大学 | 一种正则化rbf网络多标签分类方法 |
| US11062228B2 (en) | 2015-07-06 | 2021-07-13 | Microsoft Technoiogy Licensing, LLC | Transfer learning techniques for disparate label sets |
| GB2543542A (en) * | 2015-10-21 | 2017-04-26 | Ford Global Tech Llc | A method of controlling a motor vehicle entertainment system |
| EP3267438B1 (en) * | 2016-07-05 | 2020-11-25 | Nxp B.V. | Speaker authentication with artificial neural networks |
| US20180018973A1 (en) | 2016-07-15 | 2018-01-18 | Google Inc. | Speaker verification |
| US10657424B2 (en) * | 2016-12-07 | 2020-05-19 | Samsung Electronics Co., Ltd. | Target detection method and apparatus |
| US10019668B1 (en) | 2017-05-19 | 2018-07-10 | Google Llc | Scheduling neural network processing |
| US11321604B2 (en) | 2017-06-21 | 2022-05-03 | Arm Ltd. | Systems and devices for compressing neural network parameters |
| US11275996B2 (en) * | 2017-06-21 | 2022-03-15 | Arm Ltd. | Systems and devices for formatting neural network parameters |
| US10885900B2 (en) | 2017-08-11 | 2021-01-05 | Microsoft Technology Licensing, Llc | Domain adaptation in speech recognition via teacher-student learning |
| KR102098461B1 (ko) * | 2018-02-23 | 2020-04-07 | 창원대학교 산학협력단 | 퍼지 범주 표현을 이용한 확률 레이블 부착 알고리즘을 사용한 분류 방법 |
| US11157816B2 (en) * | 2018-10-17 | 2021-10-26 | Capital One Services, Llc | Systems and methods for selecting and generating log parsers using neural networks |
| CN109817198B (zh) * | 2019-03-06 | 2021-03-02 | 广州多益网络股份有限公司 | 语音合成方法、装置及存储介质 |
| WO2021106047A1 (ja) * | 2019-11-25 | 2021-06-03 | 日本電信電話株式会社 | 検知装置、その方法、およびプログラム |
| WO2021146652A1 (en) * | 2020-01-17 | 2021-07-22 | Syntiant | Systems and methods for neural network training via local target signal augmentsation |
| CN113380238A (zh) * | 2021-06-09 | 2021-09-10 | 阿波罗智联(北京)科技有限公司 | 处理音频信号的方法、模型训练方法、装置、设备和介质 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH05188998A (ja) * | 1992-01-17 | 1993-07-30 | Meidensha Corp | 音声認識方法 |
| JPH06348291A (ja) * | 1993-06-10 | 1994-12-22 | Nippondenso Co Ltd | 単語音声認識方法 |
| JPH09319395A (ja) * | 1996-03-26 | 1997-12-12 | Meidensha Corp | 離散単語音声認識システムにおける音声データ学習装置 |
| JPH1097293A (ja) * | 1996-09-19 | 1998-04-14 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 音声認識用単語辞書作成装置及び連続音声認識装置 |
| KR20000031935A (ko) * | 1998-11-11 | 2000-06-05 | 정선종 | 음성인식시스템에서의 발음사전 자동생성 방법 |
| KR20010003502A (ko) * | 1999-06-23 | 2001-01-15 | 정선종 | 음소분할 후처리 방법 |
Family Cites Families (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5285522A (en) * | 1987-12-03 | 1994-02-08 | The Trustees Of The University Of Pennsylvania | Neural networks for acoustical pattern recognition |
| JPH0682275B2 (ja) * | 1989-09-11 | 1994-10-19 | 株式会社エイ・ティ・アール自動翻訳電話研究所 | 音声認識装置 |
| JP2991752B2 (ja) * | 1990-08-07 | 1999-12-20 | シャープ株式会社 | 音声認識装置 |
| JPH03201161A (ja) * | 1989-12-28 | 1991-09-03 | Sharp Corp | 音声認識装置 |
| US5621857A (en) * | 1991-12-20 | 1997-04-15 | Oregon Graduate Institute Of Science And Technology | Method and system for identifying and recognizing speech |
| US5621858A (en) * | 1992-05-26 | 1997-04-15 | Ricoh Corporation | Neural network acoustic and visual speech recognition system training method and apparatus |
| JP2924555B2 (ja) * | 1992-10-02 | 1999-07-26 | 三菱電機株式会社 | 音声認識の境界推定方法及び音声認識装置 |
| US5461696A (en) * | 1992-10-28 | 1995-10-24 | Motorola, Inc. | Decision directed adaptive neural network |
| JPH09500223A (ja) * | 1993-07-13 | 1997-01-07 | ボルドー、テオドール・オースチン | 多言語音声認識システム |
| CA2161540C (en) * | 1994-04-28 | 2000-06-13 | Orhan Karaali | A method and apparatus for converting text into audible signals using a neural network |
| US5509103A (en) * | 1994-06-03 | 1996-04-16 | Motorola, Inc. | Method of training neural networks used for speech recognition |
| US5790754A (en) * | 1994-10-21 | 1998-08-04 | Sensory Circuits, Inc. | Speech recognition apparatus for consumer electronic applications |
| US5638487A (en) * | 1994-12-30 | 1997-06-10 | Purespeech, Inc. | Automatic speech recognition |
| US5749066A (en) * | 1995-04-24 | 1998-05-05 | Ericsson Messaging Systems Inc. | Method and apparatus for developing a neural network for phoneme recognition |
| KR0173923B1 (ko) * | 1995-12-22 | 1999-04-01 | 양승택 | 다층구조 신경망을 이용한 음소 분할 방법 |
| US5737716A (en) * | 1995-12-26 | 1998-04-07 | Motorola | Method and apparatus for encoding speech using neural network technology for speech classification |
| JP3775453B2 (ja) * | 1997-07-31 | 2006-05-17 | セイコーエプソン株式会社 | 音声認識用ニューラルネットワークの学習方法 |
| US6947890B1 (en) * | 1999-05-28 | 2005-09-20 | Tetsuro Kitazoe | Acoustic speech recognition method and system using stereo vision neural networks with competition and cooperation |
| JP3779519B2 (ja) * | 2000-03-07 | 2006-05-31 | 株式会社山武 | データ領域の解析方法及び表現方法 |
-
2003
- 2003-02-28 KR KR10-2003-0012700A patent/KR100486735B1/ko not_active Expired - Fee Related
-
2004
- 2004-02-27 DE DE602004027566T patent/DE602004027566D1/de not_active Expired - Lifetime
- 2004-02-27 EP EP04251145A patent/EP1453037B1/en not_active Expired - Lifetime
- 2004-03-01 JP JP2004056726A patent/JP4545456B2/ja not_active Expired - Fee Related
- 2004-03-01 US US10/788,301 patent/US7444282B2/en active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH05188998A (ja) * | 1992-01-17 | 1993-07-30 | Meidensha Corp | 音声認識方法 |
| JPH06348291A (ja) * | 1993-06-10 | 1994-12-22 | Nippondenso Co Ltd | 単語音声認識方法 |
| JPH09319395A (ja) * | 1996-03-26 | 1997-12-12 | Meidensha Corp | 離散単語音声認識システムにおける音声データ学習装置 |
| JPH1097293A (ja) * | 1996-09-19 | 1998-04-14 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 音声認識用単語辞書作成装置及び連続音声認識装置 |
| KR20000031935A (ko) * | 1998-11-11 | 2000-06-05 | 정선종 | 음성인식시스템에서의 발음사전 자동생성 방법 |
| KR20010003502A (ko) * | 1999-06-23 | 2001-01-15 | 정선종 | 음소분할 후처리 방법 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2004264856A (ja) | 2004-09-24 |
| US7444282B2 (en) | 2008-10-28 |
| EP1453037B1 (en) | 2010-06-09 |
| EP1453037A3 (en) | 2006-05-17 |
| KR20040077227A (ko) | 2004-09-04 |
| US20040172238A1 (en) | 2004-09-02 |
| DE602004027566D1 (de) | 2010-07-22 |
| EP1453037A2 (en) | 2004-09-01 |
| JP4545456B2 (ja) | 2010-09-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100486735B1 (ko) | 최적구획 분류신경망 구성방법과 최적구획 분류신경망을이용한 자동 레이블링방법 및 장치 | |
| JP5768093B2 (ja) | 音声処理システム | |
| US5839105A (en) | Speaker-independent model generation apparatus and speech recognition apparatus each equipped with means for splitting state having maximum increase in likelihood | |
| US8321222B2 (en) | Synthesis by generation and concatenation of multi-form segments | |
| JP5229216B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
| US7054810B2 (en) | Feature vector-based apparatus and method for robust pattern recognition | |
| Jacob | Modelling speech emotion recognition using logistic regression and decision trees | |
| US20110015927A1 (en) | System and method for efficient laser processing of a moving web-based material | |
| Hwang | Subphonetic acoustic modeling for speaker-independent continuous speech recognition | |
| EP1465154B1 (en) | Method of speech recognition using variational inference with switching state space models | |
| JP2007047818A (ja) | 最適化された部分的確率混合共通化を用いる音声認識のための方法および装置 | |
| JP7209330B2 (ja) | 識別器、学習済モデル、学習方法 | |
| Stuttle | A Gaussian mixture model spectral representation for speech recognition | |
| KR101120765B1 (ko) | 스위칭 상태 스페이스 모델과의 멀티모덜 변동 추정을이용한 스피치 인식 방법 | |
| CN102237082B (zh) | 语音识别系统的自适应方法 | |
| Mohamed et al. | HMM/ANN hybrid model for continuous Malayalam speech recognition | |
| Furui | Generalization problem in ASR acoustic model training and adaptation | |
| JP2004117503A (ja) | 音声認識用音響モデル作成方法、その装置、そのプログラムおよびその記録媒体、上記音響モデルを用いる音声認識装置 | |
| JPH0895592A (ja) | パターン認識方法 | |
| Mohanty et al. | Double ended speech enabled system in Indian travel & tourism industry | |
| Moon et al. | A preliminary study on topical model for multi-domain speech recognition via word embedding vector | |
| Cronk et al. | Optimized stopping criteria for tree-based unit selection in concatenative synthesis. | |
| Saxena | Significance of knowledge-based representation of speech for spoken term detection | |
| JP4705535B2 (ja) | 音響モデル作成装置及び音声認識装置並びに音響モデル作成プログラム | |
| Khorram et al. | Soft context clustering for F0 modeling in HMM-based speech synthesis |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-3-3-R10-R18-oth-X000 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| D13-X000 | Search requested |
St.27 status event code: A-1-2-D10-D13-srh-X000 |
|
| D14-X000 | Search report completed |
St.27 status event code: A-1-2-D10-D14-srh-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| PN2301 | Change of applicant |
St.27 status event code: A-5-5-R10-R13-asn-PN2301 St.27 status event code: A-5-5-R10-R11-asn-PN2301 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 6 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 7 |
|
| FPAY | Annual fee payment |
Payment date: 20120329 Year of fee payment: 8 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 8 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| FPAY | Annual fee payment |
Payment date: 20130328 Year of fee payment: 9 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 9 |
|
| LAPS | Lapse due to unpaid annual fee | ||
| PC1903 | Unpaid annual fee |
St.27 status event code: A-4-4-U10-U13-oth-PC1903 Not in force date: 20140423 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE |
|
| PC1903 | Unpaid annual fee |
St.27 status event code: N-4-6-H10-H13-oth-PC1903 Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20140423 |