KR101009799B1 - 음성 신호 압축 장치, 음성 신호 압축 방법 및 프로그램 - Google Patents
음성 신호 압축 장치, 음성 신호 압축 방법 및 프로그램 Download PDFInfo
- Publication number
- KR101009799B1 KR101009799B1 KR1020057015569A KR20057015569A KR101009799B1 KR 101009799 B1 KR101009799 B1 KR 101009799B1 KR 1020057015569 A KR1020057015569 A KR 1020057015569A KR 20057015569 A KR20057015569 A KR 20057015569A KR 101009799 B1 KR101009799 B1 KR 101009799B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- signal
- compression
- pitch
- phoneme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000007906 compression Methods 0.000 title claims abstract description 116
- 230000006835 compression Effects 0.000 title claims abstract description 116
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000005236 sound signal Effects 0.000 claims abstract description 21
- 230000003595 spectral effect Effects 0.000 claims description 42
- 238000013144 data compression Methods 0.000 claims description 22
- 238000005070 sampling Methods 0.000 claims description 20
- 238000001914 filtration Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 3
- 230000002238 attenuated effect Effects 0.000 abstract 1
- 239000000284 extract Substances 0.000 abstract 1
- 239000011295 pitch Substances 0.000 description 125
- 238000013139 quantization Methods 0.000 description 27
- 238000004891 communication Methods 0.000 description 18
- 238000002372 labelling Methods 0.000 description 18
- 238000005311 autocorrelation function Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 9
- 230000002159 abnormal effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000005856 abnormality Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000009131 signaling function Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (9)
- 압축하는 대상인 음성의 파형을 나타내는 음성 신호를 취득하고, 개개의 음소에 대한 음성 신호 파형으로 분할하는 음소별 분할 수단과,분할된 상기 음성 신호를 필터링하여 피치 신호를 추출하는 필터와,상기 필터에 의해 추출된 피치 신호에 의거하여 상기 음성 신호를 구간으로 구획하고, 각 해당 구간에 관해 상기 구획된 음성 신호와 상기 피치 신호의 상관 관계에 의거하여 위상을 조정하는 위상 조정 수단과,상기 위상 조정 수단에 의해 위상이 조정된 각 구간에 관해, 해당 위상에 의거하여 샘플링 길이를 정하고, 해당 샘플링 길이에 따라 샘플링을 행함에 의해 샘플링 신호를 생성하는 샘플링 수단과,상기 위상 조정 수단에 의한 상기 조정의 결과와 상기 샘플링 길이의 값에 의거하여, 상기 샘플링 신호를 피치 파형 신호로 가공하는 음성 신호 가공 수단과,상기 피치 파형 신호에 의거하여, 각 상기 음소의 스펙트럼 분포의 시간 변화를 나타내는 서브밴드 데이터를 생성하는 서브밴드 데이터 생성 수단과,상기 서브밴드 데이터에, 해당 서브밴드 데이터가 나타내는 음소에 관해 정해진 소정의 조건에 따라 데이터 압축을 시행하는 음소별 압축 수단을 포함하며,상기 음소별 압축 수단은 상기 서브밴드 데이터로부터 소정의 스펙트럼 성분을 삭제하도록 상기 서브밴드 데이터를 변경하는 것에 의해 상기 서브밴드의 데이터 압축을 수행하는 것을 특징으로 하는 음성 신호 압축 장치.
- 제 1항에 있어서,상기 음소별 압축 수단은,각각의 음소를 나타내는 서브밴드 데이터에 시행하는 데이터 압축의 조건을 지정하는 테이블을 재기록 가능하게 기억하는 수단과,각각의 음소를 나타내는 서브밴드 데이터에, 상기 테이블이 지정하는 조건에 따라 데이터 압축을 시행하는 수단에 의해 구성되어 있는 것을 특징으로 하는 음성 신호 압축 장치.
- 제 1항 또는 제 2항에 있어서,상기 음소별 압축 수단은, 각각의 음소를 나타내는 서브밴드 데이터를, 해당 음소에 관해 정해진 조건을 충족시키는 압축률에 달하도록 비선형 양자화함에 의해, 이들의 데이터에 데이터 압축을 시행하는 것을 특징으로 하는 음성 신호 압축 장치.
- 제 1항 또는 제 2항에 있어서,서브밴드 데이터의 각각의 스펙트럼 성분에는 우선도가 정하여져 있고,상기 음소별 압축 수단은, 서브밴드 데이터의 각각의 스펙트럼 성분을, 우선도가 높은 것일 수록 고분해능으로 양자화함에 의해, 이들의 데이터에 데이터 압축을 시행하는 것을 특징으로 하는 음성 신호 압축 장치.
- 삭제
- 삭제
- 음성의 파형 또는 음성의 스펙트럼 분포의 시간 변화를 나타내는 신호를 취득하는 수단과,취득된 신호에 대해, 개개의 음소를 나타내는 부분마다, 해당 부분이 나타내는 음소에 관해 정해진 소정의 조건에 따라 데이터 압축을 수행하는 수단을 포함하고,상기 데이터 압축을 수행하는 수단은 서브밴드 데이터로부터 소정의 스펙트럼 성분을 삭제하도록 상기 서브밴드 데이터를 변경하는 것에 의해 상기 서브밴드의 데이터 압축을 수행하는 것을 특징으로 하는 음성 신호 압축 장치.
- 디지털 신호 처리기에 의해 음성 신호를 압축하는 방법에 있어서,제 1의 처리기 소자에 의해 음성의 스펙트럼 분포의 시간에 따른 변화 또는 음성 파형을 나타내는 신호를 생성하고 취득하는 단계와,상기 취득된 신호의 개개의 음소를 나타내는 각 부분에 대해, 상기 부분에 의해 나타내어지는 음소의 특징에 따라 특정되는 소정의 압축율로 제 2의 처리기 소자에 의해 데이터 압축을 수행하여, 상기 취득된 신호의 개개의 음소를 나타내는 상기 각 부분을, 상기 각 부분에서 소정의 스펙트럼 성분을 삭제하도록 변경하는 단계를 포함하는 것을 특징으로 하는 음성 신호 압축 방법.
- 삭제
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003090045A JP4256189B2 (ja) | 2003-03-28 | 2003-03-28 | 音声信号圧縮装置、音声信号圧縮方法及びプログラム |
| JPJP-P-2003-00090045 | 2003-03-28 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20050107763A KR20050107763A (ko) | 2005-11-15 |
| KR101009799B1 true KR101009799B1 (ko) | 2011-01-19 |
Family
ID=33127254
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020057015569A Expired - Lifetime KR101009799B1 (ko) | 2003-03-28 | 2004-03-26 | 음성 신호 압축 장치, 음성 신호 압축 방법 및 프로그램 |
Country Status (7)
| Country | Link |
|---|---|
| US (1) | US7653540B2 (ko) |
| EP (1) | EP1610300B1 (ko) |
| JP (1) | JP4256189B2 (ko) |
| KR (1) | KR101009799B1 (ko) |
| CN (1) | CN100570709C (ko) |
| DE (2) | DE602004015753D1 (ko) |
| WO (1) | WO2004088634A1 (ko) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1895511B1 (en) * | 2005-06-23 | 2011-09-07 | Panasonic Corporation | Audio encoding apparatus, audio decoding apparatus and audio encoding information transmitting apparatus |
| US20070011009A1 (en) * | 2005-07-08 | 2007-01-11 | Nokia Corporation | Supporting a concatenative text-to-speech synthesis |
| JP4736699B2 (ja) * | 2005-10-13 | 2011-07-27 | 株式会社ケンウッド | 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム |
| US8694318B2 (en) * | 2006-09-19 | 2014-04-08 | At&T Intellectual Property I, L. P. | Methods, systems, and products for indexing content |
| EP3389043A4 (en) * | 2015-12-07 | 2019-05-15 | Yamaha Corporation | VOICE INTERACTION DEVICE AND VOICE INTERACTION METHOD |
| CN109817196B (zh) * | 2019-01-11 | 2021-06-08 | 安克创新科技股份有限公司 | 一种噪音消除方法、装置、系统、设备及存储介质 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2003019530A1 (en) * | 2001-08-31 | 2003-03-06 | Kenwood Corporation | Pitch waveform signal generation apparatus, pitch waveform signal generation method, and program |
Family Cites Families (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3946167A (en) * | 1973-11-20 | 1976-03-23 | Ted Bildplatten Aktiengesellschaft Aeg-Telefunken-Teldec | High density recording playback element construction |
| GR58359B (en) * | 1977-08-09 | 1977-10-03 | Of Scient And Applied Res Ltd | Voice codification system |
| JPS5667899A (en) | 1979-11-09 | 1981-06-08 | Canon Kk | Voice storage system |
| US4661915A (en) * | 1981-08-03 | 1987-04-28 | Texas Instruments Incorporated | Allophone vocoder |
| JPH01244499A (ja) | 1988-03-25 | 1989-09-28 | Toshiba Corp | 音声素片ファイル作成装置 |
| JPH03136100A (ja) * | 1989-10-20 | 1991-06-10 | Canon Inc | 音声処理方法及び装置 |
| JP2931059B2 (ja) | 1989-12-22 | 1999-08-09 | 沖電気工業株式会社 | 音声合成方式およびこれに用いる装置 |
| KR940002854B1 (ko) * | 1991-11-06 | 1994-04-04 | 한국전기통신공사 | 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치 |
| BE1010336A3 (fr) * | 1996-06-10 | 1998-06-02 | Faculte Polytechnique De Mons | Procede de synthese de son. |
| FR2815457B1 (fr) * | 2000-10-18 | 2003-02-14 | Thomson Csf | Procede de codage de la prosodie pour un codeur de parole a tres bas debit |
| JP2002244688A (ja) * | 2001-02-15 | 2002-08-30 | Sony Computer Entertainment Inc | 情報処理方法及び装置、情報伝送システム、情報処理プログラムを情報処理装置に実行させる媒体、情報処理プログラム |
| JP2002251196A (ja) * | 2001-02-26 | 2002-09-06 | Kenwood Corp | 音素データ処理装置、音素データ処理方法及びプログラム |
| US7089184B2 (en) * | 2001-03-22 | 2006-08-08 | Nurv Center Technologies, Inc. | Speech recognition for recognizing speaker-independent, continuous speech |
| JP4867076B2 (ja) * | 2001-03-28 | 2012-02-01 | 日本電気株式会社 | 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法 |
| CA2359771A1 (en) * | 2001-10-22 | 2003-04-22 | Dspfactory Ltd. | Low-resource real-time audio synthesis system and method |
-
2003
- 2003-03-28 JP JP2003090045A patent/JP4256189B2/ja not_active Expired - Lifetime
-
2004
- 2004-03-26 WO PCT/JP2004/004304 patent/WO2004088634A1/ja not_active Ceased
- 2004-03-26 US US10/545,427 patent/US7653540B2/en active Active
- 2004-03-26 KR KR1020057015569A patent/KR101009799B1/ko not_active Expired - Lifetime
- 2004-03-26 EP EP04723803A patent/EP1610300B1/en not_active Expired - Lifetime
- 2004-03-26 DE DE602004015753T patent/DE602004015753D1/de not_active Expired - Lifetime
- 2004-03-26 DE DE04723803T patent/DE04723803T1/de active Pending
- 2004-03-26 CN CNB2004800086632A patent/CN100570709C/zh not_active Expired - Lifetime
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2003019530A1 (en) * | 2001-08-31 | 2003-03-06 | Kenwood Corporation | Pitch waveform signal generation apparatus, pitch waveform signal generation method, and program |
Also Published As
| Publication number | Publication date |
|---|---|
| DE602004015753D1 (de) | 2008-09-25 |
| EP1610300A1 (en) | 2005-12-28 |
| US20060167690A1 (en) | 2006-07-27 |
| KR20050107763A (ko) | 2005-11-15 |
| DE04723803T1 (de) | 2006-07-13 |
| EP1610300B1 (en) | 2008-08-13 |
| CN100570709C (zh) | 2009-12-16 |
| US7653540B2 (en) | 2010-01-26 |
| WO2004088634A1 (ja) | 2004-10-14 |
| EP1610300A4 (en) | 2007-02-21 |
| JP2004294969A (ja) | 2004-10-21 |
| JP4256189B2 (ja) | 2009-04-22 |
| CN1768375A (zh) | 2006-05-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7630883B2 (en) | Apparatus and method for creating pitch wave signals and apparatus and method compressing, expanding and synthesizing speech signals using these pitch wave signals | |
| RU2144261C1 (ru) | Передающая система на принципах различного кодирования | |
| KR101393298B1 (ko) | 적응적 부호화/복호화 방법 및 장치 | |
| JP4170217B2 (ja) | ピッチ波形信号生成装置、ピッチ波形信号生成方法及びプログラム | |
| EP1876587A1 (en) | Pitch period equalizing apparatus, pitch period equalizing method, sound encoding apparatus, sound decoding apparatus, and sound encoding method | |
| JP4444296B2 (ja) | オーディオ符号化 | |
| KR101009799B1 (ko) | 음성 신호 압축 장치, 음성 신호 압축 방법 및 프로그램 | |
| EP1512952B1 (en) | Speech signal interpolation device, speech signal interpolation method, and program | |
| EP0772185A2 (en) | Speech decoding method and apparatus | |
| Robinson | Speech analysis | |
| JP4407305B2 (ja) | ピッチ波形信号分割装置、音声信号圧縮装置、音声合成装置、ピッチ波形信号分割方法、音声信号圧縮方法、音声合成方法、記録媒体及びプログラム | |
| JP2000132193A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
| JP3994332B2 (ja) | 音声信号圧縮装置、音声信号圧縮方法、及び、プログラム | |
| JP2003216172A (ja) | 音声信号加工装置、音声信号加工方法及びプログラム | |
| JP4736699B2 (ja) | 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム | |
| JP2796408B2 (ja) | 音声情報圧縮装置 | |
| JP2003108172A (ja) | 音声信号加工装置、音声信号加工方法及びプログラム | |
| JP3994333B2 (ja) | 音声辞書作成装置、音声辞書作成方法、及び、プログラム | |
| JP2535809B2 (ja) | 線形予測型音声分析合成装置 | |
| KR100196387B1 (ko) | 성분 분리를 통한 시간 영역상의 음성피치 변경방법 | |
| JP2000132195A (ja) | 信号符号化装置及び方法 | |
| JP2003216171A (ja) | 音声信号加工装置、信号復元装置、音声信号加工方法、信号復元方法及びプログラム | |
| EP0138954A1 (en) | LANGUAGE PATTERN PROCESSING USING LANGUAGE PATTERN RESTRICTION. |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0105 | International application |
Patent event date: 20050823 Patent event code: PA01051R01D Comment text: International Patent Application |
|
| PG1501 | Laying open of application | ||
| A201 | Request for examination | ||
| PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20081008 Comment text: Request for Examination of Application |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20100615 Patent event code: PE09021S01D |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20101220 |
|
| FPAY | Annual fee payment | ||
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20110113 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20110112 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration | ||
| PR1001 | Payment of annual fee |
Payment date: 20140401 Start annual number: 4 End annual number: 4 |
|
| FPAY | Annual fee payment |
Payment date: 20150209 Year of fee payment: 5 |
|
| PR1001 | Payment of annual fee |
Payment date: 20150209 Start annual number: 5 End annual number: 5 |
|
| FPAY | Annual fee payment |
Payment date: 20151217 Year of fee payment: 6 |
|
| PR1001 | Payment of annual fee |
Payment date: 20151217 Start annual number: 6 End annual number: 6 |
|
| FPAY | Annual fee payment |
Payment date: 20161220 Year of fee payment: 7 |
|
| PR1001 | Payment of annual fee |
Payment date: 20161220 Start annual number: 7 End annual number: 7 |
|
| FPAY | Annual fee payment |
Payment date: 20171219 Year of fee payment: 8 |
|
| PR1001 | Payment of annual fee |
Payment date: 20171219 Start annual number: 8 End annual number: 8 |
|
| FPAY | Annual fee payment |
Payment date: 20181226 Year of fee payment: 9 |
|
| PR1001 | Payment of annual fee |
Payment date: 20181226 Start annual number: 9 End annual number: 9 |
|
| FPAY | Annual fee payment |
Payment date: 20191217 Year of fee payment: 10 |
|
| PR1001 | Payment of annual fee |
Payment date: 20191217 Start annual number: 10 End annual number: 10 |
|
| PR1001 | Payment of annual fee |
Payment date: 20201216 Start annual number: 11 End annual number: 11 |
|
| PR1001 | Payment of annual fee |
Payment date: 20211215 Start annual number: 12 End annual number: 12 |
|
| PR1001 | Payment of annual fee |
Payment date: 20231227 Start annual number: 14 End annual number: 14 |
|
| PC1801 | Expiration of term |
Termination date: 20240926 Termination category: Expiration of duration |