JP4871501B2 - ベクトル変換装置及びベクトル変換方法 - Google Patents
ベクトル変換装置及びベクトル変換方法 Download PDFInfo
- Publication number
- JP4871501B2 JP4871501B2 JP2004321248A JP2004321248A JP4871501B2 JP 4871501 B2 JP4871501 B2 JP 4871501B2 JP 2004321248 A JP2004321248 A JP 2004321248A JP 2004321248 A JP2004321248 A JP 2004321248A JP 4871501 B2 JP4871501 B2 JP 4871501B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- code
- unit
- parameter
- codebook
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
(1)コア係数との差を符号化する場合
(2)コア係数を含めて予測VQで符号化する場合
(1)コア係数との差を符号化する場合
(2)コア係数を含めて予測VQで符号化する場合
303 コア符号器
305 コア復号器
307 拡張符号器
309 加算部
402 コア復号器
403 周波数調整部
404 拡張復号器
405 加算部
501 LPC分析部
502 適応符号帳
503 確率的符号帳
504 ゲイン調整部
505 LPC合成部
506 比較部
507 パラメータ符号化部
601 分析部
602、801 パラメータ変換部
603 量子化部
701 パラメータ復号化部
702 適応符号帳
703 確率的符号帳
704 ゲイン調整部
705 LPC合成部
802 逆量子化部
901 アップサンプリング処理部
902 ベクトル量子化部
903、905 符号帳
904 ベクトル逆量子化部
906 変換処理部
Claims (6)
- 入力ベクトルの量子化に用いる参照ベクトルを変換するベクトル変換装置であって、
ベクトル空間をクラスタリングすることにより求められた複数の第1コードベクトルを格納する第1符号帳と、
前記第1符号帳に格納された第1コードベクトルの中から参照ベクトルに対応するものの番号を取得するベクトル量子化手段と、
前記番号毎に、複数の学習用入力ベクトルに対応する複数の学習用参照ベクトルを統計処理して得られた第2コードベクトルを格納する第2符号帳と、
前記第2の符号帳に格納された第2コードベクトルの中から前記ベクトル量子化手段にて取得された番号に対応するものを取得するベクトル逆量子化手段と、
前記参照ベクトルを線形予測分析におけるαパラメータに変換し、前記αパラメータを漸化式を用いた変換により自己相関係数に変換し、前記自己相関係数をアップサンプリングすることにより、前記参照ベクトルを前記自己相関係数上でアップサンプリングするアップサンプリング処理手段と、
前記ベクトル逆量子化手段にて取得された第2コードベクトルと、前記自己相関係数上でアップサンプリングされた参照ベクトルとを加算して変換後の参照ベクトルを取得する変換処理手段と、
を具備するベクトル変換装置。 - 前記第2符号帳は、番号毎に前記学習用の入力ベクトルと前記学習用の参照ベクトルとの差分が最も小さくなるように統計処理して得られた差分ベクトルを第2コードベクトルとして格納する、
請求項1に記載のベクトル変換装置。 - 第2コードベクトルと、参照ベクトルとの重み付け加算して変換後の参照ベクトルを取得する請求項1又は請求項2に記載のベクトル変換装置。
- 統計処理は、平均である請求項1から請求項3のいずれかに記載のベクトル変換装置。
- 請求項1から請求項4のいずれかに記載のベクトル変換装置によって得られた変換後の参照ベクトルを用いて入力ベクトルを量子化する量子化装置。
- 入力ベクトルの量子化に用いる参照ベクトルを変換するベクトル変換方法であって、
ベクトル空間をクラスタリングすることにより求められた複数の第1コードベクトルを第1符号帳に格納する第1の格納工程と、
前記第1符号帳に格納された第1コードベクトルの中から参照ベクトルに対応するものの番号を取得するベクトル量子化工程と、
前記参照ベクトルを線形予測分析におけるαパラメータに変換し、前記αパラメータを漸化式を用いた変換により自己相関係数に変換し、前記自己相関係数をアップサンプリングすることにより、前記参照ベクトルを前記自己相関係数上でアップサンプリングするアップサンプリング工程と、
前記番号毎に、学習用入力ベクトルに対して複数の学習用参照ベクトルを統計処理して得られた第2コードベクトルを第2符号帳に格納する第2の格納工程と、
前記第2の符号帳に格納された第2コードベクトルの中から前記ベクトル量子化工程にて取得された番号に対応するものを取得するベクトル逆量子化工程と、
前記ベクトル逆量子化工程にて取得された第2コードベクトルと、前記自己相関係数上でアップサンプリングされた参照ベクトルとを加算して変換後の参照ベクトルを取得する変換処理工程と、を具備するベクトル変換方法。
Priority Applications (9)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004321248A JP4871501B2 (ja) | 2004-11-04 | 2004-11-04 | ベクトル変換装置及びベクトル変換方法 |
| US11/718,555 US7809558B2 (en) | 2004-11-04 | 2005-11-01 | Vector transformation apparatus and vector transformation method |
| BRPI0517778-2A BRPI0517778A (pt) | 2004-11-04 | 2005-11-01 | aparelho de transformação de vetor e método de transformação de vetor |
| KR1020077010121A KR20070083957A (ko) | 2004-11-04 | 2005-11-01 | 벡터 변환 장치 및 벡터 변환 방법 |
| RU2007116804/09A RU2007116804A (ru) | 2004-11-04 | 2005-11-01 | Устройство векторного преобразования и способ векторного преобразования |
| CN2005800380550A CN101057275B (zh) | 2004-11-04 | 2005-11-01 | 矢量变换装置以及矢量变换方法 |
| PCT/JP2005/020129 WO2006049179A1 (ja) | 2004-11-04 | 2005-11-01 | ベクトル変換装置及びベクトル変換方法 |
| CA002586251A CA2586251A1 (en) | 2004-11-04 | 2005-11-01 | Vector conversion device and vector conversion method |
| EP05805483.4A EP1796084B1 (en) | 2004-11-04 | 2005-11-01 | Apparatus and method for LPC vector transformation |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004321248A JP4871501B2 (ja) | 2004-11-04 | 2004-11-04 | ベクトル変換装置及びベクトル変換方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2006133423A JP2006133423A (ja) | 2006-05-25 |
| JP4871501B2 true JP4871501B2 (ja) | 2012-02-08 |
Family
ID=36319184
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004321248A Expired - Fee Related JP4871501B2 (ja) | 2004-11-04 | 2004-11-04 | ベクトル変換装置及びベクトル変換方法 |
Country Status (9)
| Country | Link |
|---|---|
| US (1) | US7809558B2 (ja) |
| EP (1) | EP1796084B1 (ja) |
| JP (1) | JP4871501B2 (ja) |
| KR (1) | KR20070083957A (ja) |
| CN (1) | CN101057275B (ja) |
| BR (1) | BRPI0517778A (ja) |
| CA (1) | CA2586251A1 (ja) |
| RU (1) | RU2007116804A (ja) |
| WO (1) | WO2006049179A1 (ja) |
Families Citing this family (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7610195B2 (en) | 2006-06-01 | 2009-10-27 | Nokia Corporation | Decoding of predictively coded data using buffer adaptation |
| JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
| CN101765880B (zh) * | 2007-07-27 | 2012-09-26 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
| EP2045800A1 (en) * | 2007-10-05 | 2009-04-08 | Nokia Siemens Networks Oy | Method and apparatus for transcoding |
| CA2729752C (en) * | 2008-07-10 | 2018-06-05 | Voiceage Corporation | Multi-reference lpc filter quantization and inverse quantization device and method |
| KR101261677B1 (ko) * | 2008-07-14 | 2013-05-06 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
| US20120203548A1 (en) * | 2009-10-20 | 2012-08-09 | Panasonic Corporation | Vector quantisation device and vector quantisation method |
| JP5746974B2 (ja) * | 2009-11-13 | 2015-07-08 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 符号化装置、復号装置およびこれらの方法 |
| PT3364411T (pt) * | 2009-12-14 | 2022-09-06 | Fraunhofer Ges Forschung | Dispositivo de quantização de vetor, dispositivo de codificação de voz, método de quantização de vetor e método de codificação de voz |
| ES2552179T3 (es) * | 2010-04-14 | 2015-11-26 | Voiceage Corporation | Libro de códigos de innovación combinado flexible y escalable para ser usado en codificador y decodificador CELP |
| US9082412B2 (en) * | 2010-06-11 | 2015-07-14 | Panasonic Intellectual Property Corporation Of America | Decoder, encoder, and methods thereof |
| US8924200B2 (en) * | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
| US8868432B2 (en) * | 2010-10-15 | 2014-10-21 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
| CN102783034B (zh) * | 2011-02-01 | 2014-12-17 | 华为技术有限公司 | 用于提供信号处理系数的方法和设备 |
| JP5817499B2 (ja) * | 2011-12-15 | 2015-11-18 | 富士通株式会社 | 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム |
| US9524720B2 (en) | 2013-12-15 | 2016-12-20 | Qualcomm Incorporated | Systems and methods of blind bandwidth extension |
| CN114171035B (zh) * | 2020-09-11 | 2024-10-15 | 海能达通信股份有限公司 | 抗干扰方法及装置 |
| CN115831105B (zh) * | 2022-11-04 | 2025-08-12 | 中山大学 | 基于改进Transformer模型的语音识别方法及装置 |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4926488A (en) * | 1987-07-09 | 1990-05-15 | International Business Machines Corporation | Normalization of speech by adaptive labelling |
| JP2779886B2 (ja) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
| JP3483958B2 (ja) * | 1994-10-28 | 2004-01-06 | 三菱電機株式会社 | 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 |
| US6889182B2 (en) * | 2001-01-12 | 2005-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Speech bandwidth extension |
| US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
| US7752052B2 (en) | 2002-04-26 | 2010-07-06 | Panasonic Corporation | Scalable coder and decoder performing amplitude flattening for error spectrum estimation |
| JP2003323199A (ja) | 2002-04-26 | 2003-11-14 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置及び符号化方法、復号化方法 |
-
2004
- 2004-11-04 JP JP2004321248A patent/JP4871501B2/ja not_active Expired - Fee Related
-
2005
- 2005-11-01 WO PCT/JP2005/020129 patent/WO2006049179A1/ja not_active Ceased
- 2005-11-01 RU RU2007116804/09A patent/RU2007116804A/ru not_active Application Discontinuation
- 2005-11-01 BR BRPI0517778-2A patent/BRPI0517778A/pt not_active Application Discontinuation
- 2005-11-01 CN CN2005800380550A patent/CN101057275B/zh not_active Expired - Fee Related
- 2005-11-01 CA CA002586251A patent/CA2586251A1/en not_active Abandoned
- 2005-11-01 EP EP05805483.4A patent/EP1796084B1/en not_active Expired - Lifetime
- 2005-11-01 US US11/718,555 patent/US7809558B2/en not_active Expired - Fee Related
- 2005-11-01 KR KR1020077010121A patent/KR20070083957A/ko not_active Withdrawn
Also Published As
| Publication number | Publication date |
|---|---|
| US20080126085A1 (en) | 2008-05-29 |
| WO2006049179A1 (ja) | 2006-05-11 |
| CN101057275A (zh) | 2007-10-17 |
| KR20070083957A (ko) | 2007-08-24 |
| CA2586251A1 (en) | 2006-05-11 |
| CN101057275B (zh) | 2011-06-15 |
| EP1796084A1 (en) | 2007-06-13 |
| EP1796084B1 (en) | 2014-06-04 |
| EP1796084A4 (en) | 2008-07-02 |
| RU2007116804A (ru) | 2008-11-20 |
| US7809558B2 (en) | 2010-10-05 |
| JP2006133423A (ja) | 2006-05-25 |
| BRPI0517778A (pt) | 2008-10-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4771674B2 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
| JP4871501B2 (ja) | ベクトル変換装置及びベクトル変換方法 | |
| US6829579B2 (en) | Transcoding method and system between CELP-based speech codes | |
| EP2041745B1 (en) | Adaptive encoding and decoding methods and apparatuses | |
| CN1890714B (zh) | 一种优化的复合编码方法 | |
| EP2200026B1 (en) | Encoding apparatus and encoding method | |
| JP2011503653A (ja) | スケーラブルなスピーチおよびオーディオコーデックにおける、量子化mdctスペクトルに対するコードブックインデックスのエンコーディング/デコーディングのための技術 | |
| JP2003044097A (ja) | 音声信号および音楽信号を符号化する方法 | |
| KR100503415B1 (ko) | 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법 | |
| US7599833B2 (en) | Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same | |
| JPWO2008053970A1 (ja) | 音声符号化装置、音声復号化装置、およびこれらの方法 | |
| WO2009125588A1 (ja) | 符号化装置および符号化方法 | |
| JPH0341500A (ja) | 低遅延低ビツトレート音声コーダ | |
| JPWO2000063878A1 (ja) | 音声符号化装置、音声処理装置及び音声処理方法 | |
| JPWO2008018464A1 (ja) | 音声符号化装置および音声符号化方法 | |
| JPH09127987A (ja) | 信号符号化方法及び装置 | |
| JPH09127998A (ja) | 信号量子化方法及び信号符号化装置 | |
| RU2807462C1 (ru) | Устройство квантования аудиоданных, устройство деквантования аудиоданных и соответствующие способы | |
| RU2809981C1 (ru) | Аудиодекодер, аудиокодер и связанные способы с использованием объединенного кодирования параметров масштабирования для каналов многоканального аудиосигнала | |
| Bakır | Compressing English Speech Data with Hybrid Methods without Data Loss | |
| WO2011074233A1 (ja) | ベクトル量子化装置、音声符号化装置、ベクトル量子化方法、及び音声符号化方法 | |
| Kálazi | Lossless Neural Coding for Multi-Channel Audio | |
| JP4293005B2 (ja) | 音声音楽信号の符号化装置および復号装置 | |
| JPH09127986A (ja) | 符号化信号の多重化方法及び信号符号化装置 | |
| HK1144851A (en) | Technique for encoding/decoding of codebook indices for quantized mdct spectrum in scalable speech and audio codecs |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071102 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101124 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110121 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110816 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111014 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111101 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111121 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4871501 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141125 Year of fee payment: 3 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |