JP5166425B2 - 音声信号中の遷移フレームの符号化のための方法およびデバイス - Google Patents
音声信号中の遷移フレームの符号化のための方法およびデバイス Download PDFInfo
- Publication number
- JP5166425B2 JP5166425B2 JP2009533622A JP2009533622A JP5166425B2 JP 5166425 B2 JP5166425 B2 JP 5166425B2 JP 2009533622 A JP2009533622 A JP 2009533622A JP 2009533622 A JP2009533622 A JP 2009533622A JP 5166425 B2 JP5166425 B2 JP 5166425B2
- Authority
- JP
- Japan
- Prior art keywords
- transition
- codebook
- frame
- transition mode
- glottal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
1)音声活動がないことによって特徴づけられる不活性フレーム
2)非周期的構造およびより高い周波数に向かうエネルギー集中によって特徴づけられる無声の音声フレーム
3)エネルギーが主に低周波数に集中して、はっきりした疑似周期的性質を有する有声の音声フレーム
4)急速に変化する特性を有する遷移として分類される他のあらゆるフレーム
音声コーデックは、エンコーダおよびデコーダの2つの基本部からなる。エンコーダはオーディオ信号をデジタル化し、音声信号を表す符号化パラメータの限定された数を選択して、これらのパラメータを、通信チャネルを介してデコーダに転送されるデジタルビットストリームに変換する。デコーダは、この音声信号を元の音声信号にできるだけ似るように復元する。現在、広く普及した音声符号化技法は線形予測(LP)に基づくものであり、より詳細にはCELP技術に基づく。LPベースの符号化では、音声信号は、全極型合成フィルタ1/A(z)によって励振信号をフィルタリングすることにより合成される。CELPでは、励振は一般に2つの部分からなり、第1段階の励振信号は適応コードブックから選択され、第2段階の励振信号は固定コードブックから選択される。一般に、適応コードブック励振は励振の周期的部分をモデル化し、また、音声信号の変遷をモデル化するために固定コードブック励振が付加される。
遅延(ピッチ周期)tおよびピッチ利得gpを求め、かつ適応コードベクトルv(n)と称される励振信号の疑似周期的部分を構築するために、重み付き音声領域でCELPベースのコーデックにおける適応コードブック検索が行われる。ピッチ周期は特定の話者に強く依存し、その正確な測定は合成音声の質に決定的な影響を及ぼす。
y1(n)=v(n)*h(n) (3)
CELPベースのコーデックにおける固定(革新)コードブック(FCB)検索の寄与の目的は、適応コードブックを用いた後の残余誤差(すなわち次式で表される)を最小化することであり、
x2(n)=x1(n)-gpy1(n) (6)
EV-VBRコーデックにおけるフレーム分類は、非特許文献3に説明されるような可変レート多重モード広帯域(VMR-WB)分類に基づく。VMR-WB分類は隠蔽および回復の方策の配慮とともになされる。換言すれば、いかなるフレームも、後続のフレームが失われていたなら隠蔽が最適になり得るように、あるいは前フレームが失われていたなら回復が最適になり得るように分類される。フレーム消去隠蔽処理に用いられたクラスのうちのいくつかは、それらをデコーダで曖昧さなしに推定することができるので転送する必要はない。5つの別個のクラスが用いられ、以下のように定義される。
正規化相関
ピッチ安定性カウンタpc
現行フレームの終端部での音声信号の相対的フレームエネルギーErel
ゼロ交差カウンタzc
以下の詳細な分析で見られるように、これらのパラメータの計算はルックアヘッドを用いる。ルックアヘッドによって後続のフレーム中の音声信号の変遷を推定することが可能になり、その結果、将来の音声信号の挙動を考慮に入れることにより分類を行うことができる。
e't=10log(etilt(0)/etilt(1)) (9)
pc=|Top1-Top0|+|Top2-Top0| (10)
ps=kppx+cp (0≦ps≦1によって制限される) (11)
If (local_VAD=0) OR (Erel<-8) then class=UNVOICED (13)
ここでlocal_VADは、ローカルの有声活動検出を表す。
今まで論じられたように、説明されている技法は、CELPベースのコーダにおける適応コードブックを声門形状のコードブックで置き換えてフレーム消去に対する頑強性を改善し、かつ非定常音声フレームを処理するときの符号化効率を向上する。これは、この技法が過去の励振を用いて第1段階の励振信号を構築するのでなく、声門形状のコードブックから第1段階の励振信号を選択することを意味する。第2段階の励振信号(全体の励振の革新部分)は、依然として従来のCELP固定コードブックから選択される。これらのコードブックのうちいかなるものも、過去の(以前に転送された)音声フレームからの情報を用いることなく、それによってCELPベースのエンコーダに固有のフレームエラー伝播に関する主要な理由を解消する。
前の節では、TM符号化技法を用いる符号化向けにフレームを選択する理由およびメカニズムを説明した。次に、所与のビットレートでのクリーンチャネル性能とTMフレームに先行するフレームに消去がある状況での性能との最善の兼ね合いを実現するためには、すべてのサブフレームでは声門形状のコードブックを用いない方が、一般により高効率であることを示す。まず、声門形状のコードブック検索は、フレームの最初のピッチ周期でのみ重要である。後続するピッチ周期は、もはや過去のフレームの励振を用いない(適応コードブックが検索されるとき、励振は過去の約1つのピッチ周期まで検索される)ので、より効率的な標準的適応コードブック検索を用いて符号化することができる。その結果、フレームの最初のピッチ周期の部分を含まないサブフレームで声門形状のコードブック検索を用いる理由はない。
原理的には、声門形状のコードブックは、特定の位置に配置された声門インパルスの量子化され正規化された形状からなる。したがって、コードブック検索は、最善の形状の選択および特定のサブフレーム中にその最善の位置を求めることの両方にある。その最も簡単な形式では、声門インパルス形状は単位インパルスによって表すことができ、量子化する必要はない。その場合、サブフレーム中の単位インパルスの位置だけが求められる。しかし、そのような簡単なコードブックの性能は非常に制限されている。
声門形状のコードブックの実現は、いくつかのやり方で行うことができる。例えば検索は、CELPにおける固定コードブック検索と同様に行うことができる。この場合、コードブックは、サブフレーム中のあらゆる可能な位置に声門インパルス形状の中心を配置することにより構築される。例えば、64サンプルのサブフレーム長および8つの声門インパルス形状については、64×8=512のサイズの声門形状のコードブックのコードベクトルが得られる。別の例によれば、適応コードブック検索と同様に、コードブックのエントリは、過去の励振中のすべての可能な位置に次々と配置することができ、適応コードブック検索で用いられたのと同様のやり方で最善の形状/位置の組合せを選択することができる。後者の実現では、すべてのピッチ周期の繰返しは、長期のCELPフィルタによって自動的に行われ、声門インパルスは(後に論じるように境界では声門形状の切捨てが必要な第1の実現とは対照的に)フルサイズの形状で表される。
z1(0)=g(-1)h(0)
z1(n)=z0(n-1)+g(-1)h(n) for n=1、・・・、N-1 (20)
zk'(0)=g(-k')h(0)
zk'(n)=zk'-1(n-1)+g(-k')h(n) for n=1、・・・、N-1 (21)
zk'(0)=0
zk'(n)=zk'-1(n-1) for n=1、・・・、N-1 (24)
kmin=k'-Δ
kmax=k'+Δ (30)
音声信号のピッチ周期がサブフレーム長より短い状況があり、この場合、サブフレームが複数の声門インパルスを含むことがある(特に構成TRANSITION_1_1において)。この場合、声門インパルスをすべてモデル化する必要がある。この非限定的な例示の実施形態では、ピッチ周期の長さの制限およびサブフレーム長が与えられると、サブフレームは2つを上回る声門インパルスを含むことができない。
非限定的な例示の実施形態によるTM符号化技法が、EV-VBRコーデックで実施されている。EV-VBRは、12.8kHzの内部サンプリング周波数および20ミリ秒のフレーム長を用いる。各フレームはN=64サンプルの4つのサブフレームに分割される。EV-VBR分類プロシージャは、TM符号化技法を用いて符号化されるべきフレームを選択するように適合されている。この実装形態では、声門形状のコードブックの寄与の利得は、図16に示されるように2ステップで量子化され、ここでG(z)は成形フィルタであり、k'は声門形状の中心の位置であり、gmはTM利得(すなわち声門形状コードベクトルの概算で量子化されたエネルギー)である。TM利得gmは、式(4)を用いてピッチ利得と同じやり方で見つかるが、ピッチ利得との違いはTM利得が制限されないことだけである。次いで、TM利得は3ビットのスカラ量子化器によって量子化され、符号用の1ビットが用いられる。次いで、この利得gmを用いて声門形状のコードベクトルをスケーリングする。フィルタリングされた励振信号に対する両方の寄与(第1段階の寄与信号および第2段階の寄与信号、すなわちフィルタリングされた声門形状のコードブックの寄与およびフィルタリングされた代数コードブックの寄与)が見つかった後、標準的なEV-VBR利得ベクトル量子化(VQ)を用いて、第1段階の励振信号の利得を、第2段階の励振信号の利得量子化と一緒にさらに調節する。このように、一般的な符号化モードまたは有声の符号化モード向けに設計されたEV-VBRの利得量子化コードブックをTM符号化でも用いることができる。もちろん、他の様々な方法を用いて利得量子化を行うことは本発明の範囲内である。
この節では、EV-VBRコーデックの実装形態におけるTM符号化技法の性能のいくつかの例が提示される。図17に、クリーンチャネル状態に関してTM符号化技法の影響の一例が示されている。図17aは入力音声信号を示し、図17bはLP残余信号を示し、図17cは第1段階の励振信号を示すが、ここでは最初の3フレームでTM符号化技法を用いる。予期されたように、残余信号と第1段階の励振信号の間の差は、各フレームの先頭でより顕著である。フレームの終端に向かって、標準的な適応コードブック検索が用いられるので、第1段階の励振信号は、よりぴったりと残余信号に一致する。
TM符号化技法はITU-T標準化のためのEV-VBRコーデック候補で実施された。以下の表9は、本明細書で上記に紹介された元の一般的なモードおよびすべてのTM符号化モード構成のビット割付け表を示す。これらの構成はEV-VBRコーデックで用いられる。
EV-VBRコーデックで用いられる一般的な符号化モードでは、すべてのサブフレームについてピッチ周期T0の値を転送する。第1および第3のサブフレームでは8ビットの符号化を用い、一方、ピッチ周期値は、分数(範囲[Tmin, 91・1/2]のT0については1/2)または整数(範囲[92, Tmax]のT0について)の分解能で伝達する。第2および第4のサブフレームではデルタ検索を用い、また、常に分数の分解能を有するピッチ周期値は5ビットで符号化する。デルタ検索は、範囲[T0p-8, T0p+7・1/2]での検索を意味し、ここでT0pは前の(第1または第3の)サブフレームの分数のピッチ周期に最も近い整数である。ピッチ周期の値は、EV-VBRコーデックでは範囲[Tmin, Tmax]内の値に制限されており、ここでTmin=34かつTmax=231である。
この構成では、1つまたは2つの最初の声門インパルスが、声門形状のコードブック検索を用いて処理される第1のサブフレームに現われる。これは、第1のサブフレーム中のピッチ周期値がサブフレーム長未満の最大値を有し得る(すなわちTmin<T0<Nである)ことを意味する。整数の分解能でピッチ周期値を5ビットで符号化することができる。次のサブフレーム中のピッチ周期は、分数の分解能で5ビットのデルタ検索を用いて見つかる。これはTM符号化技法の最もビットを必要とする構成であり、すなわち声門形状のコードブックが第1のサブフレームで用いられ、また、第1のサブフレームの一部でフィルタQ(z)を求めるかまたは適応コードブック検索を行うためにピッチ周期T0が転送されるときである。この構成は、第1のサブフレームでは前述のプロシージャを用いる。第1のサブフレームに1つの声門インパルスだけが現われるときにも、EV-VBRコーデックでこの構成を用いる。ここで、ピッチ周期T0はT0<Nという関係を保ち、T0は、固定コードブック検索での周期性向上に用いられる(非特許文献1)。
構成TRANSITION_1_2を用いるとき、声門形状のコードブック検索を用いて第1のサブフレームを処理する。ピッチ周期は不要であり、適応コードブック検索を用いて後続するすべてのサブフレームを処理する。第2のサブフレームが第2の声門インパルスを含むことが既知であるため、ピッチ周期の最大値はT0≦2・N-1という関係を保つ。この最大値は、声門インパルスの位置k'についての知識の恩恵でさらに減少させることができる。次いで、全範囲で、分数の分解能で7ビットを用いて、第2のサブフレーム中のピッチ周期値を符号化する。第3および第4のサブフレームでは、5ビットを用いるデルタ検索を分数の分解能で用いる。
構成TRANSITION_1_3を用いるとき、再び声門形状のコードブック検索を用いて、ピッチ周期を用いずに第1のサブフレームを処理する。LP残余信号の第2のサブフレームが声門インパルスを含まず、適応検索が役立たないので、第2のサブフレームでは第1段階の励振信号をゼロで置き換える。第2のサブフレームでは適応コードブックパラメータ(T0およびgp)を転送せず、第3のサブフレームではFCBのサイズを増加するために保存されたビットを用いる。第2のサブフレームが含む有益情報が最小限であるため12ビットしかないFCBを用い、第4のサブフレームでは20ビットのFCBを用いる。第3のサブフレーム中の第1段階の励振信号は、ピッチ周期の最大値(3・N-1-k')および最小値(2・N-k')を有する適応コードブック検索を用いて構築し、したがって、すべての範囲にわたって分数の分解能を有するピッチ周期の7ビット符号化だけを用いる。第4のサブフレームは、再びピッチ周期値の5ビットのデルタ検索符号化で適応検索を用いて処理する。第2のサブフレームでは、固定コードブック利得gcだけを転送する。したがって、利得の量子化には、従来のACELP符号化を用いるサブフレームで用いられる5ビット(すなわち利得gpおよびgcを転送するとき)の量子化器の代わりに、2ビットまたは3ビットしか必要でない。このことは、以下のすべての構成にも有効である。フレームで利用可能なビット数に合わせるために、利得量子化器が2ビットまたは3ビットを用いるべきか否かが判断される。
構成TRANSITION_1_4を用いるとき、声門形状のコードブック検索を用いて第1のサブフレームを処理する。再び、ピッチ周期を転送する必要はない。しかし、LP残余信号が第2および第3のサブフレームに声門インパルスを含まないので、これら2つのサブフレームには適応コードブック検索が役立たない。再び、これらのサブフレーム中の第1段階の励振信号をゼロで置き換え、すべてのサブフレームが利益を受けかつ20ビットのFCBを用いることができるように、FCBのサイズを増加するために保存されたビットを用いる。ピッチ周期値は第4のサブフレームでのみ転送され、その最小値は(3・N-k')である。ピッチ周期の最大値はTmaxによって制限される。第2の声門インパルスが第4のサブフレームに現われるか否かということは問題ではない(k'+Tmax≧Nであれば、第2の声門インパルスは次のフレーム中に存在し得る)。ピッチ周期の絶対値は、デコーダにおいてフレーム隠蔽のために用いられるので、ピッチ周期のこの絶対値は、第2の声門インパルスが次のフレームに現われる状況のとき転送される。TMフレームm+1に先行するフレームmが欠けているとき、フレームmで合成信号の欠けている部分を首尾よく復元するのに、フレームm-1とm+1からのピッチ周期値についての正確な知識が役立つ。
第1の声門インパルスが第2のサブフレームに現われ、TM符号化技法を用いて有声オンセットフレームの後のフレームだけを符号化する(すなわち、有声オンセットフレームは従来の一般的な符号化を用いて符号化する)とき、第3および第4のサブフレームでのみピッチ周期を転送する。この場合、第1のサブフレームでは、固定コードブックパラメータだけを転送する。図24に示されたフレームは、有声オンセットフレームでTMを用いないときこの構成を想定する。有声オンセットフレームでもTMを用いるなら、構成TRANSITION_2aを用い、この構成では、前述のプロシージャを用いるために第2のサブフレームでピッチ周期T0を転送する。
第1の声門インパルスが第3のサブフレームに現われ、TM符号化技法を用いて有声オンセットフレームの後のフレームだけを符号化する(すなわち、有声オンセットフレームは従来の一般的な符号化を用いて符号化する)とき、第4のサブフレームでのみピッチ周期を転送する。この場合、第1および第2のサブフレームでは固定コードブックパラメータだけを転送する。ピッチ周期は、ビットストリーム中の第3のサブフレーム向けに依然として転送される。しかし、有声オンセットフレームを符号化するのにTM符号化技法を用いないなら、ピッチ周期は役に立たない。この値が有効なのは、TM符号化技法を用いて有声オンセットフレームを符号化するときだけである。
第1の声門インパルスが第4のサブフレームに現われ、TM符号化技法を用いて有声オンセットフレームの後のフレームだけを符号化する(すなわち、有声オンセットフレームは従来の一般的な符号化を用いて符号化する)とき、このサブフレームではピッチ周期値情報を用いない。しかし、デコーダでのフレーム隠蔽ではピッチ周期値を用いる(TMフレームに先行するフレームが欠けているとき、欠けているフレームの再構成にこの値を用いる)。したがって、第4のサブフレームでのみピッチ値を転送し、第1、第2および第3のサブフレームでは固定コードブックパラメータのみを転送する(ピッチ利得gpは必要でない)。保存されたビットによって、すべてのサブフレームで20ビットのFCBを用いることが可能になる。
902 A/Dコンバータ
903 音声エンコーダ
904 チャネルエンコーダ
905 通信チャネル
906 チャネルデコーダ
907 音声デコーダ
908 D/Aコンバータ
909 スピーカユニット
Claims (86)
- 音響信号中の遷移フレームおよび/または遷移に後続する少なくとも1つのフレームでの適応コードブック励振を置き換える遷移モード励振を生成するための予測型の音響信号コーデックで用いられる遷移モードデバイスであって、
コードブックのインデックスを受け取る入力端と、
過去の励振から独立した1組のコードベクトルを発生するための遷移モードのコードブックと
を備え、前記遷移モードのコードブックは、前記遷移フレームおよび/または前記遷移に後続する少なくとも1つのフレーム中に前記遷移モード励振に対応する前記組の前記コードベクトルのうち1つを発生するための前記コードブックのインデックスに応答し、
前記遷移モードのコードブックが声門インパルス形状のコードブックを備える遷移モードデバイス。 - 前記予測型の音響信号コーデックがデコーダを備え、それによって、作動中、前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームの中で、前記適応コードブック励振を前記遷移モード励振で置き換えることが、フレーム消去の場合に前記デコーダでのエラー伝播を低減し、かつ/または、符号化効率を向上する請求項1に記載の遷移モードデバイス。
- 前記音響信号が音声信号を含み、前記遷移フレームが、有声オンセットを含むフレームと2つの有声音の間の遷移を含むフレームからなるグループから選択される請求項1に記載の遷移モードデバイス。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームが、一連のいくつかのフレームが後続する遷移フレームを備える請求項1に記載の遷移モードデバイス。
- 前記遷移フレームおよび前記遷移フレームに後続する前記一連のいくつかのフレームが、連続したフレームである請求項4に記載の遷移モードデバイス。
- 前記予測型コーデックがCELP型コーデックであり、前記遷移モードのコードブックが、前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームの中で前記CELP型コーデックの適応コードブックに取って代わる請求項1に記載の遷移モードデバイス。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備え、前記遷移モードのコードブックが前記サブフレームの第1の部分で用いられ、前記予測型コーデックの予測型コードブックが前記サブフレームの第2の部分で用いられる請求項1に記載の遷移モードデバイス。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備え、前記遷移モードのコードブックが現在のフレームの第1の声門インパルスを含むサブフレームのみで用いられる請求項1に記載の遷移モードデバイス。
- 前記遷移モードのコードブックを用いるサブフレームに先行する少なくとも1つのサブフレームにおいて、革新コードブックコンポーネントを排他的に備える励振信号を発生する手段を備える請求項8に記載の遷移モードデバイス。
- 前記声門インパルス形状のコードブックが、前記コードベクトルの各位置に中心がある声門インパルス形状に対応するコードベクトルを備える請求項1に記載の遷移モードデバイス。
- 前記声門インパルス形状のコードブックが、所定数の声門インパルスの形状を含み、声門インパルスの各形状が、前記コードベクトルの複数の位置に配置されて前記声門インパルス形状のコードブックの複数のコードベクトルを形成する請求項1に記載の遷移モードデバイス。
- 前記声門インパルス形状のコードブックが、非ゼロ要素を1つだけ含むコードベクトルの発生器および非ゼロ要素を1つだけ含む前記コードベクトルを処理するための成形フィルタを備えて、各位置に中心がある声門インパルス形状を表すコードベクトルを生成する請求項1に記載の遷移モードデバイス。
- 前記予測型の音響信号コーデックが、各位置に中心がある声門インパルス形状を表す、前記成形フィルタからの前記コードベクトルを処理するための重み付き合成フィルタを備えたエンコーダを備える請求項12に記載の遷移モードデバイス。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備え、前記声門インパルス形状のコードブックが、1つのサブフレームにつき複数の声門インパルスがあるときピッチ周期が経過した後に前記声門インパルス形状を繰り返すために、前記成形フィルタの下流に配置された反復フィルタをさらに備える請求項12に記載の遷移モードデバイス。
- 前記声門インパルス形状が、最初と最後のサンプルを含み、前記最初と最後のサンプルの所定数が切り詰められる請求項10に記載の遷移モードデバイス。
- 各位置に中心がある声門インパルス形状を表す前記コードベクトルに利得を適用するための増幅器をさらに備える請求項12に記載の遷移モードデバイス。
- 音響信号中の遷移フレームおよび/または遷移に後続する少なくとも1つのフレームでの適応コードブック励振を置き換える遷移モード励振を発生するためのエンコーダデバイスであって、
コードブック検索の目標信号の発生器と、
過去の励振から独立した1組のコードベクトルを発生するための遷移モードのコードブックと、
前記コードブック検索の目標信号に対応する前記遷移モード励振に対応する前記組の前記コードベクトルを見つけるための前記遷移モードのコードブックの検索器と
を備え、前記組の前記コードベクトルのそれぞれは、それぞれの遷移モード励振に対応し、前記遷移モードのコードブックが声門インパルス形状のコードブックを備えるエンコーダデバイス。 - 前記検索器が、前記声門インパルス形状のコードブックのすべての声門インパルス形状に対して検索の基準を適用して、前記基準の最大値に対応する前記組の前記コードベクトルを、前記コードブック検索の目標信号に最適に対応する前記コードベクトルとして見つける請求項17に記載のエンコーダデバイス。
- 前記検索器が、遷移モードの構成の識別と、声門インパルス形状と、前記見つかったコードベクトル中の前記声門インパルス形状の中心の位置と、遷移モード利得と、前記遷移モード利得の符号と、閉ループピッチ周期とからなるグループから選択された遷移モードパラメータによって前記見つかったコードベクトルを識別する請求項18に記載のエンコーダデバイス。
- 前記音響信号が音声信号を含み、前記遷移フレームが、有声オンセットを含むフレームと2つの有声音の間の遷移を含むフレームからなるグループから選択される請求項17に記載のエンコーダデバイス。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームが、一連のいくつかのフレームが後続する遷移フレームを備える請求項17に記載のエンコーダデバイス。
- 前記遷移フレームおよび前記遷移フレームに後続する前記一連のいくつかのフレームが、連続したフレームである請求項21に記載のエンコーダデバイス。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備え、前記検索器が、前記サブフレームの第1の部分で前記遷移モードのコードブックを検索し、前記サブフレームの第2の部分で前記エンコーダデバイスの予測型コードブックを検索する請求項17に記載のエンコーダデバイス。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備え、前記遷移モードのコードブックが現在のフレームの第1の声門インパルスを含むサブフレームのみで用いられる請求項18に記載のエンコーダデバイス。
- 前記遷移モードのコードブックを用いるサブフレームに先行する少なくとも1つのサブフレームにおいて、革新コードブックコンポーネントを排他的に備える励振信号を発生する手段を備える請求項24に記載のエンコーダデバイス。
- 前記声門インパルス形状のコードブックが、前記コードベクトルの各位置に中心がある声門インパルス形状に対応するコードベクトルを備える請求項17に記載のエンコーダデバイス。
- 前記声門インパルス形状のコードブックが、所定数の声門インパルスの形状を含み、声門インパルスの各形状が、前記コードベクトルの複数の位置に配置されて前記声門インパルス形状のコードブックの複数のコードベクトルを形成する請求項26に記載のエンコーダデバイス。
- 前記声門インパルス形状のコードブックが、非ゼロ要素を1つだけ含むコードベクトルの発生器および非ゼロ要素を1つだけ含む前記コードベクトルを処理するための成形フィルタを備えて、各位置に中心がある声門インパルス形状を表すコードベクトルを生成する請求項26に記載のエンコーダデバイス。
- 各位置に中心がある声門インパルス形状を表す、前記成形フィルタからの前記コードベクトルを処理するための重み付き合成フィルタを備える請求項28に記載のエンコーダデバイス。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備え、前記声門インパルス形状のコードブックが、1つのサブフレームにつき複数の声門インパルスがあるときピッチ周期が経過した後に前記声門インパルス形状を繰り返すために、前記成形フィルタの下流に配置された反復フィルタをさらに備える請求項28に記載のエンコーダデバイス。
- 前記声門インパルス形状が、最初と最後のサンプルを含み、前記最初と最後のサンプルの所定数が切り詰められる請求項26に記載のエンコーダデバイス。
- 各位置に中心がある声門インパルス形状を表す前記コードベクトルに利得を適用するための増幅器をさらに備える請求項29に記載のエンコーダデバイス。
- 革新コードブック検索の目標信号の発生器と、
それぞれが、それぞれの革新励振に対応する1組の革新コードベクトルを発生するための革新コードブックと、
前記革新コードブック検索の目標信号に対応する革新励振に対応する前記組の前記革新コードベクトルを見つけるための前記革新コードブックの検索器と、
音響信号合成フィルタ向けの励振を生成するための、前記遷移モード励振と前記革新励振の加算器とをさらに備える請求項17に記載のエンコーダデバイス。 - 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備え、1つまたは複数の声門インパルスが前記サブフレーム中のどこに配置されているかに応じて、前記エンコーダデバイスが、前記遷移モードのコードブック、適応コードブックおよび前記革新コードブックの少なくとも1つを用いて前記サブフレームを符号化するための手段を備える請求項33に記載のエンコーダデバイス。
- 音響信号中の遷移フレームおよび/または遷移に後続する少なくとも1つのフレームでの適応コードブック励振を置き換える遷移モード励振を発生するためのデコーダデバイスであって、
コードブックのインデックスを受け取る入力端と、
過去の励振から独立した1組のコードベクトルを発生するための遷移モードのコードブックと
を備え、前記遷移モードのコードブックは、前記遷移フレームおよび/または前記遷移に後続する少なくとも1つのフレーム中に前記遷移モード励振に対応する前記組の前記コードベクトルのうち1つを発生するための前記コードブックのインデックスに応答し、前記遷移モードのコードブックが声門インパルス形状のコードブックを備えるデコーダデバイス。 - 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームの中で、前記適応コードブック励振を前記遷移モード励振で置き換えることが、フレーム消去の場合に前記デコーダデバイスにおけるエラー伝播を低減し、かつ/または、符号化効率を改善する請求項35に記載のデコーダデバイス。
- 前記音響信号が音声信号を含み、前記遷移フレームが、有声オンセットを含むフレームと2つの有声音の間の遷移を含むフレームからなるグループから選択される請求項35に記載のデコーダデバイス。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備え、前記遷移モードのコードブックが前記サブフレームの第1の部分で用いられるデコーダデバイスであって、前記サブフレームの第2の部分で用いられる予測型コードブックを備える請求項35に記載のデコーダデバイス。
- 前記声門インパルス形状のコードブックが、前記コードベクトルの各位置に中心がある声門インパルス形状に対応するコードベクトルを備える請求項35に記載のデコーダデバイス。
- 前記声門インパルス形状のコードブックが、所定数の声門インパルスの形状を含み、声門インパルスの各形状が、前記コードベクトルの複数の位置に配置されて前記声門インパルス形状のコードブックの複数のコードベクトルを形成する請求項39に記載のデコーダデバイス。
- 前記声門インパルス形状のコードブックが、非ゼロ要素を1つだけ含むコードベクトルの発生器および非ゼロ要素を1つだけ含む前記コードベクトルを処理するための成形フィルタを備えて、各位置に中心がある声門インパルス形状を表すコードベクトルを生成する請求項39に記載のデコーダデバイス。
- 各位置に中心がある声門インパルス形状を表す前記コードベクトルに利得を適用するための増幅器をさらに備える請求項41に記載のデコーダデバイス。
- 革新コードブックのインデックスを受け取る入力端と、
1組の革新コードベクトルを発生するための革新コードブックと、
音響信号合成フィルタ向けの励振を生成するための、前記遷移モード励振と前記革新励振の加算器とをさらに備え、
前記革新コードブックは、前記遷移フレームおよび/または前記遷移に後続する少なくとも1つのフレーム中に、革新励振に対応する前記組の前記革新コードベクトルのうち1つを発生するための前記革新コードブックのインデックスに応答する請求項35に記載のデコーダデバイス。 - 音響信号中の遷移フレームおよび/または遷移に後続する少なくとも1つのフレームでの適応コードブック励振を置き換える遷移モード励振を生成するための予測型の音響信号コーデックで用いられる遷移モードの方法であって、
過去の励振から独立した1組のコードベクトルを発生するための遷移モードのコードブックをもたらすステップと、
前記遷移モードのコードブックにコードブックのインデックスを供給するステップと、
前記遷移モードのコードブックを用いて、前記コードブックのインデックスに応じて、前記遷移モード励振に対応する前記組の前記コードベクトルのうちの1つを発生するステップとを含み、前記遷移モードのコードブックが声門インパルス形状のコードブックを備える遷移モードの方法。 - 前記予測型の音響信号コーデックがデコーダを備え、それによって、作動中、前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームの中で、前記適応コードブック励振を前記遷移モード励振で置き換えることが、フレーム消去の場合に前記デコーダでのエラー伝播を低減し、かつ/または、符号化効率を向上する請求項44に記載の遷移モードの方法。
- 前記音響信号が音声信号を含む遷移モードの方法であって、有声オンセットを含むフレームと2つの有声音の間の遷移を含むフレームからなるグループから前記遷移フレームを選択するステップを含む請求項44に記載の遷移モードの方法。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームが、一連のいくつかのフレームが後続する遷移フレームを備える請求項44に記載の遷移モードの方法。
- 前記遷移フレームおよび前記遷移フレームに後続する前記一連のいくつかのフレームが、連続したフレームである請求項47に記載の遷移モードの方法。
- 前記予測型コーデックがCELP型コーデックである遷移モードの方法であって、前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームの中で前記CELP型コーデックの適応コードブックを前記遷移モードのコードブックで置き換えるステップを含む請求項44に記載の遷移モードの方法。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備える遷移モードの方法であって、前記サブフレームの第1の部分で前記遷移モードのコードブックを用い、かつ前記サブフレームの第2の部分で前記予測型コーデックの予測型コードブックを用いるステップを含む請求項44に記載の遷移モードの方法。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備え、前記方法が、現在のフレームの第1の声門インパルスを含むサブフレームにおいて前記遷移モードのコードブックを用いるステップを含む請求項44に記載の遷移モードの方法。
- 前記遷移モードのコードブックを用いるサブフレームに先行する少なくとも1つのサブフレームにおいて、革新コードブックコンポーネントを排他的に備える励振信号を発生するステップを備える請求項51に記載の遷移モードの方法。
- 前記声門インパルス形状のコードブックが、前記コードベクトルの各位置に中心がある声門インパルス形状に対応するコードベクトルを備える請求項44に記載の遷移モードの方法。
- 前記声門インパルス形状のコードブックが、所定数の声門インパルスの形状を含み、前記遷移モードの方法は、前記コードベクトル中の複数の位置に声門インパルスの各形状を配置することにより、前記声門インパルス形状のコードブックの中に複数のコードベクトルを形成するステップを含む請求項53に記載の遷移モードの方法。
- 前記声門インパルス形状のコードブックの中に、非ゼロ要素を1つだけ含むコードベクトルを発生するステップと、成形フィルタによって非ゼロ要素を1つだけ含む前記コードベクトルを処理して各位置に中心がある声門インパルス形状を表すコードベクトルを生成するステップとを含む請求項53に記載の遷移モードの方法。
- 前記予測型の音響信号コーデックが重み付き合成フィルタを備えるエンコーダを備え、前記方法が、前記重み付き合成フィルタによって、各位置に中心がある声門インパルス形状を表す、前記成形フィルタからの前記コードベクトルを処理するステップをさらに含む請求項55に記載の遷移モードの方法。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備え、前記コードベクトルのうちの1つを発生するステップが、1つのサブフレームにつき複数の声門インパルスがあるとき、ピッチ周期が経過した後に前記声門インパルス形状を繰り返すステップを含む請求項55に記載の遷移モードの方法。
- 前記声門インパルス形状のインパルスが最初と最後のサンプルを含む遷移モードの方法であって、前記最初と最後のサンプルの所定数を切り詰めるステップを含む請求項53に記載の遷移モードの方法。
- 各位置に中心がある声門インパルス形状を表す前記コードベクトルに利得を適用するステップをさらに含む請求項55に記載の遷移モードの方法。
- 音響信号中の遷移フレームおよび/または遷移に後続する少なくとも1つのフレームでの適応コードブック励振を置き換える遷移モード励振を発生するための符号化の方法であって、
コードブック検索の目標信号を発生するステップと、
過去の励振から独立した1組のコードベクトルを発生するための遷移モードのコードブックをもたらすステップと、
前記コードブック検索の目標信号に対応する遷移モード励振に対応する前記組の前記コードベクトルを見つけるために前記遷移モードのコードブックを検索するステップと
を含み、前記組の前記コードベクトルは、それぞれの遷移モード励振にそれぞれ対応し、前記遷移モードのコードブックが声門インパルス形状のコードブックを備える符号化の方法。 - 前記遷移モードのコードブックを検索するステップが、前記声門インパルス形状のコードブックのすべての声門インパルス形状に対して検索の基準を適用するステップと、前記基準の最大値に対応する前記組の前記コードベクトルを、前記コードブック検索の目標信号に対応する前記コードベクトルとして見つけるステップとを含む請求項60に記載の符号化の方法。
- 前記遷移モードのコードブックを検索するステップが、遷移モードの構成の識別と、声門インパルス形状と、前記見つかったコードベクトル中の前記声門インパルス形状の中心の位置と、遷移モード利得と、前記遷移モード利得の符号と、閉ループピッチ周期とからなるグループから選択された遷移モードパラメータによって前記見つかったコードベクトルを識別するステップを含む請求項61に記載の符号化の方法。
- 前記音響信号が音声信号を含む符号化の方法であって、有声オンセットを含むフレームと2つの有声音の間の遷移を含むフレームからなるグループから前記遷移フレームを選択するステップをさらに含む請求項60に記載の符号化の方法。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームが、一連のいくつかのフレームが後続する遷移フレームを備える請求項60に記載の符号化の方法。
- 前記遷移フレームおよび前記遷移フレームに後続する前記一連のいくつかのフレームが、連続したフレームである請求項64に記載の符号化の方法。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備え、前記遷移モードのコードブックを検索するステップが、前記サブフレームの第1の部分で前記遷移モードのコードブックを検索するステップと、前記サブフレームの第2の部分で予測型コードブックを検索するステップとを含む請求項60に記載の符号化の方法。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備え、前記方法が、現在のフレームの第1の声門インパルスを含むサブフレームにおいて前記遷移モードのコードブックを用いるステップを含む請求項60に記載の符号化の方法。
- 前記遷移モードのコードブックを用いるサブフレームに先行する少なくとも1つのサブフレームにおいて、革新コードブックコンポーネントを排他的に備える励振信号を発生するステップを備える請求項67に記載の符号化の方法。
- 前記声門インパルス形状のコードブックが、前記コードベクトルの各位置に中心がある声門インパルス形状に対応する声門形状のコードブックを備える請求項60に記載の符号化の方法。
- 前記声門インパルス形状のコードブックが、所定数の声門インパルスの形状を含み、前記符号化の方法は、前記コードベクトル中の複数の位置に声門インパルスの各形状を配置することにより、前記声門インパルス形状のコードブックの複数のコードベクトルを形成するステップを含む請求項69に記載の符号化の方法。
- 前記声門インパルス形状のコードブックの中に過去の励振から独立した前記1組のコードベクトルを発生するステップが、非ゼロ要素を1つだけ含むコードベクトルを発生するステップと、成形フィルタによって非ゼロ要素を1つだけ含む前記コードベクトルを処理して各位置に中心がある声門インパルス形状を表すコードベクトルを生成するステップとを含む請求項69に記載の符号化の方法。
- 重み付き合成フィルタによって、各位置に中心がある声門インパルス形状を表す、前記成形フィルタからの前記コードベクトルを処理するステップを含む請求項71に記載の符号化の方法。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備える符号化の方法であって、1つのサブフレームにつき複数の声門インパルスがあるとき、ピッチ周期が経過した後に前記声門インパルス形状を繰り返すステップをさらに含む請求項71に記載の符号化の方法。
- 前記声門インパルス形状が最初と最後のサンプルを含む符号化の方法であって、前記最初と最後のサンプルの所定数を切り詰めるステップを含む請求項69に記載の符号化の方法。
- 各位置に中心がある声門インパルス形状を表す前記コードベクトルに利得を適用するステップをさらに含む請求項72に記載の符号化の方法。
- 革新コードブック検索の目標信号を発生するステップと、
それぞれが、それぞれの革新励振に対応する1組の革新コードベクトルを発生するための革新コードブックをもたらすステップと、
前記革新コードブック検索の目標信号に対応する革新励振に対応する前記組の前記革新コードベクトルを見つけるために前記革新コードブックを検索するステップと、
前記遷移モード励振と前記革新励振を加算して音響信号合成フィルタ向けの励振を生成するステップとをさらに含む請求項60に記載の符号化の方法。 - 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備える符号化の方法であって、1つまたは複数の前記声門インパルスが前記サブフレーム中のどこにあるかに応じて、前記遷移モードのコードブック、前記適応コードブックおよび前記革新コードブックの少なくとも1つを用いて前記サブフレームを符号化するステップを含む請求項76に記載の符号化の方法。
- 音響信号中の遷移フレームおよび/または遷移に後続する少なくとも1つのフレームでの適応コードブック励振を置き換える遷移モード励振を発生するための復号化の方法であって、
コードブックのインデックスを受け取るステップと、
過去の励振から独立した1組のコードベクトルを発生するための遷移モードのコードブックに対して前記コードブックのインデックスを供給するステップと、
前記遷移モードのコードブックを用いて、前記コードブックのインデックスに応じて、前記遷移モード励振に対応する前記組の前記コードベクトルのうちの1つを発生するステップとを含み、前記遷移モードのコードブックが声門インパルス形状のコードブックを備える復号化の方法。 - 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームの中で前記適応コードブック励振を前記遷移モード励振で置き換えるステップが、フレーム消去の場合にデコーダデバイスにおけるエラー伝播を低減し、かつ/または、符号化効率を改善する請求項78に記載の復号化の方法。
- 前記音響信号が音声信号を含む復号化の方法であって、有声オンセットを含むフレームと2つの有声音の間の遷移を含むフレームからなるグループから前記遷移フレームを選択するステップを含む請求項78に記載の復号化の方法。
- 前記遷移フレームおよび/または前記遷移に後続する前記少なくとも1つのフレームのそれぞれが複数のサブフレームを備える復号化の方法であって、前記サブフレームの第1の部分で前記遷移モードのコードブックを用い、かつ前記サブフレームの第2の部分で予測型コードブックを用いるステップを含む請求項78に記載の復号化の方法。
- 前記声門インパルス形状のコードブックが、前記コードベクトルの各位置に中心がある声門インパルス形状に対応するコードベクトルを備える請求項78に記載の復号化の方法。
- 前記声門インパルス形状のコードブックが、所定数の声門インパルスの形状を含む復号化の方法であって、前記コードベクトル中の複数の位置に声門インパルスの各形状を配置することにより、前記声門形状のコードブックの複数のコードベクトルを形成するステップを含む請求項82に記載の復号化の方法。
- 前記組のコードベクトルが、前記声門インパルス形状のコードブックにより、非ゼロ要素を1つだけ含むコードベクトルを発生するステップと、成形フィルタによって非ゼロ要素を1つだけ含む前記コードベクトルを処理して各位置に中心がある声門インパルス形状を表すコードベクトルを生成するステップとによって発生される請求項82に記載の復号化の方法。
- 各位置に中心がある声門インパルス形状を表す前記コードベクトルに利得を適用するステップをさらに含む請求項84に記載の復号化の方法。
- 1組の革新コードベクトルを発生するための革新コードブックをもたらすステップと、
前記革新コードブックに革新コードブックのインデックスを供給するステップと、
前記革新コードブックを用いて、前記革新コードブックのインデックスに応じて、革新励振に対応する前記組の前記革新コードベクトルのうちの1つを発生するステップと、
前記遷移モード励振と前記革新励振を加算して音響信号合成フィルタ向けの励振を生成するステップとをさらに含む請求項78に記載の復号化の方法。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US85374906P | 2006-10-24 | 2006-10-24 | |
| US60/853,749 | 2006-10-24 | ||
| PCT/CA2007/001896 WO2008049221A1 (en) | 2006-10-24 | 2007-10-24 | Method and device for coding transition frames in speech signals |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2010507818A JP2010507818A (ja) | 2010-03-11 |
| JP5166425B2 true JP5166425B2 (ja) | 2013-03-21 |
Family
ID=39324068
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009533622A Active JP5166425B2 (ja) | 2006-10-24 | 2007-10-24 | 音声信号中の遷移フレームの符号化のための方法およびデバイス |
Country Status (15)
| Country | Link |
|---|---|
| US (1) | US8401843B2 (ja) |
| EP (1) | EP2102619B1 (ja) |
| JP (1) | JP5166425B2 (ja) |
| KR (1) | KR101406113B1 (ja) |
| CN (1) | CN101578508B (ja) |
| BR (1) | BRPI0718300B1 (ja) |
| CA (1) | CA2666546C (ja) |
| DK (1) | DK2102619T3 (ja) |
| ES (1) | ES2624718T3 (ja) |
| MX (1) | MX2009004427A (ja) |
| MY (1) | MY152845A (ja) |
| NO (1) | NO341585B1 (ja) |
| PT (1) | PT2102619T (ja) |
| RU (1) | RU2462769C2 (ja) |
| WO (1) | WO2008049221A1 (ja) |
Families Citing this family (33)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5302190B2 (ja) * | 2007-05-24 | 2013-10-02 | パナソニック株式会社 | オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路 |
| US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
| US20090319261A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
| US20090319263A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
| US8768690B2 (en) * | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
| JP2010204391A (ja) * | 2009-03-03 | 2010-09-16 | Nippon Telegr & Teleph Corp <Ntt> | 音声信号モデル化方法、信号認識装置及び方法、パラメータ学習装置及び方法、特徴量生成装置及び方法並びにプログラム |
| KR101137652B1 (ko) * | 2009-10-14 | 2012-04-23 | 광운대학교 산학협력단 | 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법 |
| CN105374362B (zh) * | 2010-01-08 | 2019-05-10 | 日本电信电话株式会社 | 编码方法、解码方法、编码装置、解码装置以及记录介质 |
| US9626982B2 (en) * | 2011-02-15 | 2017-04-18 | Voiceage Corporation | Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a CELP codec |
| NO2669468T3 (ja) * | 2011-05-11 | 2018-06-02 | ||
| US9972325B2 (en) * | 2012-02-17 | 2018-05-15 | Huawei Technologies Co., Ltd. | System and method for mixed codebook excitation for speech coding |
| KR101812123B1 (ko) | 2012-11-15 | 2017-12-26 | 가부시키가이샤 엔.티.티.도코모 | 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램 |
| FR3001593A1 (fr) * | 2013-01-31 | 2014-08-01 | France Telecom | Correction perfectionnee de perte de trame au decodage d'un signal. |
| EP4246516B1 (en) * | 2013-03-04 | 2025-07-23 | VoiceAge EVS LLC | Device and method for reducing quantization noise in a time-domain decoder |
| IL278164B (en) * | 2013-04-05 | 2022-08-01 | Dolby Int Ab | Audio encoder and decoder |
| JP6153661B2 (ja) * | 2013-06-21 | 2017-06-28 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 改善されたパルス再同期化を採用するacelp型封じ込めにおける適応型コードブックの改善された封じ込めのための装置および方法 |
| CN111862998B (zh) | 2013-06-21 | 2025-03-07 | 弗朗霍夫应用科学研究促进协会 | 利用改进的音调滞后估计的似acelp隐藏中的自适应码本的改进隐藏的装置及方法 |
| CN104301064B (zh) | 2013-07-16 | 2018-05-04 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
| US10614816B2 (en) * | 2013-10-11 | 2020-04-07 | Qualcomm Incorporated | Systems and methods of communicating redundant frame information |
| CN104637486B (zh) * | 2013-11-07 | 2017-12-29 | 华为技术有限公司 | 一种数据帧的内插方法及装置 |
| CN103680509B (zh) * | 2013-12-16 | 2016-04-06 | 重庆邮电大学 | 一种语音信号非连续传输及背景噪声生成方法 |
| BR112016022466B1 (pt) | 2014-04-17 | 2020-12-08 | Voiceage Evs Llc | método para codificar um sinal sonoro, método para decodificar um sinal sonoro, dispositivo para codificar um sinal sonoro e dispositivo para decodificar um sinal sonoro |
| PL3139382T3 (pl) * | 2014-05-01 | 2019-11-29 | Nippon Telegraph & Telephone | Urządzenie kodujące sygnał dźwiękowy, sposób kodowania sygnału dźwiękowego, program i nośnik rejestrujący |
| CN105225666B (zh) * | 2014-06-25 | 2016-12-28 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
| FR3024581A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Determination d'un budget de codage d'une trame de transition lpd/fd |
| FR3024582A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
| WO2016030568A1 (en) | 2014-08-28 | 2016-03-03 | Nokia Technologies Oy | Audio parameter quantization |
| US9916835B2 (en) * | 2015-01-22 | 2018-03-13 | Sennheiser Electronic Gmbh & Co. Kg | Digital wireless audio transmission system |
| US10157441B2 (en) * | 2016-12-27 | 2018-12-18 | Automotive Research & Testing Center | Hierarchical system for detecting object with parallel architecture and hierarchical method thereof |
| WO2019056107A1 (en) * | 2017-09-20 | 2019-03-28 | Voiceage Corporation | METHOD AND DEVICE FOR ALLOCATING A BINARY BUDGET BETWEEN SUB-FRAMES IN A CELP CODEC |
| CN120510852A (zh) | 2019-02-21 | 2025-08-19 | 瑞典爱立信有限公司 | 用于频域分组丢失隐藏的方法及相关解码器 |
| BR112021020507A2 (pt) * | 2019-05-07 | 2021-12-07 | Voiceage Corp | Métodos e dispositivos para detectar um ataque em um sinal de som a ser codificado e para codificar o ataque detectado |
| CN111123305B (zh) * | 2019-12-12 | 2023-08-22 | 秦然 | 一种gnss记录回放测试仪图形化噪声系数优化方法 |
Family Cites Families (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US549555A (en) * | 1895-11-12 | white | ||
| JP2707564B2 (ja) | 1987-12-14 | 1998-01-28 | 株式会社日立製作所 | 音声符号化方式 |
| US5495555A (en) | 1992-06-01 | 1996-02-27 | Hughes Aircraft Company | High quality low bit rate celp-based speech codec |
| CA2108623A1 (en) * | 1992-11-02 | 1994-05-03 | Yi-Sheng Wang | Adaptive pitch pulse enhancer and method for use in a codebook excited linear prediction (celp) search loop |
| EP1355298B1 (en) | 1993-06-10 | 2007-02-21 | Oki Electric Industry Company, Limited | Code Excitation linear prediction encoder and decoder |
| US6233550B1 (en) * | 1997-08-29 | 2001-05-15 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
| KR100925084B1 (ko) | 1997-10-22 | 2009-11-05 | 파나소닉 주식회사 | 음성 부호화기 및 음성 부호화 방법 |
| US6385576B2 (en) | 1997-12-24 | 2002-05-07 | Kabushiki Kaisha Toshiba | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch |
| DE69736446T2 (de) * | 1997-12-24 | 2007-03-29 | Mitsubishi Denki K.K. | Audio Dekodierverfahren und -vorrichtung |
| US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
| US6192335B1 (en) * | 1998-09-01 | 2001-02-20 | Telefonaktieboiaget Lm Ericsson (Publ) | Adaptive combining of multi-mode coding for voiced speech and noise-like signals |
| JP4008607B2 (ja) * | 1999-01-22 | 2007-11-14 | 株式会社東芝 | 音声符号化/復号化方法 |
| US6782360B1 (en) | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
| DE60128677T2 (de) | 2000-04-24 | 2008-03-06 | Qualcomm, Inc., San Diego | Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen |
| DE10114561A1 (de) | 2001-03-24 | 2002-09-26 | Wella Ag | Verwendung von Mitteln enthaltend Kreatin, Kreatin und/oder deren Derivaten zur Verstärkung und Strukturverbesserung von keratinischen Fasern |
| DE10124420C1 (de) | 2001-05-18 | 2002-11-28 | Siemens Ag | Verfahren zur Codierung und zur Übertragung von Sprachsignalen |
| AU2003235868A1 (en) | 2002-05-10 | 2003-11-11 | Asahi Kasei Kabushiki Kaisha | Speech recognition device |
| CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
| JP4414705B2 (ja) * | 2003-09-17 | 2010-02-10 | パナソニック株式会社 | 音源信号符号化装置、及び音源信号符号化方法 |
| US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
| GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
| EP1775717B1 (en) * | 2004-07-20 | 2013-09-11 | Panasonic Corporation | Speech decoding apparatus and compensation frame generation method |
| US7752039B2 (en) | 2004-11-03 | 2010-07-06 | Nokia Corporation | Method and device for low bit rate speech coding |
-
2007
- 2007-10-24 CN CN2007800480774A patent/CN101578508B/zh active Active
- 2007-10-24 WO PCT/CA2007/001896 patent/WO2008049221A1/en not_active Ceased
- 2007-10-24 KR KR1020097010701A patent/KR101406113B1/ko active Active
- 2007-10-24 RU RU2009119491/08A patent/RU2462769C2/ru active
- 2007-10-24 BR BRPI0718300-3A patent/BRPI0718300B1/pt active IP Right Grant
- 2007-10-24 JP JP2009533622A patent/JP5166425B2/ja active Active
- 2007-10-24 US US12/446,892 patent/US8401843B2/en active Active
- 2007-10-24 ES ES07816046.2T patent/ES2624718T3/es active Active
- 2007-10-24 MX MX2009004427A patent/MX2009004427A/es active IP Right Grant
- 2007-10-24 CA CA2666546A patent/CA2666546C/en active Active
- 2007-10-24 PT PT78160462T patent/PT2102619T/pt unknown
- 2007-10-24 DK DK07816046.2T patent/DK2102619T3/en active
- 2007-10-24 EP EP07816046.2A patent/EP2102619B1/en active Active
- 2007-10-24 MY MYPI20091661 patent/MY152845A/en unknown
-
2009
- 2009-05-25 NO NO20092017A patent/NO341585B1/no unknown
Also Published As
| Publication number | Publication date |
|---|---|
| CA2666546C (en) | 2016-01-19 |
| PT2102619T (pt) | 2017-05-25 |
| CN101578508B (zh) | 2013-07-17 |
| CA2666546A1 (en) | 2008-05-02 |
| MX2009004427A (es) | 2009-06-30 |
| RU2462769C2 (ru) | 2012-09-27 |
| NO341585B1 (no) | 2017-12-11 |
| RU2009119491A (ru) | 2010-11-27 |
| US20100241425A1 (en) | 2010-09-23 |
| EP2102619A4 (en) | 2012-03-28 |
| HK1132324A1 (en) | 2010-02-19 |
| BRPI0718300A2 (pt) | 2014-01-07 |
| MY152845A (en) | 2014-11-28 |
| JP2010507818A (ja) | 2010-03-11 |
| EP2102619B1 (en) | 2017-03-22 |
| BRPI0718300B1 (pt) | 2018-08-14 |
| EP2102619A1 (en) | 2009-09-23 |
| CN101578508A (zh) | 2009-11-11 |
| ES2624718T3 (es) | 2017-07-17 |
| KR101406113B1 (ko) | 2014-06-11 |
| US8401843B2 (en) | 2013-03-19 |
| WO2008049221A1 (en) | 2008-05-02 |
| NO20092017L (no) | 2009-05-25 |
| DK2102619T3 (en) | 2017-05-15 |
| KR20090073253A (ko) | 2009-07-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5166425B2 (ja) | 音声信号中の遷移フレームの符号化のための方法およびデバイス | |
| US8566106B2 (en) | Method and device for fast algebraic codebook search in speech and audio coding | |
| JP2971266B2 (ja) | 低遅延celp符号化方法 | |
| CN1820306B (zh) | 可变比特率宽带语音编码中增益量化的方法和装置 | |
| JP5149198B2 (ja) | 音声コーデック内の効率的なフレーム消去隠蔽の方法およびデバイス | |
| KR20020052191A (ko) | 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법 | |
| JP2016510134A (ja) | 潜在的なフレームの不安定性を軽減するためのシステムおよび方法 | |
| JP2004163959A (ja) | 汎用AbS音声符号化方法及びそのような方法を用いた符号化装置 | |
| JP7608362B2 (ja) | コーディングされる音声信号内のアタックを検出し、検出されたアタックをコーディングするための方法およびデバイス | |
| Eksler et al. | Glottal-shape codebook to improve robustness of CELP codecs | |
| HK1132324B (en) | Method and device for coding transition frames in speech signals | |
| HK40036813A (en) | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates | |
| HK40036813B (en) | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates | |
| HK40011418B (en) | Method, device and computer-readable non-transitory memory for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates | |
| HK40011418A (en) | Method, device and computer-readable non-transitory memory for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates | |
| Stegmann et al. | CELP coding based on signal classification using the dyadic wavelet transform | |
| HK1148858A (en) | Method and device for fast algebraic codebook search in speech and audio coding |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120327 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120627 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120704 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120727 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121120 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121220 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151228 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5166425 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |