HK1074877A1 - 音频解码设备和方法 - Google Patents
音频解码设备和方法 Download PDFInfo
- Publication number
- HK1074877A1 HK1074877A1 HK05108972.0A HK05108972A HK1074877A1 HK 1074877 A1 HK1074877 A1 HK 1074877A1 HK 05108972 A HK05108972 A HK 05108972A HK 1074877 A1 HK1074877 A1 HK 1074877A1
- Authority
- HK
- Hong Kong
- Prior art keywords
- subband
- signal
- subband signal
- aliasing
- gain
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Stereo-Broadcasting Methods (AREA)
Description
技术领域
本发明涉及使用少量的附加信息,从窄带音频信号产生宽带音频信号的音频带宽扩展系统的音频解码设备和解码方法,并涉及以很少的运算量而得到高质量的解码音频的技术。
背景技术
带宽划分编码是编码低比特率音频信号而同时获得高质量的回放信号通常的方法。使用频带划分滤波器把输入音频信号划分为多个频带(子带),或用傅立叶变换或其它时间频率变换算法变换输入信号为频域信号,然后,将信号划分为频域的多个子带,并分配合适的代码位给各带宽部分。使用带宽划分编码能从低比特率数据获得高质量的回放信号的原因在于编码处理基于人类的听觉特性处理信号。
在近似10KHz或更高频率人类的听觉灵敏度通常下降,低电平声音变得难于听见。此外,称为“频率屏蔽”的现象是众所周知的。由于频率屏蔽,当在特定频带有高电平声音时,在附近频带的低电平声音难于听见。由于此听觉特性对回放质量没有实质性的影响,分配比特和编码信号是难于感觉的,因此编码此信号是无意义的。相反,取分配给此听觉无意义的代码位并重分配此代码位给听觉敏感的子带,可更详细的编码听觉敏感的信号,因此有效地改善回放信号的质量。
此用带宽划分的编码例子是国际标准的MPEG-4 AAC(ISO/IEC14496-3),这使得能在近似96Kbps比特率上高质量地编码16KHz或更宽带宽的立体声信号。
如果比特率低至,例如,近似48Kbps时,则只是在10KHz或更低的带宽可以进行高质量编码,而产生的声音却是压抑的。一种补偿此带宽限制产生的声音质量退化的方法称为SBR(谱带复制),并在欧洲电信标准学会(ETSI)出版的数字无线电世界范围的(DRM)系统规范中描述。类似的技术也在AES(音频工程协会)会议论文5553,5559,5560(112届会议,2002年五月10-13,Munich,Germany)中公开。
SBR以补偿由音频编码处理,例如由AAC或同等的频带限制处理所损失的高频带信号(也称为高频分量)为目的。对于低于由SBR能补偿的频带(也称为低频分量)的频带中的信号则必须由其它装置来传输。基于由其它装置传输的低频分量产生伪高频分量的信息包含在SBR-编码的数据中,由伪高频分量加到低频分量上可补偿由于带宽限制的声音的退化。
图7是根据现有技术的SBR带宽扩展的解码器的原理图。输入比特流106被分离为低频分量信息107,高频分量信息108,和附加信息109。例如,低频分量信息107是用MPEG-4 AAC或其它编码方法编码的信息,并解码产生表示低频分量的时间信号。由分析滤波器组103划分此表示低频分量的时间信号为多个子带。
分析滤波器组103通常是使用复系数的滤波器组,划分的子带信号用低复数值信号表示。带宽扩展器104将表示低频分量的低频子带信号复制到高频子带中,以补偿由于带宽限制导致的高频分量损失。输入到带宽扩展器104的高频分量信息108包含偿频高频子带的增益信息,该增益按各个产生的高频子带调整。
带宽扩展器104产生的高频子带信号随低频子带信号输入到合成滤波器组105进行带宽合成,并产生输出信号110。因为输入到合成滤波器组105的子带信号通常是复数值信号,所以使用复系数滤波器组作为合成滤波器组105。
发明内容
如上面结构的带宽扩展的解码器在解码处理中,因为它包括分析滤波器组和合成滤波器组的两个滤波器组执行复数运算,所以需要进行大量的运算。因此,当用集成电路实现解码器时,存在功耗增加和用给定的电源容量时可回放的时间减小的问题。
实际上从合成滤波器组输出的解码的信号是实数值信号,因此为了降低执行解码的运算量,合成滤波器组可为实数值滤波器组。然而,因为只执行实数值运算的合成滤波器组(实数值系数合成滤波器组)的特性不同于如在现有技术中的执行复数值运算的合成滤波器组(复系数合成滤波器组)的特性,所以复数值合成滤波器组不能简单地由实数值合成滤波器组替代。
图8A到图8E显示复系数合成滤波器组和实数值系数合成滤波器组的特性。任何给定频率的音调信号有如在图8A中显示的单线谱。当包含此音调信号201的输入信号由分析滤波器组分离为多个子带时,表示音调信号201的线谱包含在单个特定子带信号中,理想的,例如,包含在子带m中的信号只表示频带从mπ/M到(m+1)π/M的信号。
然而,现行的分析滤波器组,从相邻子带到给定子带的信号包含了根据频带划分滤波器的频率特性的给定子带。图8B显示用作分析滤波器组的复系数滤波器组的例子。在此例子中,音调信号201作为复数值信号,包含在如图中由实线显示的子带m信号203和如由虚线显示的子带m-1信号204中。注意,包含在两个子带中的音调信号占有频率轴上同样位置。高频子带信号产生过程复制两个子带信号到高频子带中,并调整各子带的增益,但如果各子带增益不同,则音调信号201在各子带中也会有不同的幅度。
在合成滤波后,音调信号幅度的变化作为信号误差而残留,但因为音调信号的两个子带在频率轴上占有同样位置,此信号误差的影响只表现为用复系数滤波器组作为合成滤波器组的常规方法的音调信号201的幅度变化。因此,此误差对输出信号质量的影响较小。
然而,当使用实数值系数滤波器组作为合成滤波器组时,由复系数分析滤波器组输出的复数值子带信号首先必须转换为实数值子带信号。例如,这可以由旋转复数值子带信号的实数值轴和虚数值轴π/4做到,这中做法是与从DFT导出DCT同样的。包含在子带中的信号的形状随此变换处理改变为实数值子带信号。
图8C显示由虚线表示的(m-1)子带信号的变化。作为变换为实数值子带信号的结果,包含在子带(m-1)中的信号的谱是对子带边界202的轴对称的。因此,包含在原来复数值子带信号中的音调信号201的称为“镜像频率信号”的信号出现在与子带边界202的轴对称的位置。在子带m的信号也出现类似的镜像频率分量205,至于子带(m-1)和子带m的增益没有变化,在合成滤波处理中这些镜像频率分量互相抵消,在输出信号中不出现。
然而,如图8D所示,当在高频子带信号产生过程中各子带中有增益差206时,镜像频率分量205在输出信号中抵消不完全而作为误差信号出现,称为混叠现象。如图8E所示,此混叠分量207出现在信号通常不应该存在的位置(即,相对原始音调信号在子带边界202的对面的对称位置上),因此对输出信号的声音质量有很大的影响。特别是,当音调信号接近于频带划分滤波器的衰减不够充分的子带边界时,则产生的混叠分量的幅度增加,因此,引起输出信号的声音质量的严重退化。
因此,本发明致力于解决当前技术的这些问题,提供使用实数值系数合成滤波器组既能减少解码处理中执行的运算量,又能抑止混叠现象,并能改善输出信号的声音质量的技术。
本发明的音频解码设备是从包含窄带音频信号的编码信息的比特流中解码宽带音频信号的设备。本发明的音频解码方法是从包含窄带音频信号的编码信息的比特流解码宽带音频信号的方法。
在本发明的第一方面中,所述设备包括:比特流多路分解器,用于从所述比特流中多路分解编码信息;解码器,用于从多路分解的编码信息中解码窄带音频信号;分析滤波器组,用于划分解码的窄带音频信号为由多个子带信号构成的第一子带信号;带宽扩展器,用于从所述第一子带信号产生比第一子带信号的频带更高频带的第二子带信号,该第二子带信号由多个子带信号;混叠现象去除器,为了抑止在所述第二子带信号的子带信号中产生的混叠分量,根据所述第二子带信号的子带信号的混叠分量的程度调整增益;实数值计算合成滤波器组,用于合成所述第一子带信号和所述第二子带信号获得宽带音频信号。
在本发明的第二方面中,所述设备包括:比特流多路分解器,用于从所述比特流中多路分解编码信息;解码器,用于从多路分解的编码信息中解码窄带音频信号;分析滤波器组,用于划分解码的窄带音频信号为多个子带信号,产生由所述多个子带信号构成的第一子带信号;带宽扩展器,从所述第一子带信号产生比第一子带信号的频带更高的频带的第二子带信号,该第二子带信号由多个子带信号构成;混叠现象检测器,用于检测由带宽扩展器产生的所述第二子带信号的各子带信号混叠分量的程度;混叠现象去除器,基于检测的所述混叠分量的程度,调整所述第二子带信号的子带信号的增益;实数值计算合成滤波器组,合成所述第一子带信号和所述第二子带信号获得宽带音频信号。
因此,由于在从低频子带信号产生高频子带信号的处理中,对各高频子带作用不同的增益,本发明抑止了在实数值子带信号中的混叠分量,并抑止了由于混叠引起的声音退化。
附图说明
图1是显示本发明的音频解码设备的一个例子的原理框图(第一实施方式);
图2是显示本发明的音频解码设备的一个例子的原理框图(第二实施方式);
图3描述在本发明的音频解码设备中检测混叠现象的方法的一个例子;
图4A和图4B描述在本发明的音频解码设备中检测混叠现象的方法;
图5是显示本发明的音频解码设备的一个例子的原理框图(第四实施方式);
图6是显示本发明的音频解码设备的一个例子的原理框图(第五实施方式);
图7是显示现有技术的音频解码设备的原理框图;
图8A到图8E描述混叠分量如何产生的视图。
具体实施方式
下面,参考附图描述本发明的音频解码设备和音频解码方法的优选实施方式。
实施方式1
图1是显示本发明第一实施方式的音频解码设备的原理框图。
此解码设备有比特流多路分解器101,低频解码器102,分析滤波器组103,带宽扩展器104,合成滤波器组105,混叠现象去除器113,和附加信号发生器111。
比特流多路分解器101接收输入比特流106并多路分解比特流106为低频分量信息107、高频分量信息108和附加信号信息109。低频分量信息107,例如,使用MPEG-4 AAC编码方法编码。低频解码器102解码低频分量信息107并产生表示低频分量的时间信号。
然后,表示低频分量的产生的时间信号由分析滤波器组103分成多个(M个)子带,并输入到带宽扩展器104。分析滤波器组103是复数值计算系数滤波器组,分析滤波器组103产生的子带信号用复数值信号表示。
带宽扩展器104通过将表示低频分量的低频子带信号复制到高频子带,补偿由带宽限制损失的高频分量。输入到带宽扩展器104的高频分量信息108包含要补偿的高频子带的增益信息,该增益根据各个产生的高频子带进行调整。
附加信号发生器111根据附加信号信息109产生增益控制附加信号112,并把它加到各高频子带信号上。可以使用正弦音调信号或噪声信号作为由附加信号发生器111产生的附加信号。
由带宽扩展器104产生的高频子带信号随低频子带信号输入到进行频带合成的合成滤波器组105,得到输出信号110。此合成滤波器组105是实数值系数滤波器组。在合成滤波器组105中使用的子带数不需要与在分析滤波器组103中的子带数匹配。例如,在图1中,如果N=2M,则输出信号的采样频率是输入到分析滤波器组的时间信号的采样频率的两倍。
因为关系到增益控制的信息仅包含在高频分量信息108或附加信号信息109中,与包含谱信息的低频分量信息107相比可以使用相当低的比特率。因此,此结构适合于编码低比特率的宽带信号。
在图1所示的解码设备还有混叠现象去除器113。往混叠现象去除器113输入高频分量信息108,并调整高频分量数据的增益信息,抑止由实数值系数合成滤波器组105的混叠现象。带宽扩展器104使用经调整的增益产生高频子带信号。
在此实施方式中,输入到合成滤波器组105的子带信号必须是实数值信号,但可以使用现有技术中已知的方法进行相位旋转运算,将复数值信号变换到实数值信号。
下面详细的描述混叠现象去除器113的运行。
如上所述,当实数值系数滤波器组用作为合成滤波器组时,混叠现象的一个原因是在高频信号产生过程中,相邻子带信号受不同的增益水平的调整所致。如果对所有相邻子带信号使用同样的增益,可以完全去除混叠分量。然而,在此情况中,由于作为高频分量传输而来的增益信息没有得到反映,导致高频分量增益不匹配,输出信号质量退化。因此混叠现象去除器113必须参考作为高频分量信息传输的增益信息调整所述增益信息,使得混叠分量下降到听不见的水平,因此就可以防止由混叠分量引起的声音退化和由在高频分量中不匹配的增益引起的声音退化。
根据相邻子带之间的增益差越大则混叠分量就越大,在本发明实施方式中的混叠现象去除器113设置了对相邻子带之间的增益差的限制,以降低产生混叠分量的影响。
例如,混叠现象去除器113调整所有m的g[m]满足下面的关系
g[m]≤a*g[m-1]
g[m]≤a*g[m+1]
其中g[m-1],g[m]和g[m+1]是三个连续的子带m-1,1,m+1的增益,“a”确定相邻子带之间的增益比率的上限,并近似地为2.0。系数“a”的值对所有子带m可以是相同的,或对不同的子带m使用不同的“a”。例如混叠现象对听觉的影响强的低频子带可用相对低的“a”,混叠现象对听觉的影响弱的高频子带可用相对高的“a”。
这样的增益调整抑止了混叠分量的影响,因此,因为限制相邻子带之间的增益,所以改善了可听的声音的质量。此外,高频分量子带信号的增益分布不同于基于增益信息传输的增益分布,但受影响的子带只是那些对相邻子带增益比率是相当高的子带。此外,因为同样的子带增益关系也维持在调整后的增益水平,所以可以抑止由于高频子带信号不匹配的增益的声音质量退化。
除了限制相邻子带之间的增益比率,增益调节也可以用多子带的平均增益调整增益。下面举例描述使用三个子带的平均增益的例子。在此情况中,在增益调节后子带m的增益g1[m],可以由满足以下关系获得
g1[m]=(g[m-1]+g[m]+g[m+1])/3
其中g[m-1],g[m]和g[m+1]是接收到的高频分量的三个连续的子带m-1,1,m+1的增益。
此外,从低频子带开始按顺序调整增益时,可以使用对子带m-1的调整后的增益g1[m-1],增益g1[m]可从以下公式获得。
g1[m]=(g1[m-1]+g[m]+g[m+1])/3
因为通过如上面描述的增益调整、可以使子带之间的增益变化平滑化,并且可以降低相邻子带之间的增益差,抑止混叠分量,改善听觉声音质量。此外,此平滑过渡处理使得高频子带信号的增益分布不同于基于传输的增益信息的增益分布,但在平滑过渡处理前增益分布的形状在平滑过渡处理后仍被保持,所以可以抑止由于高频子带信号的不匹配的增益的声音质量退化。
应该注意到在上面描述的增益平滑过渡处理中使用多子带的增益的简单平均,但也可以在使用计算平均值前,先对各增益预先确定其加权系数进行加权平均。
为了防止尽管原来的增益水平很低,经平滑过渡处理的增益水平变高,原来的增益水平小于预先确定的阈值时,可以不进行平滑过渡处理,而使用原来的未经调整的增益。
实施方式2
图2是本发明第二实施方式的音频解码设备的原理图。此实施方式不同于示于图1的结构是,增加了混叠现象检测装置(混叠现象检测器)315,检测导致高可能性的混叠分量的子带。从混叠现象检测器315输出的检测数据316输入到混叠现象去除器313,然后,基于检测数据316调整高频分量的增益。
除了涉及混叠现象检测装置315和混叠现象去除器313外,本发明第二实施方式的解码设备的运行与第一实施方式相同。因此下面只描述混叠现象检测装置315和混叠现象去除器313的运行。
首先描述混叠现象检测装置315的运行原理。
使用实数值子带信号从理论上不能避免混叠现象,但由混叠现象引起的声音退化的程度则因包含在子带信号中的信号的特性而大不相同。如参考图8描述的,混叠现象出现在不同于原始信号的位置,但如果在相同范围的原始信号很强,则混叠分量的影响就会被遮蔽,混叠分量对声音质量的实际影响较少。相反,如果混叠分量出现的位置原来不存在信号,则只有混叠分量是听得见的,它们对声音质量的影响就大了。因此,通过检测混叠分量出现附近的信号的强度,可以了解混叠分量的影响有多大。
然而,为了检测产生的混叠分量的位置和原始的信号周围的强度,例如,必须用傅立叶变换或其它的频率变换处理确定子带信号的频率分布。问题是从所需的运算量来看是不实际的。因此,本发明使用表示子带信号频率的斜率的参数以少量的计算检测混叠现象的影响的方法。这个方法的前提是忽略在给定子带中有宽频率分布的信号(噪声信号)的影响,因为即使出现混叠现象,由于上面描述的遮蔽现象其影响是小的。
对有频率分布限制的信号(音调信号),音调信号的位置和产生的混叠分量之间的关系如上面参考图8所描述,当音调信号接近子带边界时混叠现象的影响很大。
图3显示音调信号的位置和包含音调信号的子带的频率分布的斜率之间的关系。在图3中,音调信号401和它的镜像频率402包含在子带m-1信号403和子带m信号404中,音调信号401和它的镜像频率402对称地位于子带边界405。
当音调信号401接近子带边界405时,音调信号401和它的镜像频率402在子带m-1的高频侧。因此,子带m-1的频率分布的斜率406是正的。如果音调信号401从子带边界405向高频侧偏移时,则它的镜像频率402向相反方向移动(即在低频方向),子带m-1的频率分布的斜率就变得比较平缓最后变为负的。同样,子带m的频率分布的斜率407则从负变为正。这意味着如果子带m-1的频率分布的斜率是正的,子带m的频率分布的斜率是负的,音调信号401和它的对称的镜像频率402有可能在子带边界405附近出现。
线性预测系数(LPC)和反射系数可用作为能容易计算的参数,它为表示子带信号频率分布的斜率的参数。由下面的公式获得的一阶反射系数可用作为例子。
其中X(m,i)表示子带m的信号,i表示时间取样,X*(m,i)表示X(m,i)的复数共轭,K1[m]表示子带m的一阶反射系数。
因为当频率分布的斜率是正的时主反射系数是正的,当斜率是负的时主反射系数是负的,如果K1[m-1]是正的和K[m]是负的,则可以确定在子带m-1和m之间的边界出现混叠现象的可能性很高。
然而,如果使用公共的QMF(积分镜像滤波器)作为子带划分滤波器,由于滤波器的特性,偶数子带和奇数子带之间的频率分布反转。考虑此,可以设置检测混叠现象的条件如下。
当m是偶数:K1[m-1]<0,K1[m]<0
当m是奇数:K1[m-1]>0,K1[m]>0
下面此条件为“检测条件1”。检测条件1定义为通常检测两个相邻子带之间是否有混叠现象的条件。当使用检测条件1时,对连续的子带m和m-1混叠现象不会两次被检测,因为对偶数m和奇数m条件不可能同时满足。
QMF的通带通常展开到三个子带,即,作为对象的子带和其两侧的子带。在此情况中,如果有作为对象的子带的中心附近的音调信号,或有作为对象的子带的高频和低频范围两侧的音调信号,则作为对象的子带两侧的子带上会出现镜像频率分量。
图4A和图4B显示当在给定子带的高频和低频范围有音调信号时的频率分布。在图4A中在子带m-1的高频和低频范围内有音调信号501和502,在图4B有音调信号511和512。在子带m-2中,子带m-1的低频范围的音调信号501和511的镜像频率分量分别出现为信号503和513,在子带m中,子带m-1的高频范围的音调信号502,512的镜像频率分量分别出现为信号504和514。
如在图4A中频率分布506和图4B中频率分布516显示的,由高频和低频音调信号的能量比率确定子带m-1的频率分布的斜率。由于检测条件1是使用子带m-1的反射系数的符号来检测两个子带之间的混叠现象的,因此检测条件1不能用来检测跨过三个子带的混叠现象。另一方面,在子带m-2和子带m中,由镜像频率分量稳定的确定频率分布的斜率的符号,如在图4A中的频率分布505和507和在图4B中的频率分布515和517所显示,它与子带m-1中的低频和高频音调信号之间的能量比率无关。
这能适用到用子带m-2和子带m中的反射系数设定检测跨越三个子带的混叠现象的条件。
当m是偶数时:K1[m-2]>0,K1[m]<0
当m是奇数时:K1[m-2]<0,K1[m]>0
下面称此条件为“检测条件2”。
然而,当子带m-2和子带m中的频率分布的斜率高时,跨越三个子带的混叠现象成问题的是当只使用检测条件2时,检测误差会增加。在子带m-2和子带m中的频率分布的斜率变化依赖于子带m-1的低频和高频范围的音调信号之间的能量比率。
即,如果在子带m-1的低频范围中的音调信号的能量比在高频范围中(显示在图4A中的情况)的音调信号的能量低时,子带m-2的反射系数K1[m-2]的绝对值小于子带m的反射系数K1[m]的绝对值。相反,当在子带m-1中的低频音调信号的能量高于高频音调信号的能量(显示在图4B中的情况)时,子带m-2的反射系数K1[m-2]的绝对值大于子带m的反射系数K1[m]的绝对值。此特性下面称为“特性1”。
因此优选同时考虑在子带m-2和子带m中的频率分布的斜率。此外,利用反射系数的绝对值是从0到1,检测跨越三个子带的条件优选首先满足上面的检测条件2,也满足下面的条件。
当m是偶数时:K1[m-2]-K1[m]>T
当m是奇数时:K1[m]-K1[m-2]>T
其中T是预先确定的阈值,如近似的值T=1.0。这些下面称为“检测条件3”。检测条件3的检测范围比检测条件2的检测范围窄。注意因为条件
-1<K1[m]<1
涉及反射系数的范围,当使用检测条件2或检测条件3时,在连续的三个子带m,m+1和m+2中的条件不重叠,因此不会检测出在连续的三个子带中的混叠现象。此外,即使检测条件1联合于检测条件2或检测条件3一起使用,也不会在连续的三个子带中检测出混叠现象。显然,使用三个子带m-2,m-1和m的反射系数也可以设定跨越三个子带的混叠现象检测条件。
满足检测条件的子带编号作为混叠现象检测数据316从混叠现象检测装置315输出。然后混叠现象去除器313仅调整由混叠现象检测数据316所表示的子带的增益,从而限制混叠的发生。例如,如果混叠现象检测数据316根据检测条件1表示出跨两个子带出现混叠现象,可由匹配子带m-1和m的增益或由限制两个子带之间的增益差或增益比率到预先确定的阈值或更小,从而调整增益。当匹配两个子带的增益水平,增益可以设两个子带中较低增益水平,也可以设较高增益水平,或设较高和较低增益水平之间的中间水平(如平均值)。
为了防止由混叠现象检测装置315的检测误差,混叠现象去除器313可使用组合方法。例如,混叠现象去除器313可以用于匹配检测到混叠现象的子带的增益,对其它子带也可用限制增益差或增益比率到或低于预先确定的阈值来限制增益。
此外,当混叠现象检测数据316基于检测条件2或检测条件3表示出跨三个子带出现混叠现象时,混叠现象去除器313可由匹配所有三个子带的增益调整增益。作为选择,如上面描述的方法匹配两个子带增益可用于从m-2的升序,即,可在调整子带m-2和m-1的增益后,将调整后的增益匹配子带m的增益。也可使用降序匹配从子带m开始的两个子带之间的增益。此外,作为选择,可使用如上面描述的升序和降序匹配的两个子带增益,然后确定并使用增益水平的中间值。当两个子带被设定相同增益水平时,增益可以按较低方的增益水平设定,也可以按较高增益水平设定,或按较高和较低增益水平之间的中间水平(如平均值)设定。
此外,作为选择,可以设定两个子带之间的增益差或增益比率为预先确定的阈值或更小,代替设定使两个子带的增益水平相同的方法。
还是作为选择,为了防止由混叠现象检测装置315的检测误差,混叠现象去除器313可适用于组合方法。例如,混叠现象去除器313可以用于匹配检测到混叠现象的增益,对其它子带也可用限制增益差或增益比率到或低于预先确定的阈值来限制增益。
用上面的结构,只对影响声音质量的混叠现象的子带的增益进行调整,对其它子带则使用接收的比特流所显示的增益水平。因此既可以防止由于混叠现象的声音质量的退化,也可以防止由于增益不匹配的声音退化。例如,当混叠现象去除器313使用如上面描述的增益匹配的方法时,如果混叠现象检测装置315使用检测条件1,增益可被调整到在至少两个子带的单元中传输的增益水平。如果混叠现象检测装置315使用检测条件2或检测条件3,增益可被调整到在至少四个子带的单元中接收的增益水平。
应该注意,表示子带信号的频率分布的斜率的参数可由计算相对于时间的多个参数来确定,然后也可以平滑处理这些参数。
此外,当用作为表示子带信号的频率分布的斜率的参数的线性预测系数或反射系数用作为在常规带宽扩展装置的中间参数时,可以共用这些参数的全部或部分,因此降低处理要求的运算量。
实施方式3
在上面第二实施方式中的混叠现象检测装置315中,将预先确定的阈值与各子带的反射系数进行比较,并基于这些值之间的关系检测并输出作为混叠现象是否出现的二进制值。当用二进制值检测方法估计值接近阈值变化时,出现/不出现混叠现象的检测值频繁地变化。增益的调整或不调整的繁杂转换给声音的质量以不利的影响。
因此,在本实施方式中,混叠现象检测装置315检测混叠现象的出现度。即,不是使用二进制值简单的指出是否检测出混叠现象,而是由表示混叠现象的出现度的连续值显示混叠现象的出现。因此基于此连续值对增益进行平缓地调整,可以抑止因增益调整和不调整的转换引起的突然变化,因此降低产生的声音质量的退化。应该注意到根据第三实施方式的音频解编设备的结构与显示在图2中的第二实施方式的结构相同。
下面描述表示混叠现象的出现度的值。
当检测两个子带之间的混叠现象时,可以从下面的关系计算在子带m中的混叠现象出现度d[m]。
i)当m是偶数和K1[m]<q,K1[m-1]<q时:
如果K1[m]>K1[m-1],
则d[m]=(-K1[m]+q)/p
如果K1[m]≤K1[m-1],
则d[m]=(-K1[m-1]+q)/p
ii)当m是奇数和K1[m]>-q,K1[m-1]>-q时:
如果K1[m]>K1[m-1],
则d[m]=(K1[m-1]+q)/p
如果K1[m]≤K1[m-1],
则d[m]=(K1[m]+q)/p
iii)否则
d[m]=0
其中p和q是预先确定的阈值,优选p=q=近似0.25。d[m]的上限也优选限制到1.0。
用混叠现象出现度d[m]调整子带m和子带m-1的增益g[m]和g[m-1]如下。
当g[m]>g[m-1]时,
g[m]=(1.0-d[m])·g[m]+d[m]·g[m-1]
当g[m]<g[m-1]时,
g[m-1](1.0-d[m])·g[m-1]+d[m]·g[m]
当用检测条件2或检测条件3检测在三个子带之间的混叠现象联合用检测条件1检测在两个子带之间的混叠现象时,可以用下面的方法计算混叠现象出现度d[m]。
首先,对所有的m,设d[m]为0.0。然后,使用下面的方法以升序确定m的d[m]和d[m-1]。
首先,如果满足检测条件1,则d[m]=1.0。其次,如果只满足检测条件2或检测条件3,混叠现象出现度d[m]设置如下。
i)当m是偶数时:
如果,d[m]=0.0,
则d[m]=(K1[m-2]-K1[m]-T)/s
如果,d[m-1]=0.0,
则d[m-1]=(K1[m-2]-K1[m]-T)/s
ii)当m是奇数时:
如果d[m]=0.0,
则d[m]=(K1[m]-K1[m-2]-T)/s
如果d[m-1]=0.0,
则d[m-1]=(K1[m]-K1[m-2]-T)/s
其中T和s是预先确定的阈值,优选近似T=0.8和s=0.4。d[m]的上限也优选限制到1.0。
用下面的方法也可计算混叠现象出现度d[m]。
首先,对所有的m,设置d[m]为0.0。然后,使用下面的方法以升序确定m的d[m]和d[m-1]。
首先,如果满足检测条件1,则d[m]=1.0。其次,如果只满足检测条件2或检测条件3,则混叠现象出现度d[m]和d[m-1]设置如下。
i)当m是偶数时:
如果,d[m]=0.0,
则d[m]=(K1[m-2]-K1[m]-abs(K1[m-1]))
如果,d[m-1]=0.0,
则d[m-1]=(K1[m-2]-K1[m]-abs(K1[m-1]))
ii)当m是奇数时:
如果d[m]=0.0,
则d[m]=(K1[m]-K1[m-2]-abs(K1[m-1]))
如果d[m-1]=0.0,
则d[m-1]=(K1[m]-K1[m-2]-abs(K1[m-1]))
注意“abs”表示提供绝对值的函数。
例如,当使用如上面描述的以升序匹配两个子带之间的增益调整三个子带之间的增益时,根据子带m和m-1的混叠现象出现度d[m]增益,增益g[m]和g[m-1]可调整如下。
当g[m]>g[m-1]时:
g[m]=(1.0-d[m])·g[m]+d[m]·g[m-1]
当g[m]<g[m-1]时:
g[m-1]=(1.0-d[m])·g[m-1]+d[m]·g[m]
由上所述使用确定混叠现象出现度d[m]调整增益,可以抑止当基于简单表示是否检测出混叠现象的二进制值调整增益时,由增益调整处理的转换引起的声音退化。
此外考虑参考图4A和图4B描述的特性1,为了降低在连续子带中的多路混叠失真,可以利用特性1计算混叠现象出现度d[m]进行增益调整。
具体的说,如在图4A中显示的情况中,在子带m中的镜像频率分量的幅度大于子带m-2的镜像频率分量的幅度,因此在子带m中混叠现象出现度大于在子带m-2中的出现度。相反,如在图4B中显示的情况中,在子带m-2中的混叠现象出现度大于在子带m中的出现度。因此,通过考虑特性1设定混叠现象出现度d[m],可以根据失真度的程度减少混叠失真。可以从下面的公式获得根据此特性设置的混叠现象出现度d[m]。
d[m]=1-K1[m-1]·K1[m-1]
或
d[m]=1-abs(K1[m-1])
因为当K1[m-1]]=0时混叠现象出现度d[m]成为1(或最大值),所以优选此方法。这是因为当在图4A和图4B中的子带m-1中的低频音调和高频音调的幅度相同时,子带m-1的频率分布的斜率成为零,即,反射系数K1[m-1]成为零,在子带m-1和子带m中生成的镜像频率分量相同,因此其混叠现象出现度必须是相同的。
下面描述基于由特性1确定的优先次序计算混叠现象出现度d[m]的方法的例子。注意下面描述的方法基于用检测条件2或检测条件3在跨三个子带上作混叠现象的检测,并根据检测条件1检测两个子带之间的混叠现象。
首先从下面的公式确定混叠现象出现度d[m]。
i)当m是偶数时:
如果K1[m]<0和K1[m-1]<0,
则d[m]=S,
如果K1[m]<0和K1[m-1]<0和K1[m-2]>0,
则d[m-1]=1-K1[m-1]·K1[m-1],
如果K1[m]<0和K1[m-1]≥0和K1[m-2]>0,
则d[m]=1-K1[m-1]·K1[m-1]
ii)当m是奇数时:
如果K1[m]>0和K1[m-1]>0,
则d[m]=S,
如果K1[m]>0和K1[m-1]>0和K1[m-2]<0,
则d[m-1]=1-K1[m-1]·K1[m-1]
如果K1[m]>0和K1[m]≤0和K1[m-2]<0,
则d[m]=1-K1[m-1]·K1[m-1]
iii)否则
d[m]=0
其中S是预先确定的值,优选近似S=1.0。注意用目标子带的反射系数可以适当地设定S值。
例如,如果使用正像上面描述的方法如上面描述的在升序的两个子带之间匹配增益,根据子带m和m-1的混叠现象出现度d[m]调整三个子带之间的增益,子带m和子带m-1的增益g[m]和g[m-1]可调整如下。
当g[m]>g[m-1]时:
g[m]=(1.0-d[m])·g[m]+d[m]·g[m-1]
当g[m]<g[m-1]时:
g[m-1]=(1.0-d[m])·g[m-1]+d[m]·g[m]
应注意到,任何特性值可用作为表示混叠现象出现度d[m],只要它是根据混叠现象出现度d[m]平滑地改变当出现混叠时的最大增益调整量,并且当不出现混叠时的最小增益调整量。
此外,可以计算表示混叠现象出现度的相对于时间的多个值,并使其平滑,用作为混叠现象出现度d[m]。
实施方式4
图5是显示本发明第四实施方式的音频解码设备的原理框图。此解码设备与上面描述的本发明第二和第三实施方式的不同之处在于,除了增加来自分析滤波器组103的低频子带信号617之外,来自比特流多路分解器101的高频分量信息输入到混叠现象检测器。
这样的结构使得混叠现象检测器615能用低频子带信号617和包含在高频分量信息108中的增益信息这两方来检测混叠现象。
如上面描述,当相邻子带之间的增益差大时,则混叠现象成为问题。此外,如果出现混叠现象附近的原始信号水平低,则只有混叠分量是听得见的,因此产生声音质量的严重退化。
考虑此事实,因而,此实施方式的混叠现象检测器615首先参考在高频分量信息108中的增益信息检测相邻子带之间的增益差大于预先确定的水平的子带,然后参考复制到检测的子带中的低频子带信号,并评估各低频子带的水平。对此评估的结果,如果给定子带和相邻子带之间的水平差大于或等于预先确定的阈值,则判断此子带是混叠现象可能发生的子带。可以利用子带信号能量,最大幅度,总的幅度,平均幅度或其它值作为显示各子带的水平的指标。
混叠现象检测器615输出满足以上条件的子带编号作为混叠现象检测数据616。然后混叠现象去除器613只对由混叠现象检测数据616显示的子带的增益进行调整从而抑止混叠现象。
调整增益可以用匹配相邻子带的增益水平,或限制子带之间的增益差或增益比率到预先确定的阈值或更低的方法。当匹配两个子带的增益水平时,增益可设为两个子带中较低的增益水平,设其中较高的增益水平,或设高和低增益水平之间的平均水平(如平均值)。
此外,通常可以用组合的方法防止混叠现象检测器615的检测误差。例如,在检测到混叠现象的子带时,可以用增益匹配,而对其它的子带的增益限制则可以将增益差或增益比率限制到或低于预先确定的值。
因而此结构只调整被认为影响声音质量的混叠现象的子带的增益,而其它的子带则使用接收的比特流显示的增益水平。因此既能防止由于混叠现象声音质量的退化,也能防止由于不匹配的增益的声音的退化。
实施方式5
在上面第一到第四实施方式描述的音频解码设备假设高频子带的增益信息包含在高频分量数据中,并只直接调整增益信息。然而,由发送实际的增益信息,或由传送解码后的高频子带信号的能量可以用来传输增益信息。在此解码处理中,由确定解码后的信号能量和复制到高频子带的低频子带的信号能量之间的比率而得到增益信息。然而,这需要在去除混叠现象前计算高频子带信号的增益。因此本实施方式描述能使用在高频子带解码后发送能量水平的增益信息传输方法的音频解码设备。
图6显示根据本发明的此实施方式的音频解码设备的原理框图。如图所示,对显示在第一实施方式中的音频解码设备的结构,此音频解码设备再加上计算去除混叠现象处理前的高频子带信号增益的增益计算器718。
传输解码高频子带的增益水平的信息108包括两个值:解码后高频子带的能量R,该能量R和由加上附加信号的能量之间的比率Q。增益计算器718识别为带宽扩展器104的增益计算部分。此增益计算器718从能量R和比率Q这两个值和低频子带信号617的能量E算出高频子带的增益g,。
g=sqrt(R/E/(1+Q))
其中sqrt表示平方根算子。
然后算出来的各子带的增益信息719与其它高频信息一起被发送到混叠现象去除器713,进行第一实施方式中描述的去除混叠现象的处理。应该注意到,此增益信息720与附加信号信息发送到附加信息发生器711。此结构使得当代替高频子带增益信息的高频子带能量值传输而来时,也能使用本发明的混叠现象去除器(去除装置)。
此外,甚至当传输来的是高频子带能量值时,本实施方式的混叠现象去除器也能用到第二到第四实施方式中。即,计算去除混叠现象前的高频子带信号的增益,并且计算的高频子带的增益输入到混叠现象去除器113。
应该注意到,因为在此实施方式可以使用低频子带信号的能量,可以调整两个相邻子带之间的增益g如下。
用下面的公式首先计算在增益调整前子带m-1和m的总能量Et[m]
Et[m]=g[m]2·E[m]+g[m-1]2·E[m-1]
其中g[m-1]和g[m]是在增益调整前子带m-1和m的增益,E[m]和E[m-1]分别是相应低频子带信号的能量。
因此,总能量Et[m]设置为目标能量,计算获得目标能量要求的对参考能量(即,低频子带信号能量)的增益。因为此增益表示为目标能量和参考能量的比率的平方根,用下面的公式计算子带m-1和子带m的平均增益Gt[m]
Gt[m]=sqrt(Et[m]/(E[m]+E[m-1]))
然后用平均增益Gt[m]和在子带m的混叠现象出现度d[m]计算在增益调整后子带m的增益g1[m]。
g1[m]=d[m]·Gt[m]+(1.0-d[m])·g[m]
由于增益的调整,子带m的能量产生变化。要防止子带m-1和子带m的总能量Et[m]改变,可以从下面的公式计算在调整后子带m-1的增益g1[m-1],因为子带m-1的能量等于Et[m]减子带m的能量。
g1[m-1]=sqrt((Et[m]-g1[m]2·E[m])/E[m-1])
如上所述,只要调整子带m-1和子带m的增益,则在增益调整前子带m-1和子带m的总能量和增益调整后子带m-1和子带m的总能量是相同的。换言之,因为不改变两个子带的总能量可以调整各子带的增益,可以抑止伴随增益调整信号能量的变化所引起的声音退化。
此外,子带m-1和子带m的总能量Et[m]是只从相应低频子带复制的信号计算出来的值,并不包含由能量比率Q表示的,由附加信号所加的能量分量。因为可以维持从低频子带复制的子带信号的能量分布,不受附加信号的影响,因此可以防止声音质量的退化。
当此增益调整方法用到三个子带上时,计算相同增益水平的各子带I(I=m-2,m-1,m)的g[I]2·E[I]值,然后设三个值的和为Et[m]。与调整两个子带之间的增益时同样,从下面的公式获得平均增益Gt[m],调整增益使目标子带的增益与Gt[m]匹配。
Gt[m]=sqrt(Et[m]/(E[m-2]+E[m-1]+E[m]))
当调整增益的子带数是4或更多时也使用此方法。
也注意到,如前面描述的对混叠现象去除器113的说明,对两个子带间的增益调整处理,可以用升序或降序。
可使用对如下的两个或多个子带的混叠现象出现度d[m]选择性地调整增益。例如,假设在三个子带上调整增益,计算各要调整增益的子带m-2,m-1,m的能量,获得总能量Et[m]如下。
Et[m]=g[m-2]2·E[m-2]+g[m-1]2·E[m-1]+g[m]2·E[m]
然后用此总能量Et[m]从下面的公式计算平均增益的平方G2t[m]。
G2t[m]=Et[m]/(E[m-2]+E[m-1]+E[m])
然后用G2t[m],临时地算出目标子带I(I=m-2,m-1,m)的增益如下。注意在此实施方式中使用平方值内插增益。
g2[I]=f[I]·G2t[m]+(1.0-f[I])·g2[I]2
其中f[I]是d[I]和d[I+1]的较大值。用此临时的增益g2[I]获得总能量E1t[m]如下。
E1t[m]=g2[m-2]2·E[m-2]+g2[m-1]2·E[m-1]+g2[m]2·E[m]
注意总能量E1t[m]不一定等于上面描述的总能量E t[m]。因此,为了防止总能量由于增益调整的变化,可以设置目标子带I(I=m-2,m-1,m)的调整后的增益g1[I]为
g1[I]=sqrt(b·g2[I])
b=Et[m]/E1t[m]。
不管增益调整的子带数是2或4或更多也可以使用此方法。
如果使用此增益调整方法,当在两个子带之间调整增益时,即使当使用混叠现象出现度d[m]在多于两个的更多子带上调整增益时,在增益调整前的总能量和在增益调整后的总能量是相同的。这意味着,因为不改变总的信号能量可以调整各子带的增益,可以防止伴随增益调整信号能量的变化产生的声音质量的退化。与如上面描述的在两个子带上调整增益时同样,声音质量也不受附加信号的影响。
当从分析滤波器组103输出的复数值低频子带信号在带宽扩展器104中转换为实数值低频子带信号,由实数运算产生高频子带信号时,也可以使用上面的实施方式中描述的音频解码设备的结构。混叠现象检测处理也可以对在带宽扩展器104中已被转换了的实数值低频子带信号进行。不改变根据本发明的音频解码设备的结构或处理方法,进行复数值信号转换到实数值信号的信号处理完成这两种情况。即,复数值信号的虚部是0的信号。这样的结构可以对产生的实数值高频子带信号进行混叠现象去除处理,并用实数运算从而降低带宽扩展器104执行的运算数量。因此可以抑止由于混叠现象的声音质量的退化。
此外,当分析滤波器组103是实数值系数滤波器组时,也可使用上面描述的音频解码设备的结构。由于实数值系数分析滤波器组103从频带划分产生的子带信号是实数值信号,因此,与将复数值信号转换而得到实数值信号时同样,在产生高频子带信号时,混叠现象成为问题。因此用上面任何实施例中描述的音频解码设备的结构,可以抑止混叠现象的产生,防止混叠现象引起的声音质量的退化。因为所有的解码运算用实数进行,用此结构能大大的减少执行的运算数量。
由上面本发明的实施方式中描述的音频解码设备实现的处理也能用预先确定的编程语言编码的软件程序完成。此软件应用程序也可记录在用作销售的计算机可读的数据记录介质中。
虽然结合特定的实施方式描述了本发明,对本领域的技术人员来说许多其它的修正,修改和应用是显见的。因此,本发明不受公开的内容所限制,仅受限于所附的权利要求的范围。
还应注意到,本发明涉及2002年10月15日注册的日本专利申请2002-300490,该专利的内容合并在此作为参考。
Claims (28)
1.一种音频解码设备,用于从包含窄带音频信号的编码信息的比特流解码宽带音频信号,包括:
比特流多路分解器,用于从所述比特流中多路分解编码的信息;
解码器,用于从多路分解的编码信息解码窄带音频信号;
分析滤波器组,用于划分解码的窄带音频信号为多个子带信号,产生由所述多个子带信号构成的第一子带信号;
带宽扩展器,从所述第一子带信号产生比第一子带信号的频带更高的频带的第二子带信号,该第二子带信号由多个子带信号构成;
混叠现象去除器,为了抑止出现在所述第二子带信号的子带信号中的混叠分量,根据所述第二子带信号的子带信号的混叠分量的程度调整增益;
实数值计算合成滤波器组,合成所述第一子带信号和所述第二子带信号,获得宽带音频信号。
2.一种音频解码设备,用于从包含窄带音频信号的编码信息的比特流解码宽带音频信号,包括:
比特流多路分解器,用于从所述比特流中多路分解编码的信息;
解码器,用于从多路分解的编码信息解码窄带音频信号;
分析滤波器组,用于划分解码的窄带音频信号为多个子带信号,产生由所述多个子带信号构成的第一子带信号;
带宽扩展器,从所述第一子带信号产生比第一子带信号的频带更高的频带的第二子带信号,该第二子带信号由多个子带信号构成;
混叠现象检测器,检测由所述带宽扩展器产生的所述第二子带信号的各子带信号的混叠分量的程度;
混叠现象去除器,基于检测的所述混叠分量的程度,调整所述第二子带信号的子带信号的增益;
实数值计算合成滤波器组,合成所述第一子带信号和所述第二子带信号,获得宽带音频信号。
3.根据权利要求2所述的音频解码设备,其特征在于所述混叠分量至少包含由进行复数运算的合成滤波器组合成后被抑止的分量。
4.根据权利要求2所述的音频解码设备,其特征在于所述第一子带信号是低频子带信号,所述第二子带信号是高频子带信号。
5.根据权利要求4所述的音频解码设备,其特征在于所述混叠现象检测器使用表示所述第一子带信号的子带信号的频率分布的斜率的参数,检测混叠分量的程度。
6.根据权利要求5所述的音频解码设备,其特征在于所述混叠现象检测器评估表示两个相邻子带信号的频率分布的斜率的参数,并检测在所述两个子带信号之间的混叠分量的程度。
7.根据权利要求5所述的音频解码设备,其特征在于混叠现象检测器评估表示三个相邻子带信号之间的频率分布的斜率的参数,并检测在三个子带中的混叠分量的程度。
8.根据权利要求5所述的音频解码设备,其特征在于表示所述频率分布的斜率的参数是反射系数。
9.根据权利要求2所述的音频解码设备,其特征在于:
所述比特流包含窄带音频信号的编码信息和使得窄带扩展到宽带的附加信息;
所述附加信息,包含显示比所述第一子带信号的频带更高的频带的信号特性的高频分量信息;
所述比特流多路分解器,还从所述比特流多路分解附加信息;
所述带宽扩展器,从所述第一子带信号和在所述附加信息中的高频分量信息产生比所述第一子带信号的频带更高的频带的所述第二子带信号,所述第二子带信号由多个子带信号构成。
10.根据权利要求9所述的音频解码设备,其特征在于:
高频分量信息包含比所述第一子带信号的频带更高的频带的增益信息;
所述带宽扩展器,基于所述增益信息从所述第一子带信号产生所述第二子带信号;
所述混叠现象去除器,为了抑止混叠分量,基于检测到的所述混叠分量的程度和所述增益信息,调整所述第二子带信号的子带信号的增益。
11.根据权利要求9所述的音频解码设备,其特征在于:
所述高频分量信息包含比所述第一子带信号的频带更高的频带的能量信息;
所述带宽扩展器,基于从能量信息算出的增益信息,从所述第一子带信号产生所述第二子带信号;
所述混叠现象去除器,为了抑止混叠分量,基于检测到的所述混叠分量的程度和所述增益信息,调整所述第二子带信号的子带信号的增益。
12.根据权利要求11所述的音频解码设备,其特征在于所述混叠现象去除器调整所述第二子带信号的子带信号的增益,使得增益调整后的所述第二子带信号的总能量等于由所述能量信息提供的、相应的第二子带信号的总能量。
13.根据权利要求11所述的音频解码设备,其特征在于:
所述带宽扩展器把附加信号加到产生的所述第二子带信号;
所述能量信息包含所述第二子带信号的能量R及所述能量R与附加信号的能量的比率Q;
所述带宽扩展器,计算所述第一子带信号的能量E,基于所述能量R,所述能量E和由所述能量比率Q表示的附加信号的能量,算出相应的所述第二子带信号的增益g。
14.根据权利要求13所述的音频解码设备,其特征在于所述第二子带信号的增益g是
g=sqrt(R/E/(1+Q))
其中sqrt表示平方根算子。
15.一种音频解码方法,从包含窄带音频信号的编码信息的比特流解码宽带音频信号,包括:
从所述比特流中多路分解编码的信息;
从多路分解的编码信息解码窄带音频信号;
划分解码的窄带音频信号为多个子带信号并且产生由所述多个子带信号构成的第一子带信号;
从所述第一子带信号产生比第一子带信号的频带更高的频带的第二子带信号,该第二子带信号由多个子带信号构成;
为了抑止出现在所述第二子带信号的子带信号中的混叠分量,根据所述第二子带信号的子带信号的混叠分量的程度调整增益;
用实数值滤波计算合成所述第一子带信号和所述第二子带信号,获得宽带音频信号。
16.一种音频解码方法,从包含窄带音频信号的编码信息的比特流解码宽带音频信号,包括:
从所述比特流中多路分解编码的信息;
从多路分解的编码信息解码窄带音频信号;
划分解码的窄带音频信号为多个子带信号并且产生由所述多个子带信号构成的第一子带信号;
从所述第一子带信号产生比第一子带信号的频带更高的频带的第二子带信号,该第二子带信号由多个子带信号构成;
在产生第二子带信号前分别检测所述产生的第二子带信号的各子带信号的混叠分量的程度;
基于检测到的混叠分量的程度,调整第二子带信号的子带信号增益;
用实数值滤波计算合成所述第一子带信号和所述第二子带信号,获得宽带音频信号。
17.根据权利要求16所述的音频解码方法,其特征在于所述混叠分量至少包含由进行复值运算的合成滤波器合成后被抑止的分量。
18.根据权利要求16所述的音频解码方法,其特征在于所述第一子带信号是低频子带信号,所述第二子带信号是高频子带信号。
19.根据权利要求18所述的音频解码方法,其特征在于使用表示所述第一子带信号的子带信号的频率分布的斜率的参数检测混叠分量的程度。
20.根据权利要求19所述的音频解码方法,其特征在于评估表示两个相邻子带信号的频率分布的斜率的参数,检测所述两个子带信号之间混叠分量的程度。
21.根据权利要求19所述的音频解码方法,其特征在于评估表示三个相邻子带信号的频率分布的斜率的参数,检测三个子带之间的混叠分量的程度。
22.根据权利要求19所述的音频解码方法,其特征在于所述表示频率分布的斜率的参数是反射系数。
23.根据权利要求16所述的音频解码方法,其特征在于:
所述比特流包含窄带音频信号的编码信息,和使得窄带扩展到宽带的附加信息;
所述附加信息包含显示比第一子带信号的频带更高频带的信号特性的高频分量信息;
在多路分解编码的信息时,从所述比特流多路分解所述附加信息;
在产生所述第二子带信号时,从所述第一子带信号和所述附加信息的高频分量信息产生比所述第一子带信号的频带更高频带的所述第二子带信号,所述第二子带信号由多个子带信号构成。
24.根据权利要求23所述的音频解码方法,其特征在于:
所述高频分量信息包含比所述第一子带信号的频带更高频带的增益信息;
在产生所述第二子带信号时,基于所述增益信息从所述第一子带信号产生所述第二子带信号;
在调整增益时,为了抑止混叠分量,基于检测的混叠分量的程度调整所述第二子带信号的子带信号的增益。
25.根据权利要求23所述的音频解码方法,其特征在于:
所述高频分量信息包含在比所述第一子带信号的频带更高频带的信号的能量信息;
在产生所述第二子带信号时,基于从所述能量信息计算的增益信息从所述第一子带信号产生所述第二子带信号;
在调整所述增益时,为了抑止混叠分量基于检测的混叠分量的程度和所述增益信息,调整所述第二子带信号子带信号的增益。
26.根据权利要求25所述的音频解码方法,其特征在于在调整所述增益时,调整所述第二子带信号的子带信号的增益,使得增益调整后的所述第二子带信号的总能量等于由所述能量信息提供的、相应的第二子带信号的总能量。
27.根据权利要求25所述的音频解码方法,其特征在于:
产生的所述第二子带信号,包括把附加信号加到产生的所述第二子带信号;
所述能量信息包含所述第二子带信号的能量R及所述能量R与所述附加信号的能量的比率Q;
产生的所述第二子带信号还包括,计算所述第一子带信号的能量E,基于所述能量R,所述能量E和由所述能量比率Q表示的附加信号的能量,算出相应的所述第二子带信号的增益g。
28.根据权利要求27所述的音频解码方法,其特征在于所述第二子带信号的增益g是
g=sqrt(R/E/(1+Q))
其中sqrt表示平方根算子。
Applications Claiming Priority (7)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002273557 | 2002-09-19 | ||
| JP2002-273557 | 2002-09-19 | ||
| JP2002-283722 | 2002-09-27 | ||
| JP2002283722 | 2002-09-27 | ||
| JP2002300490 | 2002-10-15 | ||
| JP2002-300490 | 2002-10-15 | ||
| PCT/JP2003/011601 WO2004027368A1 (en) | 2002-09-19 | 2003-09-11 | Audio decoding apparatus and method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| HK1074877A1 true HK1074877A1 (zh) | 2005-11-25 |
| HK1074877B HK1074877B (zh) | 2009-12-18 |
Family
ID=
Also Published As
| Publication number | Publication date |
|---|---|
| CN100492492C (zh) | 2009-05-27 |
| BR0306434A (pt) | 2004-10-26 |
| CA2469674C (en) | 2012-04-24 |
| EP1543307B1 (en) | 2006-02-22 |
| KR20050042075A (ko) | 2005-05-04 |
| WO2004027368A1 (en) | 2004-04-01 |
| CA2469674A1 (en) | 2004-04-01 |
| KR100728428B1 (ko) | 2007-06-13 |
| JP3646939B1 (ja) | 2005-05-11 |
| TWI313856B (en) | 2009-08-21 |
| EP1543307A1 (en) | 2005-06-22 |
| US20050149339A1 (en) | 2005-07-07 |
| ATE318405T1 (de) | 2006-03-15 |
| BRPI0306434B1 (pt) | 2018-06-12 |
| US7069212B2 (en) | 2006-06-27 |
| TW200407846A (en) | 2004-05-16 |
| BRPI0306434A8 (pt) | 2017-10-10 |
| DE60303689T2 (de) | 2006-10-19 |
| AU2003260958A1 (en) | 2004-04-08 |
| AU2003260958A8 (en) | 2004-04-08 |
| ES2259158T3 (es) | 2006-09-16 |
| CN1606687A (zh) | 2005-04-13 |
| DE60303689D1 (de) | 2006-04-27 |
| JP2005520219A (ja) | 2005-07-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CA2469674C (en) | Audio decoding apparatus and method | |
| CA2453814C (en) | Audio decoding apparatus and decoding method and program | |
| JP4220461B2 (ja) | 時間的に離散した音声信号のアップサンプリングした信号を発生する方法と装置 | |
| CA2736065C (en) | Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components | |
| US8321229B2 (en) | Apparatus, medium and method to encode and decode high frequency signal | |
| KR101703810B1 (ko) | 디지털 오디오 신호들의 계층적 코딩/디코딩을 개선하기 위한 향상 코딩/ 디코딩에서의 비트들의 할당 | |
| JP5224017B2 (ja) | オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム | |
| US10255928B2 (en) | Apparatus, medium and method to encode and decode high frequency signal | |
| US20070156397A1 (en) | Coding equipment | |
| US20080140405A1 (en) | Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components | |
| JP3081378B2 (ja) | 毎秒32kbの可聴周波数信号の符号化方法 | |
| JP4313993B2 (ja) | オーディオ復号化装置およびオーディオ復号化方法 | |
| US20040039568A1 (en) | Coding method, apparatus, decoding method and apparatus | |
| HK1074877B (zh) | 音频解码设备和方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| CHRG | Changes in the register |
Free format text: CORRECTION OF THE CHINESE NAME OF THE INVENTOR |
|
| PE | Patent expired |
Effective date: 20230910 |