[go: up one dir, main page]

CN106165015B - 用于促进基于加水印的回声管理的装置和方法 - Google Patents

用于促进基于加水印的回声管理的装置和方法 Download PDF

Info

Publication number
CN106165015B
CN106165015B CN201480069360.5A CN201480069360A CN106165015B CN 106165015 B CN106165015 B CN 106165015B CN 201480069360 A CN201480069360 A CN 201480069360A CN 106165015 B CN106165015 B CN 106165015B
Authority
CN
China
Prior art keywords
watermarked
echo
segments
signal
watermark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201480069360.5A
Other languages
English (en)
Other versions
CN106165015A (zh
Inventor
A·丹尼尔
L·莱宝卢克斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of CN106165015A publication Critical patent/CN106165015A/zh
Application granted granted Critical
Publication of CN106165015B publication Critical patent/CN106165015B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/20Arrangements for preventing acoustic feed-back
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

描述了根据一个实施例的、用于促进计算设备处的回声加水印和过滤的机制。如本文中所述,实施例的方法包括将水印分配给通信信号,其中加水印的通信信号在退出计算设备之后转换成加水印的回声。所述方法进一步包括以下步骤:接收加水印的回声;过滤加水印的回声,使得加水印的回声从最终信号中被消去;以及传输没有加水印的回声的最终信号。

Description

用于促进基于加水印的回声管理的装置和方法
技术领域
本文所述的实施例总体上涉及计算机。更具体而言,实施例涉及用于促进对于通信设备处的内容传输的基于加水印(watermarking)的回声管理的机制。
背景技术
回声可能非常扰人,并且通常被认为是对话期间最差类型的减损。尽管在当今的通信设备中采用了各种常规的回声消去技术,但这些常规技术不够高效,因为已知它们不能够完全消除回声。
附图说明
在附图中以示例而非限制方式解说了各实施例,在附图中,相似的附图标记指示相似的元件。
图1解说根据一个实施例的计算设备处的回声加水印和过滤机制。
图2解说根据一个实施例的回声加水印和过滤机制。
图3A解说根据一个实施例的具有图2的回声加水印和过滤机制的各种组件的计算设备。
图3B解说根据一个实施例的具有图2的回声加水印和过滤机制的水印回声消去引擎和增益水印回声消去引擎的计算设备。
图4解说根据一个实施例的适于实现本公开的实施例的计算机系统。
图5解说根据一个实施例的用于促进计算设备处的对回声加水印和过滤的方法。
具体实施方式
在以下描述中阐述了众多具体细节。然而,如本文中所述,可在没有这些具体细节的情况下实践实施例。在其他实例中,未详细地示出公知的电路、结构和技术以免使对本说明书的理解含糊。
实施例提供了对于基于对音频信号加水印而被分类为来自信号的混合中的回声(也称为“回声信号”)的通信信号(例如,音频信号)的提取和/或抑制,其中所述信号的混合通过网络、在计算/通信设备(例如,智能电话、平板计算机等)之间传递。在一个实施例中,被认为是回声的音频信号在退出通信设备之前被加水印,因此在它重新进入此通信设备之后可被识别为回声并被充分地抑制。例如,可根据通过使用两个不同的回声核(例如,“一”核和“零”核)以卷积载波音频信号的二进制表示来分配加水印。两个核可在所插入的回声的延迟上不同,相应地,在解码时,通过比较加水印的信号中两个预期的延迟值处回声的存在来恢复每一个时间帧的位值。通过考虑各种人耳能力和特征,通过隐藏回声的本新颖和创新的水印技术可对人耳保持透明。
图1解说根据一个实施例的计算设备100处的回声加水印和过滤机制110。计算设备100用作用于主管回声加水印和过滤机制(“回声机制”)110的主机,所述回声加水印和过滤机制包括用于促进对诸如计算设备100之类的通信设备上的语音传输中回声的加水印和隐藏的任何数量和类型的组件的组合。
计算设备100可包括任何数量和类型的通信设备,诸如,大型计算系统,诸如,服务器计算机、台式计算机等,并且可进一步包括机顶盒(例如,基于互联网的有线电视机顶盒等)、基于全球定位系统(GPS)的设备等。计算设备100可包括用作通信设备的移动计算设备,诸如,包括智能电话(例如,
Figure GDA0002282284610000021
Figure GDA0002282284610000022
Figure GDA0002282284610000023
运动
Figure GDA0002282284610000024
(Research in
Figure GDA0002282284610000025
)的
Figure GDA0002282284610000026
(BlackBerry)
Figure GDA0002282284610000027
等)的蜂窝电话、个人数字助理(PDA)、平板计算机(例如,
Figure GDA0002282284610000028
Figure GDA0002282284610000029
Figure GDA00022822846100000210
的Galaxy
Figure GDA00022822846100000211
等)、膝上型计算机(例如,笔记本、上网本、超极本TM(UltrabookTM)系统等)、电子阅读器(例如,
Figure GDA00022822846100000212
Figure GDA00022822846100000213
Barnes and
Figure GDA00022822846100000214
Figure GDA00022822846100000215
等)、智能电视、可穿戴设备(例如,手表、腕带、智能卡等)、媒体播放器等。
计算设备100可包括用作计算设备100的硬件和/或物理资源与用户之间的接口的操作系统(OS)106。计算设备100进一步包括一个或多个处理器102、存储器设备104、网络设备、驱动器等以及输入/输出(I/O)源108(诸如,触摸屏、触摸面板、触摸垫、虚拟或常规键盘、虚拟或常规鼠标等)。应当注意,贯穿本文档,可互换地使用类似“节点”、“计算节点”、“服务器”、“服务器设备”、“云计算机”、“云服务器”、“云服务器计算机”、“机器”、“主机”、“设备”、“计算设备”、“计算机”、“计算系统”等的术语。还应注意,贯穿本文档,可互换地使用类似“应用”、“软件应用”、“程序”、“软件程序”、“包”和“软件包”之类的术语。类似地,贯穿本文档,可互换地使用类似“工作”、“输入”、“请求”和“消息”之类的术语。
图2解说根据一个实施例的回声加水印和过滤机制110。在一个实施例中,可在计算设备100处采用回声机制110,所述计算设备用作通信设备,所述计算设备诸如,智能电话、可穿戴设备、平板计算机、膝上型计算机、台式计算机等。在一个实施例中,回声机制110可包括任何数量和类型的组件,这些组件诸如:信号检测和评估逻辑201、水印分配逻辑203、回声监测和接收逻辑205、水印检测逻辑207、过滤和处理逻辑209以及通信/兼容性逻辑211。
在一些实施例中,计算设备100可包含与回声机制110共同工作以执行各种常规和非常规任务的任何数量和类型的其他组件。在此不讨论许多此类组件,并且此类组件可包括(但不限于):均衡器动态控制(EDC)、语音可懂度(intelligibility)增强(SIE)、信噪估计(SNE)、声学回声消去(AEC)、增益损失控制(GLC)、包括残余回声抑制组件的降噪组件,等等。
通信信号(诸如,音频信号(例如,电话语音信号等)、音频/视频信号(例如,
Figure GDA0002282284610000031
通信信号、
Figure GDA0002282284610000032
通信信号等),等等)可通过一个或多个通信网络、在远端声学环境220内的计算设备240与近端声学环境250内的计算设备100之间传递,所述通信网络诸如网络230(例如,电信网络、因特网、云网络等)。构想了计算设备100、240之间的通信可经由一个或多个电信公司(例如,
Figure GDA0002282284610000033
Figure DA00022822846138028
Figure GDA0002282284610000034
Figure GDA0002282284610000035
等)所提供的一个或多个通信软件应用(诸如,软件应用241)来促进。构想了由软件应用(诸如,软件应用242)提供的一个或多个用户接口(诸如,用户接口217、243)可在计算设备100、240处使用以促进信号的传递(诸如,常规电话呼叫、
Figure GDA0002282284610000036
呼叫等)。
构想了尽管所解说的实施例实现具有在用作近设备的计算设备100处采用的回声机制110,在所述计算设备100处,从用作远设备的计算设备240接收通信信号以用于回声处理和过滤目的,但是实施例不限于此特定安排,构想了任务可在计算设备110和240之间反转,并且构想了可包括任何数量和类型的其他计算设备(具有或不具有回声机制110)以及任何数量和类型的网络。
一旦在计算设备100处接收了通信信号(或者简称为“信号”),此信号将在计算设备100处通过诸如收听设备213(例如,扩音器等)的收听设备传递并发声,且随后可预期一旦此信号已离开收听设备213并在诸如发言设备215(例如,话筒)之类的发言设备处接收到或被往回馈送到发言设备之后创建回声。在一个实施例中,当在计算设备100处接收到通信信号之后,此通信信号随后可由信号检测和评估逻辑210检测并评估而被认为是潜在回声。例如,当通信信号在计算设备100处被接收并通过典型的通信组件而去往收听设备213时,此通信信号在到达收听设备213之前可由信号检测和评估逻辑201检测到,使得随后在与其他外部信号混合之前可评估此通信信号以进行可能的加水印,所述外部信号诸如,接收端处的计算设备100的用户的语音以及可能是近端声学环境220的部分的任何其他噪声(例如,交通、人群、电视等)。
在一个实施例中,在检测到信号以及将此信号视为回声的后续评估之后,水印分配逻辑203将水印分配给此信号,以便将来当此信号经由发言设备215返回到计算设备100时识别为回声。在一个实施例中,回声监测和接收逻辑205在加水印的回声离开收听设备213并行进通过空气并到达发言设备215时持续地监视此加水印的回声,其中,由回声监视和接收逻辑205接收此加水印的回声。构想了加水印的回声可能不是在发言设备215处接收到的仅有的声音,并且也可接收任何数量和类型的其他声音并聚合为变成混合信号,所述其他声音包括(但不限于)计算设备100的第一用户的人类语音以及可落入近端声学环境220和发言设备215的范围内的其他噪声和声音,诸如,其他人类语音、交通等。
当在发言设备215处接收到加水印的回声之后,由水印检测逻辑207将此加水印的回声检测为是与通过发言设备215输入的其他噪声和声音完全不同的回声。在一个实施例中,随后,检测到的加水印的回声经处理,以便由过滤和处理逻辑209动态地过滤。例如,在一些实施例中,可完全地抑制(也称为“消去”、“消除”、“移除”或“隐藏”)加水印的回声;而在一些实施例中,可部分地抑制加水印的回声到达计算设备240的第二用户,诸如,可消除某些部分(例如,某些词、频段等)或者不消除并允许某些部分(例如,某些词、频段等)通过。例如,某些频段可能不可由人耳听见,因此可能没有对他们加水印或排除它们的需求。在又一些实施例中,可完全不抑制加水印的回声并允许此加水印的回声通过网络230传递到计算设备240,而在又一些实施例中,诸如,当加水印的回声用于侦测性目的或处于安全情形(诸如,在警方侦测性工作中、军事工作中等)中时,可仅保持加水印的回声并允许此加水印的回声通过,同时可抑制所有其他噪声和声音,。
在一个实施例中,可将信号分解为多个段,并且可由水印分配逻辑203选择性地对这些段加水印,其中每一个段可表示或包括一个频带。例如,在一些实施例中,可不将水印应用于整个信号谱,并且可取决于各段表示的频率而选择性地将水印应用于任何数量和类型的段。因此,当由水印检测逻辑207检测到加水印的回声时,这允许对在多个带或子带处而不是对整个信号或声音的混合的后续回声估计,这允许过滤和处理逻辑209执行随时间变化的频率响应。
在一个实施例中,通信信号包括从网络230获得和解码的扩音器信号,此扩音器信号将被发送至收听设备213。如前所述,通过发言设备215进入的混合信号可包括以下各项的和(但不限于):(i)回声,诸如,回放之后的扩音器信号、(ii)近端声学环境220的环境噪声;以及(iii)来自近端发言者(诸如,第一用户)的有用语音。如将参考图3A-3b进一步描述的那样,构想了回声机制110可与其他技术一起采用,诸如,具有可将扩音器信号作为由发言设备215拾取的回声信号的参考信号的自适应回声消去器(AEC)。
回声核(kernel)
如前所述,水印分配逻辑203可用于跟踪可在由信号检测和评估逻辑201跟踪和检测之后被加水印的通信信号的多个段(例如,频带)。例如,“回声核”可指作为滤波器的延迟线的表达,而“子带回声核”(“子带核”或简称为“子核”)可指带回声核的连续频基元(bin)的子集,并且“全带回声核”(“全带核”或简称为“全核”)可以是回声核。例如,子核可从回声核中导出,此回声核可能已经被位移、缩放和实施以具有实数值的脉冲响应。
在一个实施例中,可导出等价于全核的子核,其中所针对的回声核包括独立子核的集合。例如,不同的核可用在每一个子核中,而对于所有子核选择和使用单个类型的核确保了得到的全核等价于回声核。
在一个实施例中,让我们假设回声指前馈梳形滤波器,此前馈梳形滤波器的单位样本响应如下:
Figure GDA0002282284610000061
其中α是缩放因子(例如,回声的幅度),且D是样本中的回声延迟。在一个实施例中,让我们假设α<1且D>0。例如,4个样本的50%回声系数(例如,α=.5,且D=4)为:
h=[1 0 0 0.5].
如前所述,例如,子核的集合等价于全核以确保加水印的信号中可接受的失真。此外,对于水印的后一检测基本的是约束子核也具有回声核形式。回声核可具有以下频率响应:
H(ω)=1+αe-jωD=1+αcos(ωD)-jαsin(ωD)
在每一个间隔[kπ∶(k+1π],(k∈N)内,H是周期性的,周期为
Figure GDA0002282284610000062
让我们考虑H的频移版本如下:
Figure GDA0002282284610000063
其中K是想要的带的数量,且k=0…K-1。如果选择K=D/2q,其中整数q是每个带的时段的数量,则:
Figure GDA0002282284610000064
Figure GDA0002282284610000065
因为H在[0:π]内以
Figure GDA0002282284610000066
为周期。
随后用因子
Figure GDA0002282284610000067
对滤波器进行频率缩放:
Figure GDA0002282284610000068
此频率响应在[0:π]上被截断:
Figure GDA0002282284610000071
根据此经截断的频率响应,子带滤波器H'可通过假定其时域系数为实数来定义,这可通过期望子带滤波器为回声核形式来施加。我们选择
Figure GDA0002282284610000072
则:
Figure GDA0002282284610000073
其是周期性的,周期为
Figure GDA0002282284610000074
因此,间隔[0:π]跨全部q个
Figure GDA0002282284610000075
时段。结果是,子带滤波器H'的频率响应是周期性的,并等于
Figure GDA0002282284610000076
的频率响应:
Figure GDA0002282284610000077
根据此观点,H'是从全核H中导出的、带延迟
Figure GDA0002282284610000078
个样本的子核。
通信信号加水印
如将关于图3A-3C进一步所描述,可经由水印分配逻辑203通过与全核II卷积对输入通信信号x(n)加水印以获得信号w(n)。在声学回声去除的上下文中,信号x(n)代表通过网络230而来并由收听设备213播放的信号。
在通过发言设备215之后检测加水印的回声的存在
对话筒信号中水印的检测可基于倒谱分析(cepstral analysis)[见1996年Gruhl等的《回声隐藏》],例外在于,在一个实施例中,此检测可在子核(与整个宽带通信信号完全不同)上执行,此外,可从包含加水印的信号的信号的混合(诸如,近端声学环境220的噪声和声音)中检测加水印的信号。
回声检测
对加水印的信号的倒谱(cepstrum)W(n)可允许按如下方式将回声核H从它已经与之卷积的原始信号X(n)中分离:
w(n)=x(n)*h(n)
W(ω)=X(ω)Hω)
Figure GDA0002282284610000081
其中
Figure GDA0002282284610000082
Figure GDA0002282284610000083
分别指w、x和h的复倒谱(complex cepstra)。例如,倒谱分析将卷积操作转换成加法操作。关于h的倒谱:
Figure GDA0002282284610000084
此逆傅立叶变换中的两个项:
Figure GDA0002282284610000085
Figure GDA0002282284610000086
两者都是周期性的,周期为
Figure GDA0002282284610000087
因而,根据傅立叶分析,它们的逆傅立叶变换示出在
Figure GDA0002282284610000088
中在其基频n=D处的一个强分量。检测延迟D的回声是否存在于
Figure GDA0002282284610000089
中的第一选项可以是查看值
Figure GDA00022822846100000810
然而,由于在这两个项中log(对数)函数的存在,附加分量也可能在
Figure GDA00022822846100000811
中在其谐波频率n=2D、3D等处示出。因此,为了进一步改善对
Figure GDA00022822846100000812
中延迟D的回声的检测,通常计算
Figure GDA00022822846100000813
的自相关
Figure GDA00022822846100000814
以获得在每一个延迟n处发现的信号的功率。例如,可以通过查看在值
Figure GDA00022822846100000815
处是否存在功率尖峰来确定延迟D的回声的存在。
子带回声中回声检测器的实现的一个实施例
在一个实施例中,可基于短期傅立叶变换(STFT)来进行对话筒信号y(n)的频率分析,诸如:
Y(l,m)=W(l,m)+S(l,m)+Z(l,m)
其中W是加水印的扩音器信号,S是近端语音信号(诸如由计算设备100的第一用户发出的有用的语音),Z是环境噪声信号(诸如,来自近端声学环境220),l是频率基元,而m是时域帧索引。
遵循前述子带核加水印方式,对于每一个时域帧m,Y分解成
Figure GDA0002282284610000091
个子带信号
Figure GDA0002282284610000092
(为了清晰起见省略了索引m):
Figure GDA0002282284610000093
Figure GDA0002282284610000094
Figure GDA0002282284610000095
Figure GDA0002282284610000096
对于每一个Y_k应用频移
Figure GDA0002282284610000097
随后频率缩放
Figure GDA0002282284610000098
以获得YK′。因此,在此Y-W的特定情况下,信号YK′等于XK′与H′的积,诸如,XK′与延迟D′=2q的子核h′卷积。
例如,对于每一个时域帧,可在N个点上执行离散傅立叶变换(DFT)。基于先前的评论,可将(N/2+1)个有用频率基元分组为K个等量频率基元
Figure GDA0002282284610000099
的带。
基于加水印存在性的过滤
对于一个时域帧(忽略索引m):
YK(l)=WK(l)+SK(l)+ZK(l),其中W′K(l)=X′K(l)H′K(l)
则y′K的倒谱等于:
Figure GDA00022822846100000910
当W′K(l)>>S′K(l)+Z′K(l)时,则:
Figure GDA00022822846100000911
Figure GDA0002282284610000101
由于延迟D′的回声核
Figure GDA0002282284610000102
的存在,
Figure GDA0002282284610000103
可具有高值。
相反,当W′K(l)<<S′K(l)+Z′K(l)时,则:
Figure GDA0002282284610000104
并且假定S′K+Z′K不从与延迟D′的回声核的卷积中产生,则
Figure GDA0002282284610000105
将不具有高值。
在下文中,让我们假设期望的行为是从Y′K中去除信号W′K,但类似的推理可用于仅保持W′K。简单的二元增益规则包括设置阈值τ,高于此阈值时,认为Y′K主要由W′K组成:
Figure GDA0002282284610000106
例如,设置gmin=0且gmax=1导致去除主要由加水印的信号组成的带同时保持其他带的滤波器。
通过扩展,可以基于两个阈值τmin和τmax来定义更平滑的增益规则:
Figure GDA0002282284610000107
其中
Figure GDA0002282284610000108
此增益规则验证了:对于
Figure GDA0002282284610000109
则G(k)=gmin,而对于
Figure GDA00022822846100001010
则Gk(l)=gmax。对于τmin与τmax之间的
Figure GDA00022822846100001011
值,G(k)与
Figure GDA00022822846100001012
成反比。
过滤经由发言设备215接收的加水印的回声
关于过滤经由发言设备215接收的加水印的回声(例如,“话筒信号”),可使用任何过滤方法(例如,逆离散傅立叶变换(IDFT)、重叠-相加法(OLA)、分析-合成-滤波器组(ASFB)、滤波器组均衡器(FBE)、低延迟滤波器(LDF)等)来应用如上所述在分析阶段定义的增益规则。例如,可选择分析中用于STFT的跳(hop)尺寸以匹配过滤方法的跳尺寸。此为,由于分析可需要相当长的帧是高效的,因此在过滤阶段使用的帧能以用于分析的帧为中心。
计算设备100、240可进一步包括任何数量和类型的触摸/图像组件,其中,这些触摸/图像组件可包括(但不限于)图像捕捉设备(例如,一个或多个相机等)和图像感测设备(诸如(但不限于)与一个或多个相机共同工作的知晓上下文的传感器(例如,温度传感器、面部表情和特征测量传感器等)、环境传感器(诸如,用于感测背景色、光等)、生物测定传感器(诸如,用于检测指纹、面部点或特征等))等等。计算设备100、240也可包括一个或多个软件应用,诸如,商业应用、社交网络网站(例如,
Figure GDA0002282284610000111
Figure GDA0002282284610000112
等)、商业联网网站(例如,
Figure GDA0002282284610000113
等)、通信应用(例如,
Figure GDA0002282284610000114
等)、游戏和其他娱乐应用等,所述软件应用提供一个或多个用户接口(例如,web用户界面(WUI)、图形用户界面(GUI)、触摸屏等),同时保证与不断变化的技术、参数、协议、标准等的兼容性。
通信/兼容性逻辑211可用于促进计算设备100与任何数量和类型的下列设备之间的兼容性,同时保证与不断变化的技术、参数、协议、标准等的兼容性:其他计算设备(诸如,移动计算设备、台式计算机、服务器计算设备等)、存储设备、数据库和/或数据源(诸如,数据存储设备、硬盘驱动器、固态盘驱动器、硬盘、存储器卡或设备、存储器电路等)、网络(例如,云网络、因特网、内联网、蜂窝网络、接近度网络(诸如,蓝牙、蓝牙低功率(BLE)、智能蓝牙(Bluetooth Smart)、Wi-Fi接近度、射频识别(RFID)、近场通信(NFC)、体域网(BAN)等)、无线或有线通信和相关协议(例如,
Figure GDA0002282284610000115
WiMAX、以太网等)、连接性和位置管理技术、软件应用/网站(例如,社交和/或商业联网网站(诸如,
Figure DA00022822846137911
Figure GDA0002282284610000116
Figure GDA0002282284610000117
等)、商业应用、游戏和其他娱乐应用等)、编程语言等。
尽管出于简明、清晰和易于理解的目的可贯穿本文档讨论一个或多个项或示例(例如,通信信号、扩音器信号、话筒信号、加水印的信号、回声、回声核、子核、全核、包括频带的段、电话、智能电话、桌面计算机等),但是构想了实施例不限于任何特定数量和类型的姿势、显示面板、计算设备、用户、网络或认证协议或过程,等等。例如,实施例不限于任何特定的网络安全基础结构或协议(例如,单点登录(SSO)基础结构和协议),并且可与任何数量和类型的网络安全基础结构和网络(诸如,安全断言标记语言(SAML)、OAuth、Kerberos等)兼容。
贯穿本文档,可互换地引用如“逻辑”、“组件”、“模块”、“框架”、“引擎”、“点”等之类的术语,并作为示例,这些术语包括软件、硬件、和/或软件和硬件的任何组合(诸如,固件)。此外,对特定的品牌、词、术语、短语、名称和/或首字母缩略词(诸如,“回声去除”或“EC”、“水印回声去除”或“WEC”、“增益水印回声去除”或“GWEC”、“水印回声过滤”或“WEF”、“通信信号”、“扩音器信号”、“话筒信号”、“水印”或“加水印”、“加水印的信号”、“回声”或“加水印的回声”、“回声核”、“子带回声核”或“子核”、“全带回声核”或“全核”、“段”或“频带”、“电话”、“智能电话”、“平板计算机”等)的任何使用不应被解读为将实施例限制于在产品中或在本文档之外的文献中携带那个标签的软件或设备。
构想了可将任何数量和类型的组件添加至回声水印和过滤机制110或从回声水印和过滤机制110去除任何数量和类型的组件以促进包括添加、去除和/或增强某些特征的各种实施例。出于简明、清晰以及易于理解回声水印和过滤机制110和柔性环绕式显示器120的目的,在此未示出或讨论标准的和/或已知的组件中的许多组件,诸如,计算设备的那些组件。构想了如本文所述,实施例不限于任何特定的技术、拓扑、系统、架构和/或标准,并足够动态以采用并适配任何未来变化。
图3A解说根据一个实施例的、具有图2的回声加水印和过滤机制110的各种组件的计算设备100。出于简明、清晰和易于理解的目的,在此未描述已经参考图1-2描述的组件和过程中的许多组件和过程。在所解说的实施例中,通信信号在计算设备100处被接收,并且通过语音可懂性增强301和均衡器动态控制303A,并进一步通过具有信号检测和评估逻辑201与水印分配逻辑203的水印回声去除(WEC)引擎321,以便在加水印的信号被传递通过收听设备(例如,扩音器等)213之前执行它们各自的任务。如前述,在一个实施例中,相对于对整个信号加水印,可对任何数量和类型的信号段加水印。每一个段表示频带。
在进入空中之后,加水印的信号变成加水印的回声(例如,加水印的段或带,诸如,全带回声、子带回声等),随后可经由发言设备215(例如,话筒等)将此加水印的回声作为包括(但不限于)有用声音(例如,用户的语音)、计算设备100的声学环境内的其他噪声/声音(例如,小孩、市场噪声、交通声响、办公室聊天、背景电视声音等)的混合信号的部分经返回并往回馈送到计算设备100中。监测此加水印的回声,随后此加水印的回声作为语音、噪声和加水印的回声的混合在发言设备215处被接收。由增益水印回声消去(GWEC)引擎323的回声监测和接收逻辑205来执行此监测和接收。
在一个实施例中,也可采用诸如均衡器动态控制303B、信噪估计305、声学回声消去307、降噪309、驻留噪声抑制311和增益损失控制313之类的附加组件来执行他们各自的任务。在另一实施例中,可不需要组件301、303A-B、305、307、309、311、313,替代地,可由其他组件或简单地由回声机制110的WEC 312和GWEC 323来取代它们。构想了仅出于简明、清晰以及易于理解的目的而示出和/或讨论组件301、303A-B、305、307、309、311、313及它们各自的连接、路径和任务,并且构想了实施例不限于这些或其他此类组件中的任何一个。例如,可在降噪309之前或之后(类似地,在声学回声消去307之前或之后,等等)放置GWEC 323或允许GWEC 323工作。
在一个实施例中,具有回声监测和接收逻辑205、水印检测逻辑207、过滤和处理逻辑209以及通信/兼容性逻辑211的GWEC执行如参考图2所述的任何数量的任务,诸如:使用水印检测逻辑检测来自信号混合的加水印的回声;以及处理检测到的加水印的回声,使得完全消去此加水印的回声(例如,抑制水印的回声的所有段),部分地过滤此加水印的回声(例如,抑制一些段,而允许其他段通过),整个回声保持未经过滤并被允许通过,等等。通信/兼容性逻辑211管理回声机制110与其他组件(诸如,组件301、303A-B、305、307、309、311、313)和计算设备等的兼容性,并且按GWEC引擎323所确定的方式来管理混合信号的水印回声和其他信号中的一个或多个的移动、通信和/或消去。
图3B解说根据一个实施例的、具有图2的回声加水印和过滤机制110的水印回声消去引擎321和增益水印回声消去引擎323的计算设备100。出于简明清晰和易于理解的目的,在此未描述已经参考图1-2和图3A描述的许多组件和过程。在所解说的实施例中,近端声学环境220中的计算设备100(例如,智能电话等)和远端声学环境250中的计算设备(例如,平板计算机等)示出为通过诸如网络230之类的一个或多个网络、经由一个或多个通信应用(例如,常规电话线、
Figure GDA0002282284610000141
等)彼此通信。
例如,当用户第二用户351在计算设备240处对发言设备353(例如,话筒)发言时,发言设备353生成通过网络230传递并在计算设备100处被接收的通信信号331。在一个实施例中,由WEC引擎321检测通信信号331,其中,当信号通过收听设备(例如,扩音器)213离开时被分配水印。加水印的信号333在经由收听设备213离开计算设备100之后变成加水印的回声335,并且经由发言设备215(例如,话筒)而往回进入到计算设备100中。如图中所解说,加水印的回声335可能不是可通过发言设备215而进入的仅有的声音,因为它可能由其他声音(诸如,对发言设备215发言的第一用户331的语音337、近端声学环境220内的其他噪声/声音(例如,交通噪声、聊天、背景音乐、犬吠等))结合。
这些声音335、337、339可作为混合信号341而进入计算设备100,其中,如前述,加水印的回声由GWEC引擎323标识或检测,并且从混合信号341被分离,用于进一步处理。在一个实施例中,加水印的回声可在GWEC引擎323处经处理和过滤以完全地或部分地被消去,或者在另一实施例中,可不过滤它并被允许它继续。在一个实施例中,随后促进经过滤的或最终信号343通过网络230继续传输到计算设备240。在计算设备240处,通过收听设备(例如,扩音器)355将经过滤的信号343广播到第二用户351。
参考图5,图5解说根据一个实施例的用于促进在计算设备处的回声加水印和过滤的方法500。方法500可由处理逻辑执行,此处理逻辑可包括硬件(例如,电路、专用逻辑、可编程逻辑等)、软件(诸如,在处理设备上运行的指令)、或硬件和软件的组合。在一个实施例中,方法500可由图1的回声加水印和过滤机制110执行。出于呈现的简明和清晰的目的,用线性序列解说了方法500的过程,但是构想了可以并行地、异步地或以不同顺序来执行任何数量的这些过程。出于简明清晰和易于理解的目的,在此不讨论或重复参考本文档中的其他附图讨论的细节中的许多细节。
方法500开始于框505处:在第一计算设备(例如,智能电话、平板计算机等)处接收来自第二计算设备(例如,智能电话、平板计算机等)的通信信号。在框510处,在第一计算设备内检测到通信信号的存在。在框515处,在一个实施例中,在检测到的通信信号经由扩音器(其他任何收听设备)离开第一计算设备之前,对此检测到的信号分配水印,其中一旦加水印的信号通过第一计算设备的扩音器离开此第一计算设备而进入空气中,将认为它是或称之为加水印的回声。在一个实施例中,可将信号排序或划分成任何数量的段,其中每一个段指一个频带。因此,在一个实施例中,相比对整个信号加水印,可对任何数量的此类段(例如,少数段、多数段等)加水印。在另一实施例中,可对整个信号加水印或可不对整个信号加水印。例如,如果某些频带不可由人耳听到,则可不用考虑这些频段,因此可不对它们加水印,因为它们不太可能转换成或作为回声。在框520处,持续监测加水印的回声,且随后在框525处,在第一计算设备处,经由此第一计算设备的话筒(或任何其他发言设备)往回接收此加水印的回声。
构想了加水印的回声可能不是进入第一计算设备的仅有信号或声音,并且它可与其他声音混合,其他声音诸如,当第一用户对话筒发言时他(她)的语音以及在第一计算设备的接近度内发现的其他环境声响(诸如,交通噪声、背景聊天等)。在框530处,在一个实施例中,将加水印的回声从声音和信号的混合中标识或检测出来。在框535处,将检测到的加水印的回声从混合中分离出来以进一步处理而实现过滤目的。
在框540处,在一个实施例中,作出关于是否将过滤加水印的回声的判断。如果将不过滤加水印的回声,则在框545处,允许加水印的回声作为最终信号传递到第二计算设备。例如,在一些实施例中,诸如当由用户偏好或期望时,或当加水印的回声可用于特定目的(诸如,安全措施、警方/侦测性或军用目的、科学研究、研发或实验等)时,可对于任何数量的理由都不过滤加水印的回声。在框550处,允许最终信号(具有加水印的回声)被传输到第二计算设备。
往回参考框540,如果将过滤加水印的回声,则过程以框555继续,在框555处,作出关于将完整地还是部分地过滤加水印的回声的另一判断。如果将过滤整个加水印的回声,则在框560处,完整地过滤和消去/抑制此加水印的回声,且随后在框550处,最终信号(没有任何加水印的回声)被继续传输到第二计算设备。往回参考框555,如果将部分地过滤加水印的回声(例如,将要将某些段或频带过滤掉或消去/抑制,同时允许其他段保留并传递),则在框550处,促进具有经部分过滤的加水印的回声的最终信号被继续传输到第二计算设备。
现在参考图4,解说了计算系统400的实施例。计算系统400表示一系列计算和电子设备(有线或无线的),包括例如,台式计算系统、膝上型计算系统、蜂窝电话、个人数字助理(PDA)(包括启用蜂窝的PDA)、机顶盒、智能电话、平板机等。替换性计算系统可包括更多、更少和/或不同的组件。计算设备400可以与图2的计算设备100、240相同或类似,或者可包括图2的计算设备100、240。
计算系统400包括总线405(或者例如,用于传递信息的链路、互连、或另一类型的通信设备或接口)以及可处理信息的、耦合至总线405的处理器410。尽管以单个处理器解说计算系统400,但是电子系统400可包括多个处理器和/或协处理器,诸如,一个或多个中央处理器、图形处理器和物理处理器等。计算系统400可进一步包括耦合至总线405并可存储信息和可由处理器410执行的指令的随机存取存储器(RAM)或其他动态存储设备420(称为主存储器)。主存储器420也可用于在由处理器410执行指令期间存储临时变量或其他中间信息。
计算系统400也可包括耦合至总线405的、可存储用于处理器410的静态信息和指令的只读存储器(ROM)和/或其他存储设备430。数据存储设备440可耦合至总线405以存储信息和指令。诸如磁盘或光盘之类的数据存储设备440和对应的驱动器可耦合至计算系统400。
计算系统400也可经由总线405耦合至显示设备450以向用户显示信息,所述显示设备诸如,阴极射线管(CRT)、液晶显示器(LCD)或有机发光二极管(OLED)阵列。包括字母数字和其他键的用户输入设备460可耦合至总线405以将通信信息和命令选择传递至处理器410。另一类型的用户输入设备460是用于将方向信息和命令选择传递至处理器410以及用于控制显示器450上的光标运动的光标控件470,诸如,鼠标、轨迹球、触摸屏、触摸垫或光标方向键。计算机系统400的相机和话筒阵列490可耦合至总线405以观察姿势,记录音频和视频,并且接收和发送视觉和音频命令。
计算系统400可进一步包括网络接口480以提供对网络的访问,所述网络诸如,局域网(LAN)、广域网(WAN)、城域网(MAN)、个域网(PAN)、蓝牙、云网络、移动网络(例如,第3代(3G)等)、内联网、因特网等。(多个)网络接口480可包括例如,具有天线485的无线网络接口,所述天线485表示一个或多个天线。(多个)网络接口480也可包括例如有线网络接口以经由网络线缆487与远程设备通信,所述网络线缆487可以是例如,以太网电缆、同轴电缆、光纤电缆、串行电缆或并行电缆。
(多个)网络接口480可通过例如符合IEEE 802.11b和/或IEEE 802.11g标准来提供对LAN的访问,和/或无线网络接口可通过例如符合蓝牙标准来提供对个域网的访问。也可支持其他无线网络接口和/或协议,包括先前和后续版本的标准。
附加于或替代于经由无线LAN标准,(多个)网络接口480可使用例如时分多址(TDMA)协议、全球移动通信系统(GSM)协议、码分多址(CDMA)协议和/或任何其他类型的无线通信协议来提供无线通信。
(多个)网络接口480可包括一个或多个通信接口,诸如,调制解调器、网络接口卡、或其他公知的接口设备,其他公知的接口设备诸如,用于耦合至以太网的那些设备、令牌环、或用于提供通信链路以支持例如LAN或WAN的其他类型的物理有线或无线的附连。以此方式,计算机系统也可经由包括例如内联网或因特网的常规网络基础结构而耦合至许多外围设备、客户端、控制表面、控制器或服务器。
应理解,对于某些实现,比上述示例经更少或更多地配备的系统可能是优选的。因此,取决于众多因素,计算系统400的配置因实现而异,所述因素诸如,价格约束、性能要求、技术改进或其他情况。电子设备或计算机系统400的示例可包括但不限于,移动设备、个人数字助理、移动计算设备、智能电话、蜂窝电话、手机、单向寻呼机、双向寻呼机、消息收发设备、计算机、个人计算机(PC)、台式计算机、膝上型计算机、笔记本计算机、手持式计算机、平板计算机、服务器、服务器阵列或服务器场、web服务器、网络服务器、因特网服务器、工作站、小型计算机、大型计算机、超级计算机、网络设备、web设备、分布式计算系统、多处理器系统、基于处理器的系统、消费电子产品、可编程消费电子产品、电视机、数字电视机、机顶盒、无线接入点、基站、订户站、移动订户中心、无线电网络控制器、路由器、集线器、网关、网桥、交换机、机器、或上述各项的组合。
实施例可实现为以下各项中的任一项或者其组合:使用母板互连的一个或多个微芯片或集成电路、硬连线逻辑、由存储器设备存储并由微处理器执行的软件、固件、专用集成电路(ASIC)和/或现场可编程门阵列(FPGA)。作为示例,术语“逻辑”可包括软件或硬件和/或软件与硬件的组合。
例如,实施例可作为计算机程序产品来提供,所述计算机程序产品可包括一种或多种机器可读介质,所述机器可读介质具有存储于其上的机器可执行指令,当由一个或多个机器(诸如,计算机、计算机网络或其他电子设备)执行所述机器可执行指令时,所述机器可执行指令可导致一个或多个机器执行根据本文所述的实施例的操作。机器可读存储介质可包括但不限于:软盘、光盘、CD-ROM(紧致碟只读存储器)、以及磁光盘、ROM、RAM、EPROM(可擦除可编程只读存储器)、EEPROM(电可擦除可编程只读存储器)、磁卡或光卡、闪存或适用于存储机器可执行指令的其他类型的媒体/计算机可读介质。
此外,实施例可作为计算机程序产品被下载,其中程序可借助于一个或多个数据信号的方式、经由通信链路(例如,调制解调器和/或网络连接)而从远程计算机(例如,服务器)传输到请求计算机(例如,客户端),所述一个或多个数据信号在载波或其他传播介质中具体化和/或由载波或其他传播介质调制。
对“一个实施例”、“实施例”、“示例实施例”、“各种实施例”等的引用指示如此描述的实施例可包括特定的特征、结构或特性,但不是每一个实施例都必须包括所述特定的特征、结构或特性。此外,一些实施例可具有针对其他实施例描述的特征中的一些、全部或完全没有。
在本申请的申请文件中,可以使用术语“耦合的”及其派生词。“耦合的”用于指示两个或更多个元件彼此协作或交互,但在它们之间可能具有或不具有中间的物理或电子组件。
如申请文件中所使用的,除非另外指定,否则用于描述共同元件的对序数形容词“第一”、“第二”和“第三”等的使用仅指示指类似元件的不同实例,而不旨在暗示所述元件必须按照给定顺序(无论是时域的、空间上的或等级上的)或按照任何其他方式。
以下条款和/或示例涉及进一步的实施例或示例。示例中的细节可用在一个或多个实施例中的任何地方。不同的实施例或示例的各种特征能以各种方式来与所包括的一些特征和被排出的其他特征组合以适合各种不同的应用。示例可包括诸如以下各项的主题:方法、用于执行方法的动作的装置、至少一种机器可读介质(其包括指令,当由机器执行时所述指令时,所述指令使所述机器执行方法的动作)或用于促进根据本文所述的实施例和示例的混合式通信的装置或系统。
一些实施例涉及示例1,示例1包括用于促进回声加水印和过滤的装置,所述装置包括:水印分配逻辑,用于将水印分配给通信信号,其中加水印的通信信号在退出装置之后转换成加水印的回声;回声监测和接收逻辑,用于接收所述加水印的回声;过滤和处理逻辑,用于过滤所述加水印的回声以使得所述加水印的回声从最终信号中被消去;以及通信/兼容新逻辑,用于传输没有所述加水印的回声的最终信号。
示例2包括示例1的主题,进一步包括信号检测和评估逻辑,用于检测所述通信信号,其中所述信号检测和评估逻辑进一步用于:将所述检测到的通信信号评估为在退出所述装置而进入空气中之后具有被转换成所述加水印的回声的能力,其中所述加水印的通信信号通过收听设备退出,所述收听设备包括扩音器。
示例3包括示例1的主题,其中回声监测和接收逻辑进一步用于:当在所述装置处经由发言设备接收到所述加水印的回声之前,当所述加水印的回声在空气中时,持续地监测所述加水印的回声,所述发言设备包括话筒。
示例4包括示例1或3的主题,进一步包括水印检测逻辑,所述水印检测逻辑用于在经由发言装置接收到所述加水印的回声之后检测所述加水印的回声,其中水印检测逻辑进一步用于:将检测到的加水印的回声从经由所述发言设备接收到的一个或多个声音中分离出来。
示例5包括示例4的主题,其中所述一个或多个声音包括第一声音和第二声音中的一个或多个,所述第一声音包括由用户对所述发言设备发言的语音,所述第二声音包括在所述发言设备的接近度内生成的噪声,其中所述噪声包括交通噪声、人的聊天、音乐和街道噪声中的一个或多个。
示例6包括示例1的主题,其中水印分配逻辑进一步用于检测与所述通信信号有关的多个段,其中所述多个段中的每一个段指一频带,其中所述水印分配逻辑进一步用于将所述水印分配给所述多个段中的一个或多个段。
示例7包括示例6的主题,其中如果所述多个段中的每一个段都分配了所述水印,则所述通信信号是完全加水印的,其中如果所述多个段中的一个或多个段分配了所述水印,则所述通信信号是部分加水印的,并且其中如果所述多个段都未分配所述水印,则所述通信信号是未加水印的。
示例8包括示例1或6的主题,其中过滤进一步包括滤除所述多个段以将所述加水印的回声从最终信号中消去,其中所述多个段中的每一个段都分配了水印。
示例9包括示例1或6的主题,其中过滤还包括将多个段中的一个或多个过滤出来以将加水印的回声从最终信号中部分地消除出来,其中多个段中的一个或多个包括多个段中加水印的一个或多个。
示例10包括示例1或6的主题,其中过滤进一步包括允许所述加水印的回声保留在所述最终信号内。
一些实施例涉及示例11,示例11包括用于促进回声加水印和过滤的方法,所述方法包括以下步骤:将水印分配给通信信号,其中加水印的通信信号在退出计算设备之后转换成加水印的回声;接收所述加水印的回声;过滤所述加水印的回声,使得所述加水印的回声从最终信号中被消去;以及传输没有所述加水印的回声的所述最终信号。
示例12包括示例11的主题,进一步包括以下步骤:检测所述通信信号;以及将所述检测到的通信信号评估为在退出所述计算设备而进入空气中之后具有被转换成所述加水印的回声的能力,其中加水印的通信信号通过收听设备退出,所述收听设备包括扩音器。
示例13包括示例11的主题,进一步包括以下步骤:当在所述计算设备处经由发言设备接收到所述加水印的回声之前,当所述加水印的回声在空气中时,持续地监测所述加水印的回声,所述发言设备包括话筒。
示例14包括示例13的主题,进一步包括以下步骤:在经由所述发言设备接收到所述加水印的回声之后,检测所述加水印的回声;以及将所述检测到的加水印的回声从经由发言设备接收到的一个或多个声音中分离出来。
示例15包括示例14的主题,其中所述一个或多个声音包括第一声音和第二声音中的一个或多个,所述第一声音包括由用户对所述发言设备发言的语音,所述第二声音包括包括在所述发言设备的接近度内生成的噪声,其中所述噪声包括交通噪声、人的聊天、音乐和街道噪声中的一个或多个。
示例16包括示例11的主题,进一步包括以下步骤:检测与所述通信信号有关的多个段,其中所述多个段中的每一个段指一频带,其中水印被分配给所述多个段中的一个或多个段。
示例17包括示例16的主题,其中如果所述多个段中的每一个段都分配了所述水印,则所述通信信号是完全加水印的,其中如果所述多个段中的一个或多个段分配了所述水印,则所述通信信号是部分加水印的,并且其中如果所述多个段都未分配所述水印,则所述通信信号是未加水印的。
示例18包括示例11的主题,其中过滤步骤进一步包括以下步骤:滤除所述多个段以将所述加水印的回声从所述最终信号中消取,其中所述多个段中的每一个段都分配了所述水印。
示例19包括示例11的主题,其中过滤步骤进一步包括以下步骤:滤除所述多个段中的一个或多个段以将所述加水印的回声从所述最终信号中部分地消去,其中所述多个段中的一个或多个段包括多个段中加水印的一个或多个段。
示例20包括示例11的主题,其中过滤步骤进一步包括以下步骤:允许所述加水印的回声保留在所述最终信号内。
示例21包括至少一种机器可读介质,包括多条指令,响应于在计算设备上执行所述多条指令,所述多条指令使所述计算设备执行根据前述示例11-20中的任一项的操作。
示例22包括至少一种非暂态或有形的机器可读介质,包括多条指令,响应于在计算设备上执行所述多条指令,所述多条指令使所述计算设备执行根据前述示例11-20中的任一项的操作。
示例23包括一种系统,所述系统包括用于执行根据前述示例11-20中的任一项的操作的机制。
示例24包括一种装置,所述装置包括用于执行根据前述示例11-20中的任一项的操作的设备。
示例25包括一种计算设备,所述计算设备布置成用于执行根据前述示例11-20中的任一项的操作。
示例26包括一种通信设备,所述通信设备布置成用于执行根据前述示例11-20中的任一项的操作。
一些实施例涉及示例27,示例27包括一种系统,所述系统包括具有指令的存储设备以及处理器,所述处理器用于执行所述指令以促进用于执行一个或多个操作的机制,所述操作包括:将水印分配给通信信号,其中加水印的通信信号在退出计算设备之厚转换成加水印的回声;接收所述加水印的回声;过滤所述加水印的回声,使得所述加水印的回声从最终信号中被消去;和传输不包括加水印的回声的最终信号。
示例28包括示例27的主题,其中所述一个或多个操作包括:检测所述通信信号;以及将检测到的通信信号评估为在退出所述计算设备而进入空气中之后具有被转换成所述加水印的回声的能力,其中所述加水印的通信信号通过收听设备退出,所述收听设备包括扩音器。
示例29包括示例27的主题,其中一个或个操作包括:当在所述计算设备处经由发言设备接收到所述加水印的回声之前,当所述加水印的回声在空气中时,持续地监测所述加水印的回声,所述发言设备包括话筒。
示例30包括示例29的主题,其中所述一个或多个操作包括:在经由所述发言设备接收到所述加水印的回声之后,检测所述加水印的回声;以及将检测到的加水印的回声从经由发言设备接收到的一个或多个声音中分离出来。
示例31包括示例30的主题,其中所述一个或多个声音包括第一声音和第二声音中的一个或多个,所述第一声音包括由用户对发言设备发言的语音,所述第二设备包括在所述发言设备的接近度内生成的噪声,其中所述噪声包括交通噪声、人的聊天、音乐和街道噪声中的一个或多个。
示例32包括示例27的主题,其中所述一个或多个操作包括:检测与所述通信信号有关的多个段,其中所述多个段中的每一个段指一频带,其中水印被分配给所述多个段中的一个或多个段。
示例33包括示例32的主题,其中如果所述多个段中的每一个段都分配了所述水印,则所述通信信号是完全加水印的,其中如果所述多个段中的一个或多个段分配了所述水印,则所述通信信号是部分加水印的,并且其中如果所述多个段都未分配所述水印,则所述通信信号是未加水印的。
示例34包括示例27的主题,其中过滤进一步包括:滤除所述多个段以将所述加水印的回声从所述最终信号中消去,其中所述多个段中的每一个段都分配了所述水印。
示例35包括示例27的主题,其中过滤进一步包括:滤除所述多个段中的一个或多个以将所述加水印的回声从所述最终信号中部分地消去,其中所述多个段中的一个或多个段包括所述多个段中加水印的一个或多个段。
示例36包括示例27的主题,其中过滤进一步包括:允许所述加水印的回声保留在所述最终信号内。
一些实施例涉及示例37,示例37包括装置,所述装置包括:用于将水印分配给通信信号的设备,其中加水印的通信信号在退出计算设备之后转换成加水印的回声;用于接收所述加水印的回声的设备;用于过滤所述加水印的回声使得所述加水印的回声从最终信号中被消去的设备;以及用于传输没有所述加水印的回声的所述最终信号的设备。
示例38包括示例37的主题,进一步包括:用于检测所述通信信号的设备;以及用于将检测到的通信信号评估为在退出所述计算设备而进入空气中之后具有被转换成所述加水印的回声的能力的设备,其中所述加水印的通信信号通过收听设备退出,所述收听设备包括扩音器。
示例39包括示例37的主题,进一步包括:当在所述计算设备处接收到所述加水印的回声之前,当所述加水印的回声在空气中时,持续地监测所述加水印的回声。
示例40包括示例39的主题,进一步包括:用于在经由所述发言装置接收到所述加水印的回声之后检测所述加水印的回声的设备;以及用于将检测到的加水印的回声从经由所述发言设备接收到的一个或多个声音中分离出来的设备。
示例41包括示例40的主题,其中所述一个或多个声音包括第一声音和第二声音中的一个或多个,所述第一声音包括由用户对所述发言设备发言的语音,所述第二设备包括在所述发言设备的接近度内生成的噪声,其中所述噪声包括交通噪声、人的聊天、音乐和街道噪声中的一个或多个。
示例42包括示例37的主题,进一步包括:用于检测与所述通信信号有关的多个段的设备,其中所述多个段中的每一个段指一频带,其中水印被分配给所述多个段中的一个或多个段。
示例43包括示例32的主题,其中如果所述多个段中的每一个段都分配了所述水印,则所述通信信号是完全加水印的,其中如果所述多个段中的一个或多个段分配了所述水印,则所述通信信号是部分加水印的,并且其中如果所述多个段都未分配所述水印,则所述通信信号是未加水印的。
示例44包括示例37的主题,其中用于过滤的设备进一步包括用于滤除所述多个段以将所述加水印的回声从所述最终信号中消去的设备,其中所述多个段中的每一个段都分配了所述水印。
示例45包括示例37的主题,其中用于过滤的设备进一步包括用于滤除所述多个段中的一个或多个以将所述加水印的回声从所述最终信号中部分地消去的设备,其中所述多个段中的一个或多个段包括所述多个段中加水印的一个或多个段。
示例46包括示例37的主题,其中用于过滤的设备进一步包括用于允许所述加水印的回声保留在所述最终信号内的设备。
附图和前面进行的描述给出实施例的示例。本领域技术人员将领会,所述元素中的一个或多个可很好地组合进单个功能性元素中。可替换性地,可将某些元素分成多个功能性元素。可将来自一个实施例的元素添加到另一个实施例。例如,本文所述过程的次序可被改变并且不限于本文所述的方式。此外,不仅任何流程图的动作不需要以示出的次序来实现,而且不是所有的动作都必须要执行。而且,不依赖于其他动作的那些动作可与其他动作并行地执行。各实施例的范围绝不由这些具体示例限制。多种变体都是可能的,无论是否在说明书中显示地给出,诸如结构、维度和所用材料上的差别。各实施例的范围至少与所记载的要求保护的技术方案所给出的范围一样广泛。

Claims (20)

1.一种用于促进回声加水印和过滤的装置,所述装置包括:
水印分配逻辑,用于:
将水印分配给通信信号,其中所述加水印的通信信号在退出所述装置之前转换成加水印的回声,使得所述通信信号在重新进入所述装置之后被识别为回声并被抑制;以及
检测与所述通信信号有关的多个段,其中所述多个段中的每一个段指一频带,其中所述水印分配逻辑进一步用于将所述水印分配给所述多个段中的一个或多个段;
回声监测和接收逻辑,用于接收所述加水印的回声;
过滤和处理逻辑,用于过滤所述加水印的回声以使得所述加水印的回声从最终信号中被消去,其中,过滤所述加水印的回声进一步包括:滤除所述多个段中的一个或多个段以将所述加水印的回声从所述最终信号中部分地消去,其中所述多个段中的一个或多个段包括所述多个段中的加水印的一个或多个段;以及
通信/兼容性逻辑,用于传输没有所述加水印的回声的所述最终信号。
2.如权利要求1所述的装置,其特征在于,进一步包括信号检测和评估逻辑,用于检测所述通信信号,其中所述信号检测和评估逻辑进一步用于:将所述检测到的通信信号评估为在退出所述装置而进入空气中之后具有被转换成所述加水印的回声的能力,其中所述加水印的通信信号通过收听设备而退出,所述收听设备包括扩音器。
3.如权利要求1所述的装置,其特征在于,所述回声监测和接收逻辑进一步用于:当在所述装置处经由发言设备接收到所述加水印的回声之前,当所述加水印的回声在空气中时,持续地监测所述加水印的回声,所述发言设备包括话筒。
4.如权利要求3所述的装置,其特征在于,进一步包括水印检测逻辑,所述水印检测逻辑用于在经由所述发言设备接收到所述加水印的回声之后检测所述加水印的回声,其中所述水印检测逻辑进一步用于:将检测到的加水印的回声从经由所述发言设备接收到的一个或多个声音中分离出来。
5.如权利要求4所述的装置,其特征在于,所述一个或多个声音包括第一声音和第二声音中的一个或多个,所述第一声音包括由用户对所述发言设备发言的语音,所述第二声音包括在所述发言设备的接近度内生成的噪声,其中所述噪声包括交通噪声、人的聊天、音乐和街道噪声中的一个或多个。
6.如权利要求1所述的装置,其特征在于,如果所述多个段中的每一个段都分配了所述水印,则所述通信信号是完全加水印的,其中如果所述多个段中的一个或多个段分配了所述水印,则所述通信信号是部分加水印的,并且其中如果所述多个段都未分配所述水印,则所述通信信号是未加水印的。
7.如权利要求1所述的装置,其特征在于,过滤进一步包括滤除所述多个段以将所述加水印的回声从所述最终信号中消去,其中所述多个段中的每一个段都分配了所述水印。
8.如权利要求1所述的装置,其特征在于,过滤进一步包括允许所述加水印的回声保留在所述最终信号内。
9.一种用于促进回声加水印和过滤的方法,所述方法包括以下步骤:
将水印分配给通信信号,其中加水印的通信信号在退出计算设备之前转换成加水印的回声,使得所述通信信号在重新进入所述计算设备之后被识别为回声并被抑制;
检测与所述通信信号有关的多个段,其中所述多个段中的每一个段指一频带,其中水印被分配给所述多个段中的一个或多个段
接收所述加水印的回声;
过滤所述加水印的回声,使得所述加水印的回声从最终信号中被消去,其中,过滤所述加水印的回声的步骤进一步包括以下步骤:滤除所述多个段中的一个或多个段以将所述加水印的回声从所述最终信号中部分地消去,其中所述多个段中的一个或多个段包括所述多个段中加水印的一个或多个段;以及
传输没有所述加水印的回声的所述最终信号。
10.如权利要求9所述的方法,其特征在于,进一步包括以下步骤:
检测所述通信信号;以及
将所述检测到的通信信号评估为在退出所述计算设备而进入空气中之后具有被转换成所述加水印的回声的能力,其中所述加水印的通信信号通过收听设备退出,所述收听设备包括扩音器。
11.如权利要求9所述的方法,其特征在于,进一步包括以下步骤:当在所述计算设备处经由发言设备接收到所述加水印的回声之前,当所述加水印的回声在空气中时,持续地监测所述加水印的回声,所述发言设备包括话筒。
12.如权利要求11所述的方法,其特征在于,进一步包括以下步骤:
在经由所述发言设备接收到所述加水印的回声之后,检测所述加水印的回声;以及
将所述检测到的加水印的回声从经由所述发言设备接收到的一个或多个声音中分离出来。
13.如权利要求12所述的方法,其特征在于,所述一个或多个声音包括第一声音和第二声音中的一个或多个,所述第一声音包括由用户对所述发言设备发言的语音,所述第二声音包括在所述发言设备的接近度内生成的噪声,其中所述噪声包括交通噪声、人的聊天、音乐和街道噪声中的一个或多个。
14.如权利要求9所述的方法,其特征在于,如果所述多个段中的每一个段都分配了所述水印,则所述通信信号是完全加水印的,其中如果所述多个段中的一个或多个段分配了所述水印,则所述通信信号是部分加水印的,并且其中,如果所述多个段都未分配所述水印,则所述通信信号是未加水印的。
15.如权利要求9所述的方法,其特征在于,过滤步骤进一步包括以下步骤:滤除所述多个段过滤以将所述加水印的回声从所述最终信号中消去,其中所述多个段中的每一个段都分配了所述水印。
16.如权利要求9所述的方法,其特征在于,过滤步骤进一步包括以下步骤:允许所述加水印的回声保留在所述最终信号内。
17.至少一种机器可读介质,包括多条指令,响应于在计算设备上执行所述指令,所述指令使所述计算设备执行根据权利要求9-16中的任一项的方法。
18.一种计算装置,所述计算装置包括用于执行根据权利要求9-16中的任一项的方法的设备。
19.一种计算设备,所述计算设备布置成用于执行根据权利要求9-16中的任一项的方法。
20.一种通信设备, 所述通信设备布置成用于执行根据权利要求9-16中的任一项的方法。
CN201480069360.5A 2014-01-17 2014-01-17 用于促进基于加水印的回声管理的装置和方法 Expired - Fee Related CN106165015B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2014/012119 WO2015108535A1 (en) 2014-01-17 2014-01-17 Mechanism for facilitating watermarking-based management of echoes for content transmission at communication devices

Publications (2)

Publication Number Publication Date
CN106165015A CN106165015A (zh) 2016-11-23
CN106165015B true CN106165015B (zh) 2020-03-20

Family

ID=53543293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480069360.5A Expired - Fee Related CN106165015B (zh) 2014-01-17 2014-01-17 用于促进基于加水印的回声管理的装置和方法

Country Status (3)

Country Link
US (1) US20160293181A1 (zh)
CN (1) CN106165015B (zh)
WO (1) WO2015108535A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106601261A (zh) * 2015-10-15 2017-04-26 中国电信股份有限公司 基于数字水印的回声抑制方法和系统
US10692515B2 (en) * 2018-04-17 2020-06-23 Fortemedia, Inc. Devices for acoustic echo cancellation and methods thereof
US10448154B1 (en) 2018-08-31 2019-10-15 International Business Machines Corporation Enhancing voice quality for online meetings
US11244692B2 (en) * 2018-10-04 2022-02-08 Digital Voice Systems, Inc. Audio watermarking via correlation modification using an amplitude and a magnitude modification based on watermark data and to reduce distortion
US10652654B1 (en) * 2019-04-04 2020-05-12 Microsoft Technology Licensing, Llc Dynamic device speaker tuning for echo control
US11115765B2 (en) * 2019-04-16 2021-09-07 Biamp Systems, LLC Centrally controlling communication at a venue
TWI790694B (zh) * 2021-07-27 2023-01-21 宏碁股份有限公司 聲音浮水印的處理方法及聲音浮水印產生裝置
CN115705847B (zh) * 2021-08-10 2025-12-12 宏碁股份有限公司 声音水印的处理方法及声音水印生成装置
TWI790718B (zh) 2021-08-19 2023-01-21 宏碁股份有限公司 會議終端及用於會議的回音消除方法
CN115798495A (zh) * 2021-09-13 2023-03-14 宏碁股份有限公司 会议终端及用于会议的回声消除方法
CN116486823B (zh) * 2022-01-14 2025-09-05 宏碁股份有限公司 声音水印的处理方法及声音水印产生装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5911124A (en) * 1997-02-03 1999-06-08 Motorola, Inc. Method and apparatus for applying echo mitigation in a communication device
CN101266794A (zh) * 2008-03-27 2008-09-17 上海交通大学 基于回声隐藏的多重水印嵌入和提取方法
CN101667437A (zh) * 2008-09-01 2010-03-10 索尼株式会社 音频电信系统和方法
CN102237093A (zh) * 2011-05-23 2011-11-09 南京邮电大学 一种基于前后向回声核的回声隐藏方法
CN103391381A (zh) * 2012-05-10 2013-11-13 中兴通讯股份有限公司 回声消除方法及装置
CN103516921A (zh) * 2012-06-28 2014-01-15 杜比实验室特许公司 通过隐藏音频信号的回声控制

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020031654A (ko) * 2000-10-23 2002-05-03 황준성 푸리에 변환을 이용한 워터마크 삽입 및 추출 방법 및 장치
JP2004526207A (ja) * 2001-05-08 2004-08-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 電子透かしの埋め込み及び検出
DE602004009926T2 (de) * 2003-05-28 2008-08-28 Koninklijke Philips Electronics N.V. Vorrichtung und verfahren zum einbetten eines wasserzeichens unter verwendung von subbandfilterung
US7065206B2 (en) * 2003-11-20 2006-06-20 Motorola, Inc. Method and apparatus for adaptive echo and noise control
US9705942B2 (en) * 2007-08-31 2017-07-11 Adobe Systems Incorporated Progressive playback
PL216396B1 (pl) * 2008-03-06 2014-03-31 Politechnika Gdanska Sposób i układ tłumienia echa akustycznego w terminalu VoIP
US20140133648A1 (en) * 2008-03-06 2014-05-15 Andrzej Czyzewski Method and apparatus for acoustic echo cancellation in voip terminal
CN101262530B (zh) * 2008-04-29 2011-12-07 中兴通讯股份有限公司 一种消除移动终端回音的装置
KR101201076B1 (ko) * 2009-08-06 2012-11-20 울산대학교 산학협력단 오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법
FR2952263B1 (fr) * 2009-10-29 2012-01-06 Univ Paris Descartes Procede et dispositif d'annulation d'echo acoustique par tatouage audio
US9007972B2 (en) * 2011-07-01 2015-04-14 Intel Corporation Communication state transitioning control
US9225843B2 (en) * 2011-09-28 2015-12-29 Texas Instruments Incorporated Method, system and computer program product for acoustic echo cancellation
DE102012220620A1 (de) * 2012-11-13 2014-05-15 Sonormed GmbH Bereitstellen von Audiosignalen für eine Tinnitustherapie
US9158411B2 (en) * 2013-07-12 2015-10-13 Tactual Labs Co. Fast multi-touch post processing

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5911124A (en) * 1997-02-03 1999-06-08 Motorola, Inc. Method and apparatus for applying echo mitigation in a communication device
CN101266794A (zh) * 2008-03-27 2008-09-17 上海交通大学 基于回声隐藏的多重水印嵌入和提取方法
CN101667437A (zh) * 2008-09-01 2010-03-10 索尼株式会社 音频电信系统和方法
CN102237093A (zh) * 2011-05-23 2011-11-09 南京邮电大学 一种基于前后向回声核的回声隐藏方法
CN103391381A (zh) * 2012-05-10 2013-11-13 中兴通讯股份有限公司 回声消除方法及装置
CN103516921A (zh) * 2012-06-28 2014-01-15 杜比实验室特许公司 通过隐藏音频信号的回声控制

Also Published As

Publication number Publication date
US20160293181A1 (en) 2016-10-06
WO2015108535A1 (en) 2015-07-23
CN106165015A (zh) 2016-11-23

Similar Documents

Publication Publication Date Title
CN106165015B (zh) 用于促进基于加水印的回声管理的装置和方法
US20220180632A1 (en) Exploiting visual information for enhancing audio signals via source separation and beamforming
US9978388B2 (en) Systems and methods for restoration of speech components
US9640194B1 (en) Noise suppression for speech processing based on machine-learning mask estimation
US12148443B2 (en) Speaker-specific voice amplification
Karthik et al. Efficient speech enhancement using recurrent convolution encoder and decoder
US11688412B2 (en) Multi-modal framework for multi-channel target speech separation
US10896664B1 (en) Providing adversarial protection of speech in audio signals
US8615394B1 (en) Restoration of noise-reduced speech
CN101896969A (zh) 用于通过音频电平进行上下文取代的系统、方法及设备
CN113571078B (zh) 噪声抑制方法、装置、介质以及电子设备
US10861479B2 (en) Echo cancellation for keyword spotting
CN110648680B (zh) 语音数据的处理方法、装置、电子设备及可读存储介质
CN113823313B (zh) 语音处理方法、装置、设备以及存储介质
CN111226277A (zh) 语音增强方法及装置
US20230352040A1 (en) Audio source feature separation and target audio source generation
CN118899005B (zh) 一种音频信号处理方法、装置、计算机设备及存储介质
US20230186943A1 (en) Voice activity detection method and apparatus, and storage medium
US20170206898A1 (en) Systems and methods for assisting automatic speech recognition
CN114220430A (zh) 多音区语音交互方法、装置、设备以及存储介质
CN114333892A (zh) 一种语音处理方法、装置、电子设备和可读介质
CN112634930A (zh) 多通道声音增强方法、装置及电子设备
US12041427B2 (en) Contact and acoustic microphones for voice wake and voice processing for AR/VR applications
US9564983B1 (en) Enablement of a private phone conversation
US20240373162A1 (en) Contact and acoustic microphones for voice wake and voice processing for ar/vr applications

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200320

Termination date: 20220117