[go: up one dir, main page]

CN114666695A - 一种主动降噪的方法、设备及系统 - Google Patents

一种主动降噪的方法、设备及系统 Download PDF

Info

Publication number
CN114666695A
CN114666695A CN202011535004.1A CN202011535004A CN114666695A CN 114666695 A CN114666695 A CN 114666695A CN 202011535004 A CN202011535004 A CN 202011535004A CN 114666695 A CN114666695 A CN 114666695A
Authority
CN
China
Prior art keywords
signal
earphone
cooperative
determining
headset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011535004.1A
Other languages
English (en)
Inventor
张立斌
袁庭球
张慧敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202011535004.1A priority Critical patent/CN114666695A/zh
Priority to PCT/CN2021/139667 priority patent/WO2022135340A1/zh
Priority to EP21909336.6A priority patent/EP4254979A4/en
Publication of CN114666695A publication Critical patent/CN114666695A/zh
Priority to US18/338,851 priority patent/US12488776B2/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1781Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
    • G10K11/17821Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only
    • G10K11/17827Desired external signals, e.g. pass-through audio such as music or speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1083Reduction of ambient noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1781Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
    • G10K11/17821Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only
    • G10K11/17823Reference signals, e.g. ambient acoustic environment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1783Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase handling or detecting of non-standard events or conditions, e.g. changing operating modes under specific operating conditions
    • G10K11/17837Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase handling or detecting of non-standard events or conditions, e.g. changing operating modes under specific operating conditions by retaining part of the ambient acoustic environment, e.g. speech or alarm signals that the user needs to hear
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1785Methods, e.g. algorithms; Devices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1785Methods, e.g. algorithms; Devices
    • G10K11/17853Methods, e.g. algorithms; Devices of the filter
    • G10K11/17854Methods, e.g. algorithms; Devices of the filter the filter being an adaptive filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1787General system configurations
    • G10K11/17879General system configurations using both a reference signal and an error signal
    • G10K11/17881General system configurations using both a reference signal and an error signal the reference signal being an acoustic signal, e.g. recorded with a microphone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1008Earpieces of the supra-aural or circum-aural type
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/10Applications
    • G10K2210/108Communication systems, e.g. where useful sound is kept and noise is cancelled
    • G10K2210/1081Earphones, e.g. for telephones, ear protectors or headsets
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/301Computational
    • G10K2210/3028Filtering, e.g. Kalman filters or special analogue or digital filters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/50Miscellaneous
    • G10K2210/511Narrow band, e.g. implementations for single frequency cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1041Mechanical or electronic switches, or control elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/10Details of earpieces, attachments therefor, earphones or monophonic headphones covered by H04R1/10 but not provided for in any of its subgroups
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2460/00Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
    • H04R2460/01Hearing devices using active noise cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Headphones And Earphones (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请实施例涉及一种主动降噪的方法,该方法包括:对环境声音进行采集,确定环境音频信号;确定工作状态,并根据工作状态确定相应的至少一个有用信号,然后将至少一个有用信号从环境音频信号中去除,得到参考信号,其中有用信号包含用户感兴趣的内容。若方法应用于耳机,则根据参考信号确定待播放信号,并将待播放信号进行播放,使得参考信号与环境声音进行叠加,保留至少一个有用信号并抵消环境噪声。若方法应用于协作设备,则根据参考信号确定待播放信号,并将待播放信号发送至耳机。通过对将用户感兴趣的内容从参考信号中去除掉,以保障在进行主动降噪时,经过降噪后的音频数据中仍然保留用户感兴趣的内容。

Description

一种主动降噪的方法、设备及系统
技术领域
本申请涉及音频领域,尤其涉及一种主动降噪的方法、设备及系统。
背景技术
目前,耳机已经成为人们日常生活中不可或缺的产品。当用户使用耳机聆听音乐或者接听电话时,周围环境可能会有很大的噪声,因此,通常情况下可以将耳机的音量提高从而盖过噪声。但是加大音量会对听力产生很大的影响,并且时间久了会造成听觉疲劳。所以为了降低用户听到的噪声,一部分耳机采用了主动降噪的方式进行降低周围环境的噪音。主动降噪是基于声波叠加原理,即通过声波的相互抵消实现噪声去除。例如图1示出的,通过找到一种与所要消除的噪声频谱完全一样,仅仅相位相反的声音,通过叠加从而将噪声进行抵消。
但是在通常情况下,为实现全面降噪,即任何外部声音信号均会被最大程度的抑制掉。因此经过主动降噪后,外界的所有声音将会被最大程度的抑制。若用户仍然希望听到一些有用信息时,目前的方案将无法实现。
发明内容
本申请实施例提供了一种主动降噪的方法,通过确定用户感兴趣的有用信号,然后将该有用信号从参考信号中去除。耳机再将去除有用信号之后的参考信号通过自适应滤波器进行处理,得到环境音频信号的反相信号。使得耳机在播放该反相信号后,可以将环境中的噪音进行抵消,从而实现主动降噪的同时保留有用户感兴趣的声音。
第一方面,提供了一种主动降噪的方法,方法应用于协作设备或耳机,方法包括:对协作设备或耳机周围的环境声音进行采集,确定环境音频信号;确定协作设备或耳机的工作状态;根据预先设定的工作状态与有用信号的对应关系,确定与工作状态相关的至少一个有用信号,其中,有用信号包含目标内容;将至少一个有用信号从环境音频信号中去除,得到参考信号;根据参考信号确定主动降噪所需的待播放信号,以便耳机播放待播放信号后,抵消环境噪声并保留环境中的目标内容。本申请通过确定工作状态,并根据工作状态确定该工作状态所对应的用户感兴趣的有用信号,然后将有用信号从环境信号中去除。以便进行主动降噪时,可以抵消噪音并保留相应该工作状态下用户感兴趣的有用信号。
在一个可能的实施方式中,确定协作设备或耳机的工作状态,包括:确定协作设备或耳机的工作场景,和/或确定协作设备或耳机的工作模式。本申请可以从工作场景以及工作模式两方面,确定不同情况下用户感兴趣的内容。
在一个可能的实施方式中,确定协作设备或耳机的工作场景包括:获取协作设备或耳机的环境信息;根据预设的环境信息与工作场景的对应关系,确定协作设备或耳机的环境信息对应的协作设备或耳机的工作场景。本申请可以结合当前的环境信息,确定用户可能的工作场景,以便设备可以根据该工作场景确定相应的感兴趣内容。
在一个可能的实施方式中,环境信息包括以下至少之一:地理位置信息、环境音频信号或环境视频信号。
在一个可能的实施方式中,确定协作设备或耳机的工作场景还包括:确定用户历史习惯偏好、当前行程、当前时间信息、协作设备和/或耳机的设备状态中的一个或多个;根据预设的环境信息与工作场景的对应关系,确定协作设备或耳机的环境信息对应的协作设备或耳机的工作场景,包括:根据环境信息,并结合用户历史习惯偏好、当前行程、当前时间信息、协作设备或耳机的设备状态中的一个或多个,确定协作设备或耳机的环境信息对应的协作设备或耳机的工作场景。本申请还可以在环境的基础上结合用户的其它信息,共同确定当前用户可能的感兴趣内容。
在一个可能的实施方式中,确定协作设备或耳机的工作模式包括:协作设备或耳机接收第一输入指令,第一输入指令用于从预存在协作设备或耳机上的多个工作模式中指示被选择的工作模式;根据第一输入指令,确定协作设备或耳机的工作模式,其中,工作模式为主动降噪模式下的工作模式。
在一个可能的实施方式中,若方法应用于协作设备,方法还包括:接收耳机发送的耳机的工作模式;将耳机的工作模式作为协作设备的工作模式;或根据第一输入指令和耳机的工作模式,确定协作设备的工作模式。
在一个可能的实施方式中,若方法应用于耳机,方法还包括:接收协作设备发送的协作设备的工作模式;将协作设备的工作模式作为耳机的工作模式;或根据第一输入指令和协作设备的工作模式,确定耳机的工作模式。
在一个可能的实施方式中,确定与工作状态相关的至少一个有用信号包括:确定与工作状态相关的预存在协作设备或耳机上的至少一个有用信号。
在一个可能的实施方式中,确定与工作状态相关的至少一个有用信号还包括:若方法应用于耳机,接收协作设备发送的至少一个有用信号,并根据工作状态从至少一个有用信号中确定与工作状态相关的至少一个有用信号,其中,至少一个有用信号预存在协作设备上;或若方法应用于协作设备,接收耳机发送的至少一个有用信号,并根据工作状态从至少一个有用信号中确定与工作状态相关的至少一个有用信号,其中,至少一个有用信号预存在耳机上。
在一个可能的实施方式中,确定与工作状态相关的至少一个有用信号包括:将环境音频信号进行信号分离,得到至少一个音源信号;对至少一个音源信号进行识别,确定与工作状态相关的至少一个有用信号。本申请可以实时的从环境音频信号中确定有用信号,以保障用户在进行主动降噪时,可以动态保留用户感兴趣的内容。
在一个可能的实施方式中,将环境音频信号进行信号分离,得到至少一个音源信号包括:将环境音频信号经过短时傅里叶变换后,得到环境音频频域信号;根据环境音频频域信号通过分离网络得到音源频域信号;其中,分离网络由分离滤波器的冲激响应构成;对音源频域信号进行短时傅里叶逆变换后,得到时域上的至少一个音源信号。
在一个可能的实施方式中,对至少一个音源信号进行识别,确定与工作状态相关的至少一个有用信号包括:对至少一个音源信号进行关键字识别,并从至少一个音源信号中确定包含与工作状态相关的预设关键字的至少一个有用信号;或对至少一个音源信号进行声纹匹配,并从至少一个音源信号中确定与工作状态相关的预设声纹匹配的至少一个有用信号。
在一个可能的实施方式中,对至少一个音源信号进行关键字识别,并从至少一个音源信号中确定包含预设关键字的至少一个有用信号包括:通过高通滤波器对至少一个音源信号中的每个音源信号进行预加重以及分帧加窗,得到每个音源信号对应的多个帧信号;对多个帧信号进行快速傅里叶变换,得到每个音源信号对应的频谱特征;将频谱特征经梅尔滤波器滤波后取对数,得到每个音源信号对应的梅尔频率对数能量谱;将梅尔频率对数能量谱经离散余弦变换,得到每个音源信号对应的梅尔系数;计算每个音源信号对应的梅尔系数与预设关键字的梅尔系数之间的余弦距离;当余弦距离大于或等于余弦距离阈值时,将音源信号作为有用信号。本申请通过对关键字的识别,从而保障在主动降噪的同时,保留包含有关键字的音频信号。
在一个可能的实施方式中,对至少一个音源信号进行声纹匹配,并从至少一个音源信号中确定与预设声纹匹配的至少一个有用信号包括:对至少一个音源信号中的每个音源信号进行预处理,得到每个音源信号对应的多个帧信号;对多个帧信号进行快速傅里叶变换,得到每个音源信号对应的频谱特征;将频谱特征经梅尔滤波器滤波后取对数,得到每个音源信号对应的梅尔频率对数能量谱;将梅尔频率对数能量谱经离散余弦变换,得到每个音源信号对应的梅尔系数;计算每个音源信号对应的梅尔系数与预设声纹特征梅尔系数的相似度;当相似度大于或等于相似度阈值时,将音源信号作为有用信号。本申请通过对声纹进行识别,从而保障在主动降噪的同时,保留用户感兴趣的特定人声或特定旋律。
在一个可能的实施方式中,确定与工作状态相关的至少一个有用信号包括:根据预先设定的工作状态与频率和/或频率段的对应关系,确定与工作状态相关的至少一个预设的频率和/或频率段;将至少一个有用信号从环境音频信号中去除,得到参考信号包括:对环境音频信号进行处理,将至少一个预设的频率和/或频率段去除,得到参考信号。本申请还可以对采集到的环境信号进行特定频率的滤波,从而保障经过主动降噪后,用户仍然可以感知到特定频率的音频信号。
在一个可能的实施方式中,对环境音频信号进行处理,将至少一个预设的频率和/或频率段去除,得到参考信号包括:将环境音频信号或至少一个音源信号中的每个音源信号通过带通滤波器,去除至少一个预设的频率和/或频率段的声音,得到环境音频信号或每个音源信号对应的参考信号。本申请通过对特定频域的频率进行滤波,从而保障在主动降噪的同时,保留特定频率的音频信号。
在一个可能的实施方式中,将至少一个有用信号从环境音频信号中去除,得到参考信号包括:采用自适应滤波将至少一个有用信号从环境音频信号中去除,得到参考信号;或采用谱减法将至少一个有用信号从环境音频信号中去除,得到参考信号。本申请通过将有用信号从环境音频信号中去除,从而保障参考信号中不包含用户感兴趣的有用信号,以便在进行主动降噪时,可以抵消噪音并保留用户感兴趣的内容。
在一个可能的实施方式中,在将至少一个有用信号从环境音频信号中去除之前,方法还包括:对至少一个有用信号进行带通滤波,得到至少一个滤波后的有用信号。本申请还可以对有用信号进行滤波,滤除高频有用信号,从而降低设备功耗,减少对高频的降噪。
在一个可能的实施方式中,在对至少一个有用信号进行带通滤波之前,方法还包括:获取预设的带通滤波范围;或根据工作状态,确定工作状态下的带通滤波范围;或确定协作设备或耳机的电量信息;根据协作设备或耳机的电量信息,确定带通滤波范围。
在一个可能的实施方式中,对环境声音进行采集包括:全方向采集;或通过控制麦克风阵列进行特定方向采集。本申请还可以对音频信号进行方向采集,从而可以更加快速得到不包含有用信号的参考信号。
在一个可能的实施方式中,方法还包括:若通过控制麦克风阵列进行特定方向采集,则根据采集到的至少一个方向的音频信号,确定至少一个有用信号,其中根据有用信号得到的参考信号的方向与有用信号的方向不一致;或若通过控制麦克风阵列进行特定方向采集,则根据采集到的至少一个方向的音频信号,确定参考信号。
在一个可能的实施方式中,若方法应用于协作设备,对协作设备或耳机周围的环境声音进行采集,确定环境音频信号包括:协作设备采集周围的环境声音,并将采集到的声音作为环境音频信号;或协作设备接收耳机发送的环境音频信号,其中环境音频信号为耳机采集耳机周围的环境声音。
在一个可能的实施方式中,若方法应用于耳机,对协作设备或耳机周围的环境声音进行采集,确定环境音频信号包括:耳机采集周围的环境声音,并将采集到的声音作为环境音频信号;或耳机接收协作设备发送的环境音频信号,其中环境音频信号为协作设备采集协作设备周围的环境声音。
在一个可能的实施方式中,确定待播放信号包括:根据参考信号以及主动降噪架构,确定环境音频信号的反相信号,并将反相信号作为待播放信号。
在一个可能的实施方式中,根据参考信号以及主动降噪架构,确定环境音频信号的反相信号包括:根据参考信号以及自适应滤波器的权系数,确定环境音频信号的反相信号。
在一个可能的实施方式中,方法还包括:采集耳机静区的声场特征;根据声场特征、自适应滤波器的权系数和参考信号,确定更新后的权系数,以便用于下一次确定环境音频信号的反相信号。
在一个可能的实施方式中,方法还包括:若方法应用于协作设备,则将待播放信号发送至耳机。
第二方面,提供了一种主动降噪的方法,方法应用于协作设备或耳机,方法包括:对协作设备或耳机周围的环境声音进行采集,确定环境音频信号;确定至少一个有用信号,其中,有用信号包含目标内容;对至少一个有用信号进行带通滤波,得到至少一个滤波后的有用信号;将至少一个滤波后的有用信号从环境音频信号中去除,得到参考信号;根据参考信号确定主动降噪所需的待播放信号,以便耳机播放待播放信号后,抵消环境噪声并保留环境中的目标内容。本申请通过确定用户感兴趣的有用信号,然后对有用信号进行带通滤波,从而去除降噪效果不理想的高频部分。并将滤波后的有用信号从环境信号中去除。以便进行主动降噪时,可以抵消噪音并保留相应该工作状态下用户感兴趣的有用信号。
在一个可能的实施方式中,确定至少一个有用信号包括:确定协作设备或耳机的工作状态;根据预先设定的工作状态与有用信号的对应关系,确定与工作状态相关的至少一个有用信号。本申请还可以通过确定工作状态,并根据工作状态确定该工作状态所对应的用户感兴趣的有用信号。
在一个可能的实施方式中,确定协作设备或耳机的工作状态包括:确定协作设备或耳机的工作场景,和/或确定协作设备或耳机的工作模式。本申请可以从工作场景以及工作模式两方面,确定不同情况下用户感兴趣的内容。
在一个可能的实施方式中,确定协作设备或耳机的工作场景包括:获取协作设备或耳机的环境信息;根据预设的环境信息与工作场景的对应关系,确定协作设备或耳机的环境信息对应的协作设备或耳机的工作场景。本申请可以结合当前的环境信息,确定用户可能的工作场景,以便设备可以根据该工作场景确定相应的感兴趣内容。
在一个可能的实施方式中,环境信息包括以下至少之一:地理位置信息、环境音频信号或环境视频信号。
在一个可能的实施方式中,确定协作设备或耳机的工作场景还包括:确定用户历史习惯偏好、当前行程、当前时间信息、协作设备和/或耳机的设备状态中的一个或多个;根据预设的环境信息与工作场景的对应关系,确定协作设备或耳机的环境信息对应的协作设备或耳机的工作场景,包括:根据环境信息,并结合用户历史习惯偏好、当前行程、当前时间信息中、协作设备或耳机的设备状态中的一个或多个,确定协作设备或耳机的环境信息对应的协作设备或耳机的工作场景。本申请还可以在环境的基础上结合用户的其它信息,共同确定当前用户可能的感兴趣内容。
在一个可能的实施方式中,确定协作设备或耳机的工作模式包括:协作设备或耳机接收第一输入指令,第一输入指令用于从预存在协作设备或耳机上的多个工作模式中指示被选择的工作模式;根据第一输入指令,确定协作设备或耳机的工作模式,其中,工作模式为主动降噪模式下的工作模式。
在一个可能的实施方式中,若方法应用于协作设备,方法还包括:接收耳机发送的耳机的工作模式;将耳机的工作模式作为协作设备的工作模式;或根据第一输入指令和耳机的工作模式,确定协作设备的工作模式。
在一个可能的实施方式中,若方法应用于耳机,方法还包括:接收协作设备发送的协作设备的工作模式;将协作设备的工作模式作为耳机的工作模式;或根据第一输入指令和协作设备的工作模式,确定耳机的工作模式。
在一个可能的实施方式中,在对至少一个有用信号进行带通滤波之前,方法还包括:获取预设的带通滤波范围;或根据工作状态,确定工作状态下的带通滤波范围;或确定协作设备或耳机的电量信息;根据协作设备或耳机的电量信息,确定带通滤波范围。
在一个可能的实施方式中,确定至少一个有用信号包括:确定预存在协作设备或耳机上的至少一个有用信号。
在一个可能的实施方式中,确定至少一个有用信号包括:将环境音频信号进行信号分离,得到至少一个音源信号;对至少一个音源信号进行识别,确定至少一个有用信号。本申请可以实时的从环境音频信号中确定有用信号,以保障用户在进行主动降噪时,可以动态保留用户感兴趣的内容。
在一个可能的实施方式中,将环境音频信号进行信号分离,得到至少一个音源信号包括:将环境音频信号经过短时傅里叶变换后,得到环境音频频域信号;根据环境音频频域信号通过分离网络得到音源频域信号;其中,分离网络由分离滤波器的冲激响应构成;对音源频域信号进行短时傅里叶逆变换后,得到时域上的至少一个音源信号。
在一个可能的实施方式中,对至少一个音源信号进行识别,确定至少一个有用信号包括:对至少一个音源信号进行关键字识别,并从至少一个音源信号中确定包含预设关键字的至少一个有用信号;或对至少一个音源信号进行声纹匹配,并从至少一个音源信号中确定与预设声纹匹配的至少一个有用信号。
在一个可能的实施方式中,对至少一个音源信号进行关键字识别,并从至少一个音源信号中确定包含预设关键字的至少一个有用信号包括:通过高通滤波器对至少一个音源信号中的每个音源信号进行预加重以及分帧加窗,得到每个音源信号对应的多个帧信号;对多个帧信号进行快速傅里叶变换,得到每个音源信号对应的频谱特征;将频谱特征经梅尔滤波器滤波后取对数,得到每个音源信号对应的梅尔频率对数能量谱;将梅尔频率对数能量谱经离散余弦变换,得到每个音源信号对应的梅尔系数;计算每个音源信号对应的梅尔系数与预设关键字的梅尔系数之间的余弦距离;当余弦距离大于或等于余弦距离阈值时,将音源信号作为有用信号。本申请通过对关键字的识别,从而保障在主动降噪的同时,保留包含有关键字的音频信号。
在一个可能的实施方式中,对至少一个音源信号进行声纹匹配,并从至少一个音源信号中确定与预设声纹匹配的至少一个有用信号包括:对至少一个音源信号中的每个音源信号进行预处理,得到每个音源信号对应的多个帧信号;对多个帧信号进行快速傅里叶变换,得到每个音源信号对应的频谱特征;将频谱特征经梅尔滤波器滤波后取对数,得到每个音源信号对应的梅尔频率对数能量谱;将梅尔频率对数能量谱经离散余弦变换,得到每个音源信号对应的梅尔系数;计算每个音源信号对应的梅尔系数与预设声纹特征梅尔系数的相似度;当相似度大于或等于相似度阈值时,将音源信号作为有用信号。本申请通过对声纹进行识别,从而保障在主动降噪的同时,保留用户感兴趣的特定人声或特定旋律。
在一个可能的实施方式中,确定至少一个有用信号包括:确定至少一个预设的频率和/或频率段;将至少一个滤波后的有用信号从环境音频信号中去除,得到参考信号包括:对至少一个预设的频率和/或频率段进行带通滤波,得到至少一个滤波后的频率和/或频率段;对环境音频信号进行处理,将至少一个滤波后的频率和/或频率段去除,得到参考信号。本申请还可以对采集到的环境信号进行特定频率的滤波,从而保障经过主动降噪后,用户仍然可以感知到特定频率的音频信号。
在一个可能的实施方式中,对环境音频信号进行处理,将至少一个滤波后的频率和/或频率段去除,得到参考信号包括:将环境音频信号或至少一个音源信号中的每个音源信号通过带通滤波器,去除至少一个滤波后的频率和/或频率段的声音,得到环境音频信号或每个音源信号对应的参考信号。本申请通过对特定频域的频率进行滤波,从而保障在主动降噪的同时,保留特定频率的音频信号。
在一个可能的实施方式中,将至少一个滤波后的有用信号从环境音频信号中去除,得到参考信号包括:采用自适应滤波将至少一个滤波后的有用信号从环境音频信号中去除,得到参考信号;或采用谱减法将至少一个滤波后的有用信号从环境音频信号中去除,得到参考信号。本申请通过将有用信号从环境音频信号中去除,从而保障参考信号中不包含用户感兴趣的有用信号,以便在进行主动降噪时,可以抵消噪音并保留用户感兴趣的内容。
在一个可能的实施方式中,对环境声音进行采集包括:全方向采集;或通过控制麦克风阵列进行特定方向采集。本申请还可以对音频信号进行方向采集,从而可以更加快速得到不包含有用信号的参考信号。
在一个可能的实施方式中,方法还包括:若通过控制麦克风阵列进行特定方向采集,则根据采集到的至少一个方向的音频信号,确定至少一个有用信号,其中根据有用信号得到的参考信号的方向与有用信号的方向不一致;或若通过控制麦克风阵列进行特定方向采集,则根据采集到的至少一个方向的音频信号,确定参考信号。
在一个可能的实施方式中,若方法应用于协作设备,对协作设备或耳机周围的环境声音进行采集,确定环境音频信号包括:协作设备采集周围的环境声音,并将采集到的声音作为环境音频信号;或协作设备接收耳机发送的环境音频信号,其中环境音频信号为耳机采集耳机周围的环境声音。
在一个可能的实施方式中,若方法应用于耳机,对协作设备或耳机周围的环境声音进行采集,确定环境音频信号包括:耳机采集周围的环境声音,并将采集到的声音作为环境音频信号;或耳机接收协作设备发送的环境音频信号,其中环境音频信号为协作设备采集协作设备周围的环境声音。
在一个可能的实施方式中,确定待播放信号包括:根据参考信号以及主动降噪架构,确定环境音频信号的反相信号,并将环境音频信号的反相信号作为待播放信号。
在一个可能的实施方式中,根据参考信号以及主动降噪架构,确定环境音频信号的反相信号包括:根据参考信号以及自适应滤波器的权系数,确定环境音频信号的反相信号。
在一个可能的实施方式中,方法还包括:采集耳机静区的声场特征;根据声场特征、自适应滤波器的权系数和参考信号,确定更新后的权系数,以便用于下一次确定环境音频信号的反相信号。
在一个可能的实施方式中,方法还包括:若方法应用于协作设备,则将待播放信号发送至耳机。
第三方面,提供了一种主动降噪的方法,方法应用于协作设备或耳机,方法包括:对协作设备或耳机周围的环境声音进行采集,确定环境音频信号;确定至少一个有用信号,并将至少一个有用信号从环境音频信号中去除,得到参考信号,其中,有用信号包含目标内容;根据参考信号以及主动降噪架构,确定待播放信号,以便耳机播放待播放信号后,抵消环境噪声并保留环境中的目标内容;其中,若方法应用于协作设备,方法还包括:将待播放信号发送至耳机。本申请通过确定用户感兴趣的有用信号,并将有用信号从参考信号中去除。以便进行主动降噪时,可以抵消噪音并保留用户感兴趣的有用信号。
在一个可能的实施方式中,确定至少一个有用信号包括:确定预存在协作设备或耳机上的至少一个有用信号。
在一个可能的实施方式中,确定至少一个有用信号还包括:若方法应用于耳机,接收协作设备发送的至少一个有用信号,其中,至少一个有用信号预存在协作设备上;或若方法应用于协作设备,接收耳机发送的至少一个有用信号,其中,至少一个有用信号预存在耳机上。
在一个可能的实施方式中,确定至少一个有用信号包括:将环境音频信号进行信号分离,得到至少一个音源信号;对至少一个音源信号进行识别,确定至少一个有用信号。本申请可以实时的从环境音频信号中确定有用信号,以保障用户在进行主动降噪时,可以动态保留用户感兴趣的内容。
在一个可能的实施方式中,将环境音频信号进行信号分离,得到至少一个音源信号包括:将环境音频信号经过短时傅里叶变换后,得到环境音频频域信号;根据环境音频频域信号通过分离网络得到音源频域信号;其中,分离网络由分离滤波器的冲激响应构成;对音源频域信号进行短时傅里叶逆变换后,得到时域上的至少一个音源信号。
在一个可能的实施方式中,对至少一个音源信号进行识别,确定至少一个有用信号包括:对至少一个音源信号进行关键字识别,并从至少一个音源信号中确定包含预设关键字的至少一个有用信号;或对至少一个音源信号进行声纹匹配,并从至少一个音源信号中确定与预设声纹匹配的至少一个有用信号。
在一个可能的实施方式中,对至少一个音源信号进行关键字识别,并从至少一个音源信号中确定包含预设关键字的至少一个有用信号包括:通过高通滤波器对至少一个音源信号中的每个音源信号进行预加重以及分帧加窗,得到每个音源信号对应的多个帧信号;对多个帧信号进行快速傅里叶变换,得到每个音源信号对应的频谱特征;将频谱特征经梅尔滤波器滤波后取对数,得到每个音源信号对应的梅尔频率对数能量谱;将梅尔频率对数能量谱经离散余弦变换,得到每个音源信号对应的梅尔系数;计算每个音源信号对应的梅尔系数与预设关键字的梅尔系数之间的余弦距离;当余弦距离大于或等于余弦距离阈值时,将音源信号作为有用信号。本申请通过对关键字的识别,从而保障在主动降噪的同时,保留包含有关键字的音频信号。
在一个可能的实施方式中,对至少一个音源信号进行声纹匹配,并从至少一个音源信号中确定与预设声纹匹配的至少一个有用信号包括:对至少一个音源信号中的每个音源信号进行预处理,得到每个音源信号对应的多个帧信号;对多个帧信号进行快速傅里叶变换,得到每个音源信号对应的频谱特征;将频谱特征经梅尔滤波器滤波后取对数,得到每个音源信号对应的梅尔频率对数能量谱;将梅尔频率对数能量谱经离散余弦变换,得到每个音源信号对应的梅尔系数;计算每个音源信号对应的梅尔系数与预设声纹特征梅尔系数的相似度;当相似度大于或等于相似度阈值时,将音源信号作为有用信号。本申请通过对声纹进行识别,从而保障在主动降噪的同时,保留用户感兴趣的特定人声或特定旋律。
在一个可能的实施方式中,确定至少一个有用信号包括:确定至少一个预设的频率和/或频率段;将至少一个有用信号从环境音频信号中去除,得到参考信号包括:对环境音频信号进行处理,将至少一个预设的频率和/或频率段去除,得到参考信号。本申请还可以对采集到的环境信号进行特定频率的滤波,从而保障经过主动降噪后,用户仍然可以感知到特定频率的音频信号。
在一个可能的实施方式中,对环境音频信号进行处理,将至少一个预设的频率和/或频率段去除,得到参考信号包括:将环境音频信号或至少一个音源信号中的每个音源信号通过带通滤波器,去除预设的至少一个频率和/或频率段的声音,得到环境音频信号或每个音源信号对应的参考信号。本申请通过对特定频域的频率进行滤波,从而保障在主动降噪的同时,保留特定频率的音频信号。
在一个可能的实施方式中,确定至少一个有用信号包括:确定协作设备或耳机的工作状态;根据预先设定的工作状态与有用信号的对应关系,确定与工作状态相关的至少一个有用信号。本申请还可以通过确定工作状态,并根据工作状态确定该工作状态所对应的用户感兴趣的有用信号。
在一个可能的实施方式中,确定协作设备或耳机的工作状态包括:确定协作设备或耳机的工作场景,和/或确定协作设备或耳机的工作模式。本申请可以从工作场景以及工作模式两方面,确定不同情况下用户感兴趣的内容。
在一个可能的实施方式中,确定协作设备或耳机的工作场景包括:获取协作设备或耳机的环境信息;根据预设的环境信息与工作场景的对应关系,确定协作设备或耳机的环境信息对应的协作设备或耳机的工作场景。本申请可以结合当前的环境信息,确定用户可能的工作场景,以便设备可以根据该工作场景确定相应的感兴趣内容。
在一个可能的实施方式中,环境信息包括以下至少之一:地理位置信息、环境音频信号或环境视频信号。
在一个可能的实施方式中,确定协作设备或耳机的工作场景还包括:确定用户历史习惯偏好、当前行程、当前时间信息、协作设备和/或耳机的设备状态中的一个或多个;根据预设的环境信息与工作场景的对应关系,确定协作设备或耳机的环境信息对应的协作设备或耳机的工作场景,包括:根据环境信息,并结合用户历史习惯偏好、当前行程、当前时间信息中、协作设备或耳机的设备状态中的一个或多个,确定协作设备或耳机的环境信息对应的协作设备或耳机的工作场景。本申请还可以在环境的基础上结合用户的其它信息,共同确定当前用户可能的感兴趣内容。
在一个可能的实施方式中,确定协作设备或耳机的工作模式包括:协作设备或耳机接收第一输入指令,第一输入指令用于从预存在协作设备或耳机上的多个工作模式中指示被选择的工作模式;根据第一输入指令,确定协作设备或耳机的工作模式,其中,工作模式为主动降噪模式下的工作模式。
在一个可能的实施方式中,若方法应用于协作设备,方法还包括:接收耳机发送的耳机的工作模式;将耳机的工作模式作为协作设备的工作模式;或根据第一输入指令和耳机的工作模式,确定协作设备的工作模式。
在一个可能的实施方式中,若方法应用于耳机,方法还包括:接收协作设备发送的协作设备的工作模式;将协作设备的工作模式作为耳机的工作模式;或根据第一输入指令和协作设备的工作模式,确定耳机的工作模式。
在一个可能的实施方式中,将至少一个有用信号从环境音频信号中去除,得到参考信号包括:采用自适应滤波将至少一个有用信号从环境音频信号中去除,得到参考信号;或采用谱减法将至少一个有用信号从环境音频信号中去除,得到参考信号。本申请通过将有用信号从环境音频信号中去除,从而保障参考信号中不包含用户感兴趣的有用信号,以便在进行主动降噪时,可以抵消噪音并保留用户感兴趣的内容。
在一个可能的实施方式中,在将至少一个有用信号从环境音频信号中去除之前,方法还包括:对至少一个有用信号进行带通滤波,得到至少一个滤波后的有用信号。本申请还可以对有用信号进行滤波,滤除高频有用信号,从而降低设备功耗,减少对高频的降噪。
在一个可能的实施方式中,在对至少一个有用信号进行带通滤波之前,方法还包括:获取预设的带通滤波范围;或根据工作状态,确定工作状态下的带通滤波范围;或确定协作设备或耳机的电量信息;根据协作设备或耳机的电量信息,确定带通滤波范围。
在一个可能的实施方式中,对环境声音进行采集包括:全方向采集;或通过控制麦克风阵列进行特定方向采集。本申请还可以对音频信号进行方向采集,从而可以更加快速得到不包含有用信号的参考信号。
在一个可能的实施方式中,方法还包括:若通过控制麦克风阵列进行特定方向采集,则根据采集到的至少一个方向的音频信号,确定有用信号,其中根据有用信号得到的参考信号的方向与有用信号的方向不一致;或若通过控制麦克风阵列进行特定方向采集,则根据采集到的至少一个方向的音频信号,确定参考信号。
在一个可能的实施方式中,若方法应用于协作设备,对协作设备或耳机周围的环境声音进行采集,确定环境音频信号包括:协作设备采集周围的环境声音,并将采集到的声音作为环境音频信号;或协作设备接收耳机发送的环境音频信号,其中环境音频信号为耳机采集耳机周围的环境声音。
在一个可能的实施方式中,若方法应用于耳机,对协作设备或耳机周围的环境声音进行采集,确定环境音频信号包括:耳机采集周围的环境声音,并将采集到的声音作为环境音频信号;或耳机接收协作设备发送的环境音频信号,其中环境音频信号为协作设备采集协作设备周围的环境声音。
在一个可能的实施方式中,确定待播放信号包括:根据参考信号以及主动降噪架构,确定环境音频信号的反相信号,并将环境音频信号的反相信号作为待播放信号。
在一个可能的实施方式中,根据参考信号以及主动降噪架构,确定环境音频信号的反相信号包括:根据参考信号以及自适应滤波器的权系数,确定环境音频信号的反相信号。
在一个可能的实施方式中,方法还包括:采集耳机静区的声场特征;根据声场特征、自适应滤波器的权系数和参考信号,确定更新后的权系数,以便用于下一次确定环境音频信号的反相信号。
在一个可能的实施方式中,方法还包括:若方法应用于协作设备,则将待播放信号发送至耳机。
第四方面,提供了一种主动降噪的系统,系统包括协作设备和耳机,系统包括:协作设备,用于确定协作设备或耳机的工作状态;协作设备还用于,根据预先设定的工作状态与有用信号的对应关系,确定与工作状态相关的至少一个有用信号,其中,有用信号包含目标内容;协作设备还用于,将至少一个有用信号发送至耳机;耳机,用于接收至少一个有用信号;耳机还用于,对耳机周围的环境声音进行采集,确定耳机的环境音频信号;耳机还用于,将接收到的至少一个有用信号从耳机的环境音频信号中去除,得到参考信号;耳机还用于,根据参考信号以及主动降噪架构,确定待播放信号;耳机还用于,播放待播放信号,使得待播放信号与耳机周围的环境声音进行叠加,抵消环境噪声并保留目标内容。本申请通过协作设备确定工作状态,并根据工作状态确定该工作状态所对应的用户感兴趣的有用信号,然后协作设备将有用信号发送至耳机,以便耳机将有用信号从耳机的环境信号中去除。以便在耳机进行主动降噪时,可以抵消噪音并保留相应该工作状态下用户感兴趣的有用信号。
在一个可能的实施方式中,协作设备还用于,确定协作设备或耳机的工作场景,和/或确定协作设备或耳机的工作模式。本申请中协作设备可以从工作场景以及工作模式两方面,确定不同情况下用户感兴趣的内容。
在一个可能的实施方式中,协作设备还用于,获取协作设备的第一环境信息;和/或耳机还用于,获取第二环境信息,并将第二环境信息发送至协作设备;协作设备还用于,接收耳机发送的第二环境信息;协作设备还用于,根据预设的第一环境信息和第二环境信息中的一个或多个与工作场景的对应关系,确定对应的协作设备或耳机的工作场景。本申请中协作设备可以结合当前的环境信息,确定用户可能的工作场景,以便根据该工作场景确定相应的感兴趣内容。
在一个可能的实施方式中,协作设备还用于,获取协作设备的第一环境信息,并将第一环境信息发送至耳机;耳机还用于,接收协作设备发送的第一环境信息;和/或耳机还用于,获取第二环境信息;耳机还用于,根据预设的第一环境信息和第二环境信息中的一个或多个与工作场景的对应关系,确定对应的协作设备或耳机的工作场景,并将协作设备或耳机的工作场景发送至协作设备。本申请中耳机可以结合当前的环境信息,确定用户可能的工作场景,并将可能的工作场景发送至协作设备,以便协作设备根据该工作场景确定相应的感兴趣内容。
在一个可能的实施方式中,第一环境信息包括以下至少之一:协作设备的地理位置信息、协作设备的环境音频信号或协作设备的环境视频信号;以及,第二环境信息包括以下至少之一:耳机的地理位置信息、耳机的环境音频信号或耳机的环境视频信号。
在一个可能的实施方式中,耳机还用于,确定耳机的设备状态,并将耳机的设备状态发送至协作设备;协作设备还用于,接收耳机发送的耳机的设备状态;和/或协作设备还用于,确定用户历史习惯偏好、当前行程、当前时间信息、协作设备的设备状态中的一个或多个;协作设备还用于,根据第一环境信息和/或第二环境信息,并结合用户历史习惯偏好、当前行程、当前时间信息、协作设备的设备状态以及耳机的设备状态中的一个或多个,确定协作设备或耳机的工作场景。本申请协作设备还可以在环境的基础上结合用户的其它信息,共同确定当前用户可能的感兴趣内容。
在一个可能的实施方式中,协作设备还用于,确定协作设备的设备状态,并将协作设备的设备状态发送至耳机;耳机还用于,接收协作设备发送的协作设备的设备状态;和/或耳机还用于,确定用户历史习惯偏好、当前行程、当前时间信息、耳机的设备状态中的一个或多个;耳机还用于,根据第一环境信息和/或第二环境信息,并结合用户历史习惯偏好、当前行程、当前时间信息、协作设备的设备状态以及耳机的设备状态中的一个或多个,确定协作设备或耳机的工作场景,并将协作设备或耳机的工作场景发送至协作设备。本申请耳机还可以在环境的基础上结合用户的其它信息,共同确定当前用户可能的感兴趣内容。
在一个可能的实施方式中,协作设备还用于:接收第一输入指令,第一输入指令用于从预存在协作设备上的多个工作模式中指示被选择的工作模式;根据第一输入指令,确定协作设备的工作模式,其中,工作模式为主动降噪模式下的工作模式。
在一个可能的实施方式中,协作设备还用于:接收耳机发送的耳机的工作模式;将耳机的工作模式作为协作设备的工作模式;或根据第一输入指令和耳机的工作模式,确定协作设备的工作模式。
在一个可能的实施方式中,耳机还用于:接收第一输入指令,第一输入指令用于从预存在耳机上的多个工作模式中指示被选择的工作模式;根据第一输入指令,确定耳机的工作模式,其中,工作模式为主动降噪模式下的工作模式;将耳机的工作模式发送至协作设备。
在一个可能的实施方式中,耳机还用于:接收协作设备发送的协作设备的工作模式;将协作设备的工作模式作为耳机的工作模式;或根据第一输入指令和协作设备的工作模式,确定耳机的工作模式。
在一个可能的实施方式中,协作设备还用于:确定与工作状态相关的预存的至少一个有用信号。
在一个可能的实施方式中,协作设备还用于:对协作设备周围环境的环境声音进行采集,确定协作设备的环境音频信号;根据协作设备的环境音频信号,确定与工作状态相关的至少一个有用信号。
在一个可能的实施方式中,协作设备还用于:将协作设备的环境音频信号进行信号分离,得到至少一个音源信号;对至少一个音源信号进行识别,确定与工作状态相关的至少一个有用信号。本申请可以实时的从环境音频信号中确定有用信号,以保障用户在进行主动降噪时,可以动态保留用户感兴趣的内容。
在一个可能的实施方式中,协作设备还用于:将环境音频信号经过短时傅里叶变换后,得到环境音频频域信号;根据环境音频频域信号通过分离网络得到音源频域信号;其中,分离网络由分离滤波器的冲激响应构成;对音源频域信号进行短时傅里叶逆变换后,得到时域上的至少一个音源信号。
在一个可能的实施方式中,协作设备还用于:对至少一个音源信号进行关键字识别,并从至少一个音源信号中确定包含与工作状态相关的预设关键字的至少一个有用信号;或对至少一个音源信号进行声纹匹配,并从至少一个音源信号中确定与工作状态相关的预设声纹匹配的至少一个有用信号。
在一个可能的实施方式中,协作设备还用于:通过高通滤波器对至少一个音源信号中的每个音源信号进行预加重以及分帧加窗,得到每个音源信号对应的多个帧信号;对多个帧信号进行快速傅里叶变换,得到每个音源信号对应的频谱特征;将频谱特征经梅尔滤波器滤波后取对数,得到每个音源信号对应的梅尔频率对数能量谱;将梅尔频率对数能量谱经离散余弦变换,得到每个音源信号对应的梅尔系数;计算每个音源信号对应的梅尔系数与预设关键字的梅尔系数之间的余弦距离;当余弦距离大于或等于余弦距离阈值时,将音源信号作为有用信号。本申请通过对关键字的识别,从而保障在主动降噪的同时,保留包含有关键字的音频信号。
在一个可能的实施方式中,协作设备还用于:对至少一个音源信号中的每个音源信号进行预处理,得到每个音源信号对应的多个帧信号;对多个帧信号进行快速傅里叶变换,得到每个音源信号对应的频谱特征;将频谱特征经梅尔滤波器滤波后取对数,得到每个音源信号对应的梅尔频率对数能量谱;将梅尔频率对数能量谱经离散余弦变换,得到每个音源信号对应的梅尔系数;计算每个音源信号对应的梅尔系数与预设声纹特征梅尔系数的相似度;当相似度大于或等于相似度阈值时,将音源信号作为有用信号。本申请通过对声纹进行识别,从而保障在主动降噪的同时,保留用户感兴趣的特定人声或特定旋律。
在一个可能的实施方式中,协作设备还用于:根据预先设定的工作状态与频率和/或频率段的对应关系,确定与工作状态相关的至少一个预设的频率和/或频率段;对环境音频信号进行处理,将至少一个预设的频率和/或频率段去除,得到参考信号。本申请还可以对采集到的环境信号进行特定频率的滤波,从而保障经过主动降噪后,用户仍然可以感知到特定频率的音频信号。
在一个可能的实施方式中,耳机还用于:将耳机的环境音频信号通过带通滤波器,去除至少一个预设的频率和/或频率段的声音,得到耳机的环境音频信号对应的参考信号。本申请通过对特定频域的频率进行滤波,从而保障在主动降噪的同时,保留特定频率的音频信号。
在一个可能的实施方式中,耳机还用于:采用自适应滤波将至少一个有用信号从耳机的环境音频信号中去除,得到参考信号;或采用谱减法将至少一个有用信号从耳机的环境音频信号中去除,得到参考信号。本申请通过将有用信号从环境音频信号中去除,从而保障参考信号中不包含用户感兴趣的有用信号,以便在进行主动降噪时,可以抵消噪音并保留用户感兴趣的内容。
在一个可能的实施方式中,耳机还用于,对至少一个有用信号进行带通滤波,得到至少一个滤波后的有用信号;或协作设备还用于,对至少一个有用信号进行带通滤波,得到至少一个滤波后的有用信号;协作设备还用于,将至少一个滤波后的有用信号发送至耳机;耳机还用于,接收至少一个滤波后的有用信号,以便耳机根据至少一个滤波后的有用信号确定参考信号。
在一个可能的实施方式中,耳机还用于,获取预设的带通滤波范围;或根据工作状态,确定工作状态下的带通滤波范围;或确定耳机的电量信息;根据耳机的电量信息,确定带通滤波范围;或,协作设备还用于,获取预设的带通滤波范围;或根据工作状态,确定工作状态下的带通滤波范围;或确定协作设备的电量信息;根据协作设备的电量信息,确定带通滤波范围。
在一个可能的实施方式中,协作设备还用于:对协作设备周围环境的环境声音进行全方向采集;或通过控制麦克风阵列进行特定方向采集。本申请还可以对音频信号进行方向采集,从而可以更加快速得到不包含有用信号的参考信号。
在一个可能的实施方式中,协作设备还用于:若通过控制麦克风阵列进行特定方向采集,则根据采集到的至少一个方向的音频信号,确定至少一个有用信号,其中根据有用信号得到的参考信号的方向与有用信号的方向不一致;或若通过控制麦克风阵列进行特定方向采集,则根据采集到的至少一个方向的音频信号,确定参考信号,并将参考信号发送至耳机,以便耳机根据接收到的参考信号确定待播放信号。
在一个可能的实施方式中,耳机还用于:根据参考信号以及主动降噪架构,确定耳机的环境音频信号的反相信号,并将反相信号作为待播放信号。
在一个可能的实施方式中,耳机还用于:根据参考信号以及自适应滤波器的权系数,确定耳机的环境音频信号的反相信号。
在一个可能的实施方式中,耳机还用于:采集耳机静区的声场特征;根据声场特征、自适应滤波器的权系数和参考信号,确定更新后的权系数,以便用于下一次确定耳机的环境音频信号的反相信号。
第五方面,提供了一种主动降噪的系统,系统包括协作设备和耳机,系统包括:协作设备,用于确定至少一个有用信号,其中,有用信号包含目标内容;协作设备还用于,将至少一个有用信号发送至耳机;或,协作设备还用于,对至少一个有用信号进行带通滤波,得到至少一个滤波后的有用信号,并将至少一个滤波后的有用信号发送至耳机;耳机,用于接收至少一个有用信号,或接收至少一个滤波后的有用信号;若耳机接收至少一个有用信号,对接收到的至少一个有用信号进行带通滤波,得到至少一个滤波后的有用信号;耳机还用于,对耳机周围的环境声音进行采集,确定耳机的环境音频信号;耳机还用于,将至少一个滤波后的有用信号从耳机的环境音频信号中去除,得到参考信号;耳机还用于,根据参考信号以及主动降噪架构,确定待播放信号;耳机还用于,播放待播放信号,使得待播放信号与耳机周围的环境声音进行叠加,抵消环境噪声并保留目标内容。本申请通过协作设备确定用户感兴趣的有用信号,然后对有用信号进行带通滤波,从而去除降噪效果不理想的高频部分。并将滤波后的有用信号发送至耳机,以便耳机可以将滤波后的有用信号从环境信号中去除。从而在进行主动降噪时,耳机可以抵消噪音并保留相应该工作状态下用户感兴趣的有用信号。
在一个可能的实施方式中,协作设备还用于,确定协作设备或耳机的工作状态;根据预先设置的工作状态与有用信号的对应关系,确定与工作状态相关的至少一个有用信号。本申请协作设备还可以通过确定工作状态,并根据工作状态确定该工作状态所对应的用户感兴趣的有用信号。
在一个可能的实施方式中,协作设备还用于,确定协作设备或耳机的工作场景,和/或确定协作设备或耳机的工作模式。本申请协作设备可以从工作场景以及工作模式两方面,确定不同情况下用户感兴趣的内容。
在一个可能的实施方式中,协作设备还用于,获取协作设备的第一环境信息;和/或耳机还用于,获取第二环境信息,并将第二环境信息发送至协作设备;协作设备还用于,接收耳机发送的第二环境信息;协作设备还用于,根据预设的第一环境信息和第二环境信息中的一个或多个与工作场景的对应关系,确定对应的协作设备或耳机的工作场景。本申请中协作设备可以结合当前的环境信息,确定用户可能的工作场景,以便根据该工作场景确定相应的感兴趣内容。
在一个可能的实施方式中,协作设备还用于,获取协作设备的第一环境信息,并将第一环境信息发送至耳机;耳机还用于,接收协作设备发送的第一环境信息;和/或耳机还用于,获取第二环境信息;耳机还用于,根据预设的第一环境信息和第二环境信息中的一个或多个与工作场景的对应关系,确定对应的协作设备或耳机的工作场景,并将协作设备或耳机的工作场景发送至协作设备。本申请中耳机可以结合当前的环境信息,确定用户可能的工作场景,并将可能的工作场景发送至协作设备,以便协作设备根据该工作场景确定相应的感兴趣内容。
在一个可能的实施方式中,第一环境信息包括以下至少之一:协作设备的地理位置信息、协作设备的环境音频信号或协作设备的环境视频信号;以及,第二环境信息包括以下至少之一:耳机的地理位置信息、耳机的环境音频信号或耳机的环境视频信号。
在一个可能的实施方式中,耳机还用于,确定耳机的设备状态,并将耳机的设备状态发送至协作设备;协作设备还用于,接收耳机发送的耳机的设备状态;和/或协作设备还用于,确定用户历史习惯偏好、当前行程、当前时间信息、协作设备的设备状态中的一个或多个;协作设备还用于,根据第一环境信息和/或第二环境信息,并结合用户历史习惯偏好、当前行程、当前时间信息、协作设备的设备状态以及耳机的设备状态中的一个或多个,确定协作设备或耳机的工作场景。本申请协作设备还可以在环境的基础上结合用户的其它信息,共同确定当前用户可能的感兴趣内容。
在一个可能的实施方式中,协作设备还用于,确定协作设备的设备状态,并将协作设备的设备状态发送至耳机;耳机还用于,接收协作设备发送的协作设备的设备状态;和/或耳机还用于,确定用户历史习惯偏好、当前行程、当前时间信息、耳机的设备状态中的一个或多个;耳机还用于,根据第一环境信息和/或第二环境信息,并结合用户历史习惯偏好、当前行程、当前时间信息、协作设备的设备状态以及耳机的设备状态中的一个或多个,确定协作设备或耳机的工作场景,并将协作设备或耳机的工作场景发送至协作设备。本申请耳机还可以在环境的基础上结合用户的其它信息,共同确定当前用户可能的感兴趣内容。
在一个可能的实施方式中,协作设备还用于:接收第一输入指令,第一输入指令用于从预存在协作设备上的多个工作模式中指示被选择的工作模式;根据第一输入指令,确定协作设备的工作模式,其中,工作模式为主动降噪模式下的工作模式。
在一个可能的实施方式中,协作设备还用于:接收耳机发送的耳机的工作模式;将耳机的工作模式作为协作设备的工作模式;或根据第一输入指令和耳机的工作模式,确定协作设备的工作模式。
在一个可能的实施方式中,耳机还用于:接收第一输入指令,第一输入指令用于从预存在耳机上的多个工作模式中指示被选择的工作模式;根据第一输入指令,确定耳机的工作模式,其中,工作模式为主动降噪模式下的工作模式;将耳机的工作模式发送至协作设备。
在一个可能的实施方式中,耳机还用于:接收协作设备发送的协作设备的工作模式;将协作设备的工作模式作为耳机的工作模式;或根据第一输入指令和协作设备的工作模式,确定耳机的工作模式。
在一个可能的实施方式中,若耳机接收至少一个有用信号,耳机还用于,获取预设的带通滤波范围;或根据工作状态,确定工作状态下的带通滤波范围;或确定耳机的电量信息;根据耳机的电量信息,确定带通滤波范围;或,若耳机接收至少一个滤波后的有用信号,协作设备还用于,获取预设的带通滤波范围;或根据工作状态,确定工作状态下的带通滤波范围;或确定协作设备的电量信息;根据协作设备的电量信息,确定带通滤波范围。
在一个可能的实施方式中,协作设备还用于:确定预存的至少一个有用信号。
在一个可能的实施方式中,协作设备还用于:对协作设备周围环境的环境声音进行采集,确定协作设备的环境音频信号;根据协作设备的环境音频信号,确定至少一个有用信号。
在一个可能的实施方式中,协作设备还用于:将协作设备的环境音频信号进行信号分离,得到至少一个音源信号;对至少一个音源信号进行识别,确定至少一个有用信号。本申请可以实时的从环境音频信号中确定有用信号,以保障用户在进行主动降噪时,可以动态保留用户感兴趣的内容。
在一个可能的实施方式中,协作设备还用于:将环境音频信号经过短时傅里叶变换后,得到环境音频频域信号;根据环境音频频域信号通过分离网络得到音源频域信号;其中,分离网络由分离滤波器的冲激响应构成;对音源频域信号进行短时傅里叶逆变换后,得到时域上的至少一个音源信号。
在一个可能的实施方式中,协作设备还用于:对至少一个音源信号进行关键字识别,并从至少一个音源信号中确定包含预设关键字的至少一个有用信号;或对至少一个音源信号进行声纹匹配,并从至少一个音源信号中确定与预设声纹匹配的至少一个有用信号。
在一个可能的实施方式中,协作设备还用于:通过高通滤波器对至少一个音源信号中的每个音源信号进行预加重以及分帧加窗,得到每个音源信号对应的多个帧信号;对多个帧信号进行快速傅里叶变换,得到每个音源信号对应的频谱特征;将频谱特征经梅尔滤波器滤波后取对数,得到每个音源信号对应的梅尔频率对数能量谱;将梅尔频率对数能量谱经离散余弦变换,得到每个音源信号对应的梅尔系数;计算每个音源信号对应的梅尔系数与预设关键字的梅尔系数之间的余弦距离;当余弦距离大于或等于余弦距离阈值时,将音源信号作为有用信号。本申请通过对关键字的识别,从而保障在主动降噪的同时,保留包含有关键字的音频信号。
在一个可能的实施方式中,协作设备还用于:对至少一个音源信号中的每个音源信号进行预处理,得到每个音源信号对应的多个帧信号;对多个帧信号进行快速傅里叶变换,得到每个音源信号对应的频谱特征;将频谱特征经梅尔滤波器滤波后取对数,得到每个音源信号对应的梅尔频率对数能量谱;将梅尔频率对数能量谱经离散余弦变换,得到每个音源信号对应的梅尔系数;计算每个音源信号对应的梅尔系数与预设声纹特征梅尔系数的相似度;当相似度大于或等于相似度阈值时,将音源信号作为有用信号。本申请通过对声纹进行识别,从而保障在主动降噪的同时,保留用户感兴趣的特定人声或特定旋律。
在一个可能的实施方式中,协作设备还用于:确定与工作状态相关的至少一个预设的频率和/或频率段;对协作设备的环境音频信号进行处理,将至少一个预设的频率和/或频率段去除,得到参考信号。本申请还可以对采集到的环境信号进行特定频率的滤波,从而保障经过主动降噪后,用户仍然可以感知到特定频率的音频信号。
在一个可能的实施方式中,耳机还用于:将耳机的环境音频信号通过带通滤波器,去除至少一个预设的频率和/或频率段的声音,得到耳机的环境音频信号对应的参考信号。本申请通过对特定频域的频率进行滤波,从而保障在主动降噪的同时,保留特定频率的音频信号。
在一个可能的实施方式中,耳机还用于:采用自适应滤波将至少一个有用信号从耳机的环境音频信号中去除,得到参考信号;或采用谱减法将至少一个有用信号从耳机的环境音频信号中去除,得到参考信号。本申请通过将有用信号从环境音频信号中去除,从而保障参考信号中不包含用户感兴趣的有用信号,以便在进行主动降噪时,可以抵消噪音并保留用户感兴趣的内容。
在一个可能的实施方式中,协作设备还用于:对协作设备周围环境的环境声音进行全方向采集;或通过控制麦克风阵列进行特定方向采集。本申请还可以对音频信号进行方向采集,从而可以更加快速得到不包含有用信号的参考信号。
在一个可能的实施方式中,协作设备还用于:若通过控制麦克风阵列进行特定方向采集,则根据采集到的至少一个方向的音频信号,确定至少一个有用信号,其中根据有用信号得到的参考信号的方向与有用信号的方向不一致;或若通过控制麦克风阵列进行特定方向采集,则根据采集到的至少一个方向的音频信号,确定参考信号,并将参考信号发送至耳机,以便耳机根据接收到的参考信号确定待播放信号。
在一个可能的实施方式中,耳机还用于:根据参考信号以及主动降噪架构,确定耳机的环境音频信号的反相信号,并将反相信号作为待播放信号。
在一个可能的实施方式中,耳机还用于:根据参考信号以及自适应滤波器的权系数,确定耳机的环境音频信号的反相信号。
在一个可能的实施方式中,耳机还用于:采集耳机静区的声场特征;根据声场特征、自适应滤波器的权系数和参考信号,确定更新后的权系数,以便用于下一次确定耳机的环境音频信号的反相信号。
第六方面,提供了一种主动降噪的系统,系统包括协作设备和耳机,系统包括:协作设备,用于将至少一个有用信号发送至耳机,其中,有用信号包含目标内容;耳机,用于接收至少一个有用信号;耳机还用于,对耳机周围环境的环境声音进行采集,确定第二环境音频信号;耳机还用于,将接收到的至少一个有用信号从第二环境音频信号中去除,得到参考信号;耳机还用于,根据参考信号以及主动降噪架构,确定待播放信号;耳机还用于,播放待播放信号,使得待播放信号与环境声音进行叠加,抵消环境噪声并保留目标内容。本申请通过确定用户感兴趣的有用信号,并将有用信号从参考信号中去除。以便进行主动降噪时,可以抵消噪音并保留用户感兴趣的有用信号。
在一个可能的实施方式中,协作设备还用于:确定预存的至少一个有用信号。
在一个可能的实施方式中,协作设备还用于:对协作设备周围环境的环境声音进行采集,确定第一环境音频信号;根据第一环境音频信号,确定至少一个有用信号。
在一个可能的实施方式中,协作设备还用于:将第一环境音频信号进行信号分离,得到至少一个音源信号;对至少一个音源信号进行识别,确定至少一个有用信号。本申请可以实时的从环境音频信号中确定有用信号,以保障用户在进行主动降噪时,可以动态保留用户感兴趣的内容。
在一个可能的实施方式中,协作设备还用于:将第一环境音频信号经过短时傅里叶变换后,得到环境音频频域信号;根据环境音频频域信号通过分离网络得到音源频域信号;其中,分离网络由分离滤波器的冲激响应构成;对音源频域信号进行短时傅里叶逆变换后,得到时域上的至少一个音源信号。
在一个可能的实施方式中,协作设备还用于:对至少一个音源信号进行关键字识别,并从至少一个音源信号中确定包含预设关键字的至少一个有用信号;或对至少一个音源信号进行声纹匹配,并从至少一个音源信号中确定与预设声纹匹配的至少一个有用信号。
在一个可能的实施方式中,协作设备还用于:通过高通滤波器对至少一个音源信号中的每个音源信号进行预加重以及分帧加窗,得到每个音源信号对应的多个帧信号;对多个帧信号进行快速傅里叶变换,得到每个音源信号对应的频谱特征;将频谱特征经梅尔滤波器滤波后取对数,得到每个音源信号对应的梅尔频率对数能量谱;将梅尔频率对数能量谱经离散余弦变换,得到每个音源信号对应的梅尔系数;计算每个音源信号对应的梅尔系数与预设关键字的梅尔系数之间的余弦距离;当余弦距离大于或等于余弦距离阈值时,将音源信号作为有用信号。本申请通过对关键字的识别,从而保障在主动降噪的同时,保留包含有关键字的音频信号。
在一个可能的实施方式中,协作设备还用于:对至少一个音源信号中的每个音源信号进行预处理,得到每个音源信号对应的多个帧信号;对多个帧信号进行快速傅里叶变换,得到每个音源信号对应的频谱特征;将频谱特征经梅尔滤波器滤波后取对数,得到每个音源信号对应的梅尔频率对数能量谱;将梅尔频率对数能量谱经离散余弦变换,得到每个音源信号对应的梅尔系数;计算每个音源信号对应的梅尔系数与预设声纹特征梅尔系数的相似度;当相似度大于或等于相似度阈值时,将音源信号作为有用信号。本申请通过对声纹进行识别,从而保障在主动降噪的同时,保留用户感兴趣的特定人声或特定旋律。
在一个可能的实施方式中,协作设备还用于:确定至少一个预设的频率和/或频率段;对环境音频信号进行处理,将至少一个预设的频率和/或频率段去除,得到参考信号。本申请还可以对采集到的环境信号进行特定频率的滤波,从而保障经过主动降噪后,用户仍然可以感知到特定频率的音频信号。
在一个可能的实施方式中,耳机还用于:将耳机的环境音频信号通过带通滤波器,去除预设的至少一个频率和/或频率段的声音,得到耳机的环境音频信号对应的参考信号。本申请通过对特定频域的频率进行滤波,从而保障在主动降噪的同时,保留特定频率的音频信号。
在一个可能的实施方式中,协作设备还用于,确定协作设备或耳机的工作场景,和/或确定协作设备或耳机的工作模式。本申请中协作设备可以从工作场景以及工作模式两方面,确定不同情况下用户感兴趣的内容。
在一个可能的实施方式中,协作设备还用于,获取协作设备的第一环境信息;和/或耳机还用于,获取第二环境信息,并将第二环境信息发送至协作设备;协作设备还用于,接收耳机发送的第二环境信息;协作设备还用于,根据预设的第一环境信息和第二环境信息中的一个或多个与工作场景的对应关系,确定对应的协作设备或耳机的工作场景。本申请中协作设备可以结合当前的环境信息,确定用户可能的工作场景,以便根据该工作场景确定相应的感兴趣内容。
在一个可能的实施方式中,协作设备还用于,获取协作设备的第一环境信息,并将第一环境信息发送至耳机;耳机还用于,接收协作设备发送的第一环境信息;和/或耳机还用于,获取第二环境信息;耳机还用于,根据预设的第一环境信息和第二环境信息中的一个或多个与工作场景的对应关系,确定对应的协作设备或耳机的工作场景,并将协作设备或耳机的工作场景发送至协作设备。本申请中耳机可以结合当前的环境信息,确定用户可能的工作场景,并将可能的工作场景发送至协作设备,以便协作设备根据该工作场景确定相应的感兴趣内容。
在一个可能的实施方式中,第一环境信息包括以下至少之一:协作设备的地理位置信息、协作设备的环境音频信号或协作设备的环境视频信号;以及,第二环境信息包括以下至少之一:耳机的地理位置信息、耳机的环境音频信号或耳机的环境视频信号。
在一个可能的实施方式中,耳机还用于,确定耳机的设备状态,并将耳机的设备状态发送至协作设备;协作设备还用于,接收耳机发送的耳机的设备状态;和/或协作设备还用于,确定用户历史习惯偏好、当前行程、当前时间信息、协作设备的设备状态中的一个或多个;协作设备还用于,根据第一环境信息和/或第二环境信息,并结合用户历史习惯偏好、当前行程、当前时间信息、协作设备的设备状态以及耳机的设备状态中的一个或多个,确定协作设备或耳机的工作场景。本申请协作设备还可以在环境的基础上结合用户的其它信息,共同确定当前用户可能的感兴趣内容。
在一个可能的实施方式中,协作设备还用于,确定协作设备的设备状态,并将协作设备的设备状态发送至耳机;耳机还用于,接收协作设备发送的协作设备的设备状态;和/或耳机还用于,确定用户历史习惯偏好、当前行程、当前时间信息、耳机的设备状态中的一个或多个;耳机还用于,根据第一环境信息和/或第二环境信息,并结合用户历史习惯偏好、当前行程、当前时间信息、协作设备的设备状态以及耳机的设备状态中的一个或多个,确定协作设备或耳机的工作场景,并将协作设备或耳机的工作场景发送至协作设备。本申请耳机还可以在环境的基础上结合用户的其它信息,共同确定当前用户可能的感兴趣内容。
在一个可能的实施方式中,协作设备还用于:接收第一输入指令,第一输入指令用于从预存在协作设备上的多个工作模式中指示被选择的工作模式;根据第一输入指令,确定工作模式,其中,工作模式为主动降噪模式下的工作模式。
在一个可能的实施方式中,协作设备还用于:接收耳机发送的耳机的工作模式;将耳机的工作模式作为协作设备的工作模式;或根据第一输入指令和耳机的工作模式,确定协作设备的工作模式。
在一个可能的实施方式中,耳机还用于:接收第一输入指令,第一输入指令用于从预存在耳机上的多个工作模式中指示被选择的工作模式;根据第一输入指令,确定工作模式,其中,工作模式为主动降噪模式下的工作模式;将工作模式发送至协作设备。
在一个可能的实施方式中,耳机还用于:接收协作设备发送的协作设备的工作模式;将协作设备的工作模式作为耳机的工作模式;或根据第一输入指令和协作设备的工作模式,确定耳机的工作模式。
在一个可能的实施方式中,协作设备还用于:采用自适应滤波将至少一个有用信号从环境音频信号中去除,得到参考信号;或采用谱减法将至少一个有用信号从环境音频信号中去除,得到参考信号。本申请通过将有用信号从环境音频信号中去除,从而保障参考信号中不包含用户感兴趣的有用信号,以便在进行主动降噪时,可以抵消噪音并保留用户感兴趣的内容。
在一个可能的实施方式中,耳机还用于,对至少一个有用信号进行带通滤波,得到至少一个滤波后的有用信号;或协作设备还用于,对至少一个有用信号进行带通滤波,得到至少一个滤波后的有用信号;协作设备还用于,将至少一个滤波后的有用信号发送至耳机;耳机还用于,接收至少一个滤波后的有用信号,以便耳机根据至少一个滤波后的有用信号确定参考信号。
在一个可能的实施方式中,耳机还用于,获取预设的带通滤波范围;或根据工作状态,确定工作状态下的带通滤波范围;或确定耳机的电量信息;根据耳机的电量信息,确定带通滤波范围;或,协作设备还用于,获取预设的带通滤波范围;或根据工作状态,确定工作状态下的带通滤波范围;或确定协作设备的电量信息;根据协作设备的电量信息,确定带通滤波范围。
在一个可能的实施方式中,协作设备还用于:对协作设备周围环境的环境声音进行全方向采集;或通过控制麦克风阵列进行特定方向采集。本申请还可以对音频信号进行方向采集,从而可以更加快速得到不包含有用信号的参考信号。
在一个可能的实施方式中,协作设备还用于:若通过控制麦克风阵列进行特定方向采集,则将采集到的至少一个方向的音频信号作为有用信号,其中根据有用信号得到的参考信号的方向与有用信号的方向不一致;或将采集到的至少一个方向的音频信号作为参考信号,并将参考信号发送至耳机,以便耳机根据接收到的参考信号确定待播放信号。
在一个可能的实施方式中,耳机还用于:根据参考信号以及主动降噪架构,确定第二环境音频信号的反相信号,并将第二环境音频信号的反相信号作为待播放信号。
在一个可能的实施方式中,耳机还用于:根据参考信号以及自适应滤波器的权系数,确定第二环境音频信号的反相信号。
在一个可能的实施方式中,耳机还用于:采集耳机静区的声场特征;根据声场特征、自适应滤波器的权系数和参考信号,确定更新后的权系数,以便用于下一次确定环境音频信号的反相信号。
第七方面,提供了一种主动降噪设备,设备为协作设备或耳机,设备包括:麦克风、处理器、存储器、发送器、接收器;麦克风,用于对环境声音进行采集,确定环境音频信号;若设备为耳机,则设备还包括扬声器,用于播放待播放信号;处理器用于与存储器耦合,以及读取并执行存储在存储器中的指令;当处理器运行时执行指令,使得该设备执行如第一方面、第二方面或第三方面中的任意一项的方法。
第八方面,提供了一种协作设备,协作设备包括:麦克风、处理器、存储器、发送器、接收器;处理器用于与存储器耦合,以及读取并执行存储在存储器中的指令;当处理器运行时执行指令,使得处理器还用于执行如第四方面、第五方面或第六方面中的任意一项系统中协作设备侧的方法。
第九方面,提供了一种耳机,耳机包括:麦克风、处理器、存储器、发送器、接收器和扬声器;接收器,用于接收协作设备发送的至少一个有用信号,其中,有用信号包含目标内容;麦克风,用于对耳机周围环境的环境声音进行采集,确定第二环境音频信号;扬声器,用于播放待播放信号;处理器用于与存储器耦合,以及读取并执行存储在存储器中的指令;当处理器运行时执行指令,使得处理器还用于执行如第四方面、第五方面或第六方面中的任意一项系统中耳机侧的方法。
第十方面,提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在终端上运行时,使得终端执行第一方面、第二方面或第三方面任意一项的方法。
第十一方面,提供了一种包含指令的计算机程序设备,当其在终端上运行时,使得终端执行第一方面、第二方面或第三方面中的任意一项的方法。
本申请公开了一种主动降噪的方法、设备及系统,通过将有用信号从参考信号中去除。使得耳机通过自适应滤波器将去除有用信号之后的参考信号进行处理,得到环境音频信号的反相信号。以便耳机在播放该反相信号后,可以将环境中的噪音进行抵消,从而实现主动降噪的同时保留有用户感兴趣的声音。
附图说明
图1为主动降噪原理示意图;
图2为一种主动降噪系统示意图;
图3为一种主动降噪算法模型示意图;
图4为一种前馈式降噪耳机示意图;
图5为图4所示的一种前馈式降噪耳机结构示意图;
图6为一种反馈式降噪耳机示意图;
图7为图6所示的一种反馈式降噪耳机结构示意图;
图8为一种综合式降噪耳机示意图;
图9为图8所示的一种综合式降噪耳机结构示意图;
图10a-10c为本申请实施例提供的一种主动降噪方法流程图;
图11为本申请实施例提供的一种主动降噪架构示意图;
图12为本申请实施例提供的一种耳机模块示意图;
图13为本申请实施例提供的另一种主动降噪方法流程图;
图14为本申请实施例提供的另一种主动降噪架构示意图;
图15为本申请实施例提供的另一种主动降噪模块示意图;
图16为本申请实施例提供的另一种主动降噪方法流程图;
图17为本申请实施例提供的又一种主动降噪架构示意图;
图18为本申请实施例提供的又一种主动降噪模块示意图;
图19为本申请实施例提供的又一种主动降噪方法流程图;
图20为本申请实施例提供的再一种主动降噪架构示意图;
图21为本申请实施例提供的再一种主动降噪模块示意图;
图22为本申请实施例提供的再一种主动降噪方法流程图;
图23为本申请实施例提供的另一种主动降噪架构示意图;
图24为本申请实施例提供的另一种主动降噪模块示意图;
图25为本申请实施例提供的另一种主动降噪方法流程图;
图26为本申请实施例提供的一种主动降噪场景示意图;
图27为本申请实施例提供的一种模板匹配流程图;
图28为本申请实施例提供的一种MFCC特征提取流程图;
图29为本申请实施例提供的一种去除有用信号架构示意图;
图30为本申请实施例提供的另一种主动降噪场景示意图;
图31为本申请实施例提供的一种基于GMM的声纹识别流程图;
图32为本申请实施例提供的又一种主动降噪场景示意图;
图33为本申请实施例提供的一种波束形成器结构示意图;
图34为本申请实施例提供的一种协作设备示意图;
图35为本申请实施例提供的一种耳机示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
本申请应用的场景可以是涉及日常生活中周围环境存在着用户想要听到的有用信息,同时也充斥着大量的噪音的场景。当用户使用降噪耳机对周围环境的噪音进行主动降噪时,降噪耳机会生成与环境噪音频谱相同、相位相反的音频对环境噪音补偿,从而有效的抑制周围环境的噪声。用户使用的降噪耳机通常采用主动降噪(active noisecancellation,ANC)的方式,对环境噪音进行降噪。
图2为一种主动降噪系统示意图。
可以看出,ANC系统中可以由参考传感器、误差传感器、扬声器(次级源)以及控制器组成。其中①表示误差传感器采集静区(用户耳朵处)内的声场特征e(c),并将采集到的e(c)传输至控制器。其中,e(c)也可称为降噪误差信号。c表示时间索引值,表示在c时刻下采集到的信号。误差传感器采集到的e(c)可以包括声压、不同方向上的质点速度等等特征。②表示参考传感器采集初始噪音,例如采集到噪音特征x(c),其中x(c)也可称为噪音的参考信号。然后参考传感器将采集到的x(c)传输至控制器。可以理解的是,在ANC系统中,对于①和②在执行的过程中并没有严格意义上的先后顺序,也就是说可以先执行①后执行②,也可以先执行②后执行①,当然还可以同时执行①、②。③表示当控制器接收到误差传感器采集到的e(c)以及参考传感器采集到的x(c)之后,控制器可以根据e(c)计算误差代价函数,即损失函数。并基于误差代价函数最小化的原则,参考x(c)预测得到用于抑制噪音的y(c)。控制器将计算得到的y(c)输出至扬声器(次级源)后,经扬声器发出信号y(c),即④所示。使得y(c)经过次级通路与经过初级通路的x(c)在静区进行叠加,从而使得误差传感器采集到的e(c)信号代价函数最小。
图3为一种主动降噪算法模型示意图。
假设s、n0、n1为零均值的平稳随机过程,并且s与n0、n1满足互不相关。其中,环境信号d为有用信号s和噪声n0之和,参考信号x为与n0相关的噪声n1,以及自适应滤波器的输出y=n2为噪声n1的滤波信号。其中,环境信号d可以包括信号源信号和参考源信号,参考信号x可以包括参考源信号。对于ANC系统的输出z可以表示为z=d-y=s+n0-y。此时等式两边同时平方后,则可以得到z2=s2+(n0-y)2+2s(n0-y)。此时对等式两边取期望,则等式可以写成E[z2]=E[s2]+E[(n0-y)]+2E[s(n0-y)],。由于s、n0、n1为零均值且互不相关,因此2E[s(n0-y)]为0,则公式还可以等价为E[z2]=E[s2]+E[(n0-y)2]。其中,E[s2]可以表示信号的功率。通过上述公式可以看出,若将系统输出的z最大程度的接近信号s,则需要将E[(n0-y)2]取最小值。而z-s=n0-y在理想的情况下,若y=n0,则z=s。从而使得输出信号z只保留有用信号s,而噪音n0则被完全抵消。可以理解的是,由于噪声的幅度、相位、频度等特征会随时发生变化,因此,ANC算法模型必须适应并且处理好上述变化,所以ANC算法模型中采用了自适应滤波器。
更为具体的,可以参考以下网址“https://wenku.baidu.com/view/4cf5af553c1ec5da51e27006.html”所描述的《主动噪声控制(ANC)技术》,在此不再赘述。
当在耳机上部署ANC系统时,该耳机则可以称为降噪耳机。对于降噪耳机而言,可以分为前馈式和反馈式两种结构。降噪耳机的特点即各组件将进行合一布置。
例如图4所示的前馈式降噪耳机示意图,结合图5所示的结构示意图可以看出,在前馈式降噪耳机中包含有参考传感器、控制器和扬声器。在耳机外部可以部署参考传感器,例如麦克风。以便参考传感器可以在耳机外侧采集外部噪音。控制器用于对参考传感器采集的噪音的参考信号x(c)直接做反相,例如将音频采样点直接符号取反,从而得到y(c)。然后控制器将y(c)经电路进行缩放,并将缩放后的y(c)传输至扬声器,最终基于耳机的扬声器进行播放,从而实现降噪效果。
在一个例子中,对于反相信号y(c)的计算方式可以通过以下方式。首先通过参考传感器接收外界声音并进行数字化,得到噪音的参考信号x(c)。其中,x(c)可以为多个音频采样点。然后控制器将噪音的参考信号x(c)的各个采样点符号进行取反,从而得到反相信号y(c)。
图6为一种反馈式降噪耳机示意图。结合图7所示的结构示意图可以看出,在反馈式降噪耳机中包含有误差传感器、控制器和扬声器。在耳机内部可以部署误差传感器,例如麦克风。以便误差传感器可以在耳机内侧采集内部降噪后的音频信号。其中,误差传感器采集的降噪后的音频信号,例如可以是降噪误差信号e(c)。误差传感器在采集到e(c)后,将e(c)传输至控制器。其中,控制器例如可以采用滤波器。以便通过控制器得到反相信号y(c)。可以理解的是,反馈式降噪耳机的目的是为了使得反相信号y(c)与外界环境中的噪音信号得加后,得到的e(c)最小。显然上述过程为一个闭环过程。
如图8所示,为一种综合式降噪耳机示意图。结合图9所示的结构示意图可以看出,在综合式降噪耳机中包含有参考传感器、误差传感器、控制器和扬声器。可以理解的是,综合式降噪耳机可以是上述图4所示的前馈式降噪耳机和图6所示的反馈式降噪耳机的组合。即同时在耳机内部部署误差传感器,以及在耳机外部部署参考传感器。对于综合式降噪耳机而言,其处理方式可以是通过参考传感器采集外部噪音的参考信号x(c),以及通过误差传感器采集耳机内部降噪后的降噪误差信号e(c)。可以理解的是,采集x(c)的步骤与采集e(c)的步骤在执行过程中并没有严格的先后顺序。此时,假设外部的环境信号为d(c),则采用滤波X型最小均方差算法(filter x least mean square,FxLMS)计算得到综合式降噪耳机所需的反相信号y(c)。在一个例子中,上述计算得到反相信号y(c)的方式可以通过y(c)=wT(c)x(c)计算得到。其中,wT(c)为w(c)的转置。而w(c)为自适应滤波器的权系数。在一个例子中,w(c)可以通过w(c+1)=w(c)+ue(c)x(c)进行更新,其中u为收敛因子,其数值可以是随机的,也可以是预先设置好的。当然在最开始时,可以预先设定一个w(c),而e(c)可以通过e(c)=d(c)-y(c)确定。可以看出,综合式降噪耳机的目的是基于e(c)和x(c),不断预测得到y(c),并使得e(c)最小,即系统逐渐收敛到0。
更为具体的,上述的降噪耳机以及降噪原理可以参考以下网址所描述的,如“https://wenku.baidu.com/view/651e78d6376baf1ffd4fadc4.html”的《ANC》,“https://www.cnblog s.com/LXP-Never/archive/2019/10/18/11693567.html”的《ANC主动降噪理论及Matlab代码实现》,和“https://blog.csdn.net/weixin_42183571/article/details/80615660”的《ANC降噪学习》,本申请在此不再赘述。
可见,ANC算法模型的本质是将d中包含x或者与x相关的信号去除掉。但是若x的内容与d的内容基本一致时,则通过ANC算法模型则会将d信号完全抑制掉。换句话说,若在上述的方案中,外界环境包括噪音的同时也存在着有用信息。则在佩戴降噪耳机进行主动降噪时,降噪耳机采集到的参考信号x(c)与环境信号为d(c)基本相同,即包括噪音和有用信息。降噪耳机不仅可以抑制外界噪音,同时降噪耳机还会将用户希望听到的有用信息连同环境噪音一起被抑制掉,使得用户无法听到外界的有用信息。显然,降噪耳机在最大程度实现全面降噪的同时,任何外部环境的声音都被最大程度的抑制掉,导致在日常生活中,用户无法听到有用的信息。显然对于降噪耳机而言,其降噪是不人性化、不具有个性化的。
为了解决上述问题,本申请提供了一种主动降噪的方法。通过将用户感兴趣或者与某些需求相关的音频信号从参考信号x(c)中去除。由于此类信号仍然存在于环境信号d(c)中,因此,通过ANC进行降噪后,降噪误差信号e(c)中也将会保留这部分用户感兴趣或者与某些需求相关的音频信号。从而使得用户可以通到这部分信号,并获得想要听到内容。本申请在主动降噪的模型框架之下,对用户感兴趣或者与某些需求相关的音频信号可以仍然被用户感知,从而有效提升了主动降噪耳机的人性化和实用性。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行详细描述。
图10a-10c为本申请实施例提供的一种主动降噪方法流程图。
本申请提供了一种主动降噪的方法,该方法可以应用于协作设备或耳机。其中,协作设备可以是例如手机、智能电视、智能音响、可穿戴设备、平板电脑、桌面型计算机、手持计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digitalassistant,PDA)、膝上型计算机(laptop)、移动电脑、增强现实(augmented reality,AR)设备、虚拟现实(virtual reality,VR)设备、人工智能(artificial intelligence,AI)设备、车载设备、智能家居设备和/或智慧城市设备等任意除耳机外的终端设备或便携式终端设备。
在一个例子中,本申请所使用的无线方式例如可以是蓝牙、紫峰(ZigBee)、无线保真(wireless fidelity,WiFi)、蜂窝网络等等。其中,蜂窝网络可以包括全球移动通信系统(global system for mobile communications,GSM)、码分多址(code division multipleaccess,CDMA)、通用无线分组业务(general packet radio service,GPRS)、宽带码分多址(wideband code division multiple access,WCDMA)、时分同步码分多址(timedivision-synchronous code division multiple access,TD-SCDMA)、码分多址2000(code division multiple access 2000,CDMA2000)、长期演进(long term evolution,LTE)、长期演进升级(long term evolution-advanced,LTE-A)、演进长期演进技术(evolution-long term evolution,e-LTE)和新无线接入技术(new radio accesstechnology,NR)等等任意可能的蜂窝网络。
该方法可以包括以下步骤:
S1001,对环境声音进行采集,确定环境音频信号。
在一个例子中,可以对环境声音进行全方向采集,以及当设备具备麦克风阵列时可以通过控制时延补偿,采集包含至少一个方向的音频信号。可以理解的是,麦克风阵列中需要包括至少两个麦克风。
在一个例子中,若方法应用于耳机,对环境声音进行采集,确定环境音频信号可以是耳机接收协作设备发送的环境音频信号。其中,环境音频信号为协作设备对环境声音进行采集得到的。
在一些例子中,若方法应用在协作设备上,协作设备还可以接收耳机发送的环境音频信号。其中,该音频信号可以是耳机周围的环境声音。当然,在另一些例子中,若方法应用在耳机上,耳机还可以接收协作设备发送的环境音频信号。其中,该音频信号可以是协作设备周围的环境声音。
S1002,将至少一个有用信号从环境音频信号中去除,得到参考信号,其中,有用信号包含目标内容。
在一个例子中,需要确定至少一个有用信号。该有用信号包含有目标内容,其中,该目标内容可以理解为用户感兴趣的内容,也可以理解为用户想要听到的内容。在一些例子中,目标内容可以是对用户而言的有价值信息或是感兴趣信息,可以包括对用户安全可能产生影响的音频信息,例如鸣笛、报警声、特定的有关安全的关键字等等音频信息;目标内容还可以包括对用户的行程可能产生影响的音频信息,例如包括各个机场、地铁站等场站中进行报站的音频信息,即地铁报站、航班预告等等;当然,目标内容还可以包括对用户工作效率可能产生影响的音频信息,例如包括自己名字、电话铃声、或者特定关键字等。可以看出,目标内容为至少需要被用户感知,或者被用户感知后并做出下一步行动判断的音频信息。换句话说,即用户需要对这些有价值信息或者感兴趣信息进行反馈、反应或者干预等。可以理解的是,本申请中的“音频信息”、“音频信号”为相同含义。
上述示例中仅仅给出了几种可能的目标内容,但应当理解的是,本申请的目标内容并不局限于上述示例,还可以包括任意可能的对用户而言的有价值信息或是感兴趣信息,本申请在此并不做限定。
可以理解的是,本申请下文中提到的“用户感兴趣的内容”与“目标内容”为相同含义,以及“用户感兴趣的音频信号”与“有用信号”为相同含义。其中,至少一个有用信号可以预先存储在协作设备或耳机上。以便设备可以直接采用预存的有用信号对环境音频信号进行滤波。
在一个例子中,若方法应用于耳机,则耳机还可以接收协作设备发送的至少一个有用信号。其中,至少一个有用信号预存在协作设备上。或者在另一个例子中,若方法应用于协作设备,则协作设备可以接收耳机发送的至少一个有用信号。其中,至少一个有用信号预存在耳机上。
在另一个例子中,若预存的有用信号与真实情况中的有用信号并不是很好匹配时,设备可以从环境音频信号中确定有用信号。例如,设备可以将环境音频信号进行信号分离,得到至少一个音源信号。然后对至少一个音源信号进行识别,并从至少一个音源信号中确定至少一个有用信号。其中,进行信号分离可以采用盲分离的方式,或者采用深度神经网络(deep neural networks,DNN)的方式等任意等效的方式。
其中,若采用盲分离的方式,则设备可以将环境音频信号经过短时傅里叶变换后,得到环境音频频域信号。然后根据环境音频频域信号通过分离网络得到音源频域信号。最后对音源频域信号进行短时傅里叶逆变换后,得到时域上的至少一个音源信号。
对于对至少一个音源信号进行识别,可以是对至少一个音源信号进行关键字识别,并从至少一个音源信号中确定包含预设关键字的至少一个有用信号;和/或对至少一个音源信号进行声纹匹配,并从至少一个音源信号中确定与预设声纹匹配的至少一个有用信号。其中,进行关键字识别或是声纹匹配时,预设的关键字以及预设的声纹,可以预先存储在协作设备或耳机上。
在一个例子中,对至少一个音源信号进行关键字识别,并从至少一个音源信号中确定包含预设关键字的至少一个有用信号,可以是通过高通滤波器对至少一个音源信号中的每个音源信号进行预加重以及分帧加窗,得到每个音源信号对应的多个帧信号。然后对多个帧信号进行快速傅里叶变换,得到每个音源信号对应的频谱特征。再将频谱特征经梅尔滤波器滤波后取对数,得到每个音源信号对应的梅尔频率对数能量谱。将梅尔频率对数能量谱经离散余弦变换,得到每个音源信号对应的梅尔系数。计算每个音源信号对应的梅尔系数与预设关键字的梅尔系数之间的余弦距离。当余弦距离大于或等于余弦距离阈值时,将音源信号作为有用信号。
在另一个例子中,对至少一个音源信号进行声纹匹配,并从至少一个音源信号中确定与预设声纹匹配的至少一个有用信号,可以是对至少一个音源信号中的每个音源信号进行预处理,得到每个音源信号对应的多个帧信号。然后对多个帧信号进行快速傅里叶变换,得到每个音源信号对应的频谱特征。再将频谱特征经梅尔滤波器滤波后取对数,得到每个音源信号对应的梅尔频率对数能量谱。将梅尔频率对数能量谱经离散余弦变换,得到每个音源信号对应的梅尔系数。计算每个音源信号对应的梅尔系数与预设声纹特征梅尔系数的相似度。当相似度大于或等于相似度阈值时,将音源信号作为有用信号。
在一个例子中,若预存的有用信号与真实情况中的有用信号并不是很好匹配时,设备可以对环境音频信号或至少一个音源信号进行处理,例如频域滤波。将预设的至少一个频率和/或频率段的声音过滤后,确定参考信号。其中,进行频域滤波时,预设的频率和/或频率段可以作为有用信号预先存储在协作设备或耳机上。
例如,对环境音频信号或至少一个音源信号进行频域滤波,将预设的至少一个频率和/或频率段的声音过滤后,得到参考信号,可以是将环境音频信号或至少一个音源信号中的每个音源信号通过带通滤波器,去除预设的至少一个频率和/或频率段的声音,得到环境音频信号或每个音源信号对应的参考信号。
再一个例子中,若S1001中采集包含至少一个方向的音频信号,则可以将至少一个方向的音频信号作为有用信号。或是,将至少一个方向的音频信号作为参考信号。
在一个例子中,可以采用主动降噪架构将至少一个有用信号从环境音频信号中去除,得到参考信号。其中,主动降噪架构可以是自适应滤波架构。例如,可以根据至少一个有用信号和自适应滤波架构的权系数,确定参考信号。
在一个实施例中,如图10a所示,S1001之后和S1002之前,还可以确定协作设备和/或耳机的工作状态,并根据工作状态确定与工作状态相关的有用信号。例如在S1002之前还可以包括以下步骤:
S1004,确定工作状态。
协作设备或耳机还可以确定协作设备和/或耳机的工作状态。
在一个例子中,协作设备或耳机可以确定协作设备和/或耳机的工作状态。其中,工作状态可以包括工作场景和/或工作模式。
在一个例子中,对于工作场景,例如可以包括室外场景、居家场景、办公场景、热点场景等等。可以理解的是,还可以包括更多的场景,以及每个场景下还可以包括一个或多个子场景,本申请在此不作限定。
协作设备或耳机可以通过获取协作设备和/或耳机的环境信息,从而确定协作设备和/或耳机的工作场景。其中,环境信息可以包括地理位置信息、环境音频信号以及环境视频信息中的一个或多个。当然,环境信息还可以根据实际情况包括更多其它可以表示协作设备和/或耳机周围环境的信息。
其中,地理位置信息用于表示协作设备和/或耳机所处的地理位置。例如,协作设备、耳机可以通过定位直接获取自身设备的地理位置信息,当然,也可以通过其它设备间接获得协作设备和/或耳机的地理位置信息,例如手机、智能手表、智能手环、个人电脑(personal computer,PC)、智能眼镜等等智能终端设备。其中,定位的方式例如可以是全球定位系统(global positioning system,GPS)、北斗卫星导航系统(beidou navigationsatellite system,BDS)、伽利略卫星导航系统、俄罗斯全球导航卫星系统(globalnavigation satellite system,GLONASS)等等。当然,还可以采用其它等效的高精度定位,如通过无线技术、即时定位与地图构建(simultaneous localization and mapping,SLAM)等。
在另一个例子中,协作设备或耳机还可以通过麦克风采集设备周围的环境音频信号。以及通过摄像头、红外传感器等采集设备周围环境的环境视频信息。
若该方法应用在协作设备上时,协作设备可以根据获取到的协作设备的环境信息确定当前协作设备的工作场景。如若当前位置定位为办公楼,则工作场景可以是办公场景;或检测到环境音频信号中具有敲击键盘的声音、点击鼠标的声音和/或特定的工作术语等等,则工作场景可以是办公场景;或检测到拍摄的环境视频信息中出现了办公桌、PC和/或文件夹等关键特征图像,则工作场景可以是办公场景。可以理解的是,可以结合地理位置信息、环境音频信号以及环境视频信息中的一个或多个共同确定工作场景。在另一个例子中,协作设备还可以获取手机的环境信息,并确定当前耳机的工作场景。当然在又一个例子中,协作设备还可以结合当前协作设备的工作场景以及当前耳机的工作场景,综合确定当前用户可以能的工作场景。可以理解的是,若该方法应用在耳机上时,其方式与在协作设备上相同,为方便描述,在此不再赘述。
在又一个例子中,还可以在环境信息的基础上,结合用户的历史习惯偏好、当前用户的行程、当前时间信息、协作设备和/或耳机的设备状态中的一个或多个,共同确定工作场景。其中,设备状态例如可以设备是否正在播放音乐、用户当前是否正在通话以及设备当前的电量信息等等。可以理解的是,本申请中可以根据环境信息、用户的历史习惯偏好、当前用户的行程、当前时间信息、协作设备和/或耳机的设备状态中的一个或多个或任意组合,综合确定工作场景。
在一些例子中,执行该方法的设备,可以结合协作设备上的工作场景以及耳机上的工作场景进行综合决策,确定最终的工作场景。
在另一个例子中,对于工作模式,例如可以包括安全模式、商务模式、舒适模式等等。可以理解的是,还可以包括更多的模式,以及每个模式下还可以包括一个或多个子模式,本申请在此不作限定。
例如,可以通过检测用户当前是否正在说话,若检测到用户正在说话,则可以为商务模式;或是可以检测耳机当前是否正在播放音乐,若耳机正在播放音乐,则可以为舒适模式;再或者检测设备是否正在移动或者运动,若检测到设备在单位时间内出现了超过一定距离的位移,或是通过加速度传感器检测到设备在单位时间内出现了运动,则可以为安全模式。假设耳机或者协作设备具有运动模式或者等效的模式时,则可以直接匹配设备的模式。
当然设备还可以通过接收用户的第一输入操作,从预设的多个工作模式中选择被指示的工作模式。例如用户可以直接选择适合的工作模式。
在一些例子中,执行该方法的设备,可以结合协作设备上的工作模式以及耳机上的工作模式进行综合决策,确定最终的工作模式。
可以理解的是,本申请中涉及到的工作模式都是基于主动降噪模式下的工作模式。
S1005,根据工作状态,确定与工作状态相关的有用信号。
在S1004确定工作状态后,可以根据工作状态确定与该工作状态相关的至少一个有用信号。
例如,可以根据预设的工作场景与有用信号的对应关系,和/或预设的工作模式与有用信号的对应关系,确定相关的至少一个有用信号。
在一个例子中,例如表1所示,为工作场景与有用信号对应关系表。
Figure BDA0002852907640000281
表1
当然可以理解的是,表1中仅示出了一部分情况,当然还可以包括更多的场景,以及每个场景还可以对应更多相关的有用信号,本申请在此不作限定。
在另一个例子中,例如表2所示,为工作模式与有用信号对应关系表。
Figure BDA0002852907640000282
表2
当然可以理解的是,表2中也仅示出了一部分情况,当然还可以包括更多的模式,以及每个模式还可以对应更多相关的有用信号,本申请在此不作限定。
显然,协作设备或耳机可以根据上述表1和/或表2的对应关系,确定相关的有用信号。可以理解的是,若参考工作模式和工作场景共同确定有用信号时,则可以结合上述表1和表2,选择有用信号的交集或者并集,作为相关的有用信号。
在一个例子中,例如室外场景以及安全模式中涉及到的特定方向声音信号。可以协作设备或耳机通过上述方式确定了用户此时可能正在室外的街道上行进。则特定方向可以是预设的靠近马路的方向,例如可以结合地图、地理位置信息以及行进方向,确定靠近马路的具体方位。
在另一个例子中,对于上述表1、表2中的突发事件声音信号,可以表示在用户周围出现的突发事件所涉及到的声音信号。例如,当设备确定用户此时可能处于室外场景或安全模式下。若检测到用户周围一定范围内存在施工声音或是路障提示声音,则可以将上述施工声音或是路障提示声音作为突发事件声音信号,以便在主动降噪时可以保留上述声音。其中,用户周围一定范围可以是预设的周边距离阈值,例如可以设为20米、30米或15米等等。可以理解的是,若检测到声音来源与用户之间的距离若大于周边距离阈值时,则可以认为突发事件对用户不会造成影响,并忽略检测到的声音。具体确定声音来源与用户之间的距离的方式可以参考现有方式实现,本申请在此不再赘述。
在又一个例子中,对于上述表1、表2中的特定关键字、特定人声纹,可以是结合相应场景或模式确定可能的关键字或声纹。例如,若为室外场景、安全模式中,则关键字可能是“注意安全”、“请慢行”等;以及例如若为办公场景、商务模式时,关键字可以是“报告”、“款项”等等可能涉及到工作的关键字,当然声纹可以是用户自己的声纹以及周围同事的声纹或是上级领导的声纹;再例如若为居家场景或是舒适模式中,可以将家人的声音确定为特定人声纹等等;又例如若为热点场景、商务模式时,则车次信息可以是“XX航班号”、“XX车次”、“XX时间到达”等。其中,上述对于特定声纹的获取方式,可以是预先录入特定人声纹信息或是通过与特定人的通话过程中学习并记录。当然还可以采用其它方式获取,本申请在此不作限定。
当然,在一些例子中,还可以结合当前时间,确定可能的有用信号。例如,处于居家场景时,若当前时间点为中午上午11点至下午1点期间,则可能认为此时用户可能处于吃饭时间段内。则特定关键字还可以是“吃饭”等,而当时间段为下午1点之后,则关键字可以不再包括“吃饭”等。
当S1005确定出相关的有用信号后,可以继续执行S1002,将相关的至少一个有用信号从环境声音音频信号中去除,得到参考信号。当然可以理解的是,在S1005确定有用信号的过程中,还可以包括S1002中描述的确定方式,当然,经过S1005已经确定了有用信号后,S1002则无需再次确定有用信号,而是直接将至少一个有用信号从环境音频信号中去除。
显然经过S1004和S1005之后,可以基于工作场景和/或工作模式,更加智能、精准的确定适合的有用信号。
继续回到S1003和S1003’。
S1003,若方法应用于耳机,则确定待播放信号,并将该待播放信号进行播放,使得待播放信号与环境声音进行叠加,抵消环境噪声并保留有用信号。
在一个例子中,耳机可以采用主动降噪架构对参考信号进行处理,得到环境音频信号的反相信号。可以理解的是,该反相信号可以是对参考信号进行简单的符号取反,也可以是对参考信号进行经过一些特定方式计算后得到的反相信号。该反相信号即上述待播放信号。其中,采用主动降噪架构对参考信号进行处理可以是采用自适应滤波架构对参考信号进行处理。例如,耳机可以根据参考信号以及自适应滤波器的权系数,确定环境音频信号的反相信号。
在一个例子中,耳机还可以采集耳机静区的声场特征,然后根据声场特征、自适应滤波器的权系数和参考信号,确定更新后的权系数,以便用于下一次确定环境音频信号的反相信号,即待播放信号。
S1003’,若方法应用于协作设备,则确定待播放信号,并将该待播放信号发送至耳机,以便耳机播放该待播放信号,使得待播放信号与环境声音进行叠加,抵消环境噪声并保留有用信号。
在另一个实施例中,如图10b所示,S1001之后和S1002之前,还可以确定协作设备和/或耳机的工作状态,并根据工作状态确定与工作状态相关的有用信息。例如在S1002之前还可以包括以下步骤:
S1006,确定至少一个有用信号。
协作设备或耳机确定至少一个有用信号,该有用信号可以是预存在协作设备或耳机上。也可以是从环境音频信号中确定有用信号。其具体方式可以参考S1002中相应部分描述。但应当理解的是,经过S1006已经确定了有用信号后,S1002则无需再次确定有用信号,而是直接将至少一个有用信号从环境音频信号中去除。
S1007,对至少一个有用信号进行带通滤波,得到至少一个滤波后的有用信号。
协作设备或耳机在将有用信号从环境音频信号中去除之前,还可以对有用信号进行带通滤波,确定出滤波后的有用信号。
由于耳机在进行主动降噪的时候,音频频率上限一般在1kHz左右,即理论上可以实现0至1kHz的主动降噪。当音频频率超过1kHz之后,降噪效果则会变得越来越不明显。例如,若有用信号的频率较高,如到了3kHz甚至4kHz及以上时。由于主动降噪对于此类高频信号降噪效果并不好,换句话说,无论是否对此类音频进行主动降噪,最终用户均可以听到此类高频声音。显然,若有用信号处于该频率范围内,则徒增算力并且增加耗电量,对于用户而言结果也是均可以听到,并无差别。因此考虑到对于部分频率主动降噪效果并不理想,可以确定处于降噪效果较优频率段的有用信号,从而降低设备的功耗以及提升运算效率。
因此,可以先确定带通滤波范围,即确定带通滤波下限FL以及带通滤波上限FH。然后,基于带通滤波范围[FL,FH],对至少一个有用信号进行带通滤波,并得到滤波后的至少一个有用信号。
在一个例子中,带通滤波范围[FL,FH]可以是用户手动输入的。也可以是预先配置了几个可能的带通滤波范围,然后经用户选择。
在另一个例子中,带通滤波范围[FL,FH]还可以根据设备的当前电量确定。例如预先配置低电量情况下的带通滤波范围。然后根据当前设备电量情况为电量充足或是低电量,确定是否对有用信号进行带通滤波。可以理解的是,确定当前设备电量情况为电量充足或是低电量,可以通过预设电量阈值(如电量为30%),若大于等于该电量阈值则认为电量充足,反之,则认为低电量。
在又一个例子中,可以根据耳机上部署的误差麦克风采集到的降噪误差信号e(c)确定带通滤波范围[FL,FH]。例如,基于e(c)进行快速傅里叶变换(fast fouriertransform,FFT)得到e(c)的高频分量。然后将高频分量的起始频率作为FH。此方式可以基于设备实际的降噪能力确定适合的带通滤波范围。对于FL则可以设置为0。可以理解的是,上述确定e(c)高频分量的起始频率可以通过现有方式实现,在此不再赘述。
再一个例子中,若结合图10a中的S1004和S1005,则带通滤波范围[FL,FH]还可以基于工作场景和/或工作模式确定。例如可以参考表3示出的工作场景与带通滤波范围对应表。
Figure BDA0002852907640000301
Figure BDA0002852907640000311
表3
当然可以理解的是,表3中仅示出了一部分情况,当然还可以包括更多的工作场景,以及每个工作场景所对应的FL、FH的具体数值可以根据实际情况进行任意调整,本申请在此不作限定。
表4则示出的工作模式与带通滤波范围对应表。
工作模式 FL(Hz) FH(Hz)
安全模式 0 1500
商务模式 50 2000
舒适模式 50 1500
表4
当然可以理解的是,表4中仅示出了一部分情况,当然还可以包括更多的工作模式,以及每个工作模式所对应的FL、FH的具体数值可以根据实际情况进行任意调整,本申请在此不作限定。
显然,协作设备或耳机可以根据上述表1和/或表2的对应关系,确定适合的带通滤波范围[FL,FH]。可以理解的是,若参考工作模式和工作场景共同确定带通滤波范围[FL,FH]时,则可以结合上述表1和表2,选择带通滤波范围[FL,FH]的交集或者并集,作为最终的带通滤波范围[FL,FH]。
协作设备或耳机通过上述方式确定带通滤波范围[FL,FH]后,对确定的至少一个有用信号进行带通滤波,得到滤波后的至少一个有用信号,以便后续S1002中采用滤波后的至少一个有用信号得到参考信号,并执行后续步骤。
由于S1007对有用信号进行了滤波处理,因此S1002将替换为S1002’。
其中,S1002’,将至少一个滤波后的有用信号从环境音频信号中去除,得到参考信号,其中,有用信号包含目标内容。
可以理解的是,S1002’与S1002的区别仅在于将S1002中的有用信号替换为滤波后的有用信号。
通过上述S1006、S1007的步骤,实现了筛选出对主动降噪影响较大的频率段内的有用信号,并对这部分有用信号进行保留,从而降低算力,提升执行效率,还可以节约更多的功耗,提升性能。
当然,在一些实施例中,还可以结合图10a中的S1004、S1005以及图10b中的S1006、S1007步骤,首先确定出工作状态对应的有用信号,然后对这部分有用信号进行带通滤波,得到工作状态对应的滤波后的有用信号。可以例如图10c所示出的流程,可以包括以下步骤:
S1001,对环境声音进行采集,确定环境音频信号。
S1004,确定工作状态。
S1005,根据工作状态,确定与工作状态相关的至少一个有用信号。
其中,S1001、S1004、S1005与图10a中相应的步骤相同,在此不再赘述。
S1007’,对于工作状态相关的至少一个有用信号进行带通滤波,得到与工作状态相关的至少一个滤波后的有用信号。
其中,S1007’与图10b中的S1007的区别仅在于,将进行带通滤波的有用信号替换为与工作状态相关的有用信号。其具体执行过程可以参考S1007中的描述,在此不再赘述。
S1002”,将与工作状态相关的至少一个滤波后的有用信号从环境音频信号中去除,得到参考信号,其中,有用信号包含目标内容。
其中,S1002”与图10a中的S1002的区别仅在于,将与工作状态相关的至少一个有用信号替换为与工作状态相关的至少一个滤波后的有用信号。S1002”与图10b中的S1002’的区别仅在于,将与至少一个滤波后的有用信号替换为与工作状态相关的至少一个滤波后的有用信号。显然,可以将S1002”看作S1002与S1002’的结合。其具体执行过程可以参考S1002与S1002’中相应的描述,本申请在此不再赘述。
S1003,若方法应用于耳机,则确定待播放信号,并将该待播放信号进行播放,使得待播放信号与环境声音进行叠加,抵消环境噪声并保留有用信号。
S1003’,若方法应用于协作设备,则确定待播放信号,并将该待播放信号发送至耳机,以便耳机播放该待播放信号,使得待播放信号与环境声音进行叠加,抵消环境噪声并保留有用信号。
其中,S1003、S1003’与图10a、图10b中相应的步骤相同,在此不再赘述。
下面将结合更为具体的实施例,对图10a-10c所描述的方案进行更加详细的说明。
在一个实施例中,若上述图10a-10c所示方法应用于耳机时,则主动降噪架构可以如图11所示。通过耳机对周围环境的声音进行主动降噪后,仍然保留用户感兴趣的内容。例如,耳机可以从周围环境声音中提取有用信号,或者有用信号可以预存在耳机中。然后耳机根据确定的有用信号,在进行主动降噪时将有用信号进行保留,使得耳机可以抑制环境中的噪声,并且保证用户仍然可以听到有用信号。
在一个例子中,图11中耳机的模块示意图可以如图12所示。可以看出,耳机可以包括近端采集模块、远端采集模块、滤波处理模块、处理模块和第二定位模块。用于采集环境音频信号。在一个例子中,远端采集模块和近端采集模块可以为同一个采集模块。处理模块可以从环境音频信号中提取有用信号。当然有用信号也可以是预存的并从耳机的存储器中提取得到。然后耳机将有用信号从环境音频信号中去除,确定参考信号。滤波处理模块用于对参考信号进行滤波处理,得到待播放信号。最终使得耳机播放待播放信号时,可以对环境中的噪音进行降噪并保留用户感兴趣的内容。
结合图11和图12,在一个例子中,本申请提供了一种更为详细的主动降噪方法流程图。例如图13所示,该方法主要应用在耳机上,该方法可以包括以下步骤:
S1301,耳机采集第一环境音频信号。
耳机通过远端采集模块对周围环境的声音进行采集,得到周围环境的第一环境音频信号d(c)。可以理解的是,此时第一环境音频信号d(c)中包括有用信号s(c)和噪音信号n(c)。
S1302,耳机对采集到的第一环境音频信号进行处理,提取有用信号。
耳机通过处理模块将S1301中采集到的第一环境音频信号d(c)进行处理,提取有用信号s(c)。可以理解的是,该有用信号s(c)为用户感兴趣的音频信号,或者是与某些需求相关的音频信号。显然,该有用信号s(c)是用户希望在耳机进行主动降噪后,仍然可以听到的信号。
在一个例子中,该有用信号s(c)可以是具有一些关键字的音频信号,或是某些特定的人说话的声音等等。当然,还可以是任意用户希望保留的音频信号,本申请在此不作限定。
在另一个例子中,有用信号s(c)可以预存在耳机上,因此若耳机上预存有该有用信号s(c),则耳机可以不执行S1301和S1302,而是直接获取预存在存储器上的有用信号s(c)即可。
S1303,耳机采集周围环境的第二环境音频信号。
耳机可以通过近端采集模块采集耳机外部的环境声音作为第二环境音频信号d’(c)。在一个例子中,近端采集模块可以是参考传感器,用于采集耳机外部的环境声音作为第二环境信号d’(c)。可以理解的是,S1303可以在执行S1301至S1304之前、之间或之后的任意时刻执行,本申请在此不作限定。
当然,在一些例子中,耳机中的近端采集模块与远端采集模块可以为同一个模块,因此,耳机可以直接将第一环境音频信号d(c)作为第二环境音频信号d’(c)。可以避免多次重复采集,提升运行速度并降低功耗。
S1304,耳机对第二环境音频信号进行滤波,将有用信号从第二环境音频信号中去除,得到参考信号。
耳机中的滤波处理模块可以对第二环境音频信号d’(c)进行滤波,将有用信号s(c)从第二环境音频信号d’(c)中去除。可以理解的是,由于S1304中需要用到S1302中得到的有用信号s(c)以及S1303中采集到的第二环境音频信号d’(c)。所以S1304需在S1302和S1303执行完后再执行。
通过图11可以看出,耳机在将有用信号s(c)从第二环境音频信号d’(c)中去除后,得到的参考信号x(c)将只会保留噪音信号n(c)。
S1305,耳机根据参考信号确定待播放信号,并采用待播放信号进行主动降噪。
耳机将采用S1304中得到的参考信号x(c)作为主动降噪耳机所使用的补偿信号,并通过自适应滤波器得到参考信号x(c)的反相信号y(c)。可以理解的是,该反相信号y(c)即待播放信号,用于抵消耳机采集到的参考信号x(c)中用户感兴趣的内容。耳机通过播放反相信号y(c)从而将外界环境中的噪声抑制掉,并使得耳机中的误差传感器采集到的降噪误差信号e(c)中仍然包含有用信号s(c)。
在一个例子中,协作设备上还可以包括第一定位模块,和/或耳机上还可以包括第二定位模块。以便协作设备和/或耳机可以根据自身设备上的定位模块进行定位,并得到自身设备的地理位置信息。其中,协作设备的地理位置信息可以通过无线方式发送至耳机,因此耳机上还可以包括第二无线模块,用于通过第二无线模块接收协作设备的地理位置信息。协作设备可以包括第一无线模块,用于通过第一无线模块将协作设备的地理位置信息发送至耳机。然后,耳机可以根据协作设备和/或耳机的地理位置信息确定用户可能所处的场景,并根据不用的使用场景确定相应场景中可能的有用信号s(c)。具体方式可以参考图10a至图10c中相应描述,在此不再赘述。
在另一个实施例中,若上述图10a至图10c所示方法应用于协作设备时,则主动降噪架构可以如图14所示。通过协作设备确定用户感兴趣的有用信号,并将有用信号从环境音频信号中去除,得到参考信号。协作设备再根据参考信号确定待播放信号。并将待播放信号发送至耳机,以便耳机使用待播放信号进行主动降噪时,可以抑制环境中的噪声并且保留用户感兴趣的内容。
在一个例子中,图12中协作设备和耳机的模块示意图可以如图15所示。可以看出,协作设备中包括远端采集模块、近端采集模块、处理模块、滤波处理模块和无线模块。也就是说,协作设备在采集到第一环境音频信号d(c)后,可以从第一环境音频信号d(c)中确定有用信号s(c)。协作设备还会采集第二环境音频信号d’(c),并通过处理模块将有用信号s(c)从第二环境音频信号d’(c)中去除,得到参考信号x(c)。协作设备的处理模块还用于根据参考信号x(c),确定待播放信号y(c),然后将参考信号x(c)通过第一无线模块发送至耳机。而对于耳机而言,可以仅包括第二无线模块用于接收待播放信号y(c)。然后采用待播放信号进行主动降噪。在一些例子中,远端采集模块和近端采集模块可以为同一个采集模块。
结合图14和图15,在一个实施例中,例如图16所示的另一种主动降噪方法流程图,该方法可以包括以下步骤:
S1601,协作设备采集第一环境音频信号。
协作设备可以通过远端采集模块对周围环境的声音进行采集,得到周围环境的第一环境音频信号d(c)。
S1602,协作设备对采集到的第一环境音频信号进行处理,提取有用信号。
协作设备通过处理模块将S1601中采集到的第一环境音频信号d(c)进行处理,提取有用信号s(c)。在一个例子中,有用信号s(c)可以预存在协作设备上,因此若协作设备上预存有该有用信号s(c),则耳机可以不执行S1301和S1302,而是直接获取预存在存储器上的有用信号s(c)即可。
S1603,协作设备采集周围环境的第二环境音频信号。
协作设备可以通过近端采集模块采集协作设备外部的环境声音作为第二环境音频信号d’(c)。在一个例子中,近端采集模块可以是参考传感器,用于采集协作设备外部的环境声音作为第二环境音频信号d’(c)。可以理解的是,在一个例子中,协作设备中的远端采集模块与近端采集模块可以是同一个采集模块,使得协作设备可以直接将采集到的第一环境音频信号d(c)作为第二环境音频信号d’(c),从而避免协作设备多次采集造成的资源浪费。
可以理解的是,S1603可以在执行S1601和S1602之前、之间或之后的任意时刻执行,本申请在此不作限定。
S1604,协作设备对第二环境音频信号进行滤波,将有用信号从第二环境音频信号中去除,得到参考信号。
协作设备还可以包括滤波处理模块,用于对第二环境音频信号d’(c)进行滤波,将有用信号s(c)从第二环境音频信号d’(c)中去除,得到参考信号x(c)。可以理解的是,由于S1604中需要用到S1602中提取的有用信号s(c)以及S1603中采集到的第二环境音频信号d’(c)。所以S1604需在S1602和S1603执行完后再执行。
S1605,协作设备根据参考信号,确定待播放信号。
协作设备将采用S1604中得到的参考信号x(c)作为主动降噪所使用的补偿信号,并通过自适应滤波器得到参考信号x(c)的反相信号y(c),即待播放信号。
S1606,协作设备将待播放信号发送至耳机。
协作设备可以将S1604中得到的反相信号y(c),通过第一无线模块发送至耳机。
在一个例子中,通过无线模块发送反相信号y(c),可以采用无线电的方式,例如蓝牙、ZigBee、WiFi、GSM、CDMA、GPRS、WCDMA、TD-SCDMA、CDMA2000、LTE、LTE-A、e-LTE和NR等等任意可能的无线电方式。
S1607,耳机接收协作设备发送的待播放信号。
耳机可以通过耳机中的第二无线模块接收S1606中协作设备发送的反相信号y(c)。
S1607,耳机采用待播放信号进行主动降噪。
耳机通过播放反相信号y(c)从而将外界环境中的噪声抑制掉,并使得耳机中的误差传感器采集到的降噪误差信号e(c)中仍然包含有用信号s(c)。
在一个例子中,协作设备上还可以包括第一定位模块,和/或耳机上还可以包括第二定位模块。以便协作设备和/或耳机可以根据自身设备上的定位模块进行定位,得到自身设备的地理位置信息。其中,耳机的地理位置信息可以通过无线方式发送至协作设备,例如耳机通过第二无线模块将耳机的地理位置信息发送至协作设备,协作设备通过第一无线模块接收耳机的地理位置信息。然后,协作设备可以根据协作设备和/或耳机的地理位置信息确定用户可能所处的场景,并根据不用的使用场景确定相应场景中可能的有用信号s(c)。具体方式可以参考图10a至图10c中相应描述,在此不再赘述。
在又一个实施例中,若上述图10a至图10c所示方法应用于耳机时,则主动降噪架构还可以如图17所示。耳机所需要的第一环境音频信号,可以是协作设备采集到并发送至耳机的。例如图18所示的另一种主动降噪模块示意图。可以看出,协作设备中仅包括远端采集模块和第一无线模块。协作设备在采集到第一环境音频信号d(c)后,可以将第一环境音频信号d(c)通过无线模块传输至耳机。而对于耳机而言,可以包括第二无线模块、处理模块、近端采集模块和滤波处理模块。对于耳机中的各个模块与图12中相应模块相同,可以参考图12中相应的描述,在此不再赘述。
结合图17和图18,在一个实施例中,例如图19所示的又一种主动降噪方法流程图,该方法可以包括以下步骤:
S1901,协作设备采集第一环境音频信号。
其中,S1901与S1601相同,具体可以参考S1601相关的描述,在此不再赘述。
S1902,协作设备将采集到的第一环境音频信号发送至耳机。
协作设备可以将S1901中采集到的第一环境音频信号d(c),通过第一无线模块发送至耳机。
在一个例子中,协作设备通过第一无线模块发送第一环境音频信号d(c),可以采用无线电的方式,例如蓝牙、ZigBee、WiFi、GSM、CDMA、GPRS、WCDMA、TD-SCDMA、CDMA2000、LTE、LTE-A、e-LTE和NR等等任意可能的无线电方式。
S1903,耳机接收协作设备发送的第一环境音频信号。
耳机可以通过耳机中的第二无线模块接收S1902中协作设备发送的第一环境音频信号d(c)。
S1904,耳机对接收到的第一环境音频信号进行处理,提取有用信号。
S1905,耳机采集周围环境的第二环境音频信号。
S1906,耳机对第二环境音频信号进行滤波,将有用信号从第二环境音频信号中去除,得到参考信号。
S1907,耳机根据参考信号确定待播放信号,并采用待播放信号进行主动降噪。
其中,S1904、S1905、S1906、S1907与S1302、S1303、S1304、S1305相同,具体可以参考S1302、S1303、S1304、S1305相关的描述,在此不再赘述。应当注意的是,S1905可以在执行S1901至S1904之前、之间或之后的任意时刻执行,本申请在此不作限定。
在一个例子中,协作设备上还可以包括第一定位模块,和/或耳机上还可以包括第二定位模块。以便协作设备和/或耳机可以根据自身设备上的定位模块进行定位,并得到自身设备的地理位置信息。其中,协作设备的地理位置信息可以通过无线方式发送至耳机,例如协作设备通过第一无线模块将协作设备的地理位置信息发送至耳机,耳机通过第二无线模块接收协作设备的地理位置信息。然后,耳机再根据协作设备和/或耳机的地理位置信息确定用户可能所处的场景,并根据不用的使用场景确定相应场景中可能的有用信号s(c)。具体方式可以参考图10a至图10c中相应描述,在此不再赘述。
本申请通过协作设备采集第一环境音频信号,并从第一环境音频信号中提取有用信号。然后将有用信号发送至耳机,以便耳机可以根据有用信号,将该有用信号从第二环境音频信号中去除,得到参考信号。或是,协作设备采集第一环境音频信号后,将第一环境音频信号发送至耳机。然后耳机从接收到的第一环境音频信号中确定有用信号,并将该有用信号从第二环境音频信号中去除,得到参考信号。使得当耳机进行主动降噪时,可以保障用户仍然可以听到有用信号相关的内容,保留了用户所感兴趣的音频内容。
当然,对于图10a至图10c所示方法全部应用于耳机时,耳机在确定有用信号或参考信号时,还可以通过麦克风阵列针对某些方向进行方向采集。则主动降噪架构还可以如图20所示。可以看出,在该架构中,耳机的近端采集模块可以进行方向性采集,例如不采集用户感兴趣方向上的音频信号。由于耳机在采集环境音频信号时,采集到的音频信号将不包含感兴趣方向的音频信号。因此,耳机可以将采集到的音频信号直接作为参考信号x(c)中。可以理解的是,耳机采集到的参考信号x(c)将仅包含噪声信号n(c)。
显然基于图20示出的主动降噪架构,图21提供了再一种主动降噪模块示意图。其中,耳机包括近端采集模块,用于进行音频信号的方向采集,同时还包括滤波处理模块,可以用于提升特定频段。当然在一些例子中,耳机还可以包括无线模块,用于将耳机与其它终端设备连接。例如手机、平板电脑、笔记本电脑、可穿戴设备等等。
结合图20和图21,在一个实施例中,本申请提供了再一种主动降噪方法流程图,例如图22所示。该方法主要应用在耳机,通过耳机对进行方向性拾音,使得耳机在进行主动降噪的时候,参考信号中并不包含感兴趣方向的音频信号,从而可以在降噪后保留用户感兴趣的内容。该方法可以包括以下步骤:
S2201,耳机通过方向性拾音采集参考信号。
耳机可以采用方向性拾音,通过不采集感兴趣方向的音频信号,使得采集到的参考信号中x(c)中不包含感兴趣方向的音频信号。换句话说,耳机可以仅采集用户不感兴趣方向上的音频信号,则采集到的音频信号必然不包含用户感兴趣的内容,采集到的音频信号可以直接作为参考信号x(c)使用。
S2202,耳机采用参考信号进行主动降噪。
当耳机通过方向性拾音,采集到参考信号x(c)之后,可以直接采用该参考信号x(c)进行主动降噪。可以想到,通过ANC降噪之后,用户仍然可以听到感兴趣方向上的音频。
当然,在一些例子中,在S2202之前,还可以包括以下步骤:
S2203,耳机对采集到的参考信号进行处理,提升特定频段的能量。
耳机将S2201中采集到的参考信号x(c)进行处理,得到处理后的参考信号x’(c)。例如提升某些特定频段的能量,和/或压低另一些频段的能量等等。从而实现将参考信号x(c)中某些特定频段进行提升和凸显。当然,可以理解的是,若经过S2203对参考信号x(c)进行处理,则S2202中,耳机需要采用处理后的参考信号x’(c)进行主动降噪。
当然在又一个例子中,S2201也可以进行全方向采集,得到第二环境音频信号d’(c),然后S2202对全方向采集得到的第二环境音频信号d’(c)进行处理。换句话说,耳机既可以对全方向采集的音频信号进行处理,也可以对方向性采集的音频信号进行处理,本申请在此不作限定。
本申请还可以通过耳机进行方向性采集参考信号,和/或对参考信号进行滤波处理。当耳机根据该参考信号进行主动降噪时,可以保留特定方向上的音频和/或特定频率的音频,保障了用户可以感知到保留的特定方向上的音频和/或特定频率的音频。
当然,在另一个实施例中,本申请还提供了一种主动降噪系统,该系统中可以包括协作设备和耳机。在该系统中通过协作设备与耳机协同工作,将一部分功能放置于协作设备上实现,并通过协作设备与耳机之间的交互,使得最终耳机可以获得待播放信号,并进行主动降噪。保障了耳机在主动降噪时可以去除环境中的噪音,并保留用户感兴趣的内容。
如图23所示,为本申请实施例提供的另一种主动降噪架构示意图。
本申请所涉及的主动降噪架构中可以包括协作设备和耳机。通过协作设备和耳机协同工作,从而实现在主动降噪后,仍然可以使用户听到有用信号。其中,协作设备可以用于接收周围环境的声音,例如声源直接发出的直达声波。然后协作设备提取并移除有用信号后,将有用信号发送至耳机。以便耳机在进行主动降噪时,将有用信号进行保留,使得主动降噪耳机在抑制噪声的同时,保证用户可以听到有用信号。
可以理解的是,协作设备和耳机之间可以采用无线方式相连接,并采用无线传输方式进行数据交互。
在一个例子中,图23中的协作设备和耳机的模块示意图可以如图24所示。可以看出,协作设备可以包括远端采集模块、处理模块和第一无线模块。用于采集环境音频信号,并且将有用信号从环境信号中提取出,并通过第一无线模块传输至耳机。以及,耳机可以包括第二无线模块、近端采集模块和滤波处理模块。用于接收协作设备发送的有用信号,并基于采集的参考信号,将有用信号从参考信号中去除掉。最终使得耳机可以在降噪的同时保留有用信号。
结合图23和图24,在一个实施例中,本申请提供了另一种主动降噪方法流程图,例如图25所示。该方法主要应用在协作设备与耳机,通过协作设备将有用信号发送至耳机,使得耳机在进行主动降噪的时候可以保留有用信号。该方法可以包括以下步骤:
S2501,协作设备采集第一环境音频信号。
协作设备通过远端采集模块对周围环境的声音进行采集,得到周围环境的第一环境音频信号d(c)。可以理解的是,此时第一环境音频信号d(c)中包括有用信号s(c)和噪音信号n(c)。
S2502,协作设备对采集到的第一环境音频信号进行处理,提取有用信号。
协作设备通过处理模块将S2501中采集到的第一环境音频信号d(c)进行处理,提取有用信号s(c)。为用户感兴趣的音频信号,或者是与某些是用户希望在耳机进行主动降噪后,仍然可以听到的信号。可以是具有一些关键字的音频信号,或是某些特定的人说话的声音在另一个例子中,有用信号s(c)可以预存在协作设备上,因此若协作设备上预存有该有用信号s(c),则协作设备可以不执行S2501和S2502,而是直接获取预存在存储器上的有用信号s(c)即可。
S2503,协作设备将提取到的有用信号发送至耳机。
协作设备在S2502中将有用信号s(c)提取后,可以将该有用信号s(c)通过第一无线模块发送至耳机。
在一个例子中,协作设备通过第一无线模块发送有用信号s(c),可以采用无线电的方式,例如蓝牙、ZigBee、WiFi、蜂窝网络等等。
S2504,耳机接收协作设备发送的有用信号。
耳机可以通过耳机中的第二无线模块接收S2503中协作设备发送的有用信号s(c)。
S2505,耳机采集周围环境的第二环境音频信号。
耳机可以通过近端采集模块采集耳机外部的环境声音作为第二环境音频信号d’(c)。在一个例子中,近端采集模块可以是参考传感器,用于采集耳机外部的环境声音作为第二环境信号d’(c)。
可以理解的是,S2505可以在执行S2501至S2504之前、之间或之后的任意时刻执行,本申请在此不作限定。
在执行完S2504和S2505之后,方法还可以包括:
S2506,耳机对第二环境音频信号进行滤波,将有用信号从第二环境音频信号中去除,得到参考信号。
耳机中的滤波处理模块可以对第二环境音频信号d’(c)进行滤波,将有用信号s(c)从第二环境音频信号d’(c)中去除。可以理解的是,由于S2506中需要用到S2504中接收的有用信号s(c)以及S2505中采集到的第二环境音频信号d’(c)。所以S2506需在S2504和S2505全部执行完后再执行。
通过图23可以看出,耳机的参考传感器采集的第二环境音频信号与协作设备采集到的第一环境音频信号几乎相同,均包含有用信号s(c)和噪音信号n(c)。因此,耳机在将有用信号s(c)从第二环境音频信号d’(c)中去除后,得到的参考信号x(c)将只会保留噪音信号n(c)。
S2507,耳机根据参考信号确定待播放信号,并采用待播放信号进行主动降噪。
耳机将采用S2506中得到的参考信号x(c)作为主动降噪耳机所使用的补偿信号,并通过自适应滤波器得到参考信号x(c)的反相信号y(c)。可以理解的是,该反相信号y(c)用于抵消耳机采集到的参考信号x(c)中用户感兴趣的内容。耳机通过播放反相信号y(c)从而将外界环境中的噪声抑制掉,并使得耳机中的误差传感器采集到的降噪误差信号e(c)中仍然包含有用信号s(c)。
在一个例子中,协作设备上还可以包括第一定位模块,和/或耳机上还可以包括第二定位模块。以便协作设备和/或耳机可以根据自身设备上的定位模块进行定位,并得到自身设备的地理位置信息。其中,耳机的地理位置信息可以通过无线方式发送至协作设备,例如耳机通过第二无线模块将耳机的地理位置信息发送至协作设备,协作设备通过第一无线模块接收耳机的地理位置信息。然后,协作设备可以根据协作设备和/或耳机的地理位置信息确定用户可能所处的场景,并根据不用的使用场景确定相应场景中可能的有用信号s(c)。具体方式可以参考图10a至图10c中相应描述,在此不再赘述。
在又一些例子中,协作设备还可以包括近端采集模块,用于采集第二环境音频信号d’(c),然后将有用信号从第二环境音频信号d’(c)中去除,并得到参考信号x(c)。然后协作设备将参考信号x(c)发送至耳机。对于耳机而言,则可以无需采集第二环境音频信号,而是直接根据接收到的参考信号x(c)进行滤波处理,得到待播放信号。
进行处理,换句话说,就是协作设备不用提取有用信号,而是直接将采集到的环境信号通过无线模块发送至耳机。后无需对其进行处理,而是可以直接通过无线模块传输至耳机。而对于耳机而言,可以包括无线模块、处理模块、近端采集模块和滤波处理模块。显然进行处理。因此,在耳机中需要添加相应的处理模块,用于耳机对环境信号进行处理,提取有用信号。,通过,可以采用无线电的方式,例如蓝牙、。进行处理,提取有用信号。可以理解的是,该有用信号为用户感兴趣的音频信号,或者是与某些需求相关的音频信号。与的含义相同,在此不再赘述。可以预存在手机上,因此若手机上预存有该有用信号,则可以不执行即可。,并在提取到有用信号后,对进行滤波,将有用信号从中发送给进行主动降噪。例如,并将有用信号从中。发送至耳机。。然后确定待播放信号,并采用待播放信号。在一个例子中,。进行滤波,将有用信号从中。可以理解的是,由于。所以,通过无线模块发送至耳机。,可以采用无线电的方式,例如蓝牙、。参考上述图24、图18、图15中,其中涉及到的远端采集模块,在一个例子中,可以是麦克风或是麦克风阵列,用于采集周围环境的音频信号和/或进行声源的分离与提取。处理模块主要用于将有用信号从环境信号中提取出。协作设备上的第一无线模块与耳机上的第二无线模块,主要用于建立无线链路,用于协作设备与耳机之间进行通信。在一个例子中,无线模块可以采用如蓝牙、ZigBee、WiFi、GSM、CDMA、GPRS、WCDMA、TD-SCDMA、CDMA2000、LTE、LTE-A、e-LTE和NR等等任意可能的方式进行无线通信。在一个例子中,近端采集模块可以是麦克风,用于采集环境音频信号作为参考信号。当然在一些例子中,近端采集模块在进行音频信号采集时,可以进行方向性音频采集。也就是说仅采集某一方向上的音频信号。同时,滤波处理模块可以用于将有用信号从参考信号中去除。当然,在另一些例子中,滤波处理模块还可以对采集到的参考信号进行频域整形,例如放大或缩小某些特定频段的能量。
下面将结合不同的使用场景,对上述图至图的方案进行描述。
图26为本申请实施例提供的一种主动降噪场景示意图。
在一个实施例中,当协作设备和/或耳机通过地理位置信息确定用户可能位于某某机场、某某火车站或某某商场等一些具有广播的场景时,协作设备或耳机可以确定用户可能对该场景中的某些关键字感兴趣。本实施例以机场广播场景为例,对方案进行更为详细的描述。
可以看出,在该场景下环境中除噪声信号之外,还包括机场广播。人们在机场等待候机的时候,机场广播随时都在播报重要的通知或是公告,这些信息相对于用户而言将会是非常重要的有用信息。因此,在进行主动降噪时,用户仍然希望听到机场广播的声音,避免遗漏一些重要的通知。此时有用信号便可以是一些关键字或关键词,例如“XXX航班”、“乘客请注意”、自己名字等等。
当然,可以理解的是,该场景不仅局限于机场广播环境,还可以是火车站广播环境、或者其它环境中包含关键字的场景,本申请在此不作限定。
当本申请中的主动降噪方式应用在图26的场景中时,可以参考以下方式实现。
首先,协作设备采集第一环境音频信号。在一个例子中,协作设备上部署有麦克风或者麦克风阵列作为远端采集模块。协作设备通过麦克风或者麦克风阵列采集到第一环境音频信号d(c)。此时第一环境音频信号d(c)可以包括至少一个声源。若仅包含一个声源,则可以直接对第一环境音频信号d(c)进行处理,确定是否包含预先设置的关键字等信息。当然,若第一环境音频信号d(c)包括多个声源,则远端采集模块还需要将第一环境音频信号d(c)分离出多个声源信号。可以理解的是,由于该环境下可能无法完美适配预先存储的有用信号,因此需要从环境音频中提取匹配更加契合的有用信号。当然在一些例子中,若可以很好的适配预先存储的有用信号,则可以直接将预存的有用信号从第一环境音频信号d(c)中去除。
在一个例子中,远端采集模块可以对第一环境音频信号d(c)进行盲分离,从而分离出多个声源信号。假设第一环境音频信号d(c)有N个独立声源和M个麦克风。其声源矢量为a(c)=[a1(c),……,aN(c)]T,而观测矢量为d(c)=[d1(c),……,dN(c)]T,采用长度为P的混合滤波器,则声源矢量到观测矢量的卷积混合过程可以表达为
Figure BDA0002852907640000401
其中,混合网络H(c)为M×N的矩阵序列,其根据混合滤波器的冲激响应构成。其中,“*”用于表示矩阵之间的卷积操作,以及p的取值为[0,P-1]。
假设分离滤波器的长度为L,估计出的声源矢量r(c)=[r1(c),……,rN(c)]T,则估计出的声源矢量y(c)可以表达为
Figure BDA0002852907640000402
其中,分离网络W(c)为N×M的矩阵序列,其根据分离滤波器的冲激响应构成。其中。l的取值为[0,L-1]。
在一个例子中,分离网络W(c)可以通过频域盲源分离算法获得,例如经过L点短时傅里叶变化(short-time fourier transform,STFT),将时域卷积变换为频域卷积,即上述公式1变换为
D(m,f)=H(f)A(m,f)
……公式3以及公式2可以变换为
R(m,f)=W(f)D(m,f)
……公式4其中,m是对时间索引值c进行L点降采样后确定。D(m,f)和R(m,f)分别为d(c)和r(c)进行STFT后确定。H(f)和W(f)分别为H(c)和W(c)的傅里叶变换形式。f为频率,其中
Figure BDA0002852907640000411
最终将进行盲源分离获得的Y(m,f)进行反向傅里叶变换后,变换回时域。从而得到估计的声源信号r1(c),……,rN(c)。
当协作设备得到估计的声源信号r1(c),……,rN(c)后,可以对各个声源信号r1(c),……,rN(c),分析其是否包含预先设定的用户所感应趣的内容,例如可以识别声源信号r1(c),……,rN(c)中是否包含预先设定的关键词(或关键字)。
在一个例子中,可以通过模板匹配的方式识别声源信号中是否包含关键词(或关键字)。本申请以关键词为例进行描述,可以理解的是,关键字仅为关键词为某个字时的特殊情况。
其中,模板匹配的方式例如图27所示。包括在步骤2701中获取关键词模板语音。可以理解的是,关键词模板语音可以是预先设定好的。然后在步骤2702中将关键词进行特征表示。在步骤2701、步骤2702之前、之中或之后还可以执行步骤2703获取测试语音。可以理解的是,该测试语音可以是上述获得到的声源信号r1(c),……,rN(c)。然后对每个声源信号r1(c),……,rN(c)进行特征并表示。并最终将测试语音的特征表示与模板特征表示进行匹配,从而确定声源信号中是否包含关键词。
在一个例子中,模板特征表示以及测试语音的特征表示可以采用梅尔频率倒谱系数(mel frequency cepstrum coefficient,MFCC)特征。该MFCC特征是在语音识别和说话人识别领域中应用较为广泛的基础特征。MFCC特征基于人耳特性,即人耳对约1000Hz以上的声音频率范围的感知并不遵循线性关系,而是遵循在对数频率坐标上的近似线性关系。对于MFCC而言,其是梅尔(mel)标度频率域上提取出来的倒谱参数,而Mel标度则描述了人耳频率的折中非线性特性。
在一个例子中,对于MFCC特征的提取可以参考图28所描述的过程。首先通过步骤2801获取语音信号,该语音信号可以是步骤2701的关键词模板语音,也可以是步骤2703的测试语音,例如声源信号r1(c),……,rN(c)。然后对步骤2801获得的每个关键词模板语音或者每个声源信号进行预处理。在一个例子中,预处理可以包括步骤2802的预加重和步骤2803的分帧加窗。其中,步骤2802预加重的目的在于可以消除语音在发音时口鼻辐射带来的影响。例如通过高通滤波器,使得语音中的高频部分得到提升。由于语音信号短时平稳,因此可以通过步骤2803分帧加窗将语音信号分为一个一个的短时段。其中,每个短时段可以被称为一帧。在一个例子中,为了避免语音信号中动态信号的丢失,相邻帧之间可以存在一段重叠的区域。步骤2804对分帧加窗后的时域信号进行FFT,变换到频域,并得到频谱特征b(k)。经过步骤2804的FFT之后,步骤2805的梅尔滤波器组可以对步骤2804得到的每个语音信号的频谱特征b(k)进行滤波,并得到每个子带的能量。其中子带的能量可以通过频域信号的平方和计算得到。步骤2806可以将步骤2805中得到的每个语音信号的每个子带的能量取对数,从而得到每个语音信号的梅尔频率对数能量谱。步骤2807中将步骤2806得到的每个语音信号的梅尔频率对数能量谱进行离散余弦变换(discrete cosine transform,DCT),并得到MFCC系数,即步骤2808。
当经过上述图28的方式得到步骤2701中每个关键词模板语音的MFCC系数(即步骤2702),以及步骤2703中每个声源信号r1(c),……,rN(c)的MFCC系数(即步骤2704)后,便可以进行模板匹配,即步骤2705。在一个例子中,例如可以采用余弦距离(cosine distance)的方式进行模板匹配。
其中,两个矢量之间的距离衡量,可以描述两个矢量之间的相似度。当两个矢量距离为0时,相似度最高。因此可以采用余弦距离来定义两个矢量之间的相似度。在一个例子中,可以定义两个N’维的矢量G=(g1,g2,…,gN’)和I=(i1,i2,…,iN’)。余弦距离可以通过公式5进行表示。
Figure BDA0002852907640000421
其中,j用于表示两个G=(g1,g2,…,gN’)和I=(i1,i2,…,iN’)之间的余弦距离。n’、N’为正整数,n’的取值范围为[1,N’]。
可以理解的是,在进行模板匹配时,需要针对每个声源信号r1(c),……,rN(c)逐一对每个关键词模板语音进行模板匹配。当计算得到的余弦距离大于或等于预设的余弦距离阈值时,则可以认为该声源信号与该关键词模板语音相匹配。换句话说,就是可以认为该声源信号包含预设的关键词。协作设备可以将该声源信号作为有用信号s(c)。
当协作设备对每个声源信号r1(c),……,rN(c)与每个关键词模板语音逐一进行模板匹配,并得到一个或多个有用信号s(c)之后,可以通过无线模块将得到的一个或多个有用信号s(c)发送至耳机。具体无线传输方式可以参考图25、图19、图16中相应的描述,在此不再赘述。
耳机则可以通过位于耳机内的无线模块接收协作设备发送的一个或多个有用信号s(c)。耳机还可以通过近端采集模块,采集周围环境的音频信号作为第二环境音频信号d’(c)。在一个例子中,近端采集模块可以是一个或多个麦克风。在耳机采集到第二环境音频信号d’(c)以及接收到一个或多个有用信号s(c)之后,可以通过滤波处理模块将一个或多个有用信号s(c)从第二环境音频信号d‘(c)中去除。在一个例子中,可以采用ANC算法模型进行去除。例如图29所示,可以看出,其架构通过反馈式自适应学习的方式将有用信号s(c)从第二环境音频信号d’(c)中去除。通过累加器将有用信号s(c)取反后与第二环境音频信号d’(c)进行叠加,从而实现将有用信号s(c)从第二环境音频信号d’(c)中去除,得到参考信号x(c)。显然,参考信号x(c)中将不再包含有用信号s(c)。
当然在另一个例子中,还可以采用谱减法将有用信号s(c)从第二环境音频信号d’(c)中去除。例如,首先可以将有用信号s(c)和第二环境音频信号d’(c)进行FFT变换。并得到有用信号的频域谱S(f)以及第二环境音频信号的频域谱D’(f)。然后对第二环境音频信号的频域谱D’(f)进行降噪,例如从第二环境音频信号的频域谱D’(f)中减去有用信号的频域谱S(f),并得到参考信号的频域谱x(f)。再对参考信号的频域谱x(f)进行快速傅里叶逆变换(inverse fast Fourier transform,IFFT),得到参考信号x(c)。可以理解的是,通过该方式得到的参考信号x(c)同样不再包含有用信号s(c)。
当耳机得到参考信号x(c)后,可以再次通过ANC算法,根据参考信号x(c)作为参考信号通过自适应滤波器得到第二环境音频信号的反相信号y(c),并采用反相信号y(c)进行主动降噪。其具体主动降噪过程可以参考图2至图9中相应的描述,在此不再赘述。可以理解的是,经过主动降噪后不包含有用信号s(c)的噪音将会被抑制,使得最终用户听到或是采集的e(c)中保留有用信号s(c),从而保障了用户在经过耳机进行主动降噪后,仍然能够听到包含关键字的感兴趣的内容。
在一个例子中,若结合上述图23、图18和图19的主动降噪方式,则上述过程中进行声源特征提取以及模板匹配的过程可以由耳机执行,例如协作设备在采集到第一环境音频信号d(c)后,可以将该第一环境音频信号d(c)分离出的一个或多个音源信号通过第一无线模块发送至耳机。在耳机通过耳机上的第二无线模块接收到一个或多个音源信号后,由位于耳机上的处理模块对一个或多个音源信号进行声源特征提取以及模板匹配。其具体实现过程与前述方式相同,在此不再赘述。
在另一个例子中,对环境信号的声源信号分离也可以由耳机进行,例如,协作设备将采集到的第一环境音频信号d(c)直接通过第一无线模块发送至耳机。在耳机通过耳机上的第二无线模块接收到第一环境音频信号d(c)后,由位于耳机上的处理模块对第一环境音频信号d(c)进行信号分离得到一个或多个音源信号,并对一个或多个音源信号进行声源特征提取以及模板匹配。其具体实现过程与前述方式相同,在此不再赘述。
当然在又一个例子中,若结合上述图23、图15和图16的主动降噪方式,则上述过程中进行参考信号采集以及将有用信号s(c)滤去除的过程则可以由协作设备执行,例如协作设备可以采用参考传感器采集第二环境音频信号d’(c),并在确定有用信号s(c)后,将有用信号s(c)从第二环境音频信号d’(c)中去除,得到参考信号x(c)。可以理解的是,协作设备可以将第一环境音频信号d(c)直接作为第二环境音频信号d’(c)使用。然后协作设备将参考信号x(c)通过第一无线模块发送至耳机。耳机通过耳机上的第二无线模块接收到参考信号x(c)后,直接将其作为ANC的参考信号使用。可以理解的是,在该方式中耳机上可以不再部署麦克风,而是直接将接收到的参考信号x(c)作为参考麦克风的信号。其具体实现过程与前述方式相同,在此不再赘述。
当然,本领域人员应当注意的是,对于关键词、关键字或是某些关键内容可以预先被配置在耳机上,然后由耳机发送至协作设备,以便协作设备在进行模板匹配时使用。当然,也可以是在协作设备上预先存储好的。当然还可以是协作设备通过网络从服务器上获取到的。
在又一个例子中,还可以将协作设备与耳机集成在一个设备上,并通过该设备实现主动降噪并保留用户感兴趣内容。
协作设备通过采集第一环境音频信号,并将感兴趣的有用信号提取出。然后将有用信号发送至耳机,使得耳机将有用信号从第二环境音频信号中去除,得到参考信号。并基于参考信号进行主动降噪。保障了在主动降噪的系统框架下,保留了感兴趣的音频内容,使得用户仍然可以听到感兴趣的关键内容。显然,本申请的方法尤其适用于机场、高铁、火车站、广场、超市等等嘈杂且又需要关注广播的地方。当然本申请并不限于应用在上述场景中。
图30为本申请实施例提供的另一种主动降噪场景示意图。
在另一个实施例中,当协作设备和/或耳机通过地理位置信息确定用户可能位于某某办公楼、某某大厦等一些工作环境的场景时,协作设备或耳机可以确定用户可能对该场景中某些特定的人所说的话感兴趣。本实施例办公场景为例,对方案进行更为详细的描述。
该场景主要为办公场景,例如办公室。在该场景下,用户可能需要听到某一些特定人所说的话,或者希望听到同事的说话声音。用户在佩戴主动降噪耳机后,由于工作关系仍然希望经过主动降噪后,一些特定人群的声音可以被保留下来。
在一个例子中,可以采用声纹识别的方式,提取特定人的音频信息并作为有用信号。可以理解的是,由于声纹是一种声音的旋律,因此基于声纹识别时不仅可以识别出特定人的音频信息,同时还可以将用户喜欢的旋律识别出来并作为有用信号,例如某些音乐。当然,以下描述将基于声纹进行阐述,但可以理解若将声纹替换为音乐旋律则仍然适用。
当本申请中的主动降噪方式应用在图30的场景中时,可以参考以下方式实现。
首先协作设备采集环境信号d(c)。并将环境信号d(c)分离出多个声源信号r1(c),……,rN(c)。其具体实现方式可以参考图26场景中相应的描述,在此不再赘述。可以理解的是,由于该环境下可能无法完美适配预先存储的有用信号,例如声纹信号。因此需要从环境音频中提取匹配更加契合的有用信号。当然在一些例子中,若可以很好的适配预先存储的有用信号,则可以直接将预存的有用信号从第一环境音频信号d(c)中去除。
当无法完美适配预先存储的有用信号时,协作设备可以对分离出的多个声源信号r1(c),……,rN(c)采用声纹识别的方式,确定有用信号s(c)。
在一个例子中,可以采用基于高斯混合模型(gaussian mixture model,GMM)的方式进行声纹识别。例如图31所示出的一种基于GMM的声纹识别流程图。
可以看出该声纹识别过程包括两部分,即训练部分和测试部分。其中,训练部分可以在测试部分之前预先执行。其中训练部分可以是在协作设备上执行,当然也可以在服务器上预先进行计算,并将训练好的GMM模型库发送至协作设备。当然还可以是在服务器上上预先进行计算后,将训练好的GMM模型库预存至耳机,并由耳机将GMM模型库发送至协作设备。本申请在此不作限定。其中,训练部分首先需要训练设备进行步骤3101获取训练语音。例如,可以获取希望保留的说话人的一条或多条语音信息。在一个例子中,此类语音信息可以是预先采集好的。然后训练设备执行步骤3102,提取获取到的训练语音的特征参数,例如采用MFCC参数。MFCC参数的具体计算过程可以参考图26场景中相应的描述,在此不再赘述。然后训练设备执行步骤3103,基于训练语音所对应的MFCC参数,对原始GMM模型进行训练,从而得到某一个人声纹的GMM模型。当训练设备训练得到多个不同人声纹所对应的GMM模型时,多个不同人声纹所对应的GMM模型则构成了GMM模型库,即步骤3104。
之后,协作设备则可以进行测试部分,例如执行步骤3105获取测试语音。其中,获取的测试语音可以是协作设备通过远端采集模块采集到的环境信号d(c)。然后协作设备的处理模块可以执行步骤3106,对采集到的环境信号d(c)进行特征参数提取,例如仍采用MFCC参数。其具体计算过程可以参考图26场景中相应的描述,在此不再赘述。协作设备的处理模块还可以执行步骤3107,从GMM模型库中选择用户感兴趣的一个或多个说话人所对应的GMM模型。并进行步骤3108,计算环境信号d(c)提取到的特征参数与用户感兴趣的一个或多个说话人所对应的GMM模型的相似度。可以理解的是,该过程为每个特征参数与每个GMM模型均计算相似度,并通过步骤3109确定相似度是否大于或等于预设的相似度阈值。若某个音源信号的特征参数与某个GMM模型相似度大于或等于预设的相似度阈值时,则认为该音源信号可能对应某个感兴趣的说话人。因此可以将该音源信号作为有用信号s(c),即3110。若某个音源信号的特征参数与某个GMM模型相似度小于预设的相似度阈值时,则认为该音源信号并不对应该感兴趣的说话人。因此则不会将该音源信号作为有用信号s(c),即3111。
当协作设备的处理模块将所有的音源信号与所有的感兴趣的说话人对应的GMM模型进行相似度计算后,可以确定一个或多个有用信号s(c)。协作设备可以将确定的一个或多个有用信号s(c)通过无线模块发送至耳机,以便耳机将一个或多个有用信号s(c)从第二环境音频信号d’(c)中去除,并得到参考信号x(c)。耳机再采用自适应滤波器结合参考信号x(c)得到第二环境音频信号d’(c)的反相信号y(c),并根据反相信号y(c)进行主动降噪,从而保障用户在经过耳机进行主动降噪后,仍然能够听到包含感兴趣说话人的内容。
在一个例子中,若结合上述图23、图18和图19的主动降噪方式,则上述过程中进行声纹识别的过程可以由耳机执行,例如协作设备在采集到第一环境音频信号d(c)后,可以将该第一环境音频信号d(c)分离出的一个或多个音源信号通过第一无线模块发送至耳机。在耳机通过耳机上的第二无线模块接收到一个或多个音源信号后,由位于耳机上的处理模块对一个或多个音源信号进行声纹识别。其具体实现过程与前述方式相同,在此不再赘述。
在另一个例子中,对环境信号的声源信号分离也可以由耳机进行,例如,协作设备将采集到的第一环境音频信号d(c)直接通过第一无线模块发送至耳机。在耳机通过耳机上的第二无线模块接收到第一环境音频信号d(c)后,由位于耳机上的处理模块对第一环境音频信号d(c)进行信号分离得到一个或多个音源信号,并对一个或多个音源信号进行声纹识别。其具体实现过程与前述方式相同,在此不再赘述。
当然在又一个例子中,若结合上述图23、图15和图16的主动降噪方式,则上述过程中进行参考信号采集以及将有用信号s(c)滤去除的过程则可以由协作设备执行,例如协作设备可以采用参考传感器采集第二环境音频信号d’(c),并在确定有用信号s(c)后,将有用信号s(c)从第二环境音频信号d’(c)中去除,得到参考信号x(c)。然后协作设备将参考信号x(c)通过第一无线模块发送至耳机。耳机通过耳机上的第二无线模块接收到参考信号x(c)后,直接将其作为ANC的参考信号使用。可以理解的是,在该方式中耳机上可以不再部署麦克风,而是直接将接收到的参考信号x(c)作为参考麦克风的信号。其具体实现过程与前述方式相同,在此不再赘述。
在又一个例子中,还可以将协作设备与耳机集成在一个设备上,并通过该设备实现主动降噪并保留用户感兴趣内容。
协作设备通过采集第一环境音频信号,并将感兴趣的有用信号提取出。其中,感兴趣的内容包括特定声纹的音频内容。然后将有用信号发送至耳机,使得耳机将有用信号从第二环境音频信号中去除,得到参考信号。并基于参考信号进行主动降噪。保障了在主动降噪的系统框架下,保留了感兴趣的音频内容,使得用户仍然可以听到感兴趣的关键内容。显然,本申请的方法可以适用于办公场景,当然也可以适用于需要高效交流的环境中。本申请并不限于应用在上述场景中。,然后由位于耳机上的处理模块对环境信号进行,然后由位于耳机上的处理模块对环境信号进行,从而避免
中将仅包含噪声信号。中不包含感兴趣方向的音频信号。之后,可以直接采用该参考信号进行主动降噪进行处理,。中进行处理,则,然后进行处理。换句话说,耳机既可以对全方向采集的音频信号进行处理,也可以对方向性采集的音频信号进行处理,本申请在此不作限定。图32为本申请实施例提供的又一种主动降噪场景示意图。
在又一个实施例中,当协作设备和/或耳机通过地理位置信息确定用户可能位于某某小区、某某酒店等一些比较私人的环境场景时,协作设备或耳机可以确定用户可能对该场景中某些特定方向的音频信号感兴趣。本实施例居家场景为例,对方案进行更为详细的描述。
可以看出,该场景主要涉及居家环境中,例如用户位于家中的客厅、卧室等等。显然此类场景相对于用户而言较为私密,并不会存在过多的其他人员或者音源。并且某些特定的音源位置较为固定。因此可以通过方向性拾音避开某个用户感兴趣并且位置较为固定的音源。例如,用户可以不采集电视机方向的音频信号,或是不采集音响方向上的音频信号等等。从而实现在经过主动降噪后,用户可以听到上述方向上的音频。
当然,可以理解的是,该场景不仅局限于居家环境,还可以是旅店客房环境或是其它音源较为固定的环境场景,本申请在此不作限定。
当本申请中的主动降噪方式应用在图32的场景中时,可以参考以下方式实现。
首先,耳机采集参考信号x(c)。其中,耳机可以进行方向性采集,例如不采集感兴趣方向的音频信号,使得采集到的参考信号x(c)不包含感兴趣方向上的音频信号。在一个例子中,可以利用麦克风阵列进行波束形成的方式进行方向性采集。假设耳机上部署有O个麦克风,其中O为正整数。例如图33示出的一种波束形成器,该波束形成器可以包括延时-求和波束形成和滤波-求和波束形成两种类型。若麦克风阵列的输入信号为ko(c),滤波器传递系数为qo(c),则滤波-求和波束形成器的系统输出可以表示为:
Figure BDA0002852907640000461
在一个例子中,若滤波器传递系数为单一加权常数时,则滤波-求和波束形成器可以简化为延时-求和波束形成器,即公式6可以简化为公式7。例如,
Figure BDA0002852907640000462
上述公式6与公式7中的τo表示通过时延估计而得到的时延补偿。手机的近端采集模块可以通过控制τo的数值从而控制麦克风阵列的波束可以指向特定方向。并采集该方向的音频信号。显然,若用户对某一方向的音频信号感兴趣,则近端采集模块可以控制波束不指向感兴趣的方向,使得最终采集到的参考信号x(c)中不包括感兴趣方向的音频信号。
可以理解的是,若用户仅仅想不听某几个方向的音频信号,例如用户在居家环境中,不想听到窗外的声音。则耳机可以通过上述方式专门采集不感兴趣方向上的音频,使得采集到的参考信号x(c)仅包括不感兴趣的音频信号,
当耳机采集到参考信号x(c)后,可以直接采用该参考信号x(c)作为参考信号使用,通过自适应滤波器得到用于抵消环境噪音的反相信号y(c),并根据反相信号y(c)进行主动降噪。其具体降噪过程可以参考图2至图9中相应的描述,在此不再赘述。可以理解的是,经过主动降噪后最终用户听到或是采集的e(c)中,将会包含感兴趣方向上的音频信号,换句话说,用户将可以听到兴趣方向上的音频。
再一个实施例中,当协作设备和/或耳机通过地理位置信息确定用户可能位于某某街、某某路或是某某高速等公路场景时,协作设备或耳机可以确定用户可能对该场景中某些特定频率的音频信号感兴趣,例如告警声、鸣笛声等。在一个例子中,当耳机采集到第二环境音频信号d’(c)后,还可以对采集到的第二环境音频信号d’(c)进行处理。例如,可以对采集到的第二环境音频信号d’(c)进行频域滤波,去除特定频段。如一些设备的告警音或汽车的喇叭声等。通常情况下,告警音为固定频率的声音,频率可以在1000Hz左右。因此,耳机的滤波处理模块可以选用带通滤波器,并将采集到的第二环境音频信号d’(c)经过带通滤波器进行滤波,从而去除950至1050Hz的音频内容。以便滤波后得到的的参考信号x(c)中不再包含该频段的内容。即是处理后的参考信号。当耳机采用参考信号x(c)作为参考信号进行主动降噪时,可以保障用户仍然可以听到告警音。使得若发生特殊事件或意外事件时,告警音可以被用户感知到。可以理解的是,耳机可以对全方向采集得到的第二环境音频信号d’(c)进行滤波,也可以对某些特定方向进行采集得到的参考信号x(c)进行滤波可以是的处理。例如进行频域滤波,。
较为典型的场景,例如可以是车内环境,用户位于较为私密的车内时,想要屏蔽车窗外的杂音,同时仍然希望保留有外界的鸣笛声和告警声,以保证驾驶安全;或是例如用户在大街上行走、骑车,此时用户希望抵消环境中的杂音,同时仍然希望保留有外界的鸣笛声和告警声,以保障行走或骑行安全等。
是通过全方向采集时,也可以对采集到的参考信号进行滤波。其滤波方式与上述相同,在此不再赘述。在该场景下,耳机在采集参考信号时可以进行方向性采集,使得采集到的参考信号中不再包含一些特定方向上的音频信号。可以使耳机在以该参考信号进行主动降噪后,特定方向上的音频信号仍然可以被用户所感知到。或是将某些特定频率进行滤波,使得耳机的主动降噪后,某些特定频率的音频信号仍然可以被用户所感知到。
图34为本申请实施例提供的一种协作设备示意图。
如图34所示,提供了一种协作设备3400,该协作设备3400可以是手机、平板电脑、桌面型计算机、膝上型计算机、手持计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本,以及蜂窝电话、个人数字助理(personaldigital assistant,PDA)、增强现实(augmented reality,AR)设备、虚拟现实(virtualreality,VR)设备、人工智能(artificial intelligence,AI)设备、可穿戴式设备、车载设备、智能家居设备和/或智慧城市设备,本申请实施例对该协作设备3400的具体类型不作特殊限制。
协作设备3400可以包括处理器3410,外部存储器接口3420,内部存储器3421,通用串行总线(universal serialbus,USB)接口3430,充电管理模块3440,电源管理模块3441,电池3442,天线1,天线2,移动通信模块3450,无线通信模块3460,音频模块3470,麦克风3470A,显示屏3480、定位模块3490以及用户身份识别模块(subscriber identity module,SIM)卡接口3495等。
可以理解的是,本发明实施例示意的结构并不构成对协作设备3400的具体限定。在本申请另一些实施例中,协作设备3400可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器3410可以包括一个或多个处理单元,例如:处理器3410可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器3410中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器3410中的存储器为高速缓冲存储器。该存储器可以保存处理器3410刚用过或循环使用的指令或数据。如果处理器3410需要再次使用该指令或数据,可从存储器中直接调用。避免了重复存取,减少了处理器3410的等待时间,因而提高了系统的效率。
在一些实施例中,处理器3410可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2S接口可以用于音频通信。在一些实施例中,处理器3410可以包含多组I2S总线。处理器3410可以通过I2S总线与音频模块3470耦合,实现处理器3410与音频模块3470之间的通信。在一些实施例中,音频模块3470可以通过I2S接口向无线通信模块3460传递音频信号,实现通过蓝牙传输音频数据的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块3470与无线通信模块3460可以通过PCM总线接口耦合。在一些实施例中,音频模块3470也可以通过PCM接口向无线通信模块3460传递音频信号,实现通过蓝牙传输音频数据的功能。I2S接口和PCM接口都可以用于音频通信。
可以理解的是,本发明实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对协作设备3400的结构限定。在本申请另一些实施例中,协作设备3400也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
外部存储器接口3420可以用于连接外部存储卡,例如Micro SD卡,实现扩展协作设备3400的存储能力。外部存储卡通过外部存储器接口3420与处理器3410通信,实现数据存储功能。例如将音频数据等文件保存在外部存储卡中。
内部存储器3421可以用于存储计算机可执行程序代码,可执行程序代码包括指令。内部存储器3421可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。处理器3410通过运行存储在内部存储器3421的指令,和/或存储在设置于处理器中的存储器的指令,执行协作设备3400的各种功能应用以及数据处理。
协作设备3400可以通过音频模块3470,麦克风3470A以及应用处理器等实现音频功能。例如音乐录音等。
音频模块3470用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块3470还可以用于对音频信号编码和解码。在一些实施例中,音频模块3470可以设置于处理器3410中,或将音频模块3470的部分功能模块设置于处理器3410中。
麦克风3470A,也称“话筒”,“传声器”,用于将声音信号转换为电信号。协作设备3400可以设置至少一个麦克风3470A。在另一些实施例中,协作设备3400可以设置多个麦克风170A,从而形成麦克风阵列。以实现采集声音信号、降噪功能、识别声音来源,实现定向录音功能等。
定位模块3490,可以用于对协作设备3400进行定位,例如通过GPS、BDS、伽利略卫星导航系统、GLONASS等方式进行定位。
协作设备3400还可以包括红外传感器、陀螺仪等传感器。
本申请所提供的协作设备3400可以实现上述图10a至图25所述示例中协作设备的任意一项功能,具体实现方式可以参考述图10a至图25中的相应描述,在此不再赘述。
图35为本申请实施例提供的一种耳机示意图。
如图35所示,提供了一种耳机3500,该耳机3500可以是无线降噪耳机。
耳机3500可以包括处理器3510,外部存储器接口3520,内部存储器3521,通用串行总线(universal serial bus,USB)接口3530,充电管理模块3540,电源管理模块3541,电池3542,天线1,天线2,移动通信模块3550,无线通信模块3560,音频模块3570,扬声器3570A,麦克风3570B,耳机接口3570C、定位模块3580以及SIM卡接口3595。
可以理解的是,本发明实施例示意的结构并不构成对耳机3500的具体限定。在本申请另一些实施例中,耳机3500可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器3510可以包括一个或多个处理单元,例如:处理器3510可以包括AP,调制解调处理器,GPU,ISP,控制器,视频编解码器,DSP,基带处理器,和/或NPU等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器3510中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器3510中的存储器为高速缓冲存储器。该存储器可以保存处理器3510刚用过或循环使用的指令或数据。如果处理器3510需要再次使用该指令或数据,可从存储器中直接调用。避免了重复存取,减少了处理器3510的等待时间,因而提高了系统的效率。
在一些实施例中,处理器3510可以包括一个或多个接口。接口可以包括I2C接口,I2S接口,PCM接口,UART接口,MIPI,GPIO接口,和/或USB接口等。
I2S接口可以用于音频通信。在一些实施例中,处理器3510可以包含多组I2S总线。处理器3510可以通过I2S总线与音频模块3570耦合,实现处理器3510与音频模块3570之间的通信。在一些实施例中,音频模块3570可以通过I2S接口向无线通信模块3560传递音频信号,实现通过蓝牙耳机传输音频数据的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块3570与无线通信模块3560可以通过PCM总线接口耦合。在一些实施例中,音频模块3570也可以通过PCM接口向无线通信模块3560传递音频信号,实现通过蓝牙耳机传输音频数据的功能。I2S接口和PCM接口都可以用于音频通信。
可以理解的是,本发明实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对耳机3500的结构限定。在本申请另一些实施例中,耳机3500也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
外部存储器接口3520可以用于连接外部存储卡,例如Micro SD卡,实现扩展耳机3500的存储能力。外部存储卡通过外部存储器接口3520与处理器3510通信,实现数据存储功能。例如将音乐等文件保存在外部存储卡中。
内部存储器3521可以用于存储计算机可执行程序代码,可执行程序代码包括指令。内部存储器3521可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能等)等。存储数据区可存储耳机3500使用过程中所创建的数据(比如音频数据等)等。此外,内部存储器3521可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,UFS等。处理器3510通过运行存储在内部存储器3521的指令,和/或存储在设置于处理器中的存储器的指令,执行耳机3500的各种功能应用以及数据处理。
耳机3500可以通过音频模块3570,扬声器3570A,麦克风3570B,耳机接口3570C,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块3570用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块3570还可以用于对音频信号编码和解码。在一些实施例中,音频模块3570可以设置于处理器3510中,或将音频模块3570的部分功能模块设置于处理器3510中。
扬声器3570A,也称“喇叭”,用于将音频电信号转换为声音信号。耳机3500可以通过扬声器3570A播放音频。
麦克风3570B,也称“话筒”,“传声器”,用于将声音信号转换为电信号。耳机3500可以设置至少一个麦克风3570B。在另一些实施例中,耳机3500可以设置多个麦克风3570B,从而形成麦克风阵列。以实现采集声音信号、降噪功能、识别声音来源,实现定向录音功能等。
耳机接口3570C用于连接耳机3500与协作设备3400。耳机接口3570C可以是USB接口3530,也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industryassociation of the USA,CTIA)标准接口。
定位模块3580,可以用于对耳机3500进行定位,例如通过GPS、BDS、伽利略卫星导航系统、GLONASS等方式进行定位。
耳机3500还可以包括红外传感器、陀螺仪等传感器。
本申请所提供的耳机3500可以实现上述图10a至图25所述示例中耳机的任意一项功能,具体实现方式可以参考述图10a至图25中的相应描述,在此不再赘述。
本领域普通技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(英文:non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(英文:magnetic tape),软盘(英文:floppy disk),光盘(英文:optical disc)及其任意组合。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (91)

1.一种主动降噪的方法,其特征在于,所述方法应用于协作设备或耳机,所述方法包括:
对所述协作设备或所述耳机周围的环境声音进行采集,确定环境音频信号;
确定所述协作设备或所述耳机的工作状态;
根据预先设定的工作状态与有用信号的对应关系,确定与所述工作状态相关的至少一个所述有用信号,其中,所述有用信号包含目标内容;
将所述至少一个有用信号从所述环境音频信号中去除,得到参考信号;
根据所述参考信号确定主动降噪所需的待播放信号,以便所述耳机播放所述待播放信号后,抵消环境噪声并保留环境中的所述目标内容。
2.如权利要求1所述的方法,其特征在于,所述确定所述协作设备或所述耳机的工作状态,包括:确定所述协作设备或所述耳机的工作场景,和/或确定所述协作设备或所述耳机的工作模式。
3.如权利要求2所述的方法,其特征在于,所述确定所述协作设备或所述耳机的工作场景包括:
获取所述协作设备或所述耳机的环境信息;
根据预设的环境信息与工作场景的对应关系,确定所述协作设备或所述耳机的环境信息对应的所述协作设备或所述耳机的工作场景。
4.如权利要求3所述的方法,其特征在于,所述环境信息包括以下至少之一:地理位置信息、所述环境音频信号或环境视频信号。
5.如权利要求3或4所述的方法,其特征在于,所述确定所述协作设备或所述耳机的工作场景还包括:
确定用户历史习惯偏好、当前行程、当前时间信息、所述协作设备或所述耳机的设备状态中的一个或多个;
所述根据预设的环境信息与工作场景的对应关系,确定所述协作设备或所述耳机的环境信息对应的所述协作设备或所述耳机的工作场景,包括:
根据所述环境信息,并结合所述用户历史习惯偏好、所述当前行程、所述当前时间信息、所述协作设备或所述耳机的设备状态中的一个或多个,确定所述协作设备或所述耳机的环境信息对应的所述协作设备或所述耳机的工作场景。
6.如权利要求2所述的方法,其特征在于,所述确定所述协作设备或所述耳机的工作模式包括:
所述协作设备或所述耳机接收第一输入指令,所述第一输入指令用于从预存的多个所述工作模式中指示被选择的所述工作模式;
根据所述第一输入指令,确定所述协作设备或所述耳机的工作模式,其中,所述工作模式为主动降噪模式下的工作模式。
7.如权利要求6所述的方法,其特征在于,若所述方法应用于所述协作设备,所述方法还包括:
接收所述耳机发送的所述耳机的工作模式;
将所述耳机的工作模式作为所述协作设备的工作模式;或根据所述第一输入指令和所述耳机的工作模式,确定所述协作设备的工作模式。
8.如权利要求6所述的方法,其特征在于,若所述方法应用于所述耳机,所述方法还包括:
接收所述协作设备发送的所述协作设备的工作模式;
将所述协作设备的工作模式作为所述耳机的工作模式;或根据所述第一输入指令和所述协作设备的工作模式,确定所述耳机的工作模式。
9.如权利要求1-8任意一项所述的方法,其特征在于,所述确定与所述工作状态相关的至少一个所述有用信号包括:
确定与所述工作状态相关的预存在所述协作设备或所述耳机上的所述至少一个有用信号。
10.如权利要求1-8任意一项所述的方法,其特征在于,所述确定与所述工作状态相关的至少一个所述有用信号包括:
将所述环境音频信号进行信号分离,得到至少一个音源信号;
对至少一个所述音源信号进行识别,确定与所述工作状态相关的至少一个所述有用信号。
11.如权利要求10所述的方法,其特征在于,所述对至少一个所述音源信号进行识别,确定与所述工作状态相关的至少一个所述有用信号包括:
对至少一个所述音源信号进行关键字识别,并从至少一个所述音源信号中确定包含与所述工作状态相关的预设关键字的至少一个所述有用信号;或
对至少一个所述音源信号进行声纹匹配,并从至少一个所述音源信号中确定与所述工作状态相关的预设声纹匹配的至少一个所述有用信号。
12.如权利要求1-10任意一项所述的方法,其特征在于,所述确定与所述工作状态相关的至少一个所述有用信号包括:
根据预先设定的工作状态与频率和/或频率段的对应关系,确定与所述工作状态相关的至少一个预设的频率和/或频率段;
所述将所述至少一个有用信号从所述环境音频信号中去除,得到参考信号包括:
对所述环境音频信号进行处理,将所述至少一个预设的频率和/或频率段去除,得到所述参考信号。
13.如权利要求1-12任意一项所述的方法,其特征在于,所述将所述至少一个有用信号从所述环境音频信号中去除,得到参考信号包括:
采用自适应滤波将至少一个所述有用信号从所述环境音频信号中去除,得到参考信号;或
采用谱减法将至少一个所述有用信号从所述环境音频信号中去除,得到参考信号。
14.如权利要求1-13任意一项所述的方法,其特征在于,在所述将所述至少一个有用信号从所述环境音频信号中去除之前,所述方法还包括:
对所述至少一个有用信号进行带通滤波,得到至少一个滤波后的有用信号。
15.如权利要求14所述的方法,其特征在于,在所述对所述至少一个有用信号进行带通滤波之前,所述方法还包括:
获取预设的带通滤波范围;或
根据所述工作状态,确定所述工作状态下的所述带通滤波范围;或
确定所述协作设备或所述耳机的电量信息;
根据所述协作设备或所述耳机的电量信息,确定所述带通滤波范围。
16.如权利要求1-15任意一项所述的方法,其特征在于,所述对环境声音进行采集包括:全方向采集;或
通过控制麦克风阵列进行特定方向采集。
17.如权利要求16所述的方法,其特征在于,所述方法还包括:
若通过控制麦克风阵列进行特定方向采集,则根据采集到的至少一个方向的音频信号,确定至少一个所述有用信号,其中根据所述有用信号得到的所述参考信号的方向与所述有用信号的方向不一致;或
若通过控制麦克风阵列进行特定方向采集,则根据采集到的所述至少一个方向的音频信号,确定所述参考信号。
18.如权利要求1-17任意一项所述的方法,其特征在于,若所述方法应用于所述协作设备,所述对所述协作设备或所述耳机周围的环境声音进行采集,确定环境音频信号包括:
所述协作设备采集周围的环境声音,并将采集到的声音作为所述环境音频信号;或
所述协作设备接收所述耳机发送的所述环境音频信号,其中所述环境音频信号为所述耳机采集所述耳机周围的环境声音。
19.如权利要求1-17任意一项所述的方法,其特征在于,若所述方法应用于所述耳机,所述对所述协作设备或所述耳机周围的环境声音进行采集,确定环境音频信号包括:
所述耳机采集周围的环境声音,并将采集到的声音作为所述环境音频信号;或
所述耳机接收所述协作设备发送的所述环境音频信号,其中所述环境音频信号为所述协作设备采集所述协作设备周围的环境声音。
20.如权利要求1-19任意一项所述的方法,其特征在于,所述确定待播放信号包括:
根据所述参考信号以及所述主动降噪架构,确定所述环境音频信号的反相信号,并将所述反相信号作为所述待播放信号。
21.如权利要求1-20任意一项所述的方法,其特征在于,所述方法还包括:
若所述方法应用于所述协作设备,则将所述待播放信号发送至所述耳机。
22.一种主动降噪的方法,其特征在于,所述方法应用于协作设备或耳机,所述方法包括:
对所述协作设备或所述耳机周围的环境声音进行采集,确定环境音频信号;
确定至少一个有用信号,其中,所述有用信号包含目标内容;
对所述至少一个有用信号进行带通滤波,得到至少一个滤波后的有用信号;
将所述至少一个滤波后的有用信号从所述环境音频信号中去除,得到参考信号;
根据所述参考信号确定主动降噪所需的待播放信号,以便所述耳机播放所述待播放信号后,抵消环境噪声并保留环境中的所述目标内容。
23.如权利要求22所述的方法,其特征在于,所述确定至少一个有用信号包括:
确定所述协作设备或所述耳机的工作状态;
根据预先设定的工作状态与有用信号的对应关系,确定与所述工作状态相关的至少一个所述有用信号。
24.如权利要求23所述的方法,其特征在于,所述确定所述协作设备或所述耳机的工作状态包括:确定所述协作设备或所述耳机的工作场景,和/或确定所述协作设备或所述耳机的工作模式。
25.如权利要求24所述的方法,其特征在于,所述确定所述协作设备或所述耳机的工作场景包括:
获取所述协作设备或所述耳机的环境信息;
根据预设的环境信息与工作场景的对应关系,确定所述协作设备或所述耳机的环境信息对应的所述协作设备或所述耳机的工作场景。
26.如权利要求25所述的方法,其特征在于,所述环境信息包括以下至少之一:地理位置信息、所述环境音频信号或环境视频信号。
27.如权利要求25或26所述的方法,其特征在于,所述确定所述协作设备或所述耳机的工作场景还包括:
确定用户历史习惯偏好、当前行程、当前时间信息、所述协作设备和/或所述耳机的设备状态中的一个或多个;
所述根据预设的环境信息与工作场景的对应关系,确定所述协作设备或所述耳机的环境信息对应的所述协作设备或所述耳机的工作场景,包括:
根据所述环境信息,并结合所述用户历史习惯偏好、所述当前行程、所述当前时间信息中、所述协作设备或所述耳机的设备状态中的一个或多个,确定所述协作设备或所述耳机的环境信息对应的所述协作设备或所述耳机的工作场景。
28.如权利要求24所述的方法,其特征在于,所述确定所述协作设备或所述耳机的工作模式包括:
所述协作设备或所述耳机接收第一输入指令,所述第一输入指令用于从预存多个所述工作模式中指示被选择的所述工作模式;
根据所述第一输入指令,确定所述协作设备或所述耳机的工作模式,其中,所述工作模式为主动降噪模式下的工作模式。
29.如权利要求28所述的方法,其特征在于,若所述方法应用于所述协作设备,所述方法还包括:
接收所述耳机发送的所述耳机的工作模式;
将所述耳机的工作模式作为所述协作设备的工作模式;或根据所述第一输入指令和所述耳机的工作模式,确定所述协作设备的工作模式。
30.如权利要求28所述的方法,其特征在于,若所述方法应用于所述耳机,所述方法还包括:
接收所述协作设备发送的所述协作设备的工作模式;
将所述协作设备的工作模式作为所述耳机的工作模式;或根据所述第一输入指令和所述协作设备的工作模式,确定所述耳机的工作模式。
31.如权利要求23-30任意一项所述的方法,其特征在于,在所述对所述至少一个有用信号进行带通滤波之前,所述方法还包括:
获取预设的所述带通滤波范围;或
根据所述工作状态,确定所述工作状态下的所述带通滤波范围;或
确定所述协作设备或所述耳机的电量信息;
根据所述协作设备或所述耳机的电量信息,确定所述带通滤波范围。
32.如权利要求22-31任意一项所述的方法,其特征在于,所述确定至少一个有用信号包括:
确定预存在所述协作设备或所述耳机上的所述至少一个有用信号。
33.如权利要求22-31任意一项所述的方法,其特征在于,所述确定至少一个所述有用信号包括:
将所述环境音频信号进行信号分离,得到至少一个音源信号;
对至少一个所述音源信号进行识别,确定至少一个所述有用信号。
34.如权利要求33所述的方法,其特征在于,所述对至少一个所述音源信号进行识别,确定至少一个所述有用信号包括:
对至少一个所述音源信号进行关键字识别,并从至少一个所述音源信号中确定包含预设关键字的至少一个所述有用信号;或
对至少一个所述音源信号进行声纹匹配,并从至少一个所述音源信号中确定与预设声纹匹配的至少一个所述有用信号。
35.如权利要求22-33任意一项所述的方法,其特征在于,所述确定至少一个所述有用信号包括:
确定至少一个预设的频率和/或频率段;
所述将所述至少一个滤波后的有用信号从所述环境音频信号中去除,得到参考信号包括:
对至少一个预设的频率和/或频率段进行带通滤波,得到至少一个滤波后的频率和/或频率段;
对所述环境音频信号进行处理,将所述至少一个滤波后的频率和/或频率段去除,得到所述参考信号。
36.如权利要求22-35任意一项所述的方法,其特征在于,所述将所述至少一个滤波后的有用信号从所述环境音频信号中去除,得到参考信号包括:
采用自适应滤波将所述至少一个滤波后的有用信号从所述环境音频信号中去除,得到参考信号;或
采用谱减法将所述至少一个滤波后的有用信号从所述环境音频信号中去除,得到参考信号。
37.如权利要求19-36任意一项所述的方法,其特征在于,所述对环境声音进行采集包括:全方向采集;或
通过控制麦克风阵列进行特定方向采集。
38.如权利要求37所述的方法,其特征在于,所述方法还包括:
若通过控制麦克风阵列进行特定方向采集,则根据采集到的至少一个方向的音频信号,确定至少一个所述有用信号,其中根据所述有用信号得到的所述参考信号的方向与所述有用信号的方向不一致;或
若通过控制麦克风阵列进行特定方向采集,则根据采集到的所述至少一个方向的音频信号,确定所述参考信号。
39.如权利要求22-38任意一项所述的方法,其特征在于,若所述方法应用于所述协作设备,所述对所述协作设备或所述耳机周围的环境声音进行采集,确定环境音频信号包括:
所述协作设备采集周围的环境声音,并将采集到的声音作为所述环境音频信号;或
所述协作设备接收所述耳机发送的所述环境音频信号,其中所述环境音频信号为所述耳机采集所述耳机周围的环境声音。
40.如权利要求22-38任意一项所述的方法,其特征在于,若所述方法应用于所述耳机,所述对所述协作设备或所述耳机周围的环境声音进行采集,确定环境音频信号包括:
所述耳机采集周围的环境声音,并将采集到的声音作为所述环境音频信号;或
所述耳机接收所述协作设备发送的所述环境音频信号,其中所述环境音频信号为所述协作设备采集所述协作设备周围的环境声音。
41.如权利要求22-40任意一项所述的方法,其特征在于,所述确定待播放信号包括:
根据所述参考信号以及所述主动降噪架构,确定所述环境音频信号的反相信号,并将所述环境音频信号的反相信号作为所述待播放信号。
42.如权利要求22-41任意一项所述的方法,其特征在于,所述方法还包括:
若所述方法应用于所述协作设备,则将所述待播放信号发送至所述耳机。
43.一种主动降噪的系统,其特征在于,所述系统包括协作设备和耳机,所述系统包括:
所述协作设备,用于确定所述协作设备或所述耳机的工作状态;
所述协作设备还用于,根据预先设定的工作状态与有用信号的对应关系,确定与所述工作状态相关的至少一个所述有用信号,其中,所述有用信号包含目标内容;
所述协作设备还用于,将至少一个有用信号发送至所述耳机;
所述耳机,用于接收至少一个所述有用信号;
所述耳机还用于,对所述耳机周围的环境声音进行采集,确定所述耳机的环境音频信号;
所述耳机还用于,将接收到的所述至少一个有用信号从所述耳机的环境音频信号中去除,得到参考信号;
所述耳机还用于,根据所述参考信号以及主动降噪架构,确定待播放信号;
所述耳机还用于,播放所述待播放信号,使得所述待播放信号与所述耳机周围的环境声音进行叠加,抵消环境噪声并保留所述目标内容。
44.如权利要求43所述的系统,其特征在于,所述协作设备还用于,确定所述协作设备或所述耳机的工作场景,和/或确定所述协作设备或所述耳机的工作模式。
45.如权利要求44所述的系统,其特征在于,
所述协作设备还用于,获取所述协作设备的第一环境信息;和/或
所述耳机还用于,获取第二环境信息,并将所述第二环境信息发送至所述协作设备;
所述协作设备还用于,接收所述耳机发送的第二环境信息;
所述协作设备还用于,根据预设的所述第一环境信息和所述第二环境信息中的一个或多个与工作场景的对应关系,确定对应的所述协作设备或所述耳机的工作场景。
46.如权利要求44所述的系统,其特征在于,
所述协作设备还用于,获取所述协作设备的第一环境信息,并将所述第一环境信息发送至耳机;
所述耳机还用于,接收所述协作设备发送的所述第一环境信息;和/或
所述耳机还用于,获取第二环境信息;
所述耳机还用于,根据预设的所述第一环境信息和所述第二环境信息中的一个或多个与工作场景的对应关系,确定对应的所述协作设备或所述耳机的工作场景,并将所述协作设备或所述耳机的工作场景发送至所述协作设备。
47.如权利要求45或46所述的系统,其特征在于,所述第一环境信息包括以下至少之一:所述协作设备的地理位置信息、所述协作设备的环境音频信号或所述协作设备的环境视频信号;以及,
所述第二环境信息包括以下至少之一:所述耳机的地理位置信息、所述耳机的环境音频信号或所述耳机的环境视频信号。
48.如权利要求45或47所述的系统,其特征在于,
所述耳机还用于,确定所述耳机的设备状态,并将所述耳机的设备状态发送至所述协作设备;
所述协作设备还用于,接收所述耳机发送的所述耳机的设备状态;和/或
所述协作设备还用于,确定用户历史习惯偏好、当前行程、当前时间信息、所述协作设备的设备状态中的一个或多个;
所述协作设备还用于,根据所述第一环境信息和/或所述第二环境信息,并结合所述用户历史习惯偏好、所述当前行程、所述当前时间信息、所述协作设备的设备状态以及所述耳机的设备状态中的一个或多个,确定所述协作设备或所述耳机的工作场景。
49.如权利要求46或47所述的系统,其特征在于,
所述协作设备还用于,确定所述协作设备的设备状态,并将所述协作设备的设备状态发送至所述耳机;
所述耳机还用于,接收所述协作设备发送的所述协作设备的设备状态;和/或
所述耳机还用于,确定用户历史习惯偏好、当前行程、当前时间信息、所述耳机的设备状态中的一个或多个;
所述耳机还用于,根据所述第一环境信息和/或所述第二环境信息,并结合所述用户历史习惯偏好、所述当前行程、所述当前时间信息、所述协作设备的设备状态以及所述耳机的设备状态中的一个或多个,确定所述协作设备或所述耳机的工作场景,并将所述协作设备或所述耳机的工作场景发送至所述协作设备。
50.如权利要求44所述的系统,其特征在于,所述协作设备还用于:
接收第一输入指令,所述第一输入指令用于从预存在所述协作设备上的多个所述工作模式中指示被选择的所述工作模式;
根据所述第一输入指令,确定所述协作设备的工作模式,其中,所述工作模式为主动降噪模式下的工作模式。
51.如权利要求50所述的系统,其特征在于,所述协作设备还用于:
接收所述耳机发送的所述耳机的工作模式;
将所述耳机的工作模式作为所述协作设备的工作模式;或根据所述第一输入指令和所述耳机的工作模式,确定所述协作设备的工作模式。
52.如权利要求44所述的系统,其特征在于,所述耳机还用于:
接收第一输入指令,所述第一输入指令用于从预存在所述耳机上的多个所述工作模式中指示被选择的所述工作模式;
根据所述第一输入指令,确定所述耳机的工作模式,其中,所述工作模式为主动降噪模式下的工作模式;
将所述耳机的工作模式发送至所述协作设备。
53.如权利要求52所述的系统,其特征在于,所述耳机还用于:
接收所述协作设备发送的所述协作设备的工作模式;
将所述协作设备的工作模式作为所述耳机的工作模式;或根据所述第一输入指令和所述协作设备的工作模式,确定所述耳机的工作模式。
54.如权利要求43-53任意一项所述的系统,其特征在于,所述协作设备还用于:确定与所述工作状态相关的预存的所述至少一个有用信号。
55.如权利要求43-53任意一项所述的系统,其特征在于,所述协作设备还用于:
对所述协作设备周围环境的环境声音进行采集,确定所述协作设备的环境音频信号;
根据所述协作设备的环境音频信号,确定与所述工作状态相关的至少一个所述有用信号。
56.如权利要求55所述的系统,其特征在于,所述协作设备还用于:
将所述协作设备的环境音频信号进行信号分离,得到至少一个音源信号;
对至少一个所述音源信号进行识别,确定与所述工作状态相关的至少一个所述有用信号。
57.如权利要求56所述的系统,其特征在于,所述协作设备还用于:
对至少一个所述音源信号进行关键字识别,并从至少一个所述音源信号中确定包含与所述工作状态相关的预设关键字的至少一个所述有用信号;或
对至少一个所述音源信号进行声纹匹配,并从至少一个所述音源信号中确定与所述工作状态相关的预设声纹匹配的至少一个所述有用信号。
58.如权利要求55或56所述的系统,其特征在于,所述协作设备还用于:
根据预先设定的工作状态与频率和/或频率段的对应关系,确定与所述工作状态相关的至少一个预设的频率和/或频率段;
对所述环境音频信号进行处理,将所述至少一个预设的频率和/或频率段去除,得到所述参考信号。
59.如权利要求43-58任意一项所述的系统,其特征在于,所述耳机还用于:
采用自适应滤波将至少一个所述有用信号从所述耳机的环境音频信号中去除,得到参考信号;或
采用谱减法将至少一个所述有用信号从所述耳机的环境音频信号中去除,得到参考信号。
60.如权利要求43-59任意一项所述的系统,其特征在于,所述耳机还用于,对所述至少一个有用信号进行带通滤波,得到至少一个滤波后的有用信号;或
所述协作设备还用于,对所述至少一个有用信号进行带通滤波,得到所述至少一个滤波后的有用信号;
所述协作设备还用于,将所述至少一个滤波后的有用信号发送至所述耳机;
所述耳机还用于,接收所述至少一个滤波后的有用信号,以便所述耳机根据所述至少一个滤波后的有用信号确定所述参考信号。
61.如权利要求60所述的系统,其特征在于,所述耳机还用于,获取预设的带通滤波范围;或根据所述工作状态,确定所述工作状态下的所述带通滤波范围;或确定所述耳机的电量信息;根据所述耳机的电量信息,确定所述带通滤波范围;或,
所述协作设备还用于,获取预设的带通滤波范围;或根据所述工作状态,确定所述工作状态下的所述带通滤波范围;或确定所述协作设备的电量信息;根据所述协作设备的电量信息,确定所述带通滤波范围。
62.如权利要求43-61任意一项所述的系统,其特征在于,所述协作设备还用于:
对所述协作设备周围环境的环境声音进行全方向采集;或
通过控制麦克风阵列进行特定方向采集。
63.如权利要求62所述的系统,其特征在于,所述协作设备还用于:
若通过控制麦克风阵列进行特定方向采集,则根据采集到的至少一个方向的音频信号,确定至少一个所述有用信号,其中根据所述有用信号得到的所述参考信号的方向与所述有用信号的方向不一致;或
若通过控制麦克风阵列进行特定方向采集,则根据采集到的所述至少一个方向的音频信号,确定所述参考信号,并将所述参考信号发送至所述耳机,以便所述耳机根据接收到的所述参考信号确定所述待播放信号。
64.如权利要求43-63任意一项所述的系统,其特征在于,所述耳机还用于:
根据所述参考信号以及所述主动降噪架构,确定所述耳机的环境音频信号的反相信号,并将所述反相信号作为所述待播放信号。
65.一种主动降噪的系统,其特征在于,所述系统包括协作设备和耳机,所述系统包括:
所述协作设备,用于确定至少一个有用信号,其中,所述有用信号包含目标内容;
所述协作设备还用于,将至少一个所述有用信号发送至所述耳机;或,所述协作设备还用于,对至少一个所述有用信号进行带通滤波,得到至少一个滤波后的有用信号,并将至少一个所述滤波后的有用信号发送至所述耳机;
所述耳机,用于接收至少一个所述有用信号,或接收至少一个所述滤波后的有用信号;若所述耳机接收至少一个所述有用信号,对接收到的至少一个所述有用信号进行带通滤波,得到至少一个所述滤波后的有用信号;
所述耳机还用于,对所述耳机周围的环境声音进行采集,确定所述耳机的环境音频信号;
所述耳机还用于,将至少一个所述滤波后的有用信号从所述耳机的环境音频信号中去除,得到参考信号;
所述耳机还用于,根据所述参考信号以及主动降噪架构,确定待播放信号;
所述耳机还用于,播放所述待播放信号,使得所述待播放信号与耳机周围的环境声音进行叠加,抵消环境噪声并保留所述目标内容。
66.如权利要求65所述的系统,其特征在于,所述协作设备还用于,确定所述协作设备或所述耳机的工作状态;
根据预先设定的工作状态与有用信号的对应关系,确定与所述工作状态相关的至少一个所述有用信号。
67.如权利要求66所述的系统,其特征在于,所述协作设备还用于,确定所述协作设备或所述耳机的工作场景,和/或确定所述协作设备或所述耳机的工作模式。
68.如权利要求67所述的系统,其特征在于,
所述协作设备还用于,获取所述协作设备的第一环境信息;和/或
所述耳机还用于,获取第二环境信息,并将所述第二环境信息发送至所述协作设备;
所述协作设备还用于,接收所述耳机发送的第二环境信息;
所述协作设备还用于,根据预设的所述第一环境信息和所述第二环境信息中的一个或多个与工作场景的对应关系,确定对应的所述协作设备或所述耳机的工作场景。
69.如权利要求67所述的系统,其特征在于,
所述协作设备还用于,获取所述协作设备的第一环境信息,并将所述第一环境信息发送至耳机;
所述耳机还用于,接收所述协作设备发送的所述第一环境信息;和/或
所述耳机还用于,获取第二环境信息;
所述耳机还用于,根据预设的所述第一环境信息和所述第二环境信息中的一个或多个与工作场景的对应关系,确定对应的所述协作设备或所述耳机的工作场景,并将所述协作设备或所述耳机的工作场景发送至所述协作设备。
70.如权利要求68或69所述的系统,其特征在于,所述第一环境信息包括以下至少之一:所述协作设备的地理位置信息、所述协作设备的环境音频信号或所述协作设备的环境视频信号;以及,
所述第二环境信息包括以下至少之一:所述耳机的地理位置信息、所述耳机的环境音频信号或所述耳机的环境视频信号。
71.如权利要求68或70所述的系统,其特征在于,
所述耳机还用于,确定所述耳机的设备状态,并将所述耳机的设备状态发送至所述协作设备;
所述协作设备还用于,接收所述耳机发送的所述耳机的设备状态;和/或
所述协作设备还用于,确定用户历史习惯偏好、当前行程、当前时间信息、所述协作设备的设备状态中的一个或多个;
所述协作设备还用于,根据所述第一环境信息和/或所述第二环境信息,并结合所述用户历史习惯偏好、所述当前行程、所述当前时间信息、所述协作设备的设备状态以及所述耳机的设备状态中的一个或多个,确定所述协作设备或所述耳机的工作场景。
72.如权利要求69或70所述的系统,其特征在于,
所述协作设备还用于,确定所述协作设备的设备状态,并将所述协作设备的设备状态发送至所述耳机;
所述耳机还用于,接收所述协作设备发送的所述协作设备的设备状态;和/或
所述耳机还用于,确定用户历史习惯偏好、当前行程、当前时间信息、所述耳机的设备状态中的一个或多个;
所述耳机还用于,根据所述第一环境信息和/或所述第二环境信息,并结合所述用户历史习惯偏好、所述当前行程、所述当前时间信息、所述协作设备的设备状态以及所述耳机的设备状态中的一个或多个,确定所述协作设备或所述耳机的工作场景,并将所述协作设备或所述耳机的工作场景发送至所述协作设备。
73.如权利要求67所述的系统,其特征在于,所述协作设备还用于:
接收第一输入指令,所述第一输入指令用于从预存在所述协作设备上的多个所述工作模式中指示被选择的所述工作模式;
根据所述第一输入指令,确定所述协作设备的工作模式,其中,所述工作模式为主动降噪模式下的工作模式。
74.如权利要求73所述的系统,其特征在于,所述协作设备还用于:
接收所述耳机发送的所述耳机的工作模式;
将所述耳机的工作模式作为所述协作设备的工作模式;或根据所述第一输入指令和所述耳机的工作模式,确定所述协作设备的工作模式。
75.如权利要求67所述的系统,其特征在于,所述耳机还用于:
接收第一输入指令,所述第一输入指令用于从预存在所述耳机上的多个所述工作模式中指示被选择的所述工作模式;
根据所述第一输入指令,确定所述耳机的工作模式,其中,所述工作模式为主动降噪模式下的工作模式;
将所述耳机的工作模式发送至所述协作设备。
76.如权利要求75所述的系统,其特征在于,所述耳机还用于:
接收所述协作设备发送的所述协作设备的工作模式;
将所述协作设备的工作模式作为所述耳机的工作模式;或根据所述第一输入指令和所述协作设备的工作模式,确定所述耳机的工作模式。
77.如权利要求65-76任意一项所述的系统,其特征在于,若所述耳机接收至少一个所述有用信号,所述耳机还用于,获取预设的带通滤波范围;或根据所述工作状态,确定所述工作状态下的所述带通滤波范围;或确定所述耳机的电量信息;根据所述耳机的电量信息,确定所述带通滤波范围;或,
若所述耳机接收所述至少一个滤波后的有用信号,所述协作设备还用于,获取预设的带通滤波范围;或根据所述工作状态,确定所述工作状态下的所述带通滤波范围;或确定所述协作设备的电量信息;根据所述协作设备的电量信息,确定所述带通滤波范围。
78.如权利要求65-77任意一项所述的系统,其特征在于,所述协作设备还用于:确定预存的所述至少一个有用信号。
79.如权利要求65-77任意一项所述的系统,其特征在于,所述协作设备还用于:
对所述协作设备周围环境的环境声音进行采集,确定所述协作设备的环境音频信号;
根据所述协作设备的环境音频信号,确定至少一个所述有用信号。
80.如权利要求79所述的系统,其特征在于,所述协作设备还用于:
将所述协作设备的环境音频信号进行信号分离,得到至少一个音源信号;
对至少一个所述音源信号进行识别,确定所述至少一个有用信号。
81.如权利要求80所述的系统,其特征在于,所述协作设备还用于:
对至少一个所述音源信号进行关键字识别,并从至少一个所述音源信号中确定包含预设关键字的至少一个所述有用信号;或
对至少一个所述音源信号进行声纹匹配,并从至少一个所述音源信号中确定与预设声纹匹配的至少一个所述有用信号。
82.如权利要求79或80所述的系统,其特征在于,所述协作设备还用于:
确定与所述工作状态相关的至少一个预设的频率和/或频率段;
对所述协作设备的环境音频信号进行处理,将所述至少一个预设的频率和/或频率段去除,得到所述参考信号。
83.如权利要求65-82任意一项所述的系统,其特征在于,所述耳机还用于:
采用自适应滤波将至少一个所述有用信号从所述耳机的环境音频信号中去除,得到参考信号;或
采用谱减法将至少一个所述有用信号从所述耳机的环境音频信号中去除,得到参考信号。
84.如权利要求65-83任意一项所述的系统,其特征在于,所述协作设备还用于:
对所述协作设备周围环境的环境声音进行全方向采集;或
通过控制麦克风阵列进行特定方向采集。
85.如权利要求84所述的系统,其特征在于,所述协作设备还用于:
若通过控制麦克风阵列进行特定方向采集,则根据采集到的至少一个方向的音频信号,确定至少一个所述有用信号,其中根据所述有用信号得到的所述参考信号的方向与所述有用信号的方向不一致;或
若通过控制麦克风阵列进行特定方向采集,则根据采集到的所述至少一个方向的音频信号,确定所述参考信号,并将所述参考信号发送至所述耳机,以便所述耳机根据接收到的所述参考信号确定所述待播放信号。
86.如权利要求65-85任意一项所述的系统,其特征在于,所述耳机还用于:
根据所述参考信号以及所述主动降噪架构,确定所述耳机的环境音频信号的反相信号,并将所述反相信号作为所述待播放信号。
87.一种主动降噪设备,其特征在于,所述设备为协作设备或耳机,所述设备包括:
麦克风,用于对环境声音进行采集,确定环境音频信号;
处理器用于与存储器耦合,以及读取并执行存储在所述存储器中的指令;
当所述处理器运行时执行所述指令,使得所述处理器执行上述权利要求1-21或22-42任意一项方法。
88.一种协作设备,其特征在于,所述协作设备包括:
处理器用于与存储器耦合,以及读取并执行存储在所述存储器中的指令;
当所述处理器运行时执行所述指令,使得所述处理器执行上述权利要求43-64或65-86任意一项系统中的所述协作设备的方法。
89.一种耳机,其特征在于,所述耳机包括:
接收器,用于接收协作设备发送的至少一个所述有用信号,其中,所述有用信号包含目标内容;
麦克风,用于对所述耳机周围环境的环境声音进行采集,确定第二环境音频信号;
处理器用于与存储器耦合,以及读取并执行存储在所述存储器中的指令;
当所述处理器运行时执行所述指令,使得所述处理器执行上述权利要求43-64或65-86任意一项系统中的所述耳机的方法。
90.一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当所述指令在终端上运行时,使得所述终端执行如权利要求1-42任意一项所述的方法或43-86任意一项所述的系统。
91.一种包含指令的计算机设备,当其在终端上运行时,使得所述终端执行如权利要求1-42中的任意一项所述的方法或43-86中的任意一项所述的系统。
CN202011535004.1A 2020-12-22 2020-12-22 一种主动降噪的方法、设备及系统 Pending CN114666695A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202011535004.1A CN114666695A (zh) 2020-12-22 2020-12-22 一种主动降噪的方法、设备及系统
PCT/CN2021/139667 WO2022135340A1 (zh) 2020-12-22 2021-12-20 一种主动降噪的方法、设备及系统
EP21909336.6A EP4254979A4 (en) 2020-12-22 2021-12-20 METHOD, DEVICE AND SYSTEM FOR ACTIVE NOISE CANCELLATION
US18/338,851 US12488776B2 (en) 2020-12-22 2023-06-21 Active noise cancellation method, device, and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011535004.1A CN114666695A (zh) 2020-12-22 2020-12-22 一种主动降噪的方法、设备及系统

Publications (1)

Publication Number Publication Date
CN114666695A true CN114666695A (zh) 2022-06-24

Family

ID=82024984

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011535004.1A Pending CN114666695A (zh) 2020-12-22 2020-12-22 一种主动降噪的方法、设备及系统

Country Status (4)

Country Link
US (1) US12488776B2 (zh)
EP (1) EP4254979A4 (zh)
CN (1) CN114666695A (zh)
WO (1) WO2022135340A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115312067A (zh) * 2022-10-12 2022-11-08 深圳市婕妤达电子有限公司 基于人声的声音信号识别方法、装置及存储介质
CN116259301A (zh) * 2022-12-22 2023-06-13 北京市科学技术研究院城市安全与环境科学研究所 一种半耦合式的主动降噪方法及系统
CN116320878A (zh) * 2023-04-24 2023-06-23 深圳市齐奥通信技术有限公司 一种基于骨声纹传感器的耳机降噪方法及系统
CN117012202A (zh) * 2023-10-07 2023-11-07 北京探境科技有限公司 语音通道识别方法、装置、存储介质及电子设备
CN117041803A (zh) * 2023-08-30 2023-11-10 江西瑞声电子有限公司 耳机播放的控制方法、电子设备及存储介质
CN117061927A (zh) * 2023-08-30 2023-11-14 江西瑞声电子有限公司 一种耳机播放的控制方法、电子设备及存储介质
CN117854514A (zh) * 2024-03-06 2024-04-09 深圳市增长点科技有限公司 一种音质保真的无线耳机通信解码优化方法及系统

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2024542444A (ja) * 2021-11-14 2024-11-15 ヘビース インコーポレーテッド 電気音響変換器のラウドネスを制御するシステム及び方法
CN115778046B (zh) * 2023-02-09 2023-06-09 深圳豪成通讯科技有限公司 基于数据分析的智能安全帽调节控制方法和系统
WO2025132805A1 (en) * 2023-12-21 2025-06-26 Sony Group Corporation Noise cancelling partner device for direct communication
US20250273191A1 (en) * 2024-02-28 2025-08-28 Qualcomm Incorporated Machine learning (ml) algorithm for sound classification and cancellation

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013069556A1 (ja) * 2011-11-09 2013-05-16 ソニー株式会社 ヘッドホン装置、端末装置、情報送信方法、プログラム、ヘッドホンシステム
CN104616662A (zh) * 2015-01-27 2015-05-13 中国科学院理化技术研究所 主动降噪方法及装置
CN106210219A (zh) * 2015-05-06 2016-12-07 小米科技有限责任公司 降噪方法及装置
CN108900943A (zh) * 2018-07-24 2018-11-27 四川长虹电器股份有限公司 一种场景自适应主动降噪方法及耳机
CN110418238A (zh) * 2019-08-21 2019-11-05 深圳市昂思科技有限公司 一种降噪蓝牙耳机
CN111886878A (zh) * 2020-02-13 2020-11-03 深圳市汇顶科技股份有限公司 一种用于降噪的助听方法、装置、芯片、耳机及存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030035551A1 (en) * 2001-08-20 2003-02-20 Light John J. Ambient-aware headset
US7092529B2 (en) 2002-11-01 2006-08-15 Nanyang Technological University Adaptive control system for noise cancellation
JP4631939B2 (ja) * 2008-06-27 2011-02-16 ソニー株式会社 ノイズ低減音声再生装置およびノイズ低減音声再生方法
US9202455B2 (en) * 2008-11-24 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced active noise cancellation
US9319781B2 (en) 2012-05-10 2016-04-19 Cirrus Logic, Inc. Frequency and direction-dependent ambient sound handling in personal audio devices having adaptive noise cancellation (ANC)
US9516407B2 (en) 2012-08-13 2016-12-06 Apple Inc. Active noise control with compensation for error sensing at the eardrum
US9129586B2 (en) 2012-09-10 2015-09-08 Apple Inc. Prevention of ANC instability in the presence of low frequency noise
US9414150B2 (en) 2013-03-14 2016-08-09 Cirrus Logic, Inc. Low-latency multi-driver adaptive noise canceling (ANC) system for a personal audio device
US9515629B2 (en) 2013-05-16 2016-12-06 Apple Inc. Adaptive audio equalization for personal listening devices
US20180322861A1 (en) * 2014-04-11 2018-11-08 Ahmed Ibrahim Variable Presence Control and Audio Communications In Immersive Electronic Devices
US9905244B2 (en) 2016-02-02 2018-02-27 Ebay Inc. Personalized, real-time audio processing
CN107979790A (zh) * 2017-11-28 2018-05-01 上海与德科技有限公司 一种通话降噪方法、装置、设备及介质
CN109218882B (zh) * 2018-08-16 2021-02-26 歌尔科技有限公司 耳机的环境声音监听方法及耳机
CN109686367B (zh) * 2018-12-17 2021-02-02 科大讯飞股份有限公司 一种耳机降噪方法、装置、设备及可读存储介质
US10665220B1 (en) * 2019-03-05 2020-05-26 Bose Corporation Active noise reduction (ANR) system with multiple feedforward microphones and multiple controllers
US11276384B2 (en) * 2019-05-31 2022-03-15 Apple Inc. Ambient sound enhancement and acoustic noise cancellation based on context

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013069556A1 (ja) * 2011-11-09 2013-05-16 ソニー株式会社 ヘッドホン装置、端末装置、情報送信方法、プログラム、ヘッドホンシステム
CN104616662A (zh) * 2015-01-27 2015-05-13 中国科学院理化技术研究所 主动降噪方法及装置
CN106210219A (zh) * 2015-05-06 2016-12-07 小米科技有限责任公司 降噪方法及装置
CN108900943A (zh) * 2018-07-24 2018-11-27 四川长虹电器股份有限公司 一种场景自适应主动降噪方法及耳机
CN110418238A (zh) * 2019-08-21 2019-11-05 深圳市昂思科技有限公司 一种降噪蓝牙耳机
CN111886878A (zh) * 2020-02-13 2020-11-03 深圳市汇顶科技股份有限公司 一种用于降噪的助听方法、装置、芯片、耳机及存储介质

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115312067A (zh) * 2022-10-12 2022-11-08 深圳市婕妤达电子有限公司 基于人声的声音信号识别方法、装置及存储介质
CN115312067B (zh) * 2022-10-12 2022-12-27 深圳市婕妤达电子有限公司 基于人声的声音信号识别方法、装置及存储介质
CN116259301A (zh) * 2022-12-22 2023-06-13 北京市科学技术研究院城市安全与环境科学研究所 一种半耦合式的主动降噪方法及系统
CN116320878A (zh) * 2023-04-24 2023-06-23 深圳市齐奥通信技术有限公司 一种基于骨声纹传感器的耳机降噪方法及系统
CN117041803A (zh) * 2023-08-30 2023-11-10 江西瑞声电子有限公司 耳机播放的控制方法、电子设备及存储介质
CN117061927A (zh) * 2023-08-30 2023-11-14 江西瑞声电子有限公司 一种耳机播放的控制方法、电子设备及存储介质
CN117061927B (zh) * 2023-08-30 2024-03-22 江西瑞声电子有限公司 一种耳机播放的控制方法、电子设备及存储介质
CN117041803B (zh) * 2023-08-30 2024-03-22 江西瑞声电子有限公司 耳机播放的控制方法、电子设备及存储介质
CN117012202A (zh) * 2023-10-07 2023-11-07 北京探境科技有限公司 语音通道识别方法、装置、存储介质及电子设备
CN117012202B (zh) * 2023-10-07 2024-03-29 北京探境科技有限公司 语音通道识别方法、装置、存储介质及电子设备
CN117854514A (zh) * 2024-03-06 2024-04-09 深圳市增长点科技有限公司 一种音质保真的无线耳机通信解码优化方法及系统
CN117854514B (zh) * 2024-03-06 2024-05-31 深圳市增长点科技有限公司 一种音质保真的无线耳机通信解码优化方法及系统

Also Published As

Publication number Publication date
EP4254979A4 (en) 2024-05-08
WO2022135340A1 (zh) 2022-06-30
EP4254979A1 (en) 2023-10-04
US12488776B2 (en) 2025-12-02
US20230335101A1 (en) 2023-10-19

Similar Documents

Publication Publication Date Title
CN114666695A (zh) 一种主动降噪的方法、设备及系统
US12069470B2 (en) System and method for assisting selective hearing
CN112767908B (zh) 基于关键声音识别的主动降噪方法、电子设备及存储介质
US20230164509A1 (en) System and method for headphone equalization and room adjustment for binaural playback in augmented reality
US11048472B2 (en) Dynamically adjustable sound parameters
EP3857912B1 (en) Beamforming using an in-ear audio device
CN111916101B (zh) 一种融合骨振动传感器和双麦克风信号的深度学习降噪方法及系统
US8897455B2 (en) Microphone array subset selection for robust noise reduction
US20160078880A1 (en) Systems and Methods for Restoration of Speech Components
CN103392349A (zh) 用于空间选择性音频增强的系统、方法、设备和计算机可读媒体
CN110708625A (zh) 基于智能终端的环境声抑制与增强可调节耳机系统与方法
KR20170053623A (ko) 사운드 소스들을 향상시키기 위한 방법 및 장치
CN113593612B (zh) 语音信号处理方法、设备、介质及计算机程序产品
CN119946506B (zh) 一种音频处理方法、电子设备及存储介质
CN114067782B (zh) 音频识别方法及其装置、介质和芯片系统
WO2022256577A1 (en) A method of speech enhancement and a mobile computing device implementing the method
JPWO2022023417A5 (zh)
CN117896469B (zh) 音频分享方法、装置、计算机设备和存储介质
US12452610B2 (en) Methods for synthesis-based clear hearing under noisy conditions
US11812224B2 (en) Hearing device comprising a delayless adaptive filter
Kulhandjian et al. AI-powered Emergency Keyword Detection for Autonomous Vehicles
CN120877696A (zh) 降噪方法、装置、设备、存储介质和程序产品
CN120434550A (zh) 一种双耳机音效调节方法、系统、存储介质及程序产品
CN118447866A (zh) 一种音频处理方法及电子设备
Lai Analysis and extension of time frequency masking to multiple microphones

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination