KR20160039677A - 보이스 활성화 탐지 방법 및 장치 - Google Patents
보이스 활성화 탐지 방법 및 장치 Download PDFInfo
- Publication number
- KR20160039677A KR20160039677A KR1020167005654A KR20167005654A KR20160039677A KR 20160039677 A KR20160039677 A KR 20160039677A KR 1020167005654 A KR1020167005654 A KR 1020167005654A KR 20167005654 A KR20167005654 A KR 20167005654A KR 20160039677 A KR20160039677 A KR 20160039677A
- Authority
- KR
- South Korea
- Prior art keywords
- frame
- composition
- parameter
- value
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/81—Detection of presence or absence of voice signals for discriminating voice from music
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
- G10L2025/786—Adaptive threshold
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mathematical Physics (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
도2는 본 발명의 실시예2에서 제공되는 보이스 활성화 탐지 방법으 흐름도.
도3은 본 발명의 실시예4에서 제공되는 보이스 활성화 탐지 장치의 구조도.
도4는 도3 중의 파라미터 취득 모듈(302)의 구조도.
Claims (16)
상기 방법에는 연속 보이스 활성화 프레임 수량, 평균 전(全) 대역 신호대잡음비, 조성(調性) 신호 아이디와 적어도 두 가지 기존의 보이스 활성화 탐지(VAD) 판단 결과에 의하여 최종 연합 VAD 판단 결과를 취득하는 것이 포함되는 것을 특징으로 하는 보이스 활성화 탐지 방법.
현재 프레임의 서브밴드 신호 및 주파수 스펙트럼 진폭값을 취득하는 단계;
서브밴드 신호에 의하여 현재 프레임의 프레임 에너지 파라미터, 스펙트럼 무게중심 특징 파라미터 및 시간 도메인 안정도 특징 파라미터의 값을 산출하는 단계;
주파수 스펙트럼 진폭값에 의하여 스펙트럼 편평도 특징 파라미터 및 조성 특징 파라미터의 값을 산출하는 단계;
조성 특징 파라미터, 스펙트림 무게중심 특징 파라미터, 시간 도메인 안정도 특징 파라미터, 스펙트럼 편평도 특징 파라미터에 의하여 상기 조성 신호 아이디를 산출하는 단계;가 포함되는 것을 특징으로 하는 보이스 활성화 탐지 방법.
전(前) 프레임에 의하여 추정하여 얻은 배경 노이즈 에너지를 취득하는 단계;
상기 전 프레임에 의하여 추정하여 얻은 배경 노이즈 에너지, 현재 프레임의 프레임 에너지 파라미터에 의하여 상기 평균 전 대역 신호대잡음비를 산출하는 단계;가 포함되는 것을 특징으로 하는 보이스 활성화 탐지 방법.
전 프레임의 서브밴드 신호 및 주파수 스펙트럼 진폭값을 취득하는 단계;
전 프레임 서브밴드 신호에 의하여 전 프레임의 프레임 에너지 파라미터, 스펙트럼 무게중심 특징 파라미터, 시간 도메인 안정도 특징 파라미터의 값을 산출하는 단계;
전 프레임 주파수 스펙트럼 진폭값에 의하여 전 프레임 스펙트럼 편평도 특징 파라미터 및 조성 특징 파라미터를 산출하는 단계;
전 프레임의 프레임 에너지 파라미터, 스펙트럼 무게중심 특징 파라미터, 시간 도메인 안정도 특징 파라미터, 스펙트럼 편평도 특징 파라미터, 조성 특징 파라미터에 의하여 전 프레임의 배경 노이즈 아이디를 산출하는 단계;
전 프레임의 조성 특징 파라미터, 스펙트림 무게중심 특징 파라미터, 시간 도메인 안정도 특징 파라미터, 스펙트럼 편평도 특징 파라미터에 의하여 전 프레임의 조성 신호 아이디를 산출하는 단계;
전 프레임의 배경 노이즈 아이디, 프레임 에너지 파라미터, 조성 신호 아이디, 전 제2 프레임의 전 대역 배경 노이즈 에너지에 의하여 전 프레임 전 대역 배경 노이즈 에너지를 취득하는 단계;가 포함되는 것을 특징으로 하는 보이스 활성화 탐지 방법.
상기 프레임 에너지 파라미터는 각 서브밴드 신호 에너지의 가중 중첩 값 또는 직접 중첩 값이며;
상기 스펙트럼 무게중심 특징 파라미터는 전부 또는 일부 서브밴드 신호 에너지의 가중 누적 값과 비가중 누적 값의 비율, 또는 상기 비율에 대하여 평활 필터링을 진행하여 취득한 값이며;
상기 시간 도메인 안정도 특징 파라미터는 다수의 인접된 두 프레임 에너지 진폭 값 중첩 값의 분산 또는 다수의 인접된 두 프레임 에너지 진폭 값 중첩 값 평방의 원하는 비율, 또는 상기 비율에 하나의 계수를 곱한 것이며;
상기 스펙트럼 편평도 특징 파라미터는 일부 주파수 스펙트럼 진폭 값의 기하 평균수와 산술 평균수의 비율, 또는 상기 비율에 하나의 계수를 곱한 것이며;
조성 특징 파라미터는 전후 두 프레임 신호의 프레임 내 주파수 스펙트럼 차분 계수의 관련 계수를 계산하여 취득하거나, 또는 계속하여 상기 관련 계수에 대하여 평활 필터링을 진행하여 취득하는 것인; 것을 특징으로 하는 보이스 활성화 탐지 방법.
A) 현재 프레임 신호가 비조성 신호이고, 하나의 조성 프레임 아이디 tonality_ frame으로 현재 프레임이 조성 프레임인지 여부를 지시하는 단계;
B) 조건 1: 조성 특징 파라미터 의 값 또는 이의 평활 필터링 후의 값이 대응되게 설정된 제1 조성 특징 파라미터 판단 역치보다 크며;
조건 2: 조성 특징 파라미터 의 값 또는 이의 평활 필터링 후의 값이 대응되게 설정된 제2 조성 특징 파라미터 역치보다 크며;
와 같은 상기 조건 중의 하나를 만족시킬 때 C) 단계를 실행하고, 상기 두 조건을 모두 만족시키지 않을 때 D) 단계를 실행하는 단계;
C) 현재 프레임이 조성 프레임인지 여부를 판단하고, 또한 판단 결과에 의하여 상기 조성 프레임 아이디의 값을 설정하는 단계;
조건 1: 상기 시간 도메인 안정도 특징 파라미터 값이 하나의 설정된 제1 시간 도메인 안정도 판단 역치보다 작으며;
조건 2: 스펙트럼 무게중심 특징 파라미터 값이 하나의 설정된 제1 스펙트럼 무게중심 판단 역치보다 크며;
조건 3: 각 서브밴드의 스펙트럼 편평도 특징 파라미터가 모두 각각 대응되는 사전 설정된 스펙트럼 편평도 판단 역치보다 작을 때, 현재 프레임을 조성 프레임으로 판단하고, 상기 조성 프레임 아이디의 값을 설정하며;
와 같은 상기 조건중의 전부 조건을 만족시킬 때 상기 현재 프레임을 조성 프레임으로 판단하고, 임의 하나 또는 다수의 상기 조건을 만족시키지 않을 때, 상기 현재 프레임을 비조성 프레임으로 판단하고 D) 단계를 실행하며,
D) 상기 조성 프레임 아이디에 의하여 조성 정도 특징 파라미터 에 대하여 업데이트를 수행하는 바, 그 중에서 조성 정도 파라미터 초기 값은 보이스 활성화 탐지가 시작될 때 설정되는 단계;
E) 업데이트된 상기 조성 정도 특징 파라미터 에 의하여 상기 현재 프레임이 조성 신호인지 여부를 판단하고, 또한 조성 아이디 tonality _flag의 값을 설정하는 단계;가 포함되는 것을 특징으로 하는 보이스 활성화 탐지 방법.
현재 프레임이 제2프레임 및 제2 프레임 후의 음성 프레임일 때, 전(前) 연합 VAD 판단 결과에 의하여 현재의 연속 보이스 활성화 프레임 수량 continuous_speech_num2를 산출하는 단계;
연합 VAD 아이디 vad_flag 아이디가 1일 때, continuous_speech_num2에 1을 더하는 단계;
vad_flag가 0으로 판단되면, continuous_speech_num2를 0으로 설정하는 단계;가 포함되는 것을 특징으로 하는 보이스 활성화 탐지 방법.
현재 프레임이 제1 프레임일 때, 상기 연속 보이스 활성화 프레임 수량은 0인 것을 포함하는 것을 특징으로 하는 보이스 활성화 탐지 방법.
조건 1: 평균 전 대역 신호대잡음비가 신호대잡음비 역치보다 크며;
조건 2: continuous_speech_num2가 연속 보이스 활성화 프레임 수량 역치보다 크고 또한 평균 전 대역 신호대잡음비가 신호대잡음비 역치보다 크며;
조건 3: 조성 신호 아이디가 1로 설정되는;
상기 조건중의 임의의 하나의 조건을 만족시킬 때, 적어도 두 가지 기존의 VAD의 판단 결과의 논리 연산을 선택하여 연합 VAD 판단 결과로 하고, 상기 적어도 하나의 조건을 만족시키지 않을 때, 상기 적어도 두 가지 기존의 VAD의 판단 결과 중의 하나의 기존의 VAD 판단 결과를 선택하여 연합 VAD 판단 결과로 하는 바, 그 중에서, 상기 논리 연산은 "OR" 연산 또는 "AND" 연산인 단계가 포함되는,
것을 특징으로 하는 보이스 활성화 탐지 방법.
조건 1: 적어도 두 개의 기존의 VAD 편단 결과가 모두 1이며;
조건 2: 적어도 두 개의 기존의 VAD 편단 결과의 합이 연합 판단 역치보다 크고, 또한 조성 신호 아이디가 1로 설정되며;
조건 3: continuous_speech_num2가 연속 보이스 활성화 프레임 수량 역치보다 크고 또한 평균 전 대역 신호대잡음비가 신호대잡음비 역치보다 크며, 조성 신호 아이디가 1로 설정되는;
상기 조건중의 임의의 하나의 조건을 만족시킬 때, 상기 연합 VAD 판단 결과는 1이리고, 상기 적어도 하나의 조건을 만족시키지 않을 때, 상기 적어도 두개의 기존의 VAD의 판단 결과의 논리 연산을 선택하여 출력으로 하며, 그 중에서, 논리 연산은 "OR" 연산 또는 "AND" 연산인 단계가 포함되는,
것을 특징으로 하는 보이스 활성화 탐지 방법.
연속 보이스 활성화 프레임 수량, 평균 전 대역 신호대잡음비, 조성 신호 아이디와 적어도 두 가지 기존의 VAD 판단 결과에 의하여 최종 연합 VAD 판단 결과를 취득하도록 설정되는 연합 판단 모듈이 포함되는 것을 특징으로 하는 보이스 활성화 탐지 장치.
현재 프레임의 서브밴드 신호 및 주파수 스펙트럼 진폭값을 취득하도록 설정되는 제1 파라미터 취득 유닛;
서브밴드 신호에 의하여 현재 프레임의 프레임 에너지 파라미터, 스펙트럼 무게중심 특징 파라미터 및 시간 도메인 안정도 특징 파라미터의 값을 산출하도록 설정되는 제2 파라미터 취득 유닛;
주파수 스펙트럼 진폭값에 의하여 스펙트럼 편평도 특징 파라미터 및 조성 특징 파라미터의 값을 산출하도록 설정되는 제3 파라미터 취득 유닛;
조성 특징 파라미터, 스펙트림 무게중심 특징 파라미터, 시간 도메인 안정도 특징 파라미터, 스펙트럼 편평도 특징 파라미터에 의하여 상기 조성 신호 아이디를 산출하도록 설정되는 제4 파라미터 취득 유닛;이 포함되는 것을 특징으로 하는 보이스 활성화 탐지 장치.
전 프레임에 의하여 추정하여 얻은 배경 노이즈 에너지를 취득하도록 설정되는 제5 파라미터 취득 유닛;
상기 전 프레임에 의하여 추정하여 얻은 배경 노이즈 에너지, 현재 프레임의 프레임 에너지 파라미터에 의하여 상기 평균 전 대역 신호대잡음비를 산출하도록 설정되는 제6 파라미터 취득 유닛;이 포함되는 것을 특징으로 하는 보이스 활성화 탐지 장치.
현재 프레임이 제1 프레임일 때, 상기 연속 보이스 활성화 프레임 수량을 0으로 확정하며;
현재 프레임이 제2프레임 및 제2 프레임 후의 음성 프레임일 때, 전 연합 VAD 판단 결과에 의하여 현재의 연속 보이스 활성화 프레임 수량 continuous_speech_num2를 산출하며;
연합 VAD 아이디 vad_flag 아이디가 1일 때, continuous_speech_num2에 1을 더하며;
vad_flag가 0으로 판단되면, continuous_speech_num2를 0으로 설정하도록 설정되는 제7 파라미트 취득 유닛이 포함되는 것을 특징으로 하는 보이스 활성화 탐지 장치.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201310390795.7A CN104424956B9 (zh) | 2013-08-30 | 2013-08-30 | 激活音检测方法和装置 |
| CN201310390795.7 | 2013-08-30 | ||
| PCT/CN2014/077704 WO2014177084A1 (zh) | 2013-08-30 | 2014-05-16 | 激活音检测方法和装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20160039677A true KR20160039677A (ko) | 2016-04-11 |
| KR101831078B1 KR101831078B1 (ko) | 2018-04-04 |
Family
ID=51843162
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020167005654A Active KR101831078B1 (ko) | 2013-08-30 | 2014-05-16 | 보이스 활성화 탐지 방법 및 장치 |
Country Status (7)
| Country | Link |
|---|---|
| US (1) | US9978398B2 (ko) |
| EP (1) | EP3040991B1 (ko) |
| JP (1) | JP6412132B2 (ko) |
| KR (1) | KR101831078B1 (ko) |
| CN (1) | CN104424956B9 (ko) |
| PL (1) | PL3040991T3 (ko) |
| WO (1) | WO2014177084A1 (ko) |
Families Citing this family (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE102013111784B4 (de) * | 2013-10-25 | 2019-11-14 | Intel IP Corporation | Audioverarbeitungsvorrichtungen und audioverarbeitungsverfahren |
| CN105261375B (zh) * | 2014-07-18 | 2018-08-31 | 中兴通讯股份有限公司 | 激活音检测的方法及装置 |
| US9953661B2 (en) * | 2014-09-26 | 2018-04-24 | Cirrus Logic Inc. | Neural network voice activity detection employing running range normalization |
| CN106328169B (zh) * | 2015-06-26 | 2018-12-11 | 中兴通讯股份有限公司 | 一种激活音修正帧数的获取方法、激活音检测方法和装置 |
| CN105654947B (zh) * | 2015-12-30 | 2019-12-31 | 中国科学院自动化研究所 | 一种获取交通广播语音中路况信息的方法及系统 |
| CN107305774B (zh) * | 2016-04-22 | 2020-11-03 | 腾讯科技(深圳)有限公司 | 语音检测方法和装置 |
| US10755718B2 (en) * | 2016-12-07 | 2020-08-25 | Interactive Intelligence Group, Inc. | System and method for neural network based speaker classification |
| IT201700044093A1 (it) * | 2017-04-21 | 2018-10-21 | Telecom Italia Spa | Metodo e sistema di riconoscimento del parlatore |
| CN107393559B (zh) * | 2017-07-14 | 2021-05-18 | 深圳永顺智信息科技有限公司 | 检校语音检测结果的方法及装置 |
| CN109427345B (zh) * | 2017-08-29 | 2022-12-02 | 杭州海康威视数字技术股份有限公司 | 一种风噪检测方法、装置及系统 |
| CN109859749A (zh) * | 2017-11-30 | 2019-06-07 | 阿里巴巴集团控股有限公司 | 一种语音信号识别方法和装置 |
| CN114999535A (zh) * | 2018-10-15 | 2022-09-02 | 华为技术有限公司 | 在线翻译过程中的语音数据处理方法及装置 |
| CN109801646B (zh) * | 2019-01-31 | 2021-11-16 | 嘉楠明芯(北京)科技有限公司 | 一种基于融合特征的语音端点检测方法和装置 |
| CN111292758B (zh) * | 2019-03-12 | 2022-10-25 | 展讯通信(上海)有限公司 | 语音活动检测方法及装置、可读存储介质 |
| KR20200114019A (ko) | 2019-03-27 | 2020-10-07 | 주식회사 공훈 | 음성의 피치 정보에 기초한 화자 식별 방법 및 그 장치 |
| WO2020252782A1 (zh) * | 2019-06-21 | 2020-12-24 | 深圳市汇顶科技股份有限公司 | 语音检测方法、语音检测装置、语音处理芯片以及电子设备 |
| US11823706B1 (en) * | 2019-10-14 | 2023-11-21 | Meta Platforms, Inc. | Voice activity detection in audio signal |
| CN111739562B (zh) * | 2020-07-22 | 2022-12-23 | 上海大学 | 一种基于数据选择性和高斯混合模型的语音活动检测方法 |
| CN112908350B (zh) * | 2021-01-29 | 2022-08-26 | 展讯通信(上海)有限公司 | 一种音频处理方法、通信装置、芯片及其模组设备 |
| CN115862685B (zh) * | 2023-02-27 | 2023-09-15 | 全时云商务服务股份有限公司 | 一种实时语音活动的检测方法、装置和电子设备 |
Family Cites Families (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5884255A (en) | 1996-07-16 | 1999-03-16 | Coherent Communications Systems Corp. | Speech detection system employing multiple determinants |
| US20020116186A1 (en) * | 2000-09-09 | 2002-08-22 | Adam Strauss | Voice activity detector for integrated telecommunications processing |
| JP4123835B2 (ja) | 2002-06-13 | 2008-07-23 | 松下電器産業株式会社 | 雑音抑圧装置および雑音抑圧方法 |
| US7860718B2 (en) | 2005-12-08 | 2010-12-28 | Electronics And Telecommunications Research Institute | Apparatus and method for speech segment detection and system for speech recognition |
| WO2009000073A1 (en) * | 2007-06-22 | 2008-12-31 | Voiceage Corporation | Method and device for sound activity detection and sound signal classification |
| ES2371619B1 (es) * | 2009-10-08 | 2012-08-08 | Telefónica, S.A. | Procedimiento de detección de segmentos de voz. |
| CN102044242B (zh) * | 2009-10-15 | 2012-01-25 | 华为技术有限公司 | 语音激活检测方法、装置和电子设备 |
| CN102044243B (zh) * | 2009-10-15 | 2012-08-29 | 华为技术有限公司 | 语音激活检测方法与装置、编码器 |
| US9773511B2 (en) | 2009-10-19 | 2017-09-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Detector and method for voice activity detection |
| US8626498B2 (en) | 2010-02-24 | 2014-01-07 | Qualcomm Incorporated | Voice activity detection based on plural voice activity detectors |
| KR20140026229A (ko) * | 2010-04-22 | 2014-03-05 | 퀄컴 인코포레이티드 | 음성 액티비티 검출 |
| US8898058B2 (en) * | 2010-10-25 | 2014-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for voice activity detection |
| ES2740173T3 (es) * | 2010-12-24 | 2020-02-05 | Huawei Tech Co Ltd | Un método y un aparato para realizar una detección de actividad de voz |
| CN102741918B (zh) * | 2010-12-24 | 2014-11-19 | 华为技术有限公司 | 用于话音活动检测的方法和设备 |
| JP5737808B2 (ja) | 2011-08-31 | 2015-06-17 | 日本放送協会 | 音響処理装置およびそのプログラム |
| US9111531B2 (en) | 2012-01-13 | 2015-08-18 | Qualcomm Incorporated | Multiple coding mode signal classification |
| US9099098B2 (en) * | 2012-01-20 | 2015-08-04 | Qualcomm Incorporated | Voice activity detection in presence of background noise |
| CN103117067B (zh) * | 2013-01-19 | 2015-07-15 | 渤海大学 | 一种低信噪比下语音端点检测方法 |
-
2013
- 2013-08-30 CN CN201310390795.7A patent/CN104424956B9/zh active Active
-
2014
- 2014-05-16 KR KR1020167005654A patent/KR101831078B1/ko active Active
- 2014-05-16 EP EP14791094.7A patent/EP3040991B1/en active Active
- 2014-05-16 WO PCT/CN2014/077704 patent/WO2014177084A1/zh not_active Ceased
- 2014-05-16 JP JP2016537092A patent/JP6412132B2/ja active Active
- 2014-05-16 PL PL14791094T patent/PL3040991T3/pl unknown
- 2014-05-16 US US14/915,246 patent/US9978398B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| PL3040991T3 (pl) | 2021-08-02 |
| CN104424956B9 (zh) | 2022-11-25 |
| JP2016529555A (ja) | 2016-09-23 |
| KR101831078B1 (ko) | 2018-04-04 |
| WO2014177084A1 (zh) | 2014-11-06 |
| CN104424956B (zh) | 2018-09-21 |
| US9978398B2 (en) | 2018-05-22 |
| US20160203833A1 (en) | 2016-07-14 |
| EP3040991B1 (en) | 2021-04-14 |
| EP3040991A4 (en) | 2016-09-14 |
| CN104424956A (zh) | 2015-03-18 |
| EP3040991A1 (en) | 2016-07-06 |
| JP6412132B2 (ja) | 2018-10-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101831078B1 (ko) | 보이스 활성화 탐지 방법 및 장치 | |
| CN105261375B (zh) | 激活音检测的方法及装置 | |
| CN103903634B (zh) | 激活音检测及用于激活音检测的方法和装置 | |
| US9672841B2 (en) | Voice activity detection method and method used for voice activity detection and apparatus thereof | |
| EP4641568A2 (en) | Voice activity modification frame acquiring method, and voice activity detection method and apparatus | |
| US9959886B2 (en) | Spectral comb voice activity detection | |
| CN103026407A (zh) | 带宽扩展器 | |
| CN106991998A (zh) | 噪声环境下语音端点的检测方法 | |
| CN112530450A (zh) | 频域中的样本精度延迟识别 | |
| CN102231279B (zh) | 基于听觉关注度的音频质量客观评价系统及方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A201 | Request for examination | ||
| PA0105 | International application |
Patent event date: 20160302 Patent event code: PA01051R01D Comment text: International Patent Application |
|
| PA0201 | Request for examination | ||
| PG1501 | Laying open of application | ||
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20170328 Patent event code: PE09021S01D |
|
| AMND | Amendment | ||
| E601 | Decision to refuse application | ||
| PE0601 | Decision on rejection of patent |
Patent event date: 20170925 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20170328 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |
|
| AMND | Amendment | ||
| PX0901 | Re-examination |
Patent event code: PX09011S01I Patent event date: 20170925 Comment text: Decision to Refuse Application Patent event code: PX09012R01I Patent event date: 20170529 Comment text: Amendment to Specification, etc. |
|
| PX0701 | Decision of registration after re-examination |
Patent event date: 20171127 Comment text: Decision to Grant Registration Patent event code: PX07013S01D Patent event date: 20171025 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I Patent event date: 20170925 Comment text: Decision to Refuse Application Patent event code: PX07011S01I Patent event date: 20170529 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I |
|
| X701 | Decision to grant (after re-examination) | ||
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20180213 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20180213 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration | ||
| PR1001 | Payment of annual fee |
Payment date: 20210125 Start annual number: 4 End annual number: 4 |
|
| PR1001 | Payment of annual fee |
Payment date: 20220203 Start annual number: 5 End annual number: 5 |
|
| PR1001 | Payment of annual fee |
Payment date: 20240102 Start annual number: 7 End annual number: 7 |
|
| PR1001 | Payment of annual fee |
Payment date: 20241230 Start annual number: 8 End annual number: 8 |