RU2017103938A - Способ и устройство обнаружения голосовой активности - Google Patents
Способ и устройство обнаружения голосовой активности Download PDFInfo
- Publication number
- RU2017103938A RU2017103938A RU2017103938A RU2017103938A RU2017103938A RU 2017103938 A RU2017103938 A RU 2017103938A RU 2017103938 A RU2017103938 A RU 2017103938A RU 2017103938 A RU2017103938 A RU 2017103938A RU 2017103938 A RU2017103938 A RU 2017103938A
- Authority
- RU
- Russia
- Prior art keywords
- vad
- class
- snr
- result
- existing
- Prior art date
Links
- 238000001514 detection method Methods 0.000 title claims 4
- 230000000694 effects Effects 0.000 title claims 3
- 238000011156 evaluation Methods 0.000 claims 35
- 230000007774 longterm Effects 0.000 claims 18
- 238000000034 method Methods 0.000 claims 10
- 238000013480 data collection Methods 0.000 claims 2
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Telephone Function (AREA)
- Noise Elimination (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Telephonic Communication Services (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- User Interface Of Digital Computer (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Claims (42)
1. Способ обнаружения голосовой активности (VAD), состоящий из:
получения, по меньшей мере, одного признака первого класса в первой категории признаков, по меньшей мере, одного признака второго класса во второй категории признаков и, по меньшей мере, двух существующих результатов оценки VAD, причем признак первого класса и признак второго класса - это признаки, используемые для обнаружения VAD; а также
выполнения в соответствии с признаком первого класса, признаком второго класса и, по меньшей мере, двумя существующими результатами оценки VAD с целью получения комбинированного результата оценки VAD.
2. Способ по п. 1, в котором признак первого класса в первой категории признаков содержит, по меньшей мере, одно из следующего: количество непрерывных активных кадров, среднее общее соотношение сигнал/шум (SNR) всех поддиапазонов и флаг сигнала тональности, при этом среднее общее SNR всех поддиапазонов представляет собой среднее значение SNR по всем поддиапазонам для заданного количества кадров; а также
признак второго класса во второй категории признаков содержит, по меньшей мере, одно из следующего: флаг типа шума, сглаженную усредненную область SNR с длительной частотой, количество кадров непрерывного шума и частотную область SNR.
3. Способ по п. 2, в котором выполнение VAD согласно признака первого класса, признака второго класса и, по меньшей мере, двум существующим результатам оценки VAD, содержит:
a) в результате выбора одного результата оценки VAD из, по крайней мере, двух существующих результатов оценки VAD, появляется начальное значение комбинированного VAD;
b) выбор флага VAD, который не выбран в качестве начального значения, по меньшей мере, из двух существующих результатов оценки VAD, в качестве комбинированного результата оценки VAD, если флаг типа шума указывает, что тип шума является тишиной, SNR в частотной области больше заданного порогового значения, а начальное значение указывает на неактивный кадр, в противном случае, выполняется Этап с), причем флаг VAD используется для указания того, что является результатом оценки VAD: активный кадр или неактивный кадр;
c) выполнение Этапа d), если сглаженное усредненное значение SNR в долговременной частотной области меньше заданного порогового значения или тип шума не является тишиной, в противном случае, выбор результата оценки VAD, выбранного на Этапе а), в качестве комбинированного результата оценки VAD;
d) выполнение логической операции ИЛИ на, по меньшей мере, двух существующих результатах оценки VAD и использование результата логической операции ИЛИ в качестве комбинированного результата оценки VAD при выполнении заданного условия, в противном случае, выполнение Этапа е); а также
e) выбор флага VAD, который не выбран в качестве начального значения, по меньшей мере, по двум существующим результатам оценки VAD в качестве комбинированного результата оценки VAD, если флаг типа шума указывает на то, что тип шума является тишиной, в противном случае, выбор результата оценки VAD, выбранного на Этапе а), в качестве комбинированного результата оценки VAD.
4. Способ по п. 2, в котором выполнение VAD согласно признака первого класса, признака второго класса и, по меньшей мере, двум существующим результатам оценки VAD, содержит:
a) в результате выбора одного результата оценки VAD из, по крайней мере, двух существующих результатов оценки VAD, появляется начальное значение комбинированного VAD;
b) выбор флага VAD, который не выбран в качестве начального значения, по меньшей мере, из двух существующих результатов оценки VAD, в качестве комбинированного результата оценки VAD, если флаг типа шума указывает, что тип шума является тишиной, SNR в частотной области больше заданного порогового значения, а начальное значение указывает на неактивный кадр, в противном случае, выполняется Этап с), причем флаг VAD используется для указания того, что является результатом оценки VAD: активный кадр или неактивный кадр;
c) выполнение Этапа d), если сглаженное усредненное значение SNR в долговременной частотной области меньше заданного порогового значения или тип шума не является тишиной, в противном случае, выбор результата оценки VAD, выбранного на Этапе а), в качестве комбинированного результата оценки VAD;
d) выполнение логической операции ИЛИ на, по меньшей мере, двух существующих результатах оценки VAD и использование результата логической операции ИЛИ в качестве комбинированного результата оценки VAD при выполнении заданного условия, в противном случае, выполнение Этапа е); а также
e) выбор флага VAD, который не выбран в качестве начального значения, по меньшей мере, в двух существующих результатах оценки VAD, выбирается в качестве комбинированного результата оценки VAD.
5. Способ по п. 2, в котором выполнение VAD согласно признака первого класса, признака второго класса и, по меньшей мере, двум существующим результатам оценки VAD, содержит:
a) в результате выбора одного результата оценки VAD из, по крайней мере, двух существующих результатов оценки VAD, появляется начальное значение комбинированного VAD; и
b) выбор флага VAD, который не выбран в качестве начального значения, по меньшей мере в двух существующих результатах оценки VAD в качестве комбинированного результата оценки VAD, если флаг типа шума указывает на то, что тип шума является тишиной, сглаженное усредненное значение SNR в долговременной частотной области больше порогового значения, а флаг сигнала тональности указывает на нетональный сигнал, в котором флаг VAD используется для указания того, что результат оценки VAD является активным кадром или неактивным кадром.
6. Способ по п. 2, в котором выполнение VAD согласно признака первого класса, признака второго класса и, по меньшей мере, двум существующим результатам оценки VAD, содержит:
a) в результате выбора одного результата оценки VAD из, по крайней мере, двух существующих результатов оценки VAD, появляется начальное значение комбинированного VAD; и
b) проведение логической операции ИЛИ, по крайней мере, по двум существующим результатам оценки VAD и использование результата логической операции ИЛИ в качестве комбинированного результата оценки VAD, если типом шума является не тишина и выполнено заданное условие.
7. Способ по любому из пп. 3, 4 или 6, в котором предварительно заданное условие содержит, по меньшей мере, одно из следующих:
условие 1: среднее общее SNR всех поддиапазонов больше, чем первое пороговое значение;
условие 2: среднее общее SNR всех поддиапазонов больше второго порогового значения, а количество непрерывных активных кадров больше заданного порогового значения; а также
условие 3: флаг сигнала тональности указывает на тональный сигнал.
8. Способ по п. 2, в котором выполнение VAD согласно признака первого класса, признака второго класса и, по меньшей мере, двум существующим результатам оценки VAD, содержит:
выполнение логической операции И, по меньшей мере, по двум существующим результатам оценки VAD и использование результата логической операции И в качестве комбинированного результата оценки VAD, если количество непрерывных шумовых кадров больше, чем первое назначенное пороговое значение, а среднее общее значение SNR по всем поддиапазонам меньше второго назначенного порога; в противном же случае, случайный выбор одного из существующих результатов оценки VAD из, по меньшей мере, двух существующих результатов оценки VAD в качестве комбинированного результата оценки VAD.
9. Способ по п. 2, в котором сглаженное усредненное значение SNR в долговременной частотной области и флаг типа шума определяются с помощью следующих режимов:
вычисление средней энергии долговременных активных кадров текущего кадра и средней энергии долговременных фоновых шумов текущего кадра в соответствии с любым результатом оценки VAD в комбинированном результате оценки VAD предыдущего кадра текущего кадра или, по меньшей мере, два существующих результата оценки VAD, соответствующие предыдущему кадру, средняя энергия длительных активных кадров предыдущего кадра в течение первого заданного периода времени и средняя энергия долговременного фонового шума предыдущего кадра;
вычисление долговременного SNR текущего кадра в течение второго периода времени в соответствии со средней энергией долговременного фонового шума и средней энергией долговременных активных кадров текущего кадра в течение второго заданного периода времени;
вычисление сглаженного усредненного значения SNR в долговременной частотной области текущего кадра в течение третьего заданного периода времени в соответствии с любым результатом оценки VAD в комбинированном результате оценки VAD текущего кадра или, по меньшей мере, по двум существующим результатам оценки VAD, соответствующим предыдущему кадру и среднему значению SNR частотной области предыдущего кадра; а также
определение флага типа шума в соответствии с долговременным SNR и сглаженным усредненным значением SNR в долговременной частотной области.
10. Способ по п. 9, в котором определение флага типа шума в соответствии с долговременным SNR и сглаженным усредненным значением SNR в долговременной частотной области содержит:
задание флага типа шума на отсутствие тишины и задание флага типа шума на тишину, когда долговременное SNR больше, чем первое предварительно установленное пороговое значение, а сглаженное усредненное значение SNR в долговременной частотной области больше, чем второе заданное пороговое значение.
11. Устройство обнаружения голосовой активности (VAD), содержащее:
компонент сбора данных, выполненный с возможностью получения, по меньшей мере, одного признака первого класса в первой категории признаков, по меньшей мере, одного признака второго класса во второй категории признаков и, по меньшей мере, двух существующих результатов оценки VAD, причем признак первого класса и признак второго класса суть признаки, используемые для обнаружения VAD; а также
компонент обнаружения, выполненный с возможностью выполнения VAD в соответствии с признаком первого класса, признаком второго класса и, по меньшей мере, двумя существующими результатами оценки VAD с целью получения комбинированного результата оценки VAD.
12. Устройство по п. 11, в котором компонент сбора данных содержит:
первый блок обнаружения, скомпонованный для обнаружения признака первого класса в первой категории признаков, которое содержит, по меньшей мере, одно из следующего: количество непрерывных активных кадров, среднее общее соотношение сигнал / шум (SNR) всех поддиапазонов и флаг сигнала тональности, при этом среднее общее SNR всех поддиапазонов представляет собой среднее значение SNR по всем поддиапазонам для заданного количества кадров; а также
второй блок сбора данных, скомпонованный для обнаружения признака второго класса во второй категории признаков, который содержит, по меньшей мере, одно из следующего: флаг типа шума, сглаженное усредненное значение SNR в долговременной частотной области, количество кадров непрерывного шума и частотную область SNR.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201410345942.3 | 2014-07-18 | ||
| CN201410345942.3A CN105261375B (zh) | 2014-07-18 | 2014-07-18 | 激活音检测的方法及装置 |
| PCT/CN2014/089490 WO2015117410A1 (zh) | 2014-07-18 | 2014-10-24 | 激活音检测的方法及装置 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| RU2017103938A true RU2017103938A (ru) | 2018-08-20 |
| RU2017103938A3 RU2017103938A3 (ru) | 2018-08-31 |
| RU2680351C2 RU2680351C2 (ru) | 2019-02-19 |
Family
ID=53777227
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2017103938A RU2680351C2 (ru) | 2014-07-18 | 2014-10-24 | Способ и устройство обнаружения голосовой активности |
Country Status (9)
| Country | Link |
|---|---|
| US (1) | US10339961B2 (ru) |
| EP (2) | EP4273861A3 (ru) |
| JP (1) | JP6606167B2 (ru) |
| KR (1) | KR102390784B1 (ru) |
| CN (1) | CN105261375B (ru) |
| CA (1) | CA2955652C (ru) |
| ES (1) | ES2959448T3 (ru) |
| RU (1) | RU2680351C2 (ru) |
| WO (1) | WO2015117410A1 (ru) |
Families Citing this family (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105261375B (zh) * | 2014-07-18 | 2018-08-31 | 中兴通讯股份有限公司 | 激活音检测的方法及装置 |
| CN107305774B (zh) * | 2016-04-22 | 2020-11-03 | 腾讯科技(深圳)有限公司 | 语音检测方法和装置 |
| CN115719592A (zh) * | 2016-08-15 | 2023-02-28 | 中兴通讯股份有限公司 | 一种语音信息处理方法和装置 |
| CN107331386B (zh) * | 2017-06-26 | 2020-07-21 | 上海智臻智能网络科技股份有限公司 | 音频信号的端点检测方法、装置、处理系统及计算机设备 |
| CN107393559B (zh) * | 2017-07-14 | 2021-05-18 | 深圳永顺智信息科技有限公司 | 检校语音检测结果的方法及装置 |
| CN107393558B (zh) * | 2017-07-14 | 2020-09-11 | 深圳永顺智信息科技有限公司 | 语音活动检测方法及装置 |
| CN108665889B (zh) * | 2018-04-20 | 2021-09-28 | 百度在线网络技术(北京)有限公司 | 语音信号端点检测方法、装置、设备及存储介质 |
| CN108806707B (zh) * | 2018-06-11 | 2020-05-12 | 百度在线网络技术(北京)有限公司 | 语音处理方法、装置、设备及存储介质 |
| CN108962284B (zh) * | 2018-07-04 | 2021-06-08 | 科大讯飞股份有限公司 | 一种语音录制方法及装置 |
| CN108848435B (zh) * | 2018-09-28 | 2021-03-09 | 广州方硅信息技术有限公司 | 一种音频信号的处理方法和相关装置 |
| EP3800640B1 (en) * | 2019-06-21 | 2024-10-16 | Shenzhen Goodix Technology Co., Ltd. | Voice detection method, voice detection device, voice processing chip and electronic apparatus |
| EP4004917A1 (en) | 2019-07-30 | 2022-06-01 | Aselsan Elektronik Sanayi ve Ticaret Anonim Sirketi | Multi-channel acoustic event detection and classification method |
| US11335361B2 (en) * | 2020-04-24 | 2022-05-17 | Universal Electronics Inc. | Method and apparatus for providing noise suppression to an intelligent personal assistant |
| CN115116441B (zh) * | 2022-06-27 | 2024-10-22 | 南京大鱼半导体有限公司 | 一种语音识别功能的唤醒方法、装置及设备 |
Family Cites Families (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6910011B1 (en) * | 1999-08-16 | 2005-06-21 | Haman Becker Automotive Systems - Wavemakers, Inc. | Noisy acoustic signal enhancement |
| US20020116186A1 (en) * | 2000-09-09 | 2002-08-22 | Adam Strauss | Voice activity detector for integrated telecommunications processing |
| US7860718B2 (en) * | 2005-12-08 | 2010-12-28 | Electronics And Telecommunications Research Institute | Apparatus and method for speech segment detection and system for speech recognition |
| US8756063B2 (en) * | 2006-11-20 | 2014-06-17 | Samuel A. McDonald | Handheld voice activated spelling device |
| EP2118889B1 (en) | 2007-03-05 | 2012-10-03 | Telefonaktiebolaget LM Ericsson (publ) | Method and controller for smoothing stationary background noise |
| US8503686B2 (en) | 2007-05-25 | 2013-08-06 | Aliphcom | Vibration sensor and acoustic voice activity detection system (VADS) for use with electronic systems |
| ES2371619B1 (es) * | 2009-10-08 | 2012-08-08 | Telefónica, S.A. | Procedimiento de detección de segmentos de voz. |
| CN102044242B (zh) * | 2009-10-15 | 2012-01-25 | 华为技术有限公司 | 语音激活检测方法、装置和电子设备 |
| US9401160B2 (en) * | 2009-10-19 | 2016-07-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and voice activity detectors for speech encoders |
| KR20120091068A (ko) * | 2009-10-19 | 2012-08-17 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 음성 활성 검출을 위한 검출기 및 방법 |
| US8626498B2 (en) * | 2010-02-24 | 2014-01-07 | Qualcomm Incorporated | Voice activity detection based on plural voice activity detectors |
| EP2561508A1 (en) | 2010-04-22 | 2013-02-27 | Qualcomm Incorporated | Voice activity detection |
| EP2494545A4 (en) * | 2010-12-24 | 2012-11-21 | Huawei Tech Co Ltd | METHOD AND DEVICE FOR DETECTING LANGUAGE ACTIVITIES |
| EP2656341B1 (en) * | 2010-12-24 | 2018-02-21 | Huawei Technologies Co., Ltd. | Apparatus for performing a voice activity detection |
| US20140006019A1 (en) * | 2011-03-18 | 2014-01-02 | Nokia Corporation | Apparatus for audio signal processing |
| US9330672B2 (en) * | 2011-10-24 | 2016-05-03 | Zte Corporation | Frame loss compensation method and apparatus for voice frame signal |
| CN104424956B9 (zh) * | 2013-08-30 | 2022-11-25 | 中兴通讯股份有限公司 | 激活音检测方法和装置 |
| CN105261375B (zh) * | 2014-07-18 | 2018-08-31 | 中兴通讯股份有限公司 | 激活音检测的方法及装置 |
| EP3309784B1 (en) * | 2014-07-29 | 2019-09-04 | Telefonaktiebolaget LM Ericsson (publ) | Esimation of background noise in audio signals |
| CN106328169B (zh) * | 2015-06-26 | 2018-12-11 | 中兴通讯股份有限公司 | 一种激活音修正帧数的获取方法、激活音检测方法和装置 |
| US9672841B2 (en) * | 2015-06-30 | 2017-06-06 | Zte Corporation | Voice activity detection method and method used for voice activity detection and apparatus thereof |
-
2014
- 2014-07-18 CN CN201410345942.3A patent/CN105261375B/zh active Active
- 2014-10-24 EP EP23183896.2A patent/EP4273861A3/en active Pending
- 2014-10-24 ES ES14882109T patent/ES2959448T3/es active Active
- 2014-10-24 CA CA2955652A patent/CA2955652C/en active Active
- 2014-10-24 KR KR1020177004532A patent/KR102390784B1/ko active Active
- 2014-10-24 JP JP2017502979A patent/JP6606167B2/ja active Active
- 2014-10-24 RU RU2017103938A patent/RU2680351C2/ru active
- 2014-10-24 US US15/326,842 patent/US10339961B2/en active Active
- 2014-10-24 WO PCT/CN2014/089490 patent/WO2015117410A1/zh not_active Ceased
- 2014-10-24 EP EP14882109.3A patent/EP3171363B1/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| US10339961B2 (en) | 2019-07-02 |
| US20170206916A1 (en) | 2017-07-20 |
| RU2680351C2 (ru) | 2019-02-19 |
| CA2955652C (en) | 2022-04-05 |
| CN105261375A (zh) | 2016-01-20 |
| EP3171363A1 (en) | 2017-05-24 |
| EP3171363B1 (en) | 2023-08-09 |
| RU2017103938A3 (ru) | 2018-08-31 |
| CA2955652A1 (en) | 2015-08-13 |
| CN105261375B (zh) | 2018-08-31 |
| JP6606167B2 (ja) | 2019-11-13 |
| EP4273861A2 (en) | 2023-11-08 |
| WO2015117410A1 (zh) | 2015-08-13 |
| KR20170035986A (ko) | 2017-03-31 |
| EP4273861A3 (en) | 2023-12-20 |
| KR102390784B1 (ko) | 2022-04-25 |
| JP2017521720A (ja) | 2017-08-03 |
| ES2959448T3 (es) | 2024-02-26 |
| EP3171363A4 (en) | 2017-07-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2017103938A (ru) | Способ и устройство обнаружения голосовой активности | |
| JP6793706B2 (ja) | 音声信号を検出するための方法および装置 | |
| US20150058002A1 (en) | Detecting Wind Noise In An Audio Signal | |
| KR101737824B1 (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 | |
| JP2016529555A (ja) | 音声活動検出方法及び装置 | |
| JP2013222113A5 (ru) | ||
| EP3526792B1 (en) | Voice activity detection method and apparatus | |
| RU2017105808A (ru) | Зависящее от гармоничности управление инструментом фильтрации гармоник | |
| JP2018505737A5 (ru) | ||
| KR101666521B1 (ko) | 입력 신호의 피치 주기 검출 방법 및 그 장치 | |
| JP2015097355A5 (ru) | ||
| RU2020114434A (ru) | Способ оценки фонового шума, блок оценки фонового шума и машиночитаемый носитель | |
| CN103794222A (zh) | 语音基音频率检测方法和装置 | |
| JP6064566B2 (ja) | 音響処理装置 | |
| JP5614261B2 (ja) | 雑音抑制装置、雑音抑制方法、及びプログラム | |
| CN114913869B (zh) | 一种对噪声影响低敏的鸟类声学多样性指数方法 | |
| CN109389993A (zh) | 一种语音数据采集方法、装置、设备及存储介质 | |
| US11205407B2 (en) | Song analysis device and song analysis program | |
| JP2015188642A (ja) | 呼吸音解析装置及び呼吸音解析方法、並びにコンピュータプログラム及び記録媒体 | |
| JP2018081277A (ja) | 音声区間検出方法、音声区間検出装置および音声区間検出プログラム | |
| CN115137329A (zh) | 心率检测方法及可穿戴设备 | |
| JP6298340B2 (ja) | 呼吸音解析装置及び呼吸音解析方法、並びにコンピュータプログラム及び記録媒体 | |
| JP6298339B2 (ja) | 呼吸音解析装置及び呼吸音解析方法、並びにコンピュータプログラム及び記録媒体 | |
| JP2015119404A (ja) | マルチパス判定装置 | |
| JP2015188601A (ja) | 呼吸音解析装置及び呼吸音解析方法、並びにコンピュータプログラム及び記録媒体 |