[go: up one dir, main page]

NL1013500C2 - Inrichting voor het schatten van de frequentie-inhoud of het spectrum van een geluidssignaal in een ruizige omgeving. - Google Patents

Inrichting voor het schatten van de frequentie-inhoud of het spectrum van een geluidssignaal in een ruizige omgeving. Download PDF

Info

Publication number
NL1013500C2
NL1013500C2 NL1013500A NL1013500A NL1013500C2 NL 1013500 C2 NL1013500 C2 NL 1013500C2 NL 1013500 A NL1013500 A NL 1013500A NL 1013500 A NL1013500 A NL 1013500A NL 1013500 C2 NL1013500 C2 NL 1013500C2
Authority
NL
Netherlands
Prior art keywords
signal
input
segment
basilar membrane
time
Prior art date
Application number
NL1013500A
Other languages
English (en)
Inventor
Tjeerd Catharinus Andringa
Hendricus Duifhuis
Original Assignee
Huq Speech Technologies B V
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to NL1013500A priority Critical patent/NL1013500C2/nl
Application filed by Huq Speech Technologies B V filed Critical Huq Speech Technologies B V
Priority to JP2001535156A priority patent/JP4566493B2/ja
Priority to CN00818227.2A priority patent/CN1286084C/zh
Priority to DE60033549T priority patent/DE60033549T2/de
Priority to EP00980108A priority patent/EP1228502B1/en
Priority to AU17408/01A priority patent/AU1740801A/en
Priority to PCT/NL2000/000808 priority patent/WO2001033547A1/en
Priority to AT00980108T priority patent/ATE354849T1/de
Priority to CA2390244A priority patent/CA2390244C/en
Priority to US10/129,460 priority patent/US6745155B1/en
Application granted granted Critical
Publication of NL1013500C2 publication Critical patent/NL1013500C2/nl

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R23/00Arrangements for measuring frequencies; Arrangements for analysing frequency spectra
    • G01R23/16Spectrum analysis; Fourier analysis
    • G01R23/175Spectrum analysis; Fourier analysis by delay means, e.g. tapped delay lines
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Complex Calculations (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

NL 44.228-VB/yt
Inrichting voor het schatten van de frequentie-inhoud of het spectrum van een geluidssignaal in een ruizige omgeving
De uitvinding heeft betrekking op een inrichting voor het schatten van de frequentie-inhoud of het spectrum van een geluidssignaal dat met ruis is behept, omvattende een basilair membraanmodel waaraan het geluidssignaal is toege-5 voerd welk model een aantal in serie geschakelde segmenten omvat, en een op het basilair membraan aangesloten laagband-filter welke een geschat signaal verschaft.
Een dergelijke inrichting is bekend uit het artikel "Using an Auditory Model and Leaky Autocorrelators to Tune In 10 to Speech" van T. Andringa, gepubliceerd in ESCA Eurospeech 97, Rhodes, Greece, ISSN 1018-4074, pagina 2859-2862. Uit dit artikel is het bekend om gebruik te maken van een gehoormodel dat de werkingsprincipes van het basilair membraan nabootst. De uitgang van de segmenten van het model wordt gebruikt als 15 een ingang voor een verzameling van lekkende autocorrelator-eenheden die afgestemd zijn op een zekere periodiciteit. De activiteit van de responsgevende autocorrelatoreenheden als een functie van het segmentnummer is daarbij een directe maat voor het spectrum van de klinker die gedetecteerd dient te 2 0 worden.
Met deze inrichting uit de stand van de techniek is het mogelijk om in situaties waarin het signaal met ruis is vervuild, een energiespeetrum te reconstrueren waarvan de fundamentele periode zowel bekend als constant is. Het pro-25 bleem doet zich echter voor dat de bekende inrichting niet voorziet in de juiste reconstructie van een energiespectrum wanneer de periode onbekend is, niet constant is, of beiden. Doelstelling van de uitvinding is te voorzien in een inrichting waarmee een juiste klankreconstructie mogelijk is wan-30 neer de periode van het geluidssignaal onbekend is, en bovendien niet constant is.
In een eerste aspect van de uitvinding wordt de inrichting van de in de aanhef bedoelde soort er daartoe door gekenmerkt, dat het laagbandfilter is vormgegeven als een 35 vermenigvuldigingsorgaan met een eerste en een tweede ingang, 1 013500 2 waarbij aan de eerste ingang een van een segment van het ba-silair membraan afkomstig en gedurende een voorafbepaalde tijdsperiode aanwezig signaal is toegevoerd, dat aan de tweede ingang het signaal over een instelbare tijd Tl verschoven 5 is toegevoerd, en dat het vermenigvuldigingsorgaan een van de tijd Tl afhankelijk uitgangssignaal verschaft dat afhankelijk is van de in het signaal van dat segment in hoofdzaak aanwezige frequentie, en een maat vormt voor de frequentie-inhoud van het geluidssignaal.
10 In een tweede aspect van de uitvinding wordt de in richting van de in de aanhef bedoelde soort er daartoe door gekenmerkt, dat het laagbandfilter is vormgegeven als een vermenigvuldigingsorgaan met een eerste en een tweede ingang, waarbij voor ieder segment van het basilair membraan aan de 15 eerste ingang een van dat segment afkomstig signaal is toegevoerd, dat aan de tweede ingang het signaal over een tijd T2 verschoven is toegevoerd, en dat het vermenigvuldigingsorgaan een van het segment afhankelijk uitgangssignaal verschaft dat een maat vormt voor een tijdens de tijdsperiode in het ge-20 luidssignaal in hoofdzaak aanwezig freguentie-energiespec-trum.
De uitvinding zal nu nader worden toegelicht aan de hand van de tekening, welke in fig. 1 een schema toont van het bekende basilair 25 membraan; in fig. 2 een blokschema toont van de inrichting volgens de uitvinding; in fig. 3 de autocorrelatiefunctie wordt getoond welke bepaald is ten aanzien van één segment van het basilair 3 0 membraanmode1; in fig. 4 het geschatte frequentie-energiespectrum toont dat is bepaald met betrekking tot alle segmenten van het basilair membraanmodel; in fig. 5 de resultaten van fig. 3 en fig. 4 geag-35 gregeerd in een tweedimensionale figuur weergeeft; en in de fig. 6, 7 en 8 blokschema's getoond zijn van de inrichting.
Verwijzend nu eerst naar fig. 1 wordt een deel van het elektrotechnisch vervangingsschema van het basilair mem- 1013500 3 braan van het binnenoor getoond. Aan de linkerzijde in de figuur kan een ingangssignaal Vsound worden aangeboden, dat verwerkt wordt door een serie van tot 400 met elkaar gekoppelde tweede-orde-filters, segmenten genaamd. Ieder twee-or-5 de-filter representeert een zekere massatraagheid (spoelen), stijfheid en demping, welke bepaalt hoe snel trillingen in het aangeboden signaal Vsound door de aan elkaar geschakelde tweede-orde-filters worden uitgedempt. Gemodelleerd naar het feitelijk binnenoor vindt een koppeling van de onderscheiden 10 segmenten plaats naar de zenuwbanen die de geluidssignaalin-drukken doorgeven aan de hersenen.
Met behulp van een dergelijk in fig. 1 afgebeeld elektrisch vervangingsmodel van het basilair membraan is de inrichting volgens de uitvinding werkzaam. Het basilair mem-15 braanmodel van fig. 1 is daartoe in fig. 2 in het blok met verwijzingscijfer 1 opgenomen. Aan het basilair membraanmodel 1 wordt een geluidssignaal 2 toegevoerd dat verruist kan zijn. Op een of meer segmenten van het basilair membraanmodel 1 wordt een laagbandfilter 3 aangesloten. Dit laagbandfilter 20 3 levert een uitgangssignaal 4 op welke een schatting vormt van het ingangssignaal 2.
De essentie van de uitvinding is gelegen in de keuze van de filterfunctie die in het laagbandfilter 3 is opgenomen. In een eerste variant van de uitvinding is het laagband-25 filter daartoe vormgegeven als een vermenigvuldigingsorgaan met een eerste en een tweede ingang, waarbij aan de eerste ingang een van een segment van het basilair membraan afkomstig en gedurende een voorafbepaalde tijdsperiode aanwezig signaal is toegevoerd, dat aan de tweede ingang het signaal 30 over een instelbare tijd Tl verschoven is toegevoerd, en dat het vermenigvuldigingsorgaan een van de tijd Tl afhankelijk uitgangssignaal verschaft dat afhankelijk is van de in het signaal van dat segment in hoofdzaak aanwezige frequentie, en een maat vormt voor de frequentie-inhoud van het geluidssig-35 naai.
In een andere variant van de uitvinding is het laagbandfilter vormgegeven als een vermenigvuldigingsorgaan met een eerste en een tweede ingang, waarbij voor ieder segment van het basilair membraan aan de eerste ingang een van dat 1013500 4 segment afkomstig signaal is toegevoerd, dat aan de tweede ingang het signaal over een tijd T2 verschoven is toegevoerd, en dat het vermenigvuldigingsorgaan een van het segment afhankelijk uitgangssignaal verschaft dat een maat vormt voor 5 een tijdens de tijdsperiode in het geluidssignaal in hoofdzaak aanwezig frequentie-energiespeet rum.
In een meer wiskundig formularium en grafisch weergegeven kan de uitvinding verder als volgt worden toegelicht.
Voor de berekening van de frequentie-inhoud en het 10 frequentie-energiespectrum wordt telkens gebruik gemaakt van het in fig. 6 getoonde blokschema. Hierin representeert xe(t) het van het basilair membraanmodel 1 afkomstige signaal, en heeft T betrekking op een instelbare tijdverschuiving. Er geldt: α = e'st/T, verder wordt gewerkt met een tijdas (voor t 15 en T) die zodanig geschaald is dat δt = 1.
Bij de implementatie van de inrichting voor het bepalen van de frequentie-inhoud is het informatiesignaal dat afkomstig is van het basilair membraanmodel 1, een segment-reeks s(t) die een stapsgewijze continue functie is, zodat 20 binnen een voorafbepaalde tijdsperiode in de in fig. 7 getoonde grafische weergave het segmentnummer constant is.
De outputverzameling {r^ 0(f).....r*(/) r (0) representeert de lo pende autocorrelatie onder het segmentcontour op tijdstip t.
Fig. 3 toont een typisch verloop van bovenbedoelde outputverzameling op een zeker tijdstip t waarbij T op de x-5 as is aangegeven.
Bij de implementatie van de inrichting voor het bepalen van het frequentie-energiespectrum komen de meetresultaten van de segmenten uit het basilair membraanmodel 1 die de lage frequenties representeren, met enige vertraging tot 10 uiting ten opzichte van de segmenten die betrekking hebben op de hogere frequenties. Bij een gegeven signaal T(t) moet hiervoor gecorrigeerd worden volgens TB(t) = T(t+da), waarbij dB de lokale groepvertraging van segment s is. Dit leidt tot de in fig. 8 getoonde implementatie.
In dit laatste geval wordt derhalve een energie-inhoud bepaald voor ieder segment van het basilair membraanmodel 1, waaruit een uitgangsverzameling .r,G)W.....
resulteert die betrekking heeft op tijdstip t.
1013500 5
Pig. 4 toont grafisch het daarmee corresponderende meetresultaat waarbij op de x-as de segmentnummers van het basilair membraanmodel 1 zijn geplaatst.
Verder wordt nog verwezen naar fig. 5 welke een grafische weergave biedt van de autocorrelatiewaarden met als variabelen de op de x-as weergegeven tijdverschuiving T en de op de y-as weergegeven segmentnummers van het basilair membraanmodel. Hierbij valt op te merken dat de uitvoering van de inrichting voor het bepalen van de frequentie-inhoud van één segment, een meetresultaat geeft dat correspondeert met een horizontale doorsnede zoals deze bijvoorbeeld kan worden bepaald voor het segment van het basilair membraanmodel dat een resonantiefrequentie heeft van circa 470 Hz. De inrichting die dient voor de bepaling van het frequentie-energies-pectrum van alle segmenten van het basilair membraanmodel geeft een meetresultaat dat correspondeert met een doorsnede in verticale richting, bijvoorbeeld genomen op t = 4,7 ms.
-10135C0

Claims (2)

1. Inrichting voor het schatten van de frequentie-inhoud van een geluidssignaal dat met ruis is behept, omvattende een basilair membraanmodel waaraan het geluidssignaal is toegevoerd welk model een aantal in serie geschakelde seg- 5 menten omvat, en een op het basilair membraan aangesloten laagbandfilter welke een geschat signaal verschaft, met het kenmerk, dat het laagbandfilter is vormgegeven als een verme-nigvuldigingsorgaan met een eerste en een tweede ingang, waarbij aan de eerste ingang een van een segment van het ba-10 silair membraan afkomstig en gedurende een voorafbepaalde tijdsperiode aanwezig signaal is toegevoerd, dat aan de tweede ingang het signaal over een instelbare tijd Tl verschoven is toegevoerd, en dat het vermenigvuldigingsorgaan een van de tijd Tl afhankelijk uitgangssignaal verschaft dat afhankelijk 15 is van de in het signaal van dat segment in hoofdzaak aanwezige frequentie, en een maat vormt voor de frequentie-inhoud van het geluidssignaal.
2. Inrichting voor het schatten van het spectrum van een geluidssignaal dat met ruis is behept, omvattende een 20 basilair membraanmodel waaraan het geluidssignaal is toegevoerd welk model een aantal in serie geschakelde segmenten omvat, en een op het basilair membraan aangesloten laagbandfilter welke een geschat signaal verschaft, met het kenmerk, dat het laagbandfilter is vormgegeven als een vermenigvuldi-25 gingsorgaan met een eerste en een tweede ingang, waarbij voor ieder segment van het basilair membraan aan de eerste ingang een van dat segment afkomstig signaal is toegevoerd, dat aan de tweede ingang het signaal over een tijd T2 verschoven is toegevoerd, en dat het vermenigvuldigingsorgaan een van het 30 segment afhankelijk uitgangssignaal verschaft dat een maat vormt voor een tijdens de tijdsperiode in het geluidssignaal in hoofdzaak aanwezig frequentie-energiespectrum. ,1 0 135 CO
NL1013500A 1999-11-05 1999-11-05 Inrichting voor het schatten van de frequentie-inhoud of het spectrum van een geluidssignaal in een ruizige omgeving. NL1013500C2 (nl)

Priority Applications (10)

Application Number Priority Date Filing Date Title
NL1013500A NL1013500C2 (nl) 1999-11-05 1999-11-05 Inrichting voor het schatten van de frequentie-inhoud of het spectrum van een geluidssignaal in een ruizige omgeving.
CN00818227.2A CN1286084C (zh) 1999-11-05 2000-11-06 信号分析方法与装置
DE60033549T DE60033549T2 (de) 1999-11-05 2000-11-06 Verfahren und vorrichtung zur signalanalyse
EP00980108A EP1228502B1 (en) 1999-11-05 2000-11-06 Methods and apparatuses for signal analysis
JP2001535156A JP4566493B2 (ja) 1999-11-05 2000-11-06 信号分析方法及び装置
AU17408/01A AU1740801A (en) 1999-11-05 2000-11-06 Methods and apparatuses for signal analysis
PCT/NL2000/000808 WO2001033547A1 (en) 1999-11-05 2000-11-06 Methods and apparatuses for signal analysis
AT00980108T ATE354849T1 (de) 1999-11-05 2000-11-06 Verfahren und vorrichtungen zur analyse von signalen
CA2390244A CA2390244C (en) 1999-11-05 2000-11-06 Methods and apparatuses for signal analysis
US10/129,460 US6745155B1 (en) 1999-11-05 2000-11-06 Methods and apparatuses for signal analysis

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
NL1013500A NL1013500C2 (nl) 1999-11-05 1999-11-05 Inrichting voor het schatten van de frequentie-inhoud of het spectrum van een geluidssignaal in een ruizige omgeving.
NL1013500 1999-11-05

Publications (1)

Publication Number Publication Date
NL1013500C2 true NL1013500C2 (nl) 2001-05-08

Family

ID=19770203

Family Applications (1)

Application Number Title Priority Date Filing Date
NL1013500A NL1013500C2 (nl) 1999-11-05 1999-11-05 Inrichting voor het schatten van de frequentie-inhoud of het spectrum van een geluidssignaal in een ruizige omgeving.

Country Status (10)

Country Link
US (1) US6745155B1 (nl)
EP (1) EP1228502B1 (nl)
JP (1) JP4566493B2 (nl)
CN (1) CN1286084C (nl)
AT (1) ATE354849T1 (nl)
AU (1) AU1740801A (nl)
CA (1) CA2390244C (nl)
DE (1) DE60033549T2 (nl)
NL (1) NL1013500C2 (nl)
WO (1) WO2001033547A1 (nl)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1244093B1 (en) * 2001-03-22 2010-10-06 Panasonic Corporation Sound features extracting apparatus, sound data registering apparatus, sound data retrieving apparatus and methods and programs for implementing the same
US7136813B2 (en) * 2001-09-25 2006-11-14 Intel Corporation Probabalistic networks for detecting signal content
FR2834363B1 (fr) * 2001-12-27 2004-02-27 France Telecom Procede de caracterisation d'un signal sonore
US7065485B1 (en) * 2002-01-09 2006-06-20 At&T Corp Enhancing speech intelligibility using variable-rate time-scale modification
US7376553B2 (en) * 2003-07-08 2008-05-20 Robert Patel Quinn Fractal harmonic overtone mapping of speech and musical sounds
US7672834B2 (en) * 2003-07-23 2010-03-02 Mitsubishi Electric Research Laboratories, Inc. Method and system for detecting and temporally relating components in non-stationary signals
US7522961B2 (en) * 2004-11-17 2009-04-21 Advanced Bionics, Llc Inner hair cell stimulation model for the use by an intra-cochlear implant
US7242985B1 (en) * 2004-12-03 2007-07-10 Advanced Bionics Corporation Outer hair cell stimulation model for the use by an intra—cochlear implant
US7742914B2 (en) * 2005-03-07 2010-06-22 Daniel A. Kosek Audio spectral noise reduction method and apparatus
US20060206320A1 (en) * 2005-03-14 2006-09-14 Li Qi P Apparatus and method for noise reduction and speech enhancement with microphones and loudspeakers
JP2006309162A (ja) * 2005-03-29 2006-11-09 Toshiba Corp ピッチパターン生成方法、ピッチパターン生成装置及びプログラム
KR100724736B1 (ko) * 2006-01-26 2007-06-04 삼성전자주식회사 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치
US7729775B1 (en) 2006-03-21 2010-06-01 Advanced Bionics, Llc Spectral contrast enhancement in a cochlear implant speech processor
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8311634B2 (en) * 2006-06-16 2012-11-13 Second Sight Medical Products Inc. Apparatus and method for electrical stimulation of human retina
US8457754B2 (en) * 2006-06-16 2013-06-04 Second Sight Medical Products, Inc. Apparatus and method for electrical stimulation of human neurons
US7864968B2 (en) * 2006-09-25 2011-01-04 Advanced Bionics, Llc Auditory front end customization
US7995771B1 (en) 2006-09-25 2011-08-09 Advanced Bionics, Llc Beamforming microphone system
WO2008144715A1 (en) * 2007-05-21 2008-11-27 E Ink Corporation Methods for driving video electro-optic displays
EP2028651A1 (en) * 2007-08-24 2009-02-25 Sound Intelligence B.V. Method and apparatus for detection of specific input signal contributions
JP4925018B2 (ja) * 2008-04-04 2012-04-25 アンリツ株式会社 基本波ビート成分検出方法及びそれを用いる被測定信号のサンプリング装置並びに波形観測システム
KR20090122143A (ko) * 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
JP2012503212A (ja) * 2008-09-19 2012-02-02 ニューサウス イノベーションズ ピーティーワイ リミテッド オーディオ信号分析方法
US8359195B2 (en) * 2009-03-26 2013-01-22 LI Creative Technologies, Inc. Method and apparatus for processing audio and speech signals
US20110178800A1 (en) * 2010-01-19 2011-07-21 Lloyd Watts Distortion Measurement for Noise Suppression System
CN101806835B (zh) * 2010-04-26 2011-11-09 江苏中凌高科技有限公司 基于包络分解的间谐波测量仪
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US20120143611A1 (en) * 2010-12-07 2012-06-07 Microsoft Corporation Trajectory Tiling Approach for Text-to-Speech
US20120197643A1 (en) * 2011-01-27 2012-08-02 General Motors Llc Mapping obstruent speech energy to lower frequencies
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
KR102212225B1 (ko) * 2012-12-20 2021-02-05 삼성전자주식회사 오디오 보정 장치 및 이의 오디오 보정 방법
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
EP2963645A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Calculator and method for determining phase correction data for an audio signal
CN106797512B (zh) 2014-08-28 2019-10-25 美商楼氏电子有限公司 多源噪声抑制的方法、系统和非瞬时计算机可读存储介质
CN114464208B (zh) * 2015-09-16 2025-11-14 株式会社东芝 语音处理装置、语音处理方法以及存储介质
US9980046B2 (en) * 2016-09-29 2018-05-22 Invensense, Inc. Microphone distortion reduction
CN109540545B (zh) * 2018-11-30 2020-04-14 厦门大学 拖拉机用动力输出总成异响诊断信号采集装置及处理方法
CN112763980B (zh) * 2020-12-28 2022-08-05 哈尔滨工程大学 一种基于方位角及其变化率的目标运动分析方法
US11830481B2 (en) * 2021-11-30 2023-11-28 Adobe Inc. Context-aware prosody correction of edited speech
CN118969021B (zh) * 2024-08-23 2025-06-03 北京皮优科技有限公司 一种结构在线监测及评估系统
CN120833780B (zh) * 2025-09-17 2025-12-02 安康可之爱动漫科技有限公司 一种语音交互毛绒玩具的智能唤醒方法、设备及介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3622706A (en) * 1969-04-29 1971-11-23 Meguer Kalfaian Phonetic sound recognition apparatus for all voices
DE3070698D1 (en) * 1979-05-28 1985-07-04 Univ Melbourne Speech processor
CA1189147A (en) * 1980-12-12 1985-06-18 James F. Patrick Speech processors
US5473759A (en) * 1993-02-22 1995-12-05 Apple Computer, Inc. Sound analysis and resynthesis using correlograms
US6072885A (en) * 1994-07-08 2000-06-06 Sonic Innovations, Inc. Hearing aid device incorporating signal processing techniques
WO1997013127A1 (en) * 1995-09-29 1997-04-10 International Business Machines Corporation Mechanical signal processor based on micromechanical oscillators and intelligent acoustic detectors and systems based thereon
US5856722A (en) * 1996-01-02 1999-01-05 Cornell Research Foundation, Inc. Microelectromechanics-based frequency signature sensor
US5879283A (en) * 1996-08-07 1999-03-09 St. Croix Medical, Inc. Implantable hearing system having multiple transducers
US6501399B1 (en) * 1997-07-02 2002-12-31 Eldon Byrd System for creating and amplifying three dimensional sound employing phase distribution and duty cycle modulation of a high frequency digital signal
EP0980064A1 (de) * 1998-06-26 2000-02-16 Ascom AG Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
H.MESSNER AND Y.BAR-NESS: "closed-loop autocorrelator and its application to frequency discrimination", IEE PROCEEDINGS, SECTION A-I, vol. 133, no. 1, January 1986 (1986-01-01) - January 1986 (1986-01-01), stevenage, hertz, great, pages 25 - 33, XP002142308 *
T. ANDRINGA: "using an auditory model and leaky autocorrelators to tune in to speech", ESCA, EUROSPEECH97, 1997 - 1997, greece, pages 2859 - 2862, XP000923308 *

Also Published As

Publication number Publication date
AU1740801A (en) 2001-05-14
DE60033549D1 (de) 2007-04-05
CA2390244C (en) 2011-07-19
WO2001033547A1 (en) 2001-05-10
CN1286084C (zh) 2006-11-22
ATE354849T1 (de) 2007-03-15
WO2001033547B1 (en) 2001-11-29
DE60033549T2 (de) 2007-11-22
CA2390244A1 (en) 2001-05-10
CN1421030A (zh) 2003-05-28
JP4566493B2 (ja) 2010-10-20
EP1228502B1 (en) 2007-02-21
US6745155B1 (en) 2004-06-01
JP2003513339A (ja) 2003-04-08
EP1228502A1 (en) 2002-08-07

Similar Documents

Publication Publication Date Title
NL1013500C2 (nl) Inrichting voor het schatten van de frequentie-inhoud of het spectrum van een geluidssignaal in een ruizige omgeving.
JP4177755B2 (ja) 発話特徴抽出システム
JP6285367B2 (ja) 風雑音検出のための方法および装置
US8949118B2 (en) System and method for robust estimation and tracking the fundamental frequency of pseudo periodic signals in the presence of noise
JP2004531767A5 (nl)
WO2009070476A1 (en) Active noise cancellation using a predictive model approach
EP1632935B1 (en) Speech enhancement
US20220078561A1 (en) Apparatus and method for own voice suppression
CN118378119A (zh) 用于车辆损伤检测的方法和系统
US20020150264A1 (en) Method for eliminating spurious signal components in an input signal of an auditory system, application of the method, and a hearing aid
Záviška et al. Psychoacoustically motivated audio declipping based on weighted l 1 minimization
Fraile et al. Mfcc-based remote pathology detection on speech transmitted through the telephone channel-impact of linear distortions: Band limitation, frequency response and noise
López-Espejo et al. On speech pre-emphasis as a simple and inexpensive method to boost speech enhancement
WO2020044362A2 (en) Real-time pitch tracking by detection of glottal excitation epochs in speech signal using hilbert envelope
JP3310225B2 (ja) 雑音レベル時間変動率計算方法及び装置と雑音低減方法及び装置
JP2021015137A (ja) 情報処理装置、プログラム及び情報処理方法
CN111105811A (zh) 声音信号的处理方法、相关设备及可读存储介质
CN113409813B (zh) 语音分离方法及装置
JP2002507776A (ja) 音声信号の過渡現象を解析するための信号処理方法
JP5327735B2 (ja) 信号再生装置
JP6305273B2 (ja) 評価値算定方法及び空間特性設計方法
Nikhil et al. Impact of ERB and bark scales on perceptual distortion based near-end speech enhancement
Pendharkar Auralization of road vehicles using spectral modeling synthesis
KR0185310B1 (ko) 디지털 난청 시뮬레이션 방법
Stoeckle et al. Environmental sound sources classification using neural networks

Legal Events

Date Code Title Description
PD2B A search report has been drawn up
VD1 Lapsed due to non-payment of the annual fee

Effective date: 20070601