SE527866C2 - Channel signal masking in multi-channel audio system - Google Patents
Channel signal masking in multi-channel audio systemInfo
- Publication number
- SE527866C2 SE527866C2 SE0400416A SE0400416A SE527866C2 SE 527866 C2 SE527866 C2 SE 527866C2 SE 0400416 A SE0400416 A SE 0400416A SE 0400416 A SE0400416 A SE 0400416A SE 527866 C2 SE527866 C2 SE 527866C2
- Authority
- SE
- Sweden
- Prior art keywords
- signal
- channel
- signals
- parameters
- parts
- Prior art date
Links
- 230000000873 masking effect Effects 0.000 title claims description 64
- 238000000034 method Methods 0.000 claims description 77
- 238000009795 derivation Methods 0.000 claims description 5
- 230000003595 spectral effect Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000011084 recovery Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 2
- 241001155430 Centrarchus Species 0.000 claims 1
- 238000012544 monitoring process Methods 0.000 claims 1
- 230000002123 temporal effect Effects 0.000 claims 1
- 230000009286 beneficial effect Effects 0.000 abstract 1
- 230000005236 sound signal Effects 0.000 description 25
- 238000010586 diagram Methods 0.000 description 12
- 238000013459 approach Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 3
- 229920002554 vinyl polymer Polymers 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 230000003313 weakening effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Amplifiers (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
Description
25 30 527 866 2 konfigureras för att ta emot även förvanskade signaler eller till och med klara av förlorade signaldelar. Avkodarna kommer typiskt sett att ta emot kodat data som motsvarar ramar av insignalen och det finns typiskt sett en flagga som indikerar om ramdatat är felfritt eller förvanskat eller förlorat, d.v.s. oanvändbart. För fallet med oanvåndbart data kommer inte avkodaren att kunna avkoda och återbilda den motsvarande signalramen. Istället måste organ för att maskera ramförlust utnyttjas för att göra förlusten så ohörbar som möjligt. 25 30 527 866 2 is configured to receive even distorted signals or even cope with lost signal parts. The decoders will typically receive coded data corresponding to frames of the input signal and there is typically a flag indicating whether the frame data is error free or distorted or lost, i.e. useless. In the case of unusable data, the decoder will not be able to decode and reproduce the corresponding signal frame. Instead, means for masking frame loss must be used to make the loss as inaudible as possible.
För fallet med stereo- eller multikanalsljudsignaler kan ramförlusten särskilt påverka stereo- eller multikanalsljudrepresentationen. Om t.ex. en av de sända kanalerna är påverkad kan avkodaren fortfarande klara av att återskapa den andra kanalen, eller, beroende på den valda ekvivalenta representation, möjligen fortfarande rekonstruera en monosignal. Såväl en plötslig förlust av en av ljudkanalerna som t.ex. den plötsliga förändringen från en stereo- till en monosignal kan emellertid skada den uppfattade ljudkvaliteten. En viktig del av felmaskering i ljudkodekar âr alltså att mildra förluster av stereo- eller multikanalsinformation.In the case of stereo or multi-channel audio signals, the frame loss may particularly affect stereo or multi-channel audio representation. If e.g. if one of the transmitted channels is affected, the decoder may still be able to recreate the other channel, or, depending on the selected equivalent representation, possibly still reconstruct a mono signal. Both a sudden loss of one of the audio channels as e.g. however, the sudden change from a stereo to a mono signal can damage the perceived sound quality. An important part of error masking in audio codecs is thus to mitigate losses of stereo or multi-channel information.
De flesta felmaskeringsförfarandena enligt känd teknik är direkt kopplade till den typ av kodning som används under ett sändningssteg. Beroende på typen av ljudkodek, parametrisk eller icke-parametrisk, finns olika sätt att realisera felmaskering för ljudkodekar, vilka i allmänhet innefattar dem för stereo- eller multikanalsljud. Gemensamt för alla dessa är att de utför maskeringsförsök under eller i direkt anslutning till den faktiska avkodningsprocessen.Most prior art error masking methods are directly related to the type of coding used during a transmission step. Depending on the type of audio codec, parametric or non-parametric, there are different ways to implement error masking for audio codecs, which generally include those for stereo or multi-channel audio. Common to all of these is that they perform masking attempts during or in direct connection with the actual decoding process.
Icke-parametriska ljudkodekar kommer typiskt sett att upprepa eller skatta korrekt mottagna signalvärden t.ex. med hjälp a interpolering, för att generera en ersättning för de felaktiga värdena. Som ett exempel visar det amerikanska patentet US 6,490,551 av Wiese et.al. att ersätta förlorade spektralkomponenter med skattningar (t.ex. interpolering) från motsvarande komponenter för sarnrna eller en annan (stereo) kanal innefattande tids- eller 10 15 20 25 30 527 866 3 frekvensdomänsamplade värden. Fördelen med detta patent år att det, såsom det hävdar, bibehåller stereointrycket.Non-parametric audio codecs will typically repeat or estimate correctly received signal values e.g. using interpolation, to generate a compensation for the incorrect values. As an example, U.S. Patent No. 6,490,551 to Wiese et al. replacing lost spectral components with estimates (eg, interpolation) from corresponding components of the sensors or another (stereo) channel comprising time or frequency domain sampled values. The advantage of this patent is that it, as it claims, maintains the stereo impression.
En annan liknande teknik, särskilt för stereosignaler, beskrivs i patentet DE 3638922, enligt vilket förlorade signalsektioner hos en av stereokanalerna ersätts av motsvarande signalsektioner från den andra kanalen.Another similar technique, especially for stereo signals, is described in patent DE 3638922, according to which lost signal sections of one of the stereo channels are replaced by corresponding signal sections from the other channel.
Typisk ramförlustmaskering för parametriska ljudkodekar innefattar att ersätta en felaktig parameter med en tidigare och korrekt mottagen motsvarande parameter. Detta är en tidsteknik som ofta används i talkodekar och är direkt tillämpbar på parametriska ljudkodekar. Den beskrivs i detalj t.ex. i 3GPP-specifikationen för felmaskering av förlorade ramar för AMR-talkodeken, 3 GPP TS 26.091, paragraf 6 och 7.Typical frame loss masking for parametric audio codecs involves replacing an incorrect parameter with a previously and correctly received corresponding parameter. This is a time technique often used in speech codecs and is directly applicable to parametric sound codecs. It is described in detail e.g. in the 3GPP specification for incorrect masking of lost frames for the AMR speech codec, 3 GPP TS 26.091, paragraphs 6 and 7.
Patentet EP 0 637 013 av Cluever beskriver ett parametriskt ramförlust- maskeringsförfarande för icke-parametriska monotalkodekar. Signalvärdena från en korrekt mottagen talram används för att härleda parametrarna till en talsyntesmodell. För fallet med en ramförlust syntetiseras den saknade talramen genom att tillämpa modellen under användande av parametrarna som hårletts under den sista giltiga talramen. En sådan teknik skulle i princip kunna tillämpas för felmaskering i audiokodekar, och i multikanalfallet kanal för kanal.The patent EP 0 637 013 by Cluever describes a parametric frame loss masking method for non-parametric monotalk codecs. The signal values from a correctly received speech frame are used to derive the parameters of a speech synthesis model. In the case of a frame loss, the missing speech frame is synthesized by applying the model using the parameters searched under the last valid speech frame. Such a technology could in principle be applied for error masking in audio codecs, and in the multi-channel case channel by channel.
SAMMANFATTNING Bland de förlustmaskeringsförfaranden som diskuterats ovan återskapar de flesta tillvägagàngssätten de sända kanalerna i multikanalaudiosystem oberoende av varandra och utan hänsyn till statistiska beroenden mellan kanaler. Förfarandena i US 6,490,551 och DE 3638922 utnyttjar explicit beroenden mellan kanalerna, men är begränsade till lösningar för icke- parametriska kodekar. De utnyttjar vidare en princip av upprepad eller interpolerande skattning av korrekt mottagna signalvärden för att generera 10 15 20 25 30 527 866 4 en ersättning för de felaktiga värdena, vilket typiskt sett inte leder till den bästa uppfattade kvaliteten.SUMMARY Among the loss masking procedures discussed above, most approaches recreate the broadcast channels in multichannel audio systems independently and without regard to statistical interdependencies between channels. The methods in US 6,490,551 and DE 3638922 explicitly utilize dependencies between the channels, but are limited to solutions for non-parametric codecs. They further utilize a principle of repeated or interpolating estimation of correctly received signal values to generate a compensation for the erroneous values, which typically does not lead to the best perceived quality.
Att allmänt syfte med uppfinningen är alltså att tillhandahålla förbättrade förfaranden och anordningar för förlustmaskering i kanalsignaler, vilka tillåter riktigare generering av ersättningssignaler för saknade eller felaktiga signalkomponenter. Ett annat syfte med uppfinningen är att tillhandahålla maskeringsförfaranden och -anordningar som är användbara tillsammans med vilka kodningsprinciper som helst, och i synnerhet för parametriska kodningssystem.The general object of the invention is thus to provide improved methods and devices for loss masking in channel signals, which allow more correct generation of replacement signals for missing or incorrect signal components. Another object of the invention is to provide masking methods and devices which are useful in conjunction with any coding principles, and in particular for parametric coding systems.
Ovanstående syften uppnås med förfaranden och anordningar enligt de bifogade patentkraven. I allmänna ordalag används en parametrisk modell, vilken möjliggör generering av ersättare för förlorade eller felaktiga komponenter i en ljudkanal från en insignal. Under felfri mottagning av giltiga ramar härleds och lagras parametrarna för den modellen. I fall av ramförlust eller ramfel som påverkar multikanalsinformationen kan den saknade informationen eller åtminstone en hypotes av den återhämtas eller genereras genom att tillämpa modellen under användning av de lagrade parametrarna. Tillämpandet av modellen kan innefatta filtrering av insignalkomponenter av minst en annan ljudkanal eller någon annan signal som inte nödvändigtvis är relaterad till någon ljudsignal. l fall med flera efter varandra följande förlorade eller felaktiga ramar är det möjligt att antingen använda parametrarna som härletts under den sista giltiga ramen eller att använda parametrarna som härletts från den återhämtade multikanals- informationen för varje tidigare ogiltig ram. Det är också möjligt att kombinera båda teknikerna, d.v.s. att använda parametrar vilka har härletts som en kombination av de lagrade parametrarna härledda från den föregående giltiga ramen och parametrarna härledda från den återhämtade multikanalinformationen för den tidigare ogiltiga ramen. Vidare, om det är långa sekvenser av förlorade ramar kan det vara fördelaktigt att tillämpa någon form av gradvis dämpning av modellparametrama, vilket huvudsakligen resulterar i en gradvis dämpning av modellparametrarna, 10 15 20 25 30 527 866 vilket huvudsakligen resulterar i en gradvis försvagning av den återhämtade multikanalsinformationen. I fall med total dämpning kommer ingen multikanalssignal att återhämtas, vilket resulterar i återgång till en ren uppspelning av huvud- eller monoljudsignalen.The above objects are achieved by methods and devices according to the appended claims. In general terms, a parametric model is used, which enables the generation of replacements for lost or faulty components in an audio channel from an input signal. During error-free reception of valid frames, the parameters of that model are derived and stored. In case of frame loss or frame error affecting the multichannel information, the missing information or at least a hypothesis of it can be recovered or generated by applying the model using the stored parameters. The application of the model may involve filtering input components of at least one other audio channel or other signal which is not necessarily related to any audio signal. In case of fl consecutive lost or incorrect frames, it is possible to either use the parameters derived during the last valid frame or to use the parameters derived from the recovered multi-channel information for each previously invalid frame. It is also possible to combine both techniques, i.e. to use parameters which have been derived as a combination of the stored parameters derived from the previous valid frame and the parameters derived from the recovered multichannel information for the previously invalid frame. Furthermore, if there are long sequences of lost frames, it may be advantageous to apply some form of gradual attenuation of the model parameters, which mainly results in a gradual attenuation of the model parameters, which mainly results in a gradual weakening of the model parameters. retrieved the multi-channel information. In cases of total attenuation, no multi-channel signal will be recovered, resulting in a return to pure playback of the main or mono audio signal.
I fall med förlust av inte bara multikanalsinformation utan även av insignalsinformationen tillämpas först en känd tidsinriktad felmaskeringsteknik enligt teknikens ståndpunkt för att återhämta insignalen från insignalinformation som mottagits vid ett tidigare tidsögonblick. I ett andra steg tillämpas sedan felmaskeringen enligt uppfinningen, vilken genererar en hypotes av den ursprungliga multikanals- informationen från den återhämtade insignalen.In cases of loss of not only multichannel information but also of the input signal information, a prior art prior art error masking technique is first applied to recover the input signal from input signal information received at an earlier time moment. In a second step, the error masking according to the invention is then applied, which generates a hypothesis of the original multichannel information from the recovered input signal.
Allmännare sett kan återhämtandet av multikanalsinformation enligt uppfinningen kombineras med traditionella tidsfelmaskeringstekniker, vilka återhämtar förlorad information för respektive samma kanal baserat på information som tagits emot för dessa kanaler vid ett tidigare tidsögonblick.More generally, the recovery of multi-channel information according to the invention can be combined with traditional time error masking techniques, which recover lost information for each same channel based on information received for these channels at an earlier time moment.
En fördel med den föreliggande uppfinningen är att förluster av multikanals- information kan lindras på ett bättre sätt, eftersom korrelation mellan kanaler används för att återhämta de ursprungliga kanalsignalerna.An advantage of the present invention is that losses of multi-channel information can be alleviated in a better way, since correlation between channels is used to recover the original channel signals.
Uppfinningen är vidare väldigt allmänt tillämpbar och kan t.ex. användas i överföringssystem för ljudsignaler med multikanaler som använder någon typ av kodningstekniker, eller i system som inte ens använder signalkodning.The invention is furthermore very generally applicable and can e.g. be used in multi-channel audio signal transmission systems that use some type of coding technique, or in systems that do not even use signal coding.
KORT F IGURBESKRIVNING Uppfinningen, tillsammans med ytterligare syften och fördelar därav, kan bäst förstås genom hänvisningar till de följande beskrivningen läst tillsammans med de medföljande ritningarna, i vilka: 10 15 20 25 30 527 866 6 FIGURER. 1A-C är schematiska blockscheman av utföringsformer av audiosystem enligt den föreliggande uppfinningen; FIG. 2 är ett blockschema av en utföringsform av en maskerings- anordning enligt den föreliggande uppfinningen; FIG. 3 är ett blockschema av en utföringsform av en kanalfiltersektion enligt den föreliggande uppfinningen; FIG. 4 är ett blockschema av en annan utföringsform av en maskeringsanordning enligt den föreliggande uppfinningen; FIGURER. 5A-B är flödesdiagram över huvudstegen i utföringsformer a-v ett förfarande enligt den föreliggande uppfinningen; FIG. 6 är ett delflödesdiagram som visar ett steg i utföringsformer enligt flödesdiagrammen i ñg. SA-B mer i detalj; FIGURER. 7A-D är diagram som illustrerar datakorrelationerna enligt utföringsformer av den föreliggande uppfinningen; FIG. 8 är ett blockdiagram som visar en implementering av en utföringsforni av en maskeringsanordning enligt den föreliggande uppfinningen integrerad i en avkodare med parametriska filter; saint FIG. 9 är ett blockdiagram över en utföringsform av ett analogt audiosystem enligt den föreliggande uppfinningen.BRIEF DESCRIPTION OF THE DRAWINGS The invention, together with further objects and advantages thereof, may best be understood by reference to the following description read in conjunction with the accompanying drawings, in which: FIGURES. 1A-C are schematic block diagrams of embodiments of audio systems according to the present invention; FIG. 2 is a block diagram of an embodiment of a masking device according to the present invention; FIG. 3 is a block diagram of an embodiment of a channel filter section according to the present invention; FIG. 4 is a block diagram of another embodiment of a masking device according to the present invention; FIGURES. 5A-B are flow diagrams of the main steps in embodiments a-v of a method according to the present invention; FIG. 6 is a part fl fate diagram showing a step in embodiments according to the fl fate diagram in ñg. SA-B in more detail; FIGURES. 7A-D are diagrams illustrating the data correlations according to embodiments of the present invention; FIG. 8 is a block diagram showing an implementation of an embodiment of a masking device according to the present invention integrated in a decoder with parametric filters; saint FIG. 9 is a block diagram of an embodiment of an analog audio system according to the present invention.
DETALJERAD BESKRIVNING I den föreliggande beskrivningen används termen ”multikanal” för att beteckna mer än en kanal. Stereokanalsystem inbegrips t.ex. i termen ”multikanals”-system. En alternativ definition är ett system med n kanaler, där n22.DETAILED DESCRIPTION In the present description, the term "multi-channel" is used to denote more than one channel. Stereo channel systems are included e.g. in the term “multi-channel” system. An alternative definition is a system with n channels, where n22.
Vidare, termen ”felaktig signal” innefattar alla typer av fel, och inbegriper även avsaknaden eller förlusten av signalen.Furthermore, the term "incorrect signal" includes all types of errors, and also includes the absence or loss of the signal.
Ett typiskt ställe för en maskeringsanordning är inuti eller i närheten av en mottagare eller avkodare. Föreliggande uppfinning är emellertid på grund av sina kännetecknande delar mer allmänt tillämpbar och kan tillämpas nästan lO 15 20 25 30 527 866 var som helst i audiosystem med multikanaler. För att illustrera detta kommer den föreliggande detaljerade beskrivningen att inledas med några exempel på system, i vilka den föreliggande uppfinningen med fördel år tillämpbar.A typical location for a masking device is inside or near a receiver or decoder. However, due to its characteristic features, the present invention is more generally applicable and can be applied almost anywhere in multichannel audio systems. To illustrate this, the present detailed description will begin with some examples of systems in which the present invention is advantageously applicable.
FIG. 1A visar en utföringsform av ett audiosystem 1 som är baserat på digitala signaler. En multikanalsignalkälla 10 hämtar fram lagrade signaler från en lagring 12 för ljudsignaler, i denna utföringsform en CD med digitalt kodade signaler som representerar ljudsignaler. Multikanalsljudsignalerna sänds via kållutgångar 14. I ett alternativt system skulle ljudmultikanalssignalerna också kunna tillhandahållas i realtid, såsom indikeras av de streckade linjerna och en uppsättning mikrofoner 11.FIG. 1A shows an embodiment of an audio system 1 which is based on digital signals. A multi-channel signal source 10 retrieves stored signals from an audio signal storage 12, in this embodiment a CD with digitally encoded signals representing audio signals. The multi-channel audio signals are transmitted via source outputs 14. In an alternative system, the audio multi-channel signals could also be provided in real time, as indicated by the dashed lines and a set of microphones 11.
Fel kan uppträda under processen med att tillhandahålla ljudsignalerna.Errors can occur during the process of providing the audio signals.
Signalinnehållet hos CD-skivan 12 skulle kunna vara försämrat och svårt eller omöjligt att tolka. Framhåmtningsproceduren kan också producera vissa bitfel, vilket ger helt eller delvis förvanskade kanalsignaler. En maskeringsanordning 20 enligt den föreliggande uppfinningen skulle därmed med fördel kunna anslutas till kållutgångarna 14. De ”reparerade” multikanalsignalerna sänds sedan till destinatiorisingångar 34, i denna utföringsform anslutna till en respektive högtalare 30.The signal content of the CD 12 could be degraded and difficult or impossible to interpret. The retrieval procedure can also produce some bit errors, resulting in completely or partially distorted channel signals. A masking device 20 according to the present invention could thus advantageously be connected to the source outputs 14. The "repaired" multichannel signals are then transmitted to destination inputs 34, in this embodiment connected to a respective speaker 30.
FIG. lB visar en annan utföringsform av ett audiosystem 1, vilket i detta fall baserar sig på en stereokälla 10 av analog typ. En vinylskiva 12 innefattar ljudsignaler kodade som geometriska vågformer i spår på vinylskivan 10.FIG. 1B shows another embodiment of an audio system 1, which in this case is based on a stereo source 10 of analog type. A vinyl record 12 includes audio signals encoded as geometric waveforms in tracks on the vinyl record 10.
Stereokanalsljudsignalerna tillhandahålls via källutgångar 14 till en samplingsenhet 13, vilken samplar det analoga ljudet till digital representation. Samplingsenheten 13 verkar med andra ord som en analog- till-digital-omvandlare för ljudsignaler. Även i denna process att tillhandahålla ljudsignalerna finns felkällor.The stereo channel audio signals are provided via source outputs 14 to a sampling unit 13, which samples the analog audio for digital representation. In other words, the sampling unit 13 acts as an analog-to-digital converter for audio signals. There are also sources of error in this process of providing the audio signals.
Signalinnehållet på vinylskivan 12 skulle kunna förändras mekaniskt t.ex. genom korn eller repor. Framhämtningsproceduren skulle också kunna 10 15 20 25 30 527 866 8 producera fel som avsevärt påverkar den uppfattade kvaliteten. Slutligen kan också analog-tilldigital-omvandlingen ge upphov till helt eller delvis förvanskade kanalsignaler. En maskeringsanordning 20 enligt den föreliggande uppfinningen skulle därmed med fördel kunna anslutas till källutgångarna 14. De ”reparerade” multikanalssignalerna sänds sedan igen till stereodestinationsingångarna 34, i denna utföringsform anslutna till två högtalare 30.The signal content of the vinyl record 12 could be changed mechanically e.g. through barley or scratches. The retrieval procedure could also produce errors that significantly affect the perceived quality. Finally, the analog-to-digital conversion can also give rise to completely or partially distorted channel signals. A masking device 20 according to the present invention could thus advantageously be connected to the source outputs 14. The "repaired" multi-channel signals are then transmitted again to the stereo destination inputs 34, in this embodiment connected to two speakers 30.
FIG. 1C illustrerar ännu en annan utföringsform av ett audiosystem l. Här laddas några multikanalsljudsignaler ned från en källa 10 för multikanalsljudsignaler, i denna utföringsform en tillhandahållare av musikspår. Multikanalssignalerna hämtas fram från källan 10 och tillhandhälls över en multikanalsförbindelse 4 till en kodare 5. Kodaren 5 omvandlar multikanalssignalerna till en gemensam dataström som sänds via en förbindelse 6 till en radiosändarenhet 7. Vilken typ av kodningsprincip som helst kan utnyttjas. Radiosändarenheten 7 förbereder den gemensamma dataströmmen för att sändas som radiosignaler 9 från en sändarantenn 8 till en mottagarantenn 15. En radiomottagarenhet 16 tar emot signalerna och tillhandahåller en så korrekt version av den ursprungliga gemensamma dataströmmen som möjligt via en förbindelse 17 till en avkodare 18. Avkodaren 18 omvandlar den gemensamma dataströmmen från förbindelsen 17 till ett antal kanalsignaler som tillhandhälls vid källutgångar 14.FIG. 1C illustrates yet another embodiment of an audio system 1. Here, some multichannel audio signals are downloaded from a source 10 of multichannel audio signals, in this embodiment a music track provider. The multichannel signals are retrieved from the source 10 and provided over a multichannel connection 4 to an encoder 5. The encoder 5 converts the multichannel signals into a common data stream which is transmitted via a connection 6 to a radio transmitter unit 7. Any type of coding principle can be used. The radio transmitter unit 7 prepares the common data stream to be transmitted as radio signals 9 from a transmitter antenna 8 to a receiver antenna 15. A radio receiver unit 16 receives the signals and provides as accurate a version of the original common data stream as possible via a connection 17 to a decoder 18. The decoder 18 converts the common data stream from the connection 17 into a number of channel signals provided at source outputs 14.
Radiodelen av detta system är troligtvis den huvudsakliga källan till fel i ljudsignalerna. Både radiomottagaren 16 och avkodaren 18 innefattar typiskt sett mer eller mindre komplicerade felhanteringsfunktionaliteter eller maskeringsanordningar. En maskeringsanordning 20 enligt den föreliggande uppfinningen skulle emellertid trots detta kunna vara till fördel om den anslöts till källutgångaina 14. De ”reparerade” multikanalssignalerna kan sedan åter sändas till multikanaldestinationsingångar 34, i denna utföringsform anslutna till en ljudsignalslagring 31. 10 15 20 25 30 527 866 9 Ljudsignaler som överförs över Internet är också ofta utsatta för sändningsfel. En motsvarande maskeringsanordning 20 tillämpas därför med fördel på mottagarsidan av ett Internetbaserat ljudöverföringssystem.The radio part of this system is probably the main source of error in the audio signals. Both the radio receiver 16 and the decoder 18 typically include more or less complicated error handling functionalities or masking devices. However, a masking device 20 according to the present invention could nevertheless be advantageous if it was connected to the source outputs 14. The "repaired" multichannel signals can then be retransmitted to multichannel destination inputs 34, in this embodiment connected to an audio signal storage 31. 527 866 9 Audio signals transmitted over the Internet are also often subject to transmission errors. A corresponding masking device 20 is therefore advantageously applied on the receiver side of an Internet-based audio transmission system.
Den grundläggande principen för uppfinningen är att en kanalsignal av en uppsättning rnultikanalssignaler kan återskapas ganska noggrant genom att applicera ett parametriskt filter på en insignal. lnsignalen kan vara vilken signal som helst, t.ex. en brussignal. I föredragna utföringsformer är emellertid insignalen beroende av en linjärkombination av minst en av de andra multikanalsignalema - för att ge en ”huvud”-signal. Huvudsignalen kan vara en monosignal, d.v.s. en signal som representerar ljudsignalerna som om de vore inspelade av endast en källa (mikrofon). Andra utföringsformer utnyttjar emellertid en huvudsignal som exkluderar den kanalsignal som skall återskapas. Fig. 2 visar denna princip mer i detalj.The basic principle of the invention is that a channel signal of a set of multichannel signals can be reproduced quite accurately by applying a parametric filter to an input signal. The input signal can be any signal, e.g. a noise signal. In preferred embodiments, however, the input signal is dependent on a linear combination of at least one of the other multichannel signals - to provide a "main" signal. The main signal may be a mono signal, i.e. a signal that represents the audio signals as if they were recorded by only one source (microphone). However, other embodiments utilize a main signal that excludes the channel signal to be recreated. Fig. 2 shows this principle in more detail.
Kanalsignaler tillhandhålls vid källutgängar 14. Maskeringsanordningen 20 innefattar en linjärkombinationsenhet 21, vilken skapar huvudsignaler m. I andra uföringsformer skulle huvudsignalen m kunna tillhandahållas från annat håll. Huvudsignalen m tillhandhålls till ett antal kanalñltersektioner 40, i vilka maskering av en felaktig kanalsignal kan utföras enligt den föreliggande uppfinningen. Huvudsignalerna som tillhandahålls vid de olika kanalfiltersektionerna 40 kan vara samma huvudsignal eller olika. De icke felaktiga eller maskerade kanalsignalerna tillhandahålls till destinations- ingängarna 34.Channel signals are provided at source outputs 14. The masking device 20 comprises a linear combination unit 21, which creates main signals m. In other embodiments, the main signal m could be provided from elsewhere. The main signal m is provided to a number of channel filter sections 40, in which masking of an erroneous channel signal can be performed according to the present invention. The main signals provided at the different channel filter sections 40 may be the same main signal or different. The non-erroneous or masked channel signals are provided to the destination inputs 34.
Kanalfiltersektionema 40 är baserade på parametriska filter, vilka styrs av en uppsättning koefficienter. Dessa koefficienter härleds adaptivt under mottagning av giltiga ramar från kanalsignalen i fråga och företrädesvis från minst en av de andra kanalerna genom huvudsignalen. De beräknade parametrarna lagras i ett parametenninne. I händelse av en ramförlust eller ett ramfel, vilket påverkar åtminstone delar av kanalsignalen i fråga, appliceras den parametriska modellen under användande av de lagrade modellparametrarna och huvudsignalen för nämnda minst en andra kanalsignal. Den resulterande utsignalen från den parametriska modellen 10 15 20 25 30 527 866 10 kan användas som en ersättning för den förlorade kanalsignalen eller den kan kombineras med en kanalsignal som har härletts under användning av känd teknik för att generera en sådan ersättning.The channel filter sections 40 are based on parametric filters, which are controlled by a set of coefficients. These coefficients are adaptively derived while receiving valid frames from the channel signal in question and preferably from at least one of the other channels through the main signal. The calculated parameters are stored in a parameter memory. In the event of a frame loss or a frame error, which affects at least parts of the channel signal in question, the parametric model is applied using the stored model parameters and the main signal for said at least one second channel signal. The resulting output signal from the parametric model 10 may be used as a replacement for the lost channel signal or it may be combined with a channel signal which has been derived using known techniques to generate such a replacement.
Fig. 3 visar en utföringsform av en av kanalñltersektionerna 40 enligt den föreliggande uppfinningen. Den maskeringsanordning 20 som är ansluten till källutgángarna 14 innefattar ett antal kanalfiltersektioner 40, företrädesvis en per kanal, av vilka endast en visas i Fig. 3. Den visade kanalfiltersektionen 40 indikeras streckad. Den visade kanalñltersektionen 40 påverkar kanalsignalen X1, vilken antas vara uppdelad i tidsdelar t.ex. ramar. Tidsdel n av kanalsignalen betecknas x1(n). Ett organ 23 för utredande av felstatus är anslutet till kanalsignalen x; (n). Om signaldelen är felfri, d.v.s. en giltig ram finns, vidarebefordras kanalsignalen till ett signalspårningsorgan 22. Maskeringsanordningens 20 linjärkombinations- enhet 21 tillhandahåller en huvudsignal m1(n), vilken exkluderar kanalsignalen xz (n), till ett parametriskt filterorgan 26 för signalspårníngs- organ 22. Filtret genererar en utsignal íc,( n) , vilken är avsedd att utgöra en skattning av kanalsignalen x1(n). Ett adderingsorgan 28 genererar en differenssignal Ax1(n), vilken tillhandahålls till ett filteroptimeringsorgan 17 som optimerar det parametriska ñltrets parametrar eller koefficienter för att minimera differenssignalen Ax;(n) enligt ett minimumkriterium. Företrädes- vis minimeras differenssignalen Ax1(n) i minstakvadrat- eller viktat minstakvadrat-hänseende. Optimerade parametrar h1(n) åstadkomma på detta sätt tillhandahålls som utsignaler från signalspårníngsorganet 22 och representerar den momentana korrelationen mellan huvudsignalen m1(n) och kanalsignalen x1(n). De optimerade parametrarna h; (n) lagras i ett minne 24 för senare användning.Fig. 3 shows an embodiment of one of the channel filter sections 40 according to the present invention. The masking device 20 connected to the source outputs 14 comprises a number of channel filter sections 40, preferably one per channel, of which only one is shown in Fig. 3. The channel filter section 40 shown is indicated by a dashed line. The shown channel filter section 40 affects the channel signal X1, which is assumed to be divided into time parts e.g. frames. Time part n of the channel signal is denoted x1 (n). A means 23 for investigating error status is connected to the channel signal x; (n). If the signal part is faultless, i.e. a valid frame exists, the channel signal is forwarded to a signal tracking means 22. The linear combining unit 21 of the masking device 20 provides a main signal m1 (n), which excludes the channel signal xz (n), to a parametric filter means 26 for signal tracking means 22. The filter generates an output signal. , (n), which is intended to be an estimate of the channel signal x1 (n). An adder 28 generates a difference signal Ax1 (n), which is provided to an alter optimizer 17 which optimizes the parameters or coefficients of the parametric alter to minimize the difference signal Ax; (n) according to a minimum criterion. Preferably, the difference signal Ax1 (n) is minimized in least squared or weighted least squares respect. Optimized parameters h1 (n) provided in this way are provided as output signals from the signal tracking means 22 and represent the instantaneous correlation between the main signal m1 (n) and the channel signal x1 (n). The optimized parameters h; (n) stored in a memory 24 for later use.
Minimeringsproceduren kan alternativt implementeras genom att använda en känd felminimeringsprocedur för Wiener-filter som löser ett linjärt ekvationssystem genom att t.ex. tillämpa en Levinson-rekursíon, vilet diskuteras vidare nedan. 10 15 20 25 30 527 866 11 Kanalsignalen x1(n) ansluts på ett omodiñerat sätt genom ett väljarorgan 42 till multikanalsdestinationsingångarna 34.The minimization procedure can alternatively be implemented by using a known error minimization procedure for Wiener filters which solves a linear system of equations by e.g. apply a Levinson recursion, which will be discussed further below. The channel signal x1 (n) is connected in an unmodified manner through a selector means 42 to the multi-channel destination inputs 34.
Om organet 23 för utredande av felstatus drar slutsatsen att den föreliggande kanalsignalsdelen x1(n) är felaktig, helt eller delvis, vidarebefordras inte kanalsignalsdelen till signalspårningsorganet 22. Istället tillhandahålls en styrsignal till väljarorganet 42 för att avbryta kanalsignalsdelen. Samtidigt tillhandhålls huvudsignalen miln) till ett rekonstruktionsfilter 25, vilket definieras av parametrar associerade med den föregående felfria kanalsignaldelen h1(n-1). (Fallet med mer än en Sekventiell felaktig kanalsignal diskuteras mer i detalj nedan.) En utsignal x:(n) från rekonstruktionsñltret 25 är en hypotes angående den ursprungliga, nu felaktiga, kanalsignalen, genererad från huvudsignalen m_, (n) under användning av den föregående momentana korrelationen mellan huvudsignalen m_,(n-l) och kanalsignalen x, (n - l). Väljarorganet 42 ersätter den inkommande felaktiga kanalsignalen med hypotessignalen x:(n) för att på bästa sätt maskera felet.If the error status investigating means 23 concludes that the present channel signal portion x1 (n) is incorrect, in whole or in part, the channel signal portion is not forwarded to the signal tracking means 22. Instead, a control signal is provided to the selector means 42 to interrupt the channel signal portion. At the same time, the main signal miln) is provided to a reconstruction filter 25, which is defined by parameters associated with the previous error-free channel signal part h1 (n-1). (The case of more than one Sequential erroneous channel signal is discussed in more detail below.) An output x: (n) from the reconstruction filter 25 is a hypothesis regarding the original, now erroneous, channel signal, generated from the main signal m_, (n) using the previous instantaneous correlation between the main signal m _, (nl) and the channel signal x, (n - l). The selector means 42 replaces the incoming erroneous channel signal with the hypothesis signal x: (n) in order to best mask the error.
För fallet att flera efter varandra följande kanalsignalsdelar (ramar) är felaktiga, är flera tillvägagångssätt möjliga att tillämpa. Enligt en utföringsform använder rekonstruktionsñltret 25 den senaste lagrade parameteruppsättning som associeras med en felfri kanalsignalsdel. Detta innebär att om två efter varandra följande felaktiga delar uppträder baseras hypotessignalen för den andra pà korrelationen mellan huvudsignalen m_,(n-2) och kanalsignalen x,(n-2) för en kanalsignalsdel två delar tillbaka.In the event that efter your successive channel signal parts (frames) are incorrect, several approaches can be applied. In one embodiment, the reconstruction filter 25 uses the most recently stored set of parameters associated with an error-free channel signal portion. This means that if two consecutive erroneous parts occur, the hypothesis signal for the other is based on the correlation between the main signal m _, (n-2) and the channel signal x, (n-2) for a channel signal part two parts back.
Ju längre sekvensen av felaktiga signaler är, desto onoggrannare blir ñlterrelevansen.The longer the sequence of erroneous signals, the more inaccurate the interrelevance.
Enligt en annan utföringsform kopplas den hypotessignal x: (n) som äterskapats för en första felaktig kanalsignal tillbaka, såsom visas av den streckade linjen 41, till signalspårningsorganet 22 för att utgöra basen för en ny filterskattning. Maskeringen av en efterföljande felaktig kanalsignal kan 10 15 20 25 30 527 866 12 sedan alltid baseras på den senaste tillgängliga filterversionen, oavsett om denna ñlterversion är associerad med en felfri eller en hypotessignal.According to another embodiment, the hypothesis signal x: (n) generated for a first erroneous channel signal is fed back, as shown by the dashed line 41, to the signal tracking means 22 to form the basis for a new attlter estimate. The masking of a subsequent erroneous channel signal can then always be based on the latest available filter version, regardless of whether this interversion is associated with an error-free or a hypothesis signal.
I en tredje utföringsform kan en efterföljande felaktig kanalsignal maskeras med hjälp av en signal som härleds som en kombination av de två föregående tillvägagångssätten, d.v.s. en kombination av det senaste felfria filtret och det senaste hypotessignalbaserade filtret.In a third embodiment, a subsequent erroneous channel signal can be masked by means of a signal derived as a combination of the two preceding approaches, i.e. a combination of the latest error-free filter and the latest hypothesis signal-based filter.
I ovan diskuterade utföringsformer utförs signalspårningen med hjälp av skapande av parametriska ñlter på varje enskild kanalsignal. I andra utföringsformer kan det istället vara fördelaktigt att använda filter som istället återskapar linjärkombinationer av kanalsignalema. Fig. 4 visar ett sådan alternativ. Här tillhandahålls fyra kanalñltersektioner 40, vilka appliceras på linjärkombinationer av kanalsignalerna, skapade i respektive linjärkornbinerare 44. I fall med felaktiga signaler linjärkombineras återigen hypotessignalutgångarna från kanalfiltersektionerna 40 i en utsignals- kombinerare 45, för att skapa ersåttningssignaler för de felaktiga kanalsignalerna.In the embodiments discussed above, the signal tracking is performed by creating parametric ñlter on each individual channel signal. In other embodiments, it may instead be advantageous to use filters that instead recreate linear combinations of the channel signals. Fig. 4 shows such an alternative. Here, four channel filter sections 40 are provided, which are applied to linear combinations of the channel signals created in each linear grain binder 44. In case of erroneous signals, the hypothesis signal outputs from the channel filter sections 40 are again linearly combined in an output signal combiner 45 to create replacement signal signals.
Kanalsignalerna själva kan också vara linjärkombinationer av ursprungliga kanalsignaler. Ett vanligt tillvägagångssätt för överföring av stereoljud- signaler är till exempel att överföra en monosignal, vilken är medelvärdet av de två kanalsignalerna, och en sidosignal som är halva skillnaden mellan de ursprungliga signalerna. I ett sådant system kan ett fel mycket väl uppträda i antingen mono- eller sidosignalen, varvid kanalsignalmaskering enligt föreliggande uppfinning med fördel utförs på t.ex. sidosignalen baserad på monosignalen.The channel signals themselves can also be linear combinations of original channel signals. A common approach for transmitting stereo audio signals is, for example, to transmit a mono signal, which is the average of the two channel signals, and a side signal which is half the difference between the original signals. In such a system, an error may very well occur in either the mono or side signal, whereby channel signal masking according to the present invention is advantageously performed on e.g. the side signal based on the mono signal.
I ett mer specifikt exempel på ett överföringssystem för stereoljudsignaler, använder ett kodnings-/avkodningssystem en sido- och en monosignals- representation av den ursprungliga insignalen. Monosignalen definieras som: _ xi(")+ 35207) m(") _ "T- , 10 15 20 25 30 527 866 13 under det att sidosignalen ges av: _ xx (")" xz (n) s(n) _ ---í---.In a more specific example of a stereo audio signal transmission system, an encoding / decoding system uses a side and a mono signal representation of the original input signal. The mono signal is defined as: _ xi (") + 35207) m (") _ "T-, while the side signal is given by: _ xx (") "xz (n) s (n) _ --- í ---.
Den parametriska modellen som tillämpas för felmaskering enligt den föreliggande uppfinningen antas vara ett linjärt FlR-filter (eng. Finite Impulse Response) av Pzte ordningen med överföringsfunktíon: H(z) = fw)- z* . |'=0 Insignalen till den parametriska modellen är en avkodad monosignal m'(n) under det att modellen skapar en skattning š'(n) av den avkodade sidosignalen s'(n). En felminimeringsprocedur beräknar filterkoefficient- vektorn I_1 sådan att ñlterutsignalen š'(n) på bästa sätt matchar sidosignalen s'(n). Det ñnns kända felmínimeringsprocedurer som kan tillämpas här, av vilka en är tillvägagångssättet med Wienerñlter.The parametric model applied for error masking according to the present invention is assumed to be a linear FlR filter (Finite Impulse Response) of the Pzte order with transfer function: H (z) = fw) - z *. | '= 0 The input signal to the parametric model is a decoded mono signal m' (n) while the model creates an estimate š '(n) of the decoded side signal s' (n). An error minimization procedure calculates the efltercoefficient vector I_1 such that the utslter output signal š '(n) best matches the side signal s' (n). There are known fault minimization procedures that can be applied here, one of which is the Wienerñlter approach.
Enligt Wienertillvägagångssåttet väljs ñltret lg som är giltigt för en dataram så att det minimerar summan av de kvadrerade felen mellan sidosignalen s'(n) och ñlterutsignalen š'(n), d.v.s. summan av f2<»>=[s'<»>-f'<»>r, där n numrerar samplen i en mottagen ram. Detta minimeringskriterium leder till kravet att den felaktiga och den fördröjda versionen av signal m' är ortogonala: Elmin - k)- r(n)j = o, k e [o,...,P] . 10 15 20 25 30 527 866 14 Detta leder till följande linjära ekvationssystem för ñlterkoefñcientvektorn l_1: Än", 'är 1 där å” är en Toeplitzmatris av autokorrelationer för signal m': gm, = lrmli -k)1 11k e [0,---,Pl» och där gm, år en vektor av korskorrelationer för signaler m' och s': [m = [rm k e [O,...,P] .According to the Vienna approach, the filter lg is selected which is valid for a data frame so as to minimize the sum of the squared errors between the side signal s '(n) and the utslter output signal š' (n), i.e. the sum of f2 <»> = [s '<»> - f' <»> r, where n numbers the samples in a received frame. This minimization criterion leads to the requirement that the erroneous and the delayed version of signal m 'are orthogonal: Elmin - k) - r (n) j = o, k e [o, ..., P]. 10 15 20 25 30 527 866 14 This leads to the following linear system of equations for the koltercoefficient vector l_1: Än ", 'is 1 where å" is a Toeplitz matrix of autocorrelations for signal m': gm, = lrmli -k) 1 11k e [0, ---, Pl »and where gm, is a vector of cross-correlations for signals m 'and s': [m = [rm ke [O, ..., P].
Filterkoefficienterna lagras enbart efter beräkning utan att användas ytterligare. Om emellertid den efterföljande ramen är felaktig så att åtminstone delar av sidosignalen s' inte är tillgängliga kommer de lagrade koefñcienterna att användas.The filter coefficients are stored only after calculation without further use. However, if the subsequent frame is incorrect so that at least parts of the side signal s' are not available, the stored coefficients will be used.
Monosignalen m'(n) kommer att härledas i ett första steg. Det fall där även monosignalen påverkas av ramförlusten diskuteras mer i detalj längre ner.The mono signal m '(n) will be derived in a first step. The case where the mono signal is also affected by the frame loss is discussed in more detail below.
Den parametriska modellen kommer att tillämpas i ett andra steg för att återskapa en ersättningssignal s'*(n) till sidosignalen. Detta görs genom att först sätta ñlterkoefficienterna till de som lagrats i minnet. Sedan filtreras monosignalen, vilket genererar signalen s' * (n) Huvudstegen i en utföringsform av ett maskeringsförfarande för en kanalsignal enligt föreliggande uppfinning presenteras i ett flödesdiagram i Fig. 5A. Förfarandet inleds i steg 200. I steg 202 tillhandahålls en insignal, företrädesvis en huvudsignal baserad på en beräkning av en linjärkombination av mottagna kanalsignaler. I-Iuvudsignalen kan också tillhandahållas som en av kanalsignalerna. Detta är ett specialfall av det första alternativet där ”linjärkombinatíonen” av enbart en kanalsignal används. I-luvudsignalen kan också tillhandahållas från något annat håll, 10 15 20 25 30 527 866 15 t.ex. som ett resultat av en annan maskeringsprocedur. Monosignalen är företrädesvis på något sätt associerad med de föreliggande kanalsignalerna.The parametric model will be applied in a second step to recreate a replacement signal s' * (n) to the side signal. This is done by first setting the ñltercoefficients to those stored in memory. Then, the mono signal is filtered, which generates the signal s' * (n). The method is initiated in step 200. In step 202, an input signal, preferably a main signal, is provided based on a calculation of a linear combination of received channel signals. The I-level signal can also be provided as one of the channel signals. This is a special case of the first option where the "linear combination" of only one channel signal is used. The in-loop signal can also be provided from another source, e.g. as a result of another masking procedure. The mono signal is preferably in some way associated with the present channel signals.
Dessa alternativ kommer att diskuteras vidare nedan.These options will be discussed further below.
Felstatusen för kanalsignalen ifråga undersöks i steg 204. I många digitala system förses typiskt sett en ram som innefattar signaldata med några felstatusbitar. Undersökningssteget kommer i ett sådant fall att innefatta kontrollen av felstatusbitarna. I andra fall, där det inte finns någon uttrycklig felstatusinformation måste mer detekteringslika åtgärder vidtagas.The error status of the channel signal in question is examined in step 204. In many digital systems, a frame is typically provided which includes signal data with some error status bits. In such a case, the examination step will include checking the error status bits. In other cases, where there is no explicit error status information, more detection-like measures must be taken.
Paritets- eller redundansbitar kan till exempel kontrolleras. I ännu mer avancerade system skulle det faktiska signalinnehållet kunna analyseras för att detektera ”orealistiska” beteenden. Detta kan t.ex. vara användbart i analoga audiosystem.For example, parity or redundancy bits can be checked. In even more advanced systems, the actual signal content could be analyzed to detect "unrealistic" behaviors. This can e.g. be useful in analog audio systems.
Baserat på kanalsignalens felstatus beslutas det i steg 206 om kanalsignalens aktuella del eller ram är felaktig, helt eller delvis. Om kanalsignalen är felfri fortsätter proceduren till steg 208 där det parametriska fltret optimeras, t.ex. enligt principer som liknar det som beskrivits ovan. De optimerade parametrarna lagras sedan i steg 210 för eventuellt framtida bruk.Based on the error status of the channel signal, it is decided in step 206 whether the current part or frame of the channel signal is incorrect, in whole or in part. If the channel signal is error free, the procedure proceeds to step 208 where the parametric filter is optimized, e.g. according to principles similar to those described above. The optimized parameters are then stored in step 210 for possible future use.
Om kanalsignalen är felaktig på något sätt, d.v.s. om innehållet är förvanskat eller om ramen saknas, kommer en faktisk maskeringsprocedur att äga rum. En signal som skall ersätta och därmed maskera den felaktiga signalen skapas i steg 212 genom att filtrera den tillhandahållna huvudsignalen i ett filter som definieras av parametrar från den föregående felfria ramen eller signaldelen. Den skapade signalen ersätter den felaktiga signaldelen i steg 214, varvid felet maskeras på bästa möjliga sätt.If the channel signal is incorrect in any way, i.e. if the content is distorted or if the frame is missing, an actual masking procedure will take place. A signal to replace and thus mask the erroneous signal is created in step 212 by filtering the provided main signal in an alter as they are denoted by parameters from the previous error-free frame or signal part. The created signal replaces the erroneous signal portion in step 214, masking the error in the best possible way.
Proceduren avslutas i steg 299.The procedure ends in step 299.
Ovanstående procedur upprepas för varje signaldel, vilket indikeras av den streckade linjen 250. 10 15 20 25 30 527 866 16 Flödesdiagramrnet ovan gäller också för en av utföringsformerna när flera efter varandra följande felaktiga ramar behandlas. För varje felaktig ram i steg 212 används de ñlterparametrar som associerats med den sista felfria signaldelen, oavsett hur långt tillbaka signalen togs emot. I en något förändrad utföringsform kan steg 212 också modifieras till att innefatta en gradvis dämpning av filterparametrarna, vilket leder till en gradvis övergång till en ren huvudsignal.The above procedure is repeated for each signal part, as indicated by the dashed line 250. The flow diagram above also applies to one of the embodiments when the successive erroneous frames are processed. For each erroneous frame in step 212, the parlter parameters associated with the last error-free signal portion are used, regardless of how far back the signal was received. In a slightly modified embodiment, step 212 may also be modified to include a gradual attenuation of the filter parameters, leading to a gradual transition to a pure main signal.
En alternativ utföringsform visas i Fig. SB. Alla steg som är lika som i Fig. 5A har samma referenssiffror och kommer inte att diskuteras ytterligare. Om en felaktig signaldel detekteras fortsätter proceduren till steg 211, i vilket en maskeringssignal framställs. Denna signal baseras på. tidigare filterparametrar enligt någon förutbestämd konfiguration.An alternative embodiment is shown in Fig. SB. All steps which are the same as in Fig. 5A have the same reference numerals and will not be discussed further. If an erroneous signal portion is detected, the procedure proceeds to step 211, in which a masking signal is produced. This signal is based on. previous ter lter parameters according to any predetermined configuration.
När maskeringssignalen har skapats och har ersatt den ursprungliga felaktiga signalen, utförs stegen att optimera ñltret och lagra de optimerade parametrarna, men nu baserade på maskeringssignalen istället för en felfri ursprungssignal. På så sätt kan filter som i något hänseende innefattar senast möjlig information användas i successiva felaktiga signaldelar. 1 nägra utföringsformer kan steg 211 till och med innefatta en kombination av parametrar som härletts från felfria signaler och från maskeringssignaler.Once the masking signal has been created and has replaced the original erroneous signal, the steps of optimizing the filter and storing the optimized parameters are performed, but now based on the masking signal instead of an error-free originating signal. In this way, filters that in some respect include the latest possible information can be used in successive incorrect signal parts. In some embodiments, step 211 may even include a combination of parameters derived from error-free signals and from masking signals.
Sådana alternativ kommer att diskuteras längre ner.Such alternatives will be discussed later.
För att ytterligare åskådliggöra informationsanvändningen visar Fig. 7A en maskeringssituation som har en enda felaktig signal. Under en ram n-l skapas ñlterparametrar h,,(n-l) för kanal x. baserade på signalinformation frän de andra kanalsignalerna. Under ram n är kanalen x. felaktig och kan inte användas. De återstående kanalerna i ram n kan emellertid utnyttjas för att ge en huvudsignal m_,,(n). Huvudsignalen m_,c(n) och de lagrade ñlterparametrarna hk (n -l) används sedan för att skapa en hypotes x; (n) för en ursprunglig signal, vilken används för att maskera den felaktiga signalen. 10 15 20 25 30 527 866 17 På så sätt används korrelationer, inte bara i tidsriktningen, utan även i kanalrymden, för att skapa hypotessignalen x; För på varandra följande felaktiga signaler kan situationen se ut som Fig. 7B om utföringsformen i Fig. 5A tillämpas. Filterparametrarna för ram n-2 lagras. En huvudsignal m_,,(n) tillhandahålls och appliceras på filtret med parametrarna från ram n-2 för att åstadkomma en ersättningssignal x; I detta fall används kanalkorrelationer för ram n-2 och ram n tillsammans med tidskorrelationer mellan ramarna n-2 och n. Informationen från ram n-l är emellertid huvudsakligen oanvänd. För kortare sekvenser av felaktiga ramar behöver ett sådant försummande av information inte vara särskilt allvarligt. Om antalet sekventiella felaktiga signaler emellertid blir stort kan mer noggranna hypoteser bli möjliga om även de mellanliggande ramarna beaktas.To further illustrate the use of information, Fig. 7A shows a masking situation having a single erroneous signal. Under a frame n-1, ñlter parameters h ,, (n-1) are created for channel x. Based on signal information from the other channel signals. Under frame n, the channel x. Is incorrect and cannot be used. However, the remaining channels in frame n can be used to provide a main signal m _ ,, (n). The main signal m_, c (n) and the stored ñlter parameters hk (n -l) are then used to create a hypothesis x; (n) for an original signal, which is used to mask the erroneous signal. 10 15 20 25 30 527 866 17 In this way, correlations are used, not only in the time direction, but also in the channel space, to create the hypothesis signal x; For successive erroneous signals, the situation may look like Fig. 7B if the embodiment of Fig. 5A is applied. The filter parameters for frame n-2 are stored. A main signal m 1, (n) is provided and applied to the filter with the parameters from frame n-2 to provide a replacement signal x; In this case, channel correlations for frame n-2 and frame n are used together with time correlations between frames n-2 and n. However, the information from frame n-1 is essentially unused. For shorter sequences of incorrect frames, such neglect of information need not be very serious. However, if the number of sequential erroneous signals becomes large, more accurate hypotheses may become possible if the intermediate frames are also taken into account.
Fig. 7C visar situationen enligt ett förfarande enligt utföringsformen som visas i Fig. 5B. De felfria filterparametrarna hk (n-2) uppnås på samma sätt.Fig. 7C shows the situation according to a method according to the embodiment shown in Fig. 5B. The error-free ter lter parameters hk (n-2) are achieved in the same way.
Hypotessignalen x,:(n-1) för ram n-l används emellertid här också för att producera en annan filterparaineteruppsättning h,:(n-1), vilken emellertid inte baserats på helt felfria signaler. En hypotessignal x; (n) för ram n kan bestämmas genom att använda h; (n-Û-parametrarna på en huvudsignal m_,, Hypotessignalen x; (n) kommer sedan inbegripa korrelationer från både ram n och n-l.However, the hypothesis signal x, :( n-1) for frame n-1 is also used here to produce another ain lterparaineter set h, :( n-1), which, however, is not based on completely error-free signals. A hypothesis signal x; (n) for frame n can be determined using h; The n-Û parameters of a main signal m_ ,, The hypothesis signal x; (n) will then include correlations from both frame n and n-l.
En annan möjlighet är att kombinera information som härletts från parametrarna h; (n -l) och hk (n - 2), vilket ytterligare kommer att öka den bas på vilken maskeringen grundas.Another possibility is to combine information derived from the parameters h; (n -1) and hk (n - 2), which will further increase the base on which the mask is based.
I Fig. 7D visas en ytterligare utföringsform av uppfinningen. Situationen är den för ram n att komponenter i kanalsignal k är felaktiga och behöver maskeras enligt uppfinningen. I den föregående ramen n-l är åtminstone 10 15 20 25 30 527 866 18 kanal p påverkad av fel, men inte kanal k. Ramen n-2 antas vara helt felfri.Fig. 7D shows a further embodiment of the invention. The situation is that for frame n that components in channel signal k are faulty and need to be masked according to the invention. In the preceding frame n-1, at least channel p is affected by error, but not channel k. Frame n-2 is assumed to be completely error-free.
En uppsättning filterkoefíïcienter hk(n~l) kan härledas för tidsögonblicket n- 1 enligt de ovan beskrivna förfarandena, för vilka en huvudsignal m1, som exkluderar den felaktiga kanalen p används i härledningen av filterparametrarna. Dä kanalsignal k är felaktig för ram n kan det emellertid till och med vara mer fördelaktigt att använda en huvudsignal m-pfk som exkluderar båda kanalerna p och k vid härledningen av filterparametrarna.A set of koltercoefficients hk (n ~ 1) can be derived for the instantaneous moment n- 1 according to the methods described above, for which a main signal m1, which excludes the erroneous channel p, is used in the derivation of the filter parameters. However, since channel signal k is incorrect for frame n, it may even be more advantageous to use a main signal m-pfk which excludes both channels p and k when deriving the par filter parameters.
Användning av en uppsättning filterparametrar härledda på ett sådant sätt leder till en hypotessignal x,:(n). Då denna uppsättning emellertid inte är baserad på helt felfria signaler kan det vara fördelaktigt att använda en hypotessignal x: (n) för ram n genom att använda ñlterparametrarna hi<(n-2) härledda från den sista helt felfria ramen n-2. En ännu bättre lösning är att kombinera båda hypotessignalerna eller att härleda hypotessignalen genom att tillämpa den modell som använder en uppsättning ñlterparametrar som kombinerar båda uppsättningarna av ñlterkoefficienter hk(n-2) och h1<(n- 1).Using a set of fi lter parameters derived in such a way leads to a hypothesis signal x, :( n). However, since this set is not based on completely error-free signals, it may be advantageous to use a hypothesis signal x: (n) for frame n by using the sub-parameters hi <(n-2) derived from the last completely error-free frame n-2. An even better solution is to combine both hypothesis signals or to derive the hypothesis signal by applying the model that uses a set of ñlter parameters that combine both sets of ñltercoefficients hk (n-2) and h1 <(n- 1).
För en given kanal k är det därmed möjligt att beräkna olika modellparameteruppsättningar, beroende på vilken kombination av kanalsignaler som exkluderats från huvudsignalen. En mottagare kan förberäkna och lagra alla möjliga modellparametrar för varje kanal k genom att permutera alla möjliga kombinationer av kanalexkluderingar frän huvudsignalen. Genom att ha förberäknat alla sådana modeller tillåts mottagaren vid någon efterföljande ram med fel att använda den specifika modellparameteruppsättning som matchar mönstret av felaktiga eller felfria kanaler.For a given channel k, it is thus possible to calculate different model parameter sets, depending on which combination of channel signals has been excluded from the main signal. A receiver can pre-calculate and store all possible model parameters for each channel k by permuting all possible combinations of channel exclusions from the main signal. By having pre-calculated all such models, the receiver is allowed in any subsequent frame with errors to use the specific model parameter set that matches the pattern of incorrect or error-free channels.
Som ses ovan är det möjligt att använda en annan linjârkombination av kanalsignaler för att härleda filterparametrarna - en härledande insignal - än som används för att skapa ersättningssignalen - den genererande insignalen. De härledande och genererande insignalerna är emellertid företrädesvis så likartade som möjligt. 10 15 20 25 527 866 19 Antag ett exempel där en multikanalssignal xk (n) förloras och måste återhämtas. Detta görs genom att använda de lagrade modellkoefficienter som härletts för den sista giltiga ramen. Om det emellertid finns flera efter varandra följande ramförluster och den aktuella förlorade ramen är den q:te förlorade ramen i rad tillhör då de lagrade modellkoefñcienterna en ram med tidsindex n-q och koefñcientuppsättningen kan betecknas h,,(n-q). I detta fall är det fördelaktigt att använda parametrar h,,(n-1) hârledda från den föregående ramen även om det var en återhämtad ogiltig ram. Allmänt sett kan de koefficienter som skall användas för återhämtning av multikanals- signalen x, (n) härledas som en kombination av alla parameteruppsättningar som härletts under de föregående ramarna tillbaka till den sista giltiga ramen (eller ännu längre). Ett lämpligt val är att använda en linjärkombination av parameteruppsåttningarna: hi=i«-h,,<~-f>, í=l där a(i) är viktningsfaktorer vars summa är lika med ett. Att sätta a(n-q) till l och alla andra vikter till O resulterar i att använda enbart den senaste giltiga ramens parametrar, under det att sätta a(n-l) till 1 och alla andra vikter till O resulterar i att enbart använda den föregående ogiltiga ramens parametrar.As seen above, it is possible to use a different linear combination of channel signals to derive the parlter parameters - a derivative input signal - than that used to create the replacement signal - the generating input signal. However, the derivative and generating inputs are preferably as similar as possible. 10 15 20 25 527 866 19 Assume an example where a multi-channel signal xk (n) is lost and must be recovered. This is done by using the stored model coefficients derived for the last valid frame. However, if there are several consecutive frame losses and the current lost frame, the qth lost frame in a row then belongs to the stored model coefficients a frame with time index n-q and the coefficient set can be denoted h ,, (n-q). In this case, it is advantageous to use parameters h ,, (n-1) derived from the previous frame even if it was a recovered invalid frame. In general, the coefficients to be used for retrieving the multi-channel signal x, (n) can be derived as a combination of all parameter sets derived during the previous frames back to the last valid frame (or even longer). A suitable choice is to use a linear combination of the parameter sets: hi = i «-h ,, <~ -f>, í = l where a (i) are weighting factors whose sum is equal to one. Setting a (nq) to l and all other weights to 0 results in using only the last valid frame parameters, while setting a (nl) to 1 and all other weights to 0 results in using only the previous invalid frame parameters.
I fall av långa sekvenser av förlorade ramar kan det vara fördelaktigt att tillämpa någon gradvis dämpning av modellparametrarna, vilket huvudsakligen resulterar i en gradvis försvagning av den återhämtade multikanalinformationen. I fall av total dämpning, kommer ingen multikanalsignal att återhämtas, vilket resulterar i att återgå till en ren uppspelning av monoljudkanalen. 10 15 20 25 30 527 866 20 En exempelrealisering av en sådan dämpningsteknik för det fall att modellen är ett FIR-filter är att gradvis dämpa filterkoefficienterna. Fullständig dämpning åstadkoms genom att sätta alla koefficienter till noll.In the case of long sequences of lost frames, it may be advantageous to apply some gradual attenuation of the model parameters, which mainly results in a gradual weakening of the recovered multichannel information. In case of total attenuation, no multi-channel signal will be recovered, resulting in a return to a pure playback of the mono audio channel. 10 15 20 25 30 527 866 20 An example realization of such an attenuation technique in the case that the model is an FIR filter is to gradually attenuate the filter coefficients. Complete attenuation is achieved by setting all coefficients to zero.
I vissa tillämpningar, tex. vid användning av den faktiska monosignalen som en huvudsignal, är huvudsignalen som sådan inte tillgänglig, utan måste syntetiseras från de individuella kanalsignalerna. Om alla individuella kanalsignaler är defekta finns ingen användbar huvudsignal för multikanals- maskeringen enligt uppfinningen tillgänglig. Dessutom, om huvudsignalen erhålls från något annat håll kan huvudsignalen vara felaktig. I sådana fall kan vilken känd konventionell maskeringsteknik som helst användas för att erhålla en ersâttningssígnal till huvudsignalen innan huvudsignalen används i skapandet av filterparametrar eller maskeringssignaler för kanalsignaler. Ifall huvudsignalen måste åstadkommas som en linjärkombination av de individuella kanalsignalema kan proceduren i steg 202 i figurerna 5A och SB se ut som lig. 6. Vid ingång från steg 200 måste ett beslut tas i steg 216 om huruvida alla individuella kanalsignaler är felaktiga och därmed ingen användbar huvudsignal finns tillgänglig. Liksom i undersökningen av en särskild kanalsignals felstatus, kan detta beslut baseras antingen på ramfelsstatusbitar eller mer sofistikerade fel- detekteringstekniker. Om någon av kanalsignalerna är felfri fortsätter proceduren till steg 220, i vilket en linjärkombination av de icke-defekta kanalsignalerna skapas som den huvudsignal som exkluderar de felaktiga kanalsignalerna. Om alla kanalsignaler är felaktiga fortsätter proceduren till steg 218 där en maskeringsteknik för en huvudsignal enligt konventionella förfaranden används för att tillhandahålla en skattad huvudsignal, vilken senare kan användas i maskeringsproceduren för kanalsignaler enligt den föreliggande uppfinningen. Ett fall där multipla kanalsignaler är felaktiga och uppfinningen tillämpas rekursivt för att återhämta alla felaktiga kanalsignaler kommer att beskrivas nedan. Även om den föreliggande uppfinningen är tillämpbar i system som använder alla typer av kodningsscheman, finns det ett antal ytterligare fördelar när 10 15 20 25 30 527 866 21 den tillämpas på system som använder kodningar baserade på parametriska filter. Med hänsyn till t.ex. Fig. lC inses att om avkodaren använder parametrisk avkodning baserad på en monosignal, kan samma monosignal tillhandahållas också till maskeringsanordningen. Ett fel i en kanalsignal behöver därmed inte nödvändigtvis påverka monosignalen.In some applications, e.g. when using the actual mono signal as a main signal, the main signal as such is not available, but must be synthesized from the individual channel signals. If all individual channel signals are defective, no useful main signal for the multi-channel masking according to the invention is available. In addition, if the main signal is obtained from another source, the main signal may be incorrect. In such cases, any known conventional masking technique can be used to obtain a replacement signal to the main signal before the main signal is used in the creation of filter parameters or masking signals for channel signals. If the main signal must be provided as a linear combination of the individual channel signals, the procedure in step 202 in Figures 5A and SB may look similar. At the input of step 200, a decision must be made in step 216 as to whether all the individual channel signals are incorrect and thus no usable main signal is available. As in the examination of the fault status of a particular channel signal, this decision can be based either on frame fault status bits or more sophisticated fault detection techniques. If any of the channel signals is error free, the procedure proceeds to step 220, in which a linear combination of the non-defective channel signals is created as the main signal which excludes the erroneous channel signals. If all channel signals are incorrect, the procedure proceeds to step 218 where a main signal masking technique according to conventional methods is used to provide an estimated main signal, which can later be used in the channel signal masking procedure of the present invention. A case where multiple channel signals are erroneous and the invention is applied recursively to recover all erroneous channel signals will be described below. Although the present invention is applicable to systems using all types of coding schemes, there are a number of additional advantages when applied to systems using codings based on parametric filters. With regard to e.g. Fig. 1C understands that if the decoder uses parametric decoding based on a mono signal, the same mono signal can also be provided to the masking device. An error in a channel signal thus does not necessarily affect the mono signal.
Vidare, om avkodaren utnyttjar samma filtertyp som i maskerings- anordningen kan ytterligare fördelar erhållas. Fig. 8 visar en kombinerad avkodar- och maskeringsanordning 90, båda baserade på parametriska filtertekniker. En kodad monosignal m" tillhandahålls vid en första anslutning 17A och kodade filterparametrar h"1-h"3 tillhandahålls vid en andra anslutning 17B. Monosignalen avkodas i en monosignalavkodare 80 enligt någon konventionell monosignalteknik, vilken ger en avkodad monosignal m”. Monosignalen m' tillhandahålls till en avkodarñlterenhet 86.Furthermore, if the decoder uses the same type of filter as in the masking device, additional benefits can be obtained. Fig. 8 shows a combined decoder and masking device 90, both based on parametric filtering techniques. An encoded mono signal m "is provided at a first terminal 17A and encoded filter parameters h" 1-h "3 are provided at a second terminal 17B. provided to a decoder unit 86.
De kodade filterparametrai-iia h"1-h"3 avkodas i en pararneteravkodare 84.The encoded filter parameters h "1-h" 3 are decoded in a parameter decoder 84.
De avkodade tillhandahålls till en avkodarfilterenhet 86 för att definiera ett filter, vilket vid applicering på ñlterparametrarna h'1-h'a monosignalen återskapar linjärkombinationer c'1-c'3 av kanalsignaler.The decoders are provided to a decoder filter unit 86 for defining a filter, which when applied to the filter parameters h'1-h'a mono signal recreates linear combinations c'1-c'3 of channel signals.
Linjärkombinationerna c'1-c'3 och monosignalen m' kombineras i en linjärkombinationsenhet 82 till fyra kanalsignaler x'i~x'4.The linear combinations c'1-c'3 and the mono signal m 'are combined in a linear combination unit 82 into four channel signals x'i ~ x'4.
De avkodade filterparametrarna h'1-h'3 tillhandahålls också till ett minne 24 för lagring i väntan på någon möjlig framtida användning. Ett felstatus- undersökningsorgan 23 kontrollerar om parametrarna är felaktiga eller inte.The decoded filter parameters h'1-h'3 are also provided to a memory 24 for storage pending any possible future use. An error status examination means 23 checks whether the parameters are incorrect or not.
Om ett fel upptäcks tillhandahålls den avkodade monosignalen dessutom till ett rekonstruktionsfilter 25, definierat av lagrade filterparametrar. Den genererade signalen ersätter den felaktiga signalen med hjälp av ett våljarorgan 42 i analogi med tidigare beskrivna utföringsformer. Även om den föreliggande uppfinningen baseras på digital bearbetning av ljudsignaler, kan uppfinningen även tillämpas på analoga audiosystem. Fig. 9 visar ett blockschema av en utföringsform av en maskeringsanordning 20 10 15 20 25 30 527 866 22 enligt den föreliggande uppfinningen tillämpad i ett analogt audiosystem.In addition, if an error is detected, the decoded mono signal is provided to a reconstruction filter 25, defined by stored filter parameters. The generated signal replaces the erroneous signal by means of a selector 42 in analogy with previously described embodiments. Although the present invention is based on digital processing of audio signals, the invention can also be applied to analog audio systems. Fig. 9 shows a block diagram of an embodiment of a masking device 20 10 15 20 25 30 527 866 22 according to the present invention applied in an analog audio system.
Två analoga kanaler xi och X2 tillhandahålls till en rnonosignalshärlednings- enhet 96 i maskeringsanordningen 20. Monosignalshärledningsenheten 96 tar medelvärdet av de två kanalerna och samplar den kombinerade signalen till en digital representation av monosignalen ñ. De analoga signalerna vidarebefordras till var sin kanalñltersektion 40, av vilka endast en visas i detalj.Two analog channels x1 and X2 are provided to a mono signal derivation unit 96 in the masking device 20. The mono signal derivation unit 96 takes the average of the two channels and samples the combined signal to a digital representation of the mono signal ñ. only one is shown in detail.
En feldetektor 93 är ansluten för att känna av den analoga signalens karakteristik. Normala ljudsignaler följer typiskt sett vissa statistiska beteenden, där förändringarna i signalkarakteristik antingen är ganska långsamma eller följer viss harmonisk statistik. Ett fel i en analog signal uppträder ofta som en plötslig och extremt okorrelerad ändring i spektralkarakteristiken. Det finns olika typer av detektorer inom känd teknik för att hitta möjliga feldelar i analoga ljudsignaler. Om inga fel detekteras i feldetektom 93 förs den analoga signalen genom en fördröjningsenhet 97 för att anpassa tirningen för en omodiñerad analog signal till timingen för en maskerad felsignal. Ett väljarorgan 42 tillhandahåller den oförändrade analoga signalen på utgången från kanalñltersektionen 40. ' Om inget fel detekteras överförs den analoga signalen också till samplingsenhet 92, där den analoga ljudsignalen digitaliseras och delas in i ramar med en förutbestämd varaktighet. Den digitaliserade versionen av kanalsignalen Y, används på analogt sätt som beskrivningen ovan för att optimera ett parametriskt filter 26. Den digitaliserade monosignalen ñ används som insignal till filtret 26 och ett ñlteroptimeringsorgan 27 optimerar parametrarna, vilka sedan lagras i ett minne 24. Under felfria förhållanden är detta de fullständiga handlingarna.An error detector 93 is connected to sense the characteristics of the analog signal. Normal audio signals typically follow certain statistical behaviors, where the changes in signal characteristics are either rather slow or follow certain harmonic statistics. An error in an analog signal often appears as a sudden and extremely uncorrelated change in spectral characteristics. There are different types of detectors in the prior art to find possible fault parts in analog audio signals. If no errors are detected in the error detector 93, the analog signal is passed through a delay unit 97 to match the timing of an unmodified analog signal to the timing of a masked error signal. A selector 42 provides the unchanged analog signal at the output of the channel filter section 40. If no error is detected, the analog signal is also transmitted to the sampling unit 92, where the analog audio signal is digitized and divided into frames of a predetermined duration. The digitized version of the channel signal Y, is used in an analogous manner to the description above to optimize a parametric filter 26. The digitized mono signal ñ is used as an input to the filter 26 and an inter-optimizer 27 optimizes the parameters, which are then stored in a memory 24. Under faultless conditions these are the complete documents.
Om feldetektorn 93 emellertid hittar ett fel i den analoga signalen styrs väljarorganet 42 till att istället acceptera en analog maskeringsdel. Den digitaliserade monosignalen ñ modifieras enligt någon känd metod för 10 15 20 25 30 527 866 23 monosignalsmaskering i en monosignalsmaskeringsenhet 95 om någon av kanalsignalerna är felaktig. Den modifierade monosignalen tillhandahålls till ett återskapningsfilter 25 definierat av parametrar som tidigare lagrats i minnet 24, i analogi med de ovan beskrivna principerna. Den digitala maskeringssignalen förs till en digital-till-analog ljudomvandlare 94, vilken omvandlar den digitala signalen till en analog signal, vilken ansluts av väljarorganet 42 för att ersätta den felaktiga signalen.However, if the error detector 93 finds an error in the analog signal, the selector means 42 is directed to accept an analog masking part instead. The digitized mono signal ñ is modified according to any known method for mono signal masking in a mono signal masking unit 95 if any of the channel signals is incorrect. The modified mono signal is provided to a recovery filter 25 defined by parameters previously stored in the memory 24, in analogy to the principles described above. The digital masking signal is fed to a digital-to-analog audio converter 94, which converts the digital signal into an analog signal, which is connected by the selector means 42 to replace the erroneous signal.
Uppfinning kan därmed användas även för analog ljudsignalsåterskapning.The invention can thus also be used for analogue audio signal reproduction.
En aspekt av den föreliggande uppfinningen är möjligheten att tillämpa tekniken på komponenter hos de olika ljudkanalerna snarare än enbart på de kompletta ljudkanalema. Det är t.ex. möjligt att tillämpa uppfinningen på en eller flera delband eller spektralkomponenter. En speciñk utföringsform är tillämpningen av uppfinningen i ett förutbestämt frekvensområde, företrädesvis innefattande enbart frekvenser under 2 kHz och särskilt företrädesvis enbart på spektralkomponenter under 1 kHz.One aspect of the present invention is the ability to apply the technique to components of the various audio channels rather than just to the complete audio channels. It is e.g. possible to apply the invention to one or more of your subbands or spectral components. A specific embodiment is the application of the invention in a predetermined frequency range, preferably comprising only frequencies below 2 kHz and particularly preferably only on spectral components below 1 kHz.
Den resulterande utsignalen från en maskeringsanordning enligt den föreliggande uppfinningen kan kombineras med maskeringssignaler som erhållits av andra maskeringsförfaranden. Detta kan till .exempel utföras med hjälp av att medelvärdesbilda eller vikta de genererade ersättningssignalerna i olika förhållanden.The resulting output signal from a masking device according to the present invention can be combined with masking signals obtained by other masking methods. This can be done, for example, by averaging or weighting the generated replacement signals in different ratios.
Det föreliggande maskeringsförfarandet kan också användas på ett rekursivt sätt för att maskera felaktiga signaler för mer än en kanal. Förfarandet tillämpas inledningsvis så att det återhämtar en första felaktig kanalsignal baserat på den tillgängliga huvudsignal som exkluderar de felaktiga kanalsignalsdelarna. Därefter återhämtas alla andra felaktiga kanalsignaler rekursivt, där var och en av dessa rekursioner använder den tillgängliga huvudsignal som exkluderar de felaktiga kanalsignalsdelarna och de återhämtade multikanalsignalerna från föregående rekursion. 10 15 20 25 527 866 24 Om huvudsignalen påverkas av den felaktiga signalen kan det föreliggande maskeringsförfarandet också användas på ett rekursivt sätt även för en enda kanal. En första ersättningssignal genereras enligt principerna för föreliggande uppfinning baserad på en återhämtad huvudsignal. Denna första ersättningssignal utnyttjas sedan för att förñna skattningen av den sanna huvudsignalen och förfarandet enligt principerna för den föreliggande uppfinningen kan upprepas för att generera en förfinad ersâttningssignal.The present masking method can also be used in a recursive manner to mask erroneous signals for more than one channel. The method is initially applied so that it recovers a first erroneous channel signal based on the available main signal which excludes the erroneous channel signal portions. Thereafter, all other erroneous channel signals are recovered recursively, each of these recursions using the available main signal which excludes the erroneous channel signal portions and the recovered multichannel signals from the previous recursion. If the main signal is affected by the erroneous signal, the present masking method can also be used in a recursive manner even for a single channel. A first replacement signal is generated according to the principles of the present invention based on a recovered main signal. This first replacement signal is then used to facilitate the estimation of the true main signal and the procedure according to the principles of the present invention can be repeated to generate a modified replacement signal.
En sådan procedur kan upprepas tills förändringen mellan två på varandra följande ersättningssignaler understiger en viss gräns. Även när mer än en kanalsignal är felaktig kan också proceduren repeteras cykliskt för att successivt förfina ersättningssignalerna.Such a procedure can be repeated until the change between two consecutive replacement signals is below a certain limit. Even when more than one channel signal is incorrect, the procedure can also be repeated cyclically to successively refine the replacement signals.
De ovan beskrivna utföringsfonnerna skall betraktas som ett antal illustrativa exempel av den föreliggande uppñnningen. Fackmannen inser att olika modifieringar, kombinationer och förändringar av utföringsformerna kan göras utan att avvika från den föreliggande uppñnningens omfång.The embodiments described above are to be considered as a number of illustrative examples of the present invention. Those skilled in the art will appreciate that various modifications, combinations, and changes may be made therein without departing from the scope of the present invention.
Särskilt kan olika dellösningar i de olika utföringsformerna, där så är tekniskt möjligt, kombineras till andra konfigurationer. Den föreliggande uppñnningens skyddsomfång definieras emellertid av de bifogade patentkraven.In particular, different sub-solutions in the different embodiments, where technically possible, can be combined into other configurations. However, the scope of the present invention is defined by the appended claims.
REFERENSER US 6,490,551 DE3638922 3 GPP TS 26.091, paragrafer 6 och 7 EP O 637 013REFERENCES US 6,490,551 GP3 TS 26,091, paragraphs 6 and 7 EP 0 637 013
Claims (28)
Priority Applications (9)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| SE0400416A SE527866C2 (en) | 2003-12-19 | 2004-02-20 | Channel signal masking in multi-channel audio system |
| AT04809050T ATE365364T1 (en) | 2003-12-19 | 2004-12-15 | ERROR COVERAGE IN MULTI-CHANNEL AUDIO SYSTEMS |
| ES04809050T ES2286714T3 (en) | 2003-12-19 | 2004-12-15 | OCULTATION OF ERRORS IN MULTICHANNEL AUDIO SYSTEMS. |
| PT04809050T PT1649452E (en) | 2003-12-19 | 2004-12-15 | Error concealment in multi-channel audio systems |
| DE602004007142T DE602004007142T2 (en) | 2003-12-19 | 2004-12-15 | FAILURE LEAKAGE IN MULTI-CHANNEL AUDIO SYSTEMS |
| EP04809050A EP1649452B1 (en) | 2003-12-19 | 2004-12-15 | Error concealment in multi-channel audio systems |
| PCT/SE2004/001866 WO2005059898A1 (en) | 2003-12-19 | 2004-12-15 | Channel signal concealment in multi-channel audio systems |
| JP2006518595A JP4723490B2 (en) | 2003-12-19 | 2004-12-15 | Channel signal concealment in multi-channel audio systems |
| US11/012,717 US7835916B2 (en) | 2003-12-19 | 2004-12-16 | Channel signal concealment in multi-channel audio systems |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| SE0303500A SE0303500D0 (en) | 2003-12-19 | 2003-12-19 | Frame loss concealment for multi-channel audio signal transmission |
| SE0400416A SE527866C2 (en) | 2003-12-19 | 2004-02-20 | Channel signal masking in multi-channel audio system |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| SE0400416D0 SE0400416D0 (en) | 2004-02-20 |
| SE0400416L SE0400416L (en) | 2005-06-20 |
| SE527866C2 true SE527866C2 (en) | 2006-06-27 |
Family
ID=31996353
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| SE0400416A SE527866C2 (en) | 2003-12-19 | 2004-02-20 | Channel signal masking in multi-channel audio system |
Country Status (8)
| Country | Link |
|---|---|
| EP (1) | EP1649452B1 (en) |
| JP (1) | JP4723490B2 (en) |
| AT (1) | ATE365364T1 (en) |
| DE (1) | DE602004007142T2 (en) |
| ES (1) | ES2286714T3 (en) |
| PT (1) | PT1649452E (en) |
| SE (1) | SE527866C2 (en) |
| WO (1) | WO2005059898A1 (en) |
Families Citing this family (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4930320B2 (en) * | 2006-11-30 | 2012-05-16 | ソニー株式会社 | Reproduction method and apparatus, program, and recording medium |
| JP5153791B2 (en) * | 2007-12-28 | 2013-02-27 | パナソニック株式会社 | Stereo speech decoding apparatus, stereo speech encoding apparatus, and lost frame compensation method |
| EP2296143B1 (en) | 2008-06-27 | 2018-01-10 | III Holdings 12, LLC | Audio signal decoding device and balance adjustment method for audio signal decoding device |
| US8867752B2 (en) * | 2008-07-30 | 2014-10-21 | Orange | Reconstruction of multi-channel audio data |
| US8737626B2 (en) * | 2009-01-13 | 2014-05-27 | Panasonic Corporation | Audio signal decoding device and method of balance adjustment |
| KR101073409B1 (en) * | 2009-03-05 | 2011-10-17 | 주식회사 코아로직 | Decoding Device and Decoding Method |
| CN102414745B (en) * | 2009-05-22 | 2014-07-30 | 松下电器产业株式会社 | Encoding device, decoding device, and encoding and decoding method |
| WO2010137300A1 (en) | 2009-05-26 | 2010-12-02 | パナソニック株式会社 | Decoding device and decoding method |
| RU2584009C2 (en) * | 2011-09-29 | 2016-05-20 | Долби Интернешнл Аб | Detection of high quality in frequency modulated stereo radio signals |
| EP2709101B1 (en) | 2012-09-13 | 2015-03-18 | Nxp B.V. | Digital audio processing system and method |
| US20230267938A1 (en) * | 2020-07-08 | 2023-08-24 | Dolby International Ab | Packet loss concealment |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3421962B2 (en) * | 1996-10-14 | 2003-06-30 | 日本電信電話株式会社 | Missing sound signal synthesis processing method |
| DE19721487A1 (en) * | 1997-05-23 | 1998-11-26 | Thomson Brandt Gmbh | Method and device for concealing errors in multi-channel sound signals |
| JP3567750B2 (en) * | 1998-08-10 | 2004-09-22 | 株式会社日立製作所 | Compressed audio reproduction method and compressed audio reproduction device |
| JP2001154699A (en) * | 1999-11-23 | 2001-06-08 | Texas Instr Inc <Ti> | Hiding for frame erasure and its method |
| JP2001296894A (en) * | 2000-04-12 | 2001-10-26 | Matsushita Electric Ind Co Ltd | Audio processing device and audio processing method |
| DE10034783A1 (en) * | 2000-07-18 | 2002-02-07 | Bosch Gmbh Robert | Method for concealing transmission errors in digital audio data |
| EP1479071B1 (en) * | 2002-02-18 | 2006-01-11 | Koninklijke Philips Electronics N.V. | Parametric audio coding |
| WO2003107591A1 (en) * | 2002-06-14 | 2003-12-24 | Nokia Corporation | Enhanced error concealment for spatial audio |
| US20040083110A1 (en) * | 2002-10-23 | 2004-04-29 | Nokia Corporation | Packet loss recovery based on music signal classification and mixing |
-
2004
- 2004-02-20 SE SE0400416A patent/SE527866C2/en not_active IP Right Cessation
- 2004-12-15 WO PCT/SE2004/001866 patent/WO2005059898A1/en not_active Ceased
- 2004-12-15 EP EP04809050A patent/EP1649452B1/en not_active Expired - Lifetime
- 2004-12-15 DE DE602004007142T patent/DE602004007142T2/en not_active Expired - Lifetime
- 2004-12-15 ES ES04809050T patent/ES2286714T3/en not_active Expired - Lifetime
- 2004-12-15 PT PT04809050T patent/PT1649452E/en unknown
- 2004-12-15 AT AT04809050T patent/ATE365364T1/en not_active IP Right Cessation
- 2004-12-15 JP JP2006518595A patent/JP4723490B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| SE0400416L (en) | 2005-06-20 |
| EP1649452B1 (en) | 2007-06-20 |
| ES2286714T3 (en) | 2007-12-01 |
| PT1649452E (en) | 2007-08-08 |
| DE602004007142T2 (en) | 2008-02-14 |
| DE602004007142D1 (en) | 2007-08-02 |
| ATE365364T1 (en) | 2007-07-15 |
| SE0400416D0 (en) | 2004-02-20 |
| WO2005059898A1 (en) | 2005-06-30 |
| JP4723490B2 (en) | 2011-07-13 |
| EP1649452A1 (en) | 2006-04-26 |
| JP2007529020A (en) | 2007-10-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7835916B2 (en) | Channel signal concealment in multi-channel audio systems | |
| KR101203244B1 (en) | Method for generating concealment frames in communication system | |
| TWI413107B (en) | Sub-band voice codec with multi-stage codebooks and redundant coding | |
| RU2760485C1 (en) | Audio encoding device, audio encoding method, audio encoding program, audio decoding device, audio decoding method and audio decoding program | |
| JP5507844B2 (en) | Multi-channel audio signal encoding and decoding method and apparatus | |
| JPH0430200A (en) | Sound decoding system | |
| JP4759078B2 (en) | DIGITAL SIGNAL PROCESSING METHOD, PROGRAM THEREOF, AND RECORDING MEDIUM CONTAINING THE PROGRAM | |
| SE527866C2 (en) | Channel signal masking in multi-channel audio system | |
| EP1385150A1 (en) | Method and system for parametric characterization of transient audio signals | |
| KR100618359B1 (en) | Hierarchical lossless coding and decoding method, hierarchical lossless coding method, hierarchical lossless decoding method, apparatus and computer-readable recording medium | |
| JPH0583206A (en) | Transmission system and receiver used in transmission system | |
| WO2006114494A1 (en) | Method for adapting for an interoperability between short-term correlation models of digital signals | |
| JP4369946B2 (en) | DIGITAL SIGNAL PROCESSING METHOD, PROGRAM THEREOF, AND RECORDING MEDIUM CONTAINING THE PROGRAM | |
| EP1386311A1 (en) | Inverse filtering method, synthesis filtering method, inverse filter device, synthesis filter device and devices comprising such filter devices | |
| RU2776261C1 (en) | Audio encoding device, audio encoding method, audio encoding program, audio decoding device, audio decoding method and audio decoding program | |
| RU2792658C1 (en) | Audio encoding device, audio encoding method, audio encoding program, audio decoding device, audio decoding method and audio decoding program | |
| KR20250145594A (en) | Error recovery tool for audio encoding/decoding | |
| JPS617899A (en) | Multipulse type encoder/decoder | |
| JP2775533B2 (en) | Long-term speech prediction device | |
| JPH04149600A (en) | Voice decoding system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| NUG | Patent has lapsed |