[go: up one dir, main page]

WO2010050740A2 - 멀티 채널 신호의 부호화/복호화 장치 및 방법 - Google Patents

멀티 채널 신호의 부호화/복호화 장치 및 방법 Download PDF

Info

Publication number
WO2010050740A2
WO2010050740A2 PCT/KR2009/006247 KR2009006247W WO2010050740A2 WO 2010050740 A2 WO2010050740 A2 WO 2010050740A2 KR 2009006247 W KR2009006247 W KR 2009006247W WO 2010050740 A2 WO2010050740 A2 WO 2010050740A2
Authority
WO
WIPO (PCT)
Prior art keywords
information
frequency band
phase
bitstream
phase parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/KR2009/006247
Other languages
English (en)
French (fr)
Other versions
WO2010050740A3 (ko
Inventor
김중회
오은미
김미영
주기현
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Priority to PL09823820T priority Critical patent/PL2352152T3/pl
Priority to ES09823820T priority patent/ES2754925T3/es
Priority to EP09823820.7A priority patent/EP2352152B1/en
Priority to US13/126,947 priority patent/US8959026B2/en
Priority to CN200980153531.1A priority patent/CN102292772B/zh
Publication of WO2010050740A2 publication Critical patent/WO2010050740A2/ko
Publication of WO2010050740A3 publication Critical patent/WO2010050740A3/ko
Anticipated expiration legal-status Critical
Priority to US13/483,954 priority patent/US8452018B2/en
Priority to US14/623,431 priority patent/US9384743B2/en
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00

Definitions

  • Embodiments of the present invention relate to an apparatus and method for encoding / decoding a multi-channel signal, and more particularly, to an apparatus and method for encoding / decoding a multi-channel signal using phase information.
  • Parametric Stereo is a method used to encode stereo signals.
  • Parametric stereo technology generates mono signals by downmixing input stereo signals, extracts stereo parameters representing side information of stereo signals, and encodes the generated mono signals and extracted stereo parameters to stereo Encode the signal.
  • the stereo parameter used may include an inter-channel intensity difference (IID) or channel level differences (CLD) representing an intensity difference depending on an energy level of at least two channel signals included in the stereo signal, and at least two channels included in the stereo signal.
  • IID inter-channel intensity difference
  • CLD channel level differences
  • Inter-channel Coherence or Inter-channel Correlation (ICC) which represents the correlation between two channel signals according to the similarity of the waveforms of the signal
  • IPD Inter-channel Phase
  • Difference OPD
  • OPD overall phase difference
  • OPD an overall phase difference
  • the encoding apparatus of a multi-channel signal determines encoding of a phase parameter representing phase information of a plurality of channels constituting a multi-channel signal to generate encoding information, and when encoding of the phase parameter is determined.
  • a parameter encoding unit encoding the phase parameter, a mono signal encoding unit encoding a mono signal obtained by downmixing the multi-channel signal, and when encoding of the phase parameter is determined, the encoded mono signal, the encoded phase parameter,
  • a bitstream generator configured to generate an encoded bitstream for the multichannel signal using the encoded information.
  • the bitstream generator may generate an encoded bitstream for the multi-channel signal using the encoded mono signal and the encoding information.
  • the apparatus for decoding a multi-channel signal is a mono signal decoder for restoring a mono signal which is a down mix signal of the multi-channel signal from the encoded bitstream of the multi-channel signal, the multi-channel signal A frequency band determiner which determines whether a phase parameter of a plurality of channels to be present exists in the bitstream, and determines a frequency band of the mono signal to which the phase parameter is applied when the phase parameter exists in the bitstream, And a parameter decoder for recovering the phase parameter from the bitstream, and an upmixer for upmixing the mono signal by applying the phase parameter to the frequency band.
  • the multi-channel signal encoding method to determine whether to encode the phase parameter indicating the phase information of the plurality of channels constituting the multi-channel signal to generate encoding information, the encoding of the phase parameter Is determined, encoding the phase parameter, encoding a mono signal obtained by downmixing the multi-channel signal, and when encoding of the phase parameter is determined, the encoded mono signal, the encoded phase parameter, and the Generating an encoded bitstream for the multi-channel signal using encoding information.
  • the method for decoding a multi-channel signal comprises the steps of recovering a mono signal which is a down mix signal of the multi-channel signal from the encoded bitstream of the multi-channel signal, a plurality of constituting the multi-channel signal Determining whether a phase parameter of a channel is present in the bitstream, determining a frequency band of the mono signal to which the phase parameter is to be applied if the phase parameter is present in the bitstream, from the bitstream Restoring a parameter, and applying the phase parameter to the frequency band to upmix the mono signal.
  • the apparatus and method for encoding / decoding a multi-channel signal according to an embodiment of the present invention can reduce the amount of data required for data transmission.
  • An apparatus and method for encoding / decoding a multichannel signal may provide a multichannel audio signal with improved sound quality.
  • FIG. 1 is a block diagram showing a detailed configuration of an apparatus for encoding a multi-channel signal according to an embodiment of the present invention.
  • FIG. 2 is a block diagram showing a detailed configuration of an apparatus for decoding a multi-channel signal according to an embodiment of the present invention.
  • FIG. 3 is a diagram illustrating a structure of a bitstream of a multichannel signal encoded by an apparatus for encoding a multichannel signal according to an embodiment of the present invention.
  • FIG. 4 is a flowchart illustrating a method of encoding a multi-channel signal according to an embodiment of the present invention.
  • FIG. 5 is a flowchart illustrating a decoding method of a multi-channel signal according to an embodiment of the present invention.
  • 6 to 8 are flowcharts illustrating a method of encoding a multi-channel signal according to another embodiment of the present invention.
  • FIG. 1 is a block diagram showing a detailed configuration of an apparatus for encoding a multi-channel signal according to an embodiment of the present invention.
  • the multi-channel signal encoding apparatus 100 includes a parameter encoder 110, a mono signal encoder 120, and a bitstream generator 130.
  • the multi-channel signal means a signal of a plurality of channels, and in this specification, each of the plurality of channels included in the multi-channel signal will be referred to as a channel signal.
  • the multichannel signal input to the encoding apparatus 100 of the multichannel signal encodes a stereo signal including a left channel signal L and a right channel signal R.
  • the apparatus 100 for encoding a multi-channel signal according to an embodiment of the present invention is not limited to a stereo signal may also be used for encoding the multi-channel signal.
  • the parameter encoder 110 generates encoding information by determining whether to encode a phase parameter representing phase information of a plurality of channels constituting a stereo signal or a multi-channel signal (hereinafter referred to as a stereo signal), and encoding the phase parameter If determined, the phase parameter is encoded.
  • stereo parameters used in the case of reconstructing a stereo signal using parametric stereo technology include CLD, ICC, IPD, OPD, and the like.
  • the parameter encoder 110 may include a parameter extractor, in which case the stereo parameter is extracted by the parameter extractor.
  • the parameter encoder 110 determines whether to encode the phase parameter representing the phase information of the plurality of channels among the extracted stereo parameters, and generates the encoded information. That is, the encoding information refers to information about whether a phase parameter is included in the encoded bitstream of the stereo signal generated by the bitstream generator 130. Whether to encode the phase parameter may be determined based on the importance of the phase information in the stereo signal to be transmitted. In addition, the parameter encoder 110 encodes the CLD and the ICC.
  • the encoding information may be represented by one bit.
  • the bit When the coded phase parameter is included in the bitstream, the bit may have a value of "1", and when the coded phase parameter is not included in the bitstream, the bit may have a value of "0".
  • the parameter encoder 110 When it is decided to encode the phase parameter, the parameter encoder 110 encodes the phase parameter and generates encoding information having a value of "1". On the contrary, when it is decided not to encode the phase parameter, the parameter encoding unit 110 does not encode the phase parameter and generates encoding information having a value of "0".
  • the phase parameter may include both the IPD and the OPD, and may include only the IPD. Since the OPD can be estimated using the IPD and other stereo parameters, the phase parameter can include only the IPD. Details thereof will be described with reference to the apparatus for decoding a multi-channel signal of FIG. 3.
  • the parameter encoder 110 may include a down mixing unit.
  • the down mixing unit down mixes the stereo signal to generate a mono signal.
  • Down-mixing is to generate a mono signal of one channel from stereo signals of two or more channels, and the amount of bits allocated to the encoding process can be reduced through down mixing.
  • the mono signal may be a signal representing a stereo signal.
  • the mono signal instead of encoding each of the left channel signal and the right channel signal included in the stereo signal, only the mono signal may be encoded and transmitted.
  • the magnitude of the mono signal may be obtained as an average value of the magnitudes of the left channel signal and the right channel signal
  • the phase of the mono signal may be obtained as an average value of the phases of the left channel signal and the right channel signal.
  • the mono signal encoder 120 encodes a mono signal obtained by downmixing a stereo signal.
  • the mono signal encoder 120 may encode the mono signal by CELP (Code Excited Linear Prediction).
  • the mono signal encoder 110 may encode the mono signal using a method similar to the existing MPEG-2 / 4 AAC or mp3.
  • the bitstream generator 130 generates an encoded bitstream for the stereo signal by using the encoded mono signal.
  • the bitstream generator 130 may encode the encoded bitstream for the stereo signal using the encoded mono signal, the encoded phase parameter, and the encoding information. Create As an example, the bitstream generator 130 may generate a bitstream by multiplexing the encoded mono signal, the encoded phase parameter, and the encoding information.
  • the bitstream generator 130 when it is determined that the phase parameter is not encoded, the bitstream generator 130 generates an encoded bitstream for the stereo signal using the encoded mono signal and the encoding information. . Even in this case, the bitstream generator 130 may generate a bitstream using a multiplexing method.
  • the bitstream generator 130 uses the CLD and the ICC encoded when generating the bitstream regardless of whether the phase parameter is encoded.
  • the apparatus 100 for encoding a multi-channel signal may selectively encode a phase parameter, insert it into a bitstream, and transmit it. Accordingly, the multi-channel signal encoding apparatus 100 according to an embodiment of the present invention can provide a stereo signal with improved sound quality when compared to the case of encoding / decoding a stereo signal without using a phase parameter. In this case, the amount of data to be transmitted can be reduced as compared with the case where the stereo signal is always used to encode / decode the stereo signal.
  • whether to encode a phase parameter may be determined based on the importance of phase information in a stereo signal to be transmitted.
  • the parameter encoder 110 may perform interference between a plurality of channels. It is possible to determine whether to encode the phase parameter by considering at least one of a difference between the correlation between the coherence and the plurality of channels and the continuity of the phase information of the plurality of frames included in the stereo signal.
  • the parameter encoder 110 determines the encoding of the phase parameter.
  • Coherence between the plurality of channels may be coherence between the plurality of channels using phase information.
  • the parameter encoder 110 determines encoding of the phase parameter. .
  • the parameter encoder 110 determines that the phase parameter is not encoded.
  • the bitstream generated by the bitstream generator 130 may include a header and a plurality of frames, and encoding information may be inserted into each of the header or the plurality of frames.
  • the decoding apparatus upmixes a mono signal by using a phase parameter, not only the phase parameter but also information about the frequency band of the mono signal to which the phase parameter is to be applied, that is, up to which frequency band, is used to upmix the mono signal. Information may be needed.
  • the bitstream generator 130 may generate the encoded bitstream by further using frequency band information of the mono signal.
  • the frequency band information means information about a frequency band to which the phase parameter is applied when the mono signal is upmixed. That is, the frequency band information refers to information on a frequency band to which the phase parameter is to be applied when upmixing a mono signal in the decoding apparatus.
  • the frequency band information may include the number of frequency bands to which the phase parameter is applied.
  • the number may be selected as many low frequency bands as the number.
  • the frequency band to which the phase parameter is applied may be lower 14 frequency bands having a small frequency. This is based on the fact that the phase parameter is more important in the low frequency region.
  • the frequency of the mono signal when the frequency of the mono signal is divided into seven or less frequency bands, the importance of the bitstream is significantly lowered.
  • the number of the frequency bands may be zero. That is, no phase parameter is used during upmixing of the mono signal.
  • the parameter encoder 110 further encodes at least one of the CLD and the ICC
  • the bitstream generator 130 further generates the bitstream by using at least one of the CLD and the ICC.
  • the number of bits representing the frequency band information may be determined based on the number of frequency bands to which at least one of CLD and ICC is to be applied when the mono signal is upmixed.
  • the number of frequency bands to which the phase parameter is to be applied may be determined based on the number of wavebands to which the CLD or ICC is to be applied.
  • the number of frequency bands to which the phase parameter is applied may be the same as the number of frequency bands to which the CLD or ICC is to be applied.
  • the number of frequency bands to which the CLD or ICC is to be applied is the number of frequency bands to which the phase parameter is to be applied. It can be doubled.
  • the frequency band information may further include information on whether or not to update the number of frequency bands to which the phase parameter is applied.
  • the information on whether or not to update indicates whether the number of frequency bands to which the phase parameter in the current frame to be encoded is equal to the number of frequency bands to which the phase parameter in the previous frame is to be applied.
  • the information on whether the update can be represented by one bit. If the number of frequency bands to which the phase parameter in the current frame is to be applied is not equal to the number of frequency bands to which the phase parameter in the previous frame is to be applied, the bit has a value of "1", and the phase parameter in the current frame is to be applied. If the number of frequency bands and the number of frequency bands to which the phase parameter in the previous frame is applied are the same, the bit may have a value of "0".
  • the frequency band information includes the number of frequency bands of the mono signal to which the phase parameter is to be applied. In contrast, when the information on whether the update has a value of "0", the frequency band information does not include the number of frequency bands of the mono signal to which the phase parameter is applied.
  • the apparatus 100 for encoding a multi-channel signal uses information on whether or not to update the number of frequency bands to which a phase parameter is applied, thereby preventing duplication of unnecessary information.
  • the amount of data transmitted can be reduced.
  • frequency band information may be inserted in each of a header or a plurality of frames.
  • frequency band information when encoding information is inserted into the header, frequency band information may also be inserted into the header, and when encoding information is inserted into each of the plurality of frames, frequency band information may also be inserted into each of the plurality of frames.
  • the parameter encoder 110 may determine whether to encode the phase parameter by comparing the phase information of a plurality of frames included in the multi-channel signal.
  • the parameter encoder 110 may not encode the phase parameter.
  • the parameter encoder 110 may generate phase parameter update information indicating that the phase parameter is not updated, and the phase parameter update information may be included in the bitstream and transmitted. If the phase parameter is not updated, the decoding apparatus may upmix the mono signal using the phase parameter of the previous frame.
  • FIG. 2 is a block diagram showing a detailed configuration of an apparatus for decoding a multi-channel signal according to an embodiment of the present invention.
  • the apparatus 200 for decoding a multi-channel signal includes a mono signal decoder 210, a frequency band determiner 220, a parameter decoder 230, and an upmixer 240. do.
  • a mono signal decoder 210 includes a mono signal decoder 210, a frequency band determiner 220, a parameter decoder 230, and an upmixer 240. do.
  • bitstream input to the decoding apparatus 200 of the multi-channel signal is an encoded bitstream of the stereo signal.
  • the input bitstream is demultiplexed with the encoded mono signal, the encoded stereo parameter, and the encoded frequency band information.
  • the mono signal decoder 210 restores a mono signal, which is a downmix signal of the multi-channel signal, from a coded bitstream of a stereo signal or a multi-channel signal (hereinafter referred to as a stereo signal).
  • a stereo signal a coded bitstream of a stereo signal or a multi-channel signal
  • the mono signal decoder 210 decodes the encoded mono signal in the time domain when the mono signal is encoded in the time domain, and encodes the encoded mono signal in the frequency domain when the mono signal is encoded in the frequency domain. Can be decrypted
  • the frequency band determiner 220 checks whether the phase parameters of the plurality of channels constituting the multi-channel signal exist in the bitstream, and if the phase parameters exist in the bitstream, the frequency of the mono signal to which the phase parameters will be applied. Determine the band.
  • the frequency band determiner 220 may determine whether the phase parameter exists in the bitstream by checking the encoding information included in the bitstream.
  • the parameter decoder 230 restores the phase parameters of the plurality of channels constituting the multi-channel signal from the bitstream.
  • the parameter decoder 230 may restore encoding information included in the bitstream, determine whether the phase parameter is included in the bitstream, and, if included, restore the phase parameter.
  • the parameter decoder 230 also restores other stereo parameters included in the bitstream, such as CLD and ICC.
  • the phase parameter may include both the IPD and the OPD, and may include only the IPD.
  • the parameter decoder 230 may determine the IPD and the IPD from the bitstream. You can restore the OPD.
  • the OPD can be estimated from the IPD and other stereo parameters.
  • the estimation of the OPD is performed by the OPD estimator included in the parameter decoder 230, and the operation of the OPD estimator will be described in detail.
  • the equations described below are only one embodiment of the present invention, it can be said that the equations described below can be modified to those skilled in the art to which the present invention pertains.
  • the OPD estimator may obtain the first intermediate variable c according to Equation 1 using the IID.
  • the first intermediate variable c may be obtained by expressing the number of IID values in a specific frequency band divided by 20 in exponential form of 10.
  • the second intermediate variable c 1 and the third intermediate variable c 2 may be obtained using the first intermediate variable c as shown in Equations 5 and 6 below.
  • the third intermediate variable c2 may be obtained by multiplying the value of the second intermediate variable c 1 by c (b).
  • the OPD estimator converts the first right channel signal and the first left channel signal using the reconstructed mono signal and the second intermediate variable and the third intermediate variable obtained from Equations 2 and 3 to It can be expressed as Equation 5.
  • First right channel signal Can be expressed as the product of the second intermediate variable c 1 and the restored mono signal M.
  • First left channel signal May be represented as the product of the second intermediate variable c 2 and the restored mono signal M.
  • the IPD If so, the first mono signal Is the first right channel signal And second left channel signal It can be expressed by the following equation (6).
  • Equation 7 the fourth intermediate variable p according to the time slot and the parameter band may be obtained as in Equation 7 below.
  • the fourth intermediate variable p is a value obtained by dividing the sum of the magnitudes of the first left channel signal, the first right channel signal, and the first mono signal by two.
  • OPD can be obtained as in Equation 8 below.
  • Equation 8 The value of OPD obtained from Equation 8 Is a phase difference between the decoded mono signal and the left channel signal to be upmixed. Denotes the phase difference between the decoded mono signal and the right channel signal to be upmixed.
  • the OPD estimator generates the first left channel signal and the first right channel signal for the left channel signal and the right channel signal from the mono signal reconstructed using the IID representing the magnitude difference between the channels of the stereo signal, and the stereo signal.
  • a first mono signal is generated from the first left channel signal and the first right channel signal by using an IPD representing a phase difference between channels.
  • the generated first left channel signal, the first right channel signal, and the first mono signal are generated.
  • the upmixer 240 restores the stereo signal by upmixing the mono signal by applying a phase parameter to the frequency band.
  • Up-mixing corresponds to down-mixing by generating two or more channels of stereo signals from a mono signal on one channel.
  • the upmixing unit 240 upmixes the mono signal by applying other stereo parameters such as CLD and ICC together during the mono signal upmixing.
  • CLD complementary metal-oxide-semiconductor
  • ICC integrated circuit
  • IPD IPD
  • OPD optical photode-semiconductor
  • the upmixing unit 240 has a value of IIC When the first phase using the second and third intermediate variables c 1 and c 2 And second phase Can be obtained as in Equations 10 and 11 below.
  • the up-mixing unit 240 obtains the first and second phases, second and third intermediates obtained through Equations 10 and 11, respectively.
  • the value of The up-mixed left channel signal and the right channel signal can be obtained using Equation 12 and Equation 13 below.
  • the apparatus 200 for decoding a multi-channel signal does not receive the OPD value from the apparatus for encoding a multi-channel signal
  • the OPD value is obtained by using other parameters transmitted from the encoding end.
  • the type of parameters used for upmixing can be increased to improve the sound quality of the upmixed stereo signal.
  • the apparatus 200 for decoding a multi-channel signal includes a table in which frequency band information regarding a frequency band is stored, and the frequency band determiner 220 corresponds to a frequency corresponding to the mono signal from the table.
  • the frequency band may be determined by selecting band information.
  • the encoding apparatus and the decoding apparatus of the multi-channel signal share a table in which the frequency band information is stored
  • the encoding apparatus and the decoding apparatus of the multi-channel signal select information about the frequency band to which the phase parameter is applied by referring to the table. Accordingly, the frequency band to which the phase parameter is applied can be determined.
  • the frequency band determiner 220 may restore frequency band information on the frequency band from the bitstream, and determine the frequency band based on the recovered frequency band information.
  • the frequency band determiner 220 may directly restore the frequency band information from the bitstream, and determine the frequency band using the same.
  • the frequency band determiner 220 may restore the frequency band information from the header of the bitstream or each of the plurality of frames.
  • the frequency band information may be inserted in each of a header or a plurality of frames of the input bitstream, and in this case, the frequency band determiner 220 may restore the frequency band information from the header or the plurality of frames of the bitstream. have.
  • the frequency band information may include the number of frequency bands to which the phase parameter is applied.
  • the frequency band determiner 220 may determine as many frequency bands as the number of low frequency bands among the plurality of frequency bands of the mono signal as the frequency band to which the phase parameter is to be applied. have.
  • the lower 14 frequency bands having a small frequency may be determined as the frequency band to which the phase parameter is applied.
  • the number is 0, the phase parameter is not used when upmixing the mono signal.
  • the frequency band information may further include information on whether or not to update the number of frequency bands to which the phase parameter is applied.
  • the frequency band determination unit 220 analyzes the information on whether the update.
  • the frequency band determiner 220 extracts the number of frequency bands to which the phase parameter is to be applied from the bitstream and based on the updated number of frequency bands. Can determine the frequency band to be applied.
  • the frequency band determiner 220 may determine the frequency band to which the phase parameter is applied based on the number of frequency bands of the previous frame.
  • FIG. 3 is a diagram illustrating a structure of a bitstream of a multichannel signal encoded by an apparatus for encoding a multichannel signal according to an embodiment of the present invention.
  • the encoding information and the frequency band information may be inserted in the header or frame of the bitstream.
  • FIG. 3A illustrates a structure of a bitstream in which encoding information and frequency band information are inserted in a header of the bitstream.
  • the header 310 includes an additional information field 311, an encoding information field 312, and a frequency band information field 313.
  • the additional information field 311 includes various types of information used when encoding / decoding multi-channel data.
  • the additional information field 311 may include information indicating the number of frequency bands of the CLD and the ICC.
  • the encoding information field 312 includes information on whether a phase parameter exists in the bitstream. As mentioned above, the encoding information field 312 may be represented by one bit, and when the phase parameter is included in the bitstream, the bit has a value of "1", and the phase parameter is included in the bitstream. If not included, the bit may have a value of "0".
  • the phase parameter may be stored in the phase parameter field 322 of each of the plurality of frames 320.
  • the frequency band information field 313 includes information about a frequency band to which a phase parameter is applied when the mono signal is upmixed.
  • the information about the frequency band means the number of frequency bands to which the phase parameter is to be applied
  • the frequency band to which the phase parameter is to be applied may be represented by up to 28 frequency bands. It can have
  • the phase parameter is stored in the phase parameter field 322 of each of the plurality of frames 320.
  • the header 330 includes only the additional information field 331 and the encoding information field 332, and does not include the frequency band information field.
  • the encoding apparatus and the decoding apparatus of the multi-channel signal have a table in which frequency band information is stored.
  • the encoding apparatus and the decoding apparatus of the multi-channel signal may select information on the frequency band to which the phase parameter is applied with reference to the table, and thus determine the frequency band.
  • the apparatus for encoding and decoding a multi-channel signal may determine frequency band information by searching a table based on information indicating the number of frequency bands of CLD and ICC present in the additional information field 331 of the header.
  • FIG. 3C illustrates a structure of a bitstream in which encoding information and frequency band information are inserted in a frame.
  • the header 350 includes only an additional information field
  • the frame 360 includes a data field 361, an encoding information field 362, an update field information field 363 and a frequency band information field ( 364, and a phase parameter field 365.
  • the encoding information field 362, the frequency band information field 364, and the phase parameter field 365 are the same as in the case of FIG. 3A, detailed description thereof will be omitted.
  • the information on whether to update the frequency band information field 363 includes information on whether the frequency band information of the frequency band to which the phase parameter in the current frame is to be applied and the frequency band information of the frequency band to which the phase parameter in the previous frame is to be applied. Include.
  • the information field on whether to update may be represented by one bit.
  • the bit When the frequency band information in the current frame and the frequency band information in the previous frame are not the same, the bit has a value of "1", and the frequency band information in the current frame and the frequency band information in the previous frame are the same.
  • the bit may have a value of "0".
  • the frequency band information field 364 has a value of "0". Can be set.
  • the decoding apparatus of the multi-channel signal performs decoding using the frequency band information of the previous frame.
  • the apparatus for encoding a multi-channel signal further uses information on whether or not to update the number of frequency bands to which the phase parameter is applied, thereby preventing duplication of unnecessary information and transmitting the information.
  • the amount of data can be reduced.
  • FIG. 3D illustrates a structure of a bitstream in which only encoding information is inserted into a frame. The information on the frequency band information and whether or not the frequency band information is updated is not included in the bitstream.
  • the encoding apparatus and the decoding apparatus of the multi-channel signal refer to the table and the frequency band to which the phase parameter is applied. Select information about and determine the frequency band accordingly.
  • 4 to 8 illustrate syntax associated with a bitstream generated by an apparatus for encoding a multi-channel signal according to an embodiment of the present invention.
  • FIGS. 4 to 6 show syntax associated with a case where encoding information is inserted into a header of a bitstream. That is, the syntax illustrated in FIGS. 4 to 6 is a syntax related to the bitstream illustrated in FIGS. 3A and 3B.
  • FIG. 4 is a syntax associated with a header of a bitstream. As can be seen from FIG. 4, the information bsPhaseMode 410 has been added.
  • bsPhaseMode means information on whether to encode and transmit a phase parameter, that is, encoding information. As described above, bsPhaseMode can be represented by one bit.
  • the frequency band information is inserted into the header portion of the bitstream, that is, when the bitstream shown in FIG. 3A is generated, the syntax of the OttConfig 420 is changed as shown in FIG. 5A. .
  • FIG. 5A is a diagram illustrating syntax of OttConfig. As can be seen from (a) of FIG. 5, the information of bsOttBandsPhase [i] 510 is further added.
  • bsOttBandsPhase [i] 510 means the number of frequency bands to which the phase parameter is applied. bsOttBandsPhase [i] 510 may be expressed as a bit having a size of nBitsBandsPhase.
  • Ott (One-To-Two) is used for stereo upmixes.
  • OttConfig determines the number of frequency bands to which the phase parameter in Ott is applied. If bsPhaseMode becomes "1" (i.e., when using a phase parameter), information on up to which frequency band is used for upmixing the mono signal using the phase parameter is needed. When inserted, information about this is expressed using bsOttBandsPhase.
  • bsFreqRes is the information indicating the number of frequency bands of CLD and ICC. It is transmitted in the header and is usually represented by a maximum of 28 bands (numBands), so a general band representation method requires 5 bits. When nBitsBandsPhase is used to represent a frequency band to which a phase parameter is applied, the maximum number of bands is determined according to bsFreqRes, and thus bits may be dynamically allocated.
  • the number of frequency bands may be represented by 4 bits.
  • the phase parameter may be applied only to the low frequency band, in which case the frequency band is determined as indicated in nBitsBandsPhase (low band) of the table shown in FIG. You can allocate bits with. In this case, unlike the case where the phase parameter is applied to all frequency bands, it is not necessary to use all 5 bits.
  • bsFreqRes has a value of 5 or more, since the number of bands of the CLD is 7, in this case, information is not transmitted using nBitsBandsPhase as "0" without using a phase parameter.
  • the encoding apparatus and the decoding apparatus of the multi-channel signal have a frequency.
  • band information is stored.
  • FIG. 5C illustrates an example of a table in which frequency band storage information is stored.
  • FIG. 6 shows syntax for OttData used when a phase parameter is encoded and inserted into each frame.
  • bsPhaseMode becomes "1".
  • the EcDataIPD 610 shows a result of lossless coding the phase parameter.
  • bsIPDdataMode In EcDataIPD, a bit called bsIPDdataMode is used to determine whether to maintain the value of the previous frame as it is or to encode information of the current frame through lossless encoding. If the phase parameter is meaningless in a particular audio section, the phase parameters are all set to 0 and encoded, and subsequent bsIPDDataMode is set to “0” to transmit unnecessary phase parameters. In contrast, when bsIPDDataMode is "1", the phase parameter is encoded and transmitted.
  • FIGS. 7 and 8 illustrate syntax associated with a case where encoded information is inserted into a frame of a bitstream. That is, the syntax illustrated in FIGS. 7 and 8 is a syntax related to the bitstreams illustrated in FIGS. 3C and 3D.
  • FIG. 7 is a syntax associated with a frame of a bitstream. As can be seen from FIG. 7, the information bsPhaseMode 710 has been added.
  • FIG. 8A is syntax regarding OttData included in the syntax of FIG. 7.
  • bsUpdateOttBandsPhase is information on whether to update the number of frequency bands to apply the phase parameter in the current frame. If bsUpdateOttBandsPhase is "1", bsUpdateOttBandsPhase should be updated. Transmit to update the number of frequency bands. In contrast, when bsUpdateOttBandsPhase is "0", the phase parameter is restored by using the number of frequency bands to which the phase parameter used in the previous frame is applied.
  • bsPhaseMode becomes "1" (i.e., when using a phase parameter)
  • information on up to which frequency band is used for upmixing the mono signal using the phase parameter is needed.
  • information about this is expressed using bsOttBandsPhase.
  • bsFreqRes is the information indicating the number of frequency bands of CLD and ICC. It is transmitted in the header and is usually represented by a maximum of 28 bands (numBands), so a general band representation method requires 5 bits.
  • nBitsBandsPhase is used to represent a frequency band to which a phase parameter is applied, the maximum number of bands is determined according to bsFreqRes, and thus bits may be dynamically allocated.
  • the phase parameter can only be applied to the low frequency band, in which case the frequency band is determined as indicated in nBitsBandsPhase (low band) of the table shown in FIG. You can allocate bits with. In this case, unlike the case where the phase parameter is applied to all frequency bands, it is not necessary to use all 5 bits.
  • bsFreqRes has a value of 5 or more, since the number of bands of the CLD is 7, in this case, information is not transmitted using nBitsBandsPhase as "0" without using a phase parameter.
  • the bsUpdateOttBandsPhase is initialized to an initial bsOttBandsPhase value of the table shown in FIG.
  • the EcDataIPD 820 shows a result of lossless coding the phase parameter.
  • the encoding apparatus and the decoding apparatus of the multi-channel signal have a frequency.
  • FIG. 9 is a flowchart illustrating a method of encoding a multi-channel signal according to an embodiment of the present invention.
  • the method for encoding a multichannel signal according to an embodiment of the present invention includes the steps of time-series processing in the apparatus for encoding the multichannel signal illustrated in FIG. 1. Therefore, even if omitted below, the above descriptions of the apparatus for encoding the multi-channel signal shown in FIG. 1 also apply to the method for encoding the multi-channel signal according to an embodiment of the present invention.
  • encoding information is generated by determining whether to encode a phase parameter indicating phase information of a plurality of channels constituting the multi-channel signal.
  • the phase parameter may include both the IPD and the OPD, and may include only the IPD.
  • the step S910 may include a phase parameter in consideration of at least one of the difference between the coherence between the plurality of channels and the correlation between the plurality of channels, and the continuity of the phase information of the plurality of frames included in the stereo signal. Can be encoded.
  • step S920 the mono signal obtained by downmixing the multi-channel signal is encoded.
  • step S930 it is determined whether the phase parameter is encoded.
  • step S940 an encoded bitstream for the multi-channel signal is generated using the encoded mono signal, the encoded phase parameter, and the encoding information.
  • step S950 an encoded bitstream for the multi-channel signal is generated using the encoded mono signal and the encoding information.
  • the bitstreams generated in steps S940 and S950 may include a header and a plurality of frames, and encoding information may be inserted into each of the header or the plurality of frames.
  • the encoded bitstream may be generated using the frequency band information of the mono signal.
  • the frequency band information may include the number of frequency bands to which the phase parameter is applied and may further include information on whether the number of frequency bands to which the phase parameter is to be updated.
  • FIG. 10 is a flowchart illustrating a decoding method of a multi-channel signal according to an embodiment of the present invention.
  • the method for decoding a multichannel signal according to an embodiment of the present invention includes the steps of time-series processing in the apparatus for decoding a multichannel signal shown in FIG. 2. Therefore, even if omitted below, the above descriptions of the apparatus for decoding the multi-channel signal shown in FIG. 2 also apply to the method for decoding the multi-channel signal according to an embodiment of the present invention.
  • step S1010 a mono signal, which is a down mix signal of the multi-channel signal, is restored from the encoded bitstream of the multi-channel signal.
  • step S1020 it is determined whether a phase parameter exists in the bitstream.
  • step S1030 a frequency band of the mono signal to which the phase parameter is applied is determined.
  • step 1040 the phase parameter is restored from the bitstream, and in step S1050, the phase parameter is applied to the frequency band to upmix the mono signal.
  • the frequency band may be determined by selecting frequency band information corresponding to the mono signal from a table in which frequency band information regarding the frequency band is stored.
  • step S1040 may restore frequency band information about a frequency band from the bitstream.
  • step S1040 may restore the frequency band information from the header of the bitstream or each of the plurality of frames.
  • the frequency band information may include the number of frequency bands to which the phase parameter is applied and may further include information on whether the number of frequency bands to which the phase parameter is to be updated.
  • step S1020 If it is determined in step S1020 that the phase parameter does not exist in the bitstream, the mono signal is upmixed using only other stereo parameters.
  • 11 to 13 are flowcharts illustrating a method of encoding a multi-channel signal according to another embodiment of the present invention.
  • FIG. 11 is a flowchart illustrating a method of decoding a bitstream shown in FIGS. 3A and 3B.
  • step S1101 a mono signal, which is a down mix signal of the multi-channel signal, is restored from the encoded bitstream of the multi-channel signal.
  • step S1102 it is determined whether header information exists in the bitstream.
  • step S1102 If it is determined in step S1102 that the header information exists in the bitstream, step S1108, which will be described later, is performed.
  • step S1102 If it is determined in step S1102 that the header information exists in the bitstream, the header information is restored in step S1103, and in step S1104 information about whether or not the phase parameter is used is restored.
  • step S1105 it is determined whether the phase parameter is used based on the information on whether the restored phase parameter is used.
  • step S1107 If it is determined in step S1105 that the phase parameter is not used, in step S1107 the number of frequency bands for which the phase parameter is to be used and the phase parameter are initialized to "0", respectively.
  • step S1105 If it is determined in step S1105 that the phase parameter is used, if the bitstream has the structure of the bitstream shown in FIG. 3A, in step S1106, the number of frequency bands for which the phase parameter is to be used is restored. If the bitstream has the structure of the bitstream shown in (b) of FIG. 3, in step S1106, the frequency band information corresponding to the mono signal is selected from the table in which the frequency band information regarding the frequency band is stored and the frequency is selected. Determine the band.
  • step S1108 information CLD indicating energy difference between channels is restored, and in step S1109, information ICC indicating similarity between channels is restored.
  • step S1111 it is determined whether the phase parameter is used.
  • step S1111 If it is determined in step S1111 that the phase parameter is used, in step S1111 the phase parameter is restored as many as the number of frequency bands in which the phase parameter is to be used, and in step S1112 based on the restored phase parameter. Upmix the reconstructed mono signal.
  • step S1111 If it is determined in step S1111 that the phase parameter is not used, step S1111 is not performed, and in step S1112, the mixed mono signal is upmixed without using the phase parameter.
  • FIG. 12 is a flowchart illustrating a method of decoding a bitstream shown in FIG. 3D.
  • a mono signal which is a down mix signal of the multi-channel signal, is recovered from the encoded bitstream of the multi-channel signal.
  • step S1220 it is determined whether header information exists in the bitstream.
  • step S1250 If it is determined in step S1220 that the header information does not exist in the bitstream, step S1250 to be described later is performed.
  • step S1220 If it is determined in step S1220 that header information exists in the bitstream, the header information is restored in step S1230.
  • step S1240 information on whether a phase parameter is used is restored, at step S1250, information CLD indicating energy difference between channels is restored, and at step S1260, information indicating similarity between channels is shown.
  • step S1270 it is determined whether the phase parameter is used.
  • step S1270 If it is determined in step S1270 that the phase parameter is used, in step S1280, the phase parameter is restored by the number of frequency bands in which the phase parameter is to be used, and in step S1290, based on the restored phase parameter. Upmix the reconstructed mono signal.
  • step S1270 If it is determined in step S1270 that the phase parameter is not used, step S1280 is not performed. In step S1290, the mono signal reconstructed without using the phase parameter is upmixed.
  • FIG. 13 is a flowchart illustrating a method of decoding a bitstream shown in FIG. 3C, and illustrates only the steps added in the flowchart of FIG. 12.
  • step S1271 restores information on whether the number of frequency bands to which the phase parameter is to be updated is updated.
  • step S1272 it is determined whether the number of frequency bands to which the phase parameter is applied is updated.
  • step S1272 If it is determined in step S1272 that the number of frequency bands to which the phase parameter is to be updated is restored in step S1273, the number of frequency bands to which the phase parameter is to be applied is restored. In this case, in step S1280, the phase parameter is restored by using the number of recovered frequency bands.
  • step S1273 is not performed, and in step S1280, the number of frequency bands to which the phase parameter in the previous frame is to be applied is used. To restore the phase parameters.
  • the method of encoding / decoding a multi-channel signal may be implemented in the form of program instructions that can be executed by various computer means and recorded in a computer readable medium.
  • the computer readable medium may include program instructions, data files, data structures, etc. alone or in combination.
  • Program instructions recorded on the media may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those having skill in the computer software arts.
  • Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks.
  • Examples of program instructions such as magneto-optical, ROM, RAM, flash memory, etc. may be executed by a computer using an interpreter as well as machine code such as produced by a compiler. Contains high-level language codes.
  • the hardware device described above may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)

Abstract

멀티 채널 신호의 부호화/복호화 장치 및 방법이 개시된다. 멀티 채널 신호의 부호화 장치는 부호화하는 멀티 채널 신호의 비트스트림에 멀티 채널을 구성하는 복수 채널의 위상 정보를 나타내는 위상 파라미터의 부호화 여부에 대한 정보를 삽입하고, 멀티 채널 복호화 장치는 부호화 여부에 대한 정보에 기초하여 위상 파라미터를 이용하여 모노 신호를 업 믹싱할지 여부를 결정한다.

Description

멀티 채널 신호의 부호화/복호화 장치 및 방법
본 발명의 실시예들은 멀티 채널 신호의 부호화/복호화 장치 및 방법에 관한 것으로서, 더욱 상세하게는 위상 정보를 이용한 멀티 채널 신호의 부호화/복호화 장치 및 방법과 관련한 것이다.
스테레오 신호를 부호화하는데 이용되는 방법으로 파라메트릭 스테레오(PS, Parametric Stereo) 기술이 있다. 파라메트릭 스테레오 기술은 입력되는 스테레오 신호를 다운 믹싱하여 모노 신호를 생성하고, 스테레오 신호에 대한 부가 정보(side information)를 나타내는 스테레오 파라미터를 추출하고, 생성된 모노 신호와 추출된 스테레오 파라미터를 부호화하여 스테레오 신호를 부호화한다.
이 경우 이용되는 스테레오 파라미터에는, 스테레오 신호에 포함된 적어도 두 채널 신호의 에너지 레벨에 따른 강도 차를 나타내는 IID(Inter-channel Intensity Difference) 혹은 CLD(channel level differences), 스테레오 신호에 포함된 적어도 두 채널 신호의 파형의 유사성에 따른 두 채널 신호 사이의 상관도를 나타내는 ICC(Inter-channel Coherence 혹은 Inter-channel Correlation), 스테레오 신호에 포함된 적어도 두 채널 신호 사이의 위상 차를 나타내는 IPD(Inter-channel Phase Difference), 스테레오 신호에 포함된 적어도 두 채널 신호 사이의 위상 차가 모노 신호를 기준으로 두 채널 사이에 어떻게 분포하는지를 나타내는 OPD(Overall Phase Difference) 등이 있다.
본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치는 멀티 채널 신호를 구성하는 복수 채널의 위상 정보를 나타내는 위상 파라미터의 부호화 여부를 결정하여 부호화 정보를 생성하고, 상기 위상 파라미터의 부호화가 결정된 경우 상기 위상 파라미터를 부호화하는 파라미터 부호화부, 상기 멀티 채널 신호를 다운 믹싱한 모노 신호를 부호화하는 모노 신호 부호화부, 및 상기 위상 파라미터의 부호화가 결정된 경우, 상기 부호화된 모노 신호, 상기 부호화된 위상 파라미터, 및 상기 부호화 정보를 이용하여 상기 멀티 채널 신호에 대한 부호화된 비트스트림을 생성하는 비트스트림 생성부를 포함한다.
이 때, 상기 파라미터 부호화부가 상기 위상 파라미터의 부호화를 결정한 경우, 상기 비트스트림 생성부는 상기 부호화된 모노 신호 및 상기 부호화 정보를 이용하여 상기 멀티 채널 신호에 대한 부호화된 비트스트림을 생성할 수 있다.
또한, 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치는 멀티 채널 신호의 부호화된 비트스트림으로부터 상기 멀티 채널 신호의 다운 믹스 신호인 모노 신호를 복원하는 모노 신호 복호화부, 상기 멀티 채널 신호를 구성하는 복수 채널의 위상 파라미터가 상기 비트스트림에 존재하는지 여부를 확인하고, 상기 위상 파라미터가 상기 비트스트림에 존재하는 경우 상기 위상 파라미터가 적용될 상기 모노 신호의 주파수 대역을 결정하는 주파수 대역 결정부, 상기 비트스트림으로부터 상기 위상 파라미터를 복원하는 파라미터 복호화부, 및 상기 위상 파라미터를 상기 주파수 대역에 적용하여 상기 모노 신호를 업 믹싱하는 업 믹싱부를 포함한다.
또한, 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 방법은 멀티 채널 신호를 구성하는 복수 채널의 위상 정보를 나타내는 위상 파라미터의 부호화 여부를 결정하여 부호화 정보를 생성하는 단계, 상기 위상 파라미터의 부호화가 결정된 경우, 상기 위상 파라미터를 부호화하는 단계, 상기 멀티 채널 신호를 다운 믹싱한 모노 신호를 부호화하는 단계, 및 상기 위상 파라미터의 부호화가 결정된 경우, 상기 부호화된 모노 신호, 상기 부호화된 위상 파라미터 및 상기 부호화 정보를 이용하여 상기 멀티 채널 신호에 대한 부호화된 비트스트림을 생성하는 단계를 포함한다.
또한, 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 방법은 멀티 채널 신호의 부호화된 비트스트림으로부터 상기 멀티 채널 신호의 다운 믹스 신호인 모노 신호를 복원하는 단계, 상기 멀티 채널 신호를 구성하는 복수 채널의 위상 파라미터가 상기 비트스트림에 존재하는지 여부를 확인하는 단계, 상기 위상 파라미터가 상기 비트스트림에 존재하는 경우 상기 위상 파라미터가 적용될 상기 모노 신호의 주파수 대역을 결정하는 단계, 상기 비트스트림으로부터 상기 위상 파라미터를 복원하는 단계, 및 상기 위상 파라미터를 상기 주파수 대역에 적용하여 상기 모노 신호를 업 믹싱하는 단계를 포함한다.
본 발명의 일실시예에 따른 멀티 채널 신호의 부호화/복호화 장치 및 방법은 데이터 전송시 필요한 데이터의 양을 줄일 수 있다.
본 발명의 일실시예에 따른 멀티 채널 신호의 부호화/복호화 장치 및 방법은 음질이 향상된 멀티 채널 오디오 신호를 제공할 수 있다.
도 1은 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치의 상세한 구성을 도시한 블록도이다.
도 2는 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치의 상세한 구성을 도시한 블록도이다.
도 3은 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치에 의해 부호화된 멀티 채널 신호의 비트스트림의 구조를 도시한 도면이다.
도 4는 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 방법의 흐름도를 도시한 도면이다.
도 5는 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 방법의 흐름도를 도시한 도면이다.
도 6 내지 도 8은 본 발명의 다른 일실시예에 따른 멀티 채널 신호의 부호화 방법의 흐름도를 도시한 도면이다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치의 상세한 구성을 도시한 블록도이다.
본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치(100)는 파라미터 부호화부(110), 모노 신호 부호화부(120), 및 비트스트림 생성부(130)을 포함한다. 이하, 각 구성 요소 별로 그 기능을 상술하기로 한다. 여기서, 멀티 채널 신호는 복수의 채널들의 신호를 의미하며, 본 명세서에서는 멀티 채널 신호에 포함된 복수의 채널들 각각을 채널 신호라고 하기로 한다.
이하에서는, 설명의 편의상 멀티 채널 신호의 부호화 장치(100)에 입력되는 멀티 채널 신호는 좌채널 신호(L) 및 우채널 신호(R)를 포함하는 스테레오 신호를 부호화하는 것으로 가정한다. 그러나, 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치(100)가 스테레오 신호에 한정되지 않고 멀티 채널 신호의 부호화도 이용될 수 있음은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명하다고 할 수 있다.
파라미터 부호화부(110)는 스테레오 신호 또는 멀티 채널 신호(이하 스테레오 신호라고 한다)를 구성하는 복수 채널의 위상 정보를 나타내는 위상 파라미터의 부호화 여부를 결정하여 부호화 정보를 생성하고, 상기 위상 파라미터의 부호화가 결정된 경우 상기 위상 파라미터를 부호화한다.
상기에서 언급한 바와 같이, 파라메트릭 스테레오 기술을 이용하여 스테레오 신호를 복원하는 경우에 이용되는 스테레오 파라미터에는, CLD, ICC, IPD, OPD 등이 있다.
일례로서, 파라미터 부호화부(110)는 파라미터 추출부를 포함할 수 있고, 이 경우, 스테레오 파라미터는 파라미터 추출부에 의해 추출된다.
이 때, 파라미터 부호화부(110)는 추출된 스테레오 파라미터 중에서 복수 채널의 위상 정보를 나타내는 위상 파라미터를 부호화 할지 여부를 결정하고, 부호화 정보를 생성한다. 즉, 부호화 정보는 비트스트림 생성부(130)에 의해 생성된 스테레오 신호에 대한 부호화된 비트스트림에 위상 파라미터가 포함되었는지에 대한 정보를 의미한다. 위상 파라미터를 부호화 할지 여부는 전송될 스테레오 신호에서의 위상 정보의 중요성에 기초하여 결정될 수 있다. 또한, 파라미터 부호화부(110)는 CLD 및 ICC를 부호화한다.
본 발명의 일실시예에 따르면, 상기 부호화 정보는 하나의 비트에 의해 표현될 수 있다. 비트스트림에 부호화된 위상 파라미터가 포함된 경우, 상기 비트는 "1"의 값을 가지고, 비트스트림에 부호화된 위상 파라미터가 포함되지 않는 경우, 상기 비트는 "0"의 값을 가질 수 있다.
위상 파라미터를 부호화하기로 결정한 경우, 파라미터 부호화부(110)는 위상 파라미터를 부호화하고, "1"값을 갖는 부호화 정보를 생성한다. 반대로, 위상 파라미터를 부호화하지 않기로 결정한 경우, 파라미터 부호화부(110)는 위상 파라미터를 부호화하지 않고, "0"값을 갖는 부호화 정보를 생성한다.
본 발명의 일실시예에 따르면, 위상 파라미터는 IPD와 OPD를 모두 포함할 수 있고, IPD만을 포함할 수 있다. OPD는 IPD 및 다른 스테레오 파라미터를 이용하여 추정될 수 있으므로, 위상 파라미터는 IPD만을 포함할 수 있다. 이에 대한 자세한 내용은 도 3의 멀티 채널 신호의 복호화 장치를 참고하여 설명하기로 한다.
본 발명의 일실시예에 따르면, 파라미터 부호화부(110)는 다운 믹싱부를 포함할 수 있다. 다운 믹싱부는 스테레오 신호를 다운 믹싱하여 모노 신호를 생성한다.
다운 믹싱(Down-Mixing)은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운 믹싱을 통하여 부호화 과정에 할당되는 비트량을 줄일 수 있다. 이 때, 모노 신호는 스테레오 신호를 대표하는 신호일 수 있다. 다시 말해, 부호화단에서 스테레오 신호에 포함된 좌채널 신호 및 우채널 신호 각각을 부호화하지 않고, 대표적으로 모노 신호만을 부호화하여 전송할 수 있다. 예를 들어, 모노 신호의 크기는 좌채널 신호 및 우채널 신호의 크기의 평균 값으로 구할 수 있고, 모노 신호의 위상은 좌채널 신호 및 우채널 신호의 위상의 평균 값으로 구할 수 있다.
모노 신호 부호화부(120)는 스테레오 신호를 다운 믹싱한 모노 신호를 부호화한다.
일례로서, 스테레오 신호가 음성(voice) 신호인 경우, 모노 신호 부호화부(120)는 모노 신호를 CELP(Code Excited Linear Prediction) 방식으로 부호화할 수 있다.
또한, 다른 일례로서, 스테레오 신호가 음악(music) 신호인 경우, 모노 신호 부호화부(110)는 기존의 MPEG-2/4 AAC나 mp3와 유사한 방법을 사용하여 모노 신호를 부호화할 수 있다.
비트스트림 생성부(130)은 부호화된 모노 신호를 이용하여 스테레오 신호에 대한 부호화된 비트스트림을 생성한다.
본 발명의 일실시예에 따르면, 위상 파라미터를 부호화 하는 것으로 결정된 경우, 비트스트림 생성부(130)은 부호화된 모노 신호, 부호화된 위상 파라미터, 및 부호화 정보를 이용하여 스테레오 신호에 대한 부호화된 비트스트림을 생성한다. 일례로서, 비트스트림 생성부(130)은 부호화된 모노 신호, 부호화된 위상 파라미터, 및 부호화 정보를 다중화(Muxing)하여 비트스트림을 생성할 수 있다.
본 발명의 다른 실시예에 따르면, 위상 파라미터를 부호화를 하지 않는 것으로 결정된 경우, 비트스트림 생성부(130)은 부호화된 모노 신호, 및 부호화 정보를 이용하여 스테레오 신호에 대한 부호화된 비트스트림을 생성한다. 이 경우에도 비트스트림 생성부(130)는 다중화 방법을 이용하여 비트스트림을 생성할 수 있다.
또한, 상기 언급한 바와 같이, 파라미터 부호화부(110)는 CLD, ICC도 부호화하므로, 비트스트림 생성부(130)는 위상 파라미터의 부호화 여부와 관계없이 비트스트림 생성시 부호화된 CLD, ICC를 이용한다.
이와 같이, 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치(100)는 선택적으로 위상 파라미터를 부호화하고, 이를 비트스트림에 삽입하여 전송할 수 있다. 이에 따라, 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치(100)는 위상 파라미터를 사용하지 않고 스테레오 신호를 부호화/복호화하는 경우와 비교할 때, 보다 향상된 음질의 스테레오 신호를 제공할 수 있고, 위상 파라미터를 항상 사용하여 스테레오 신호를 부호화/복호화하는 경우와 비교할 때, 전송되는 데이터량을 줄일 수 있게 된다.
상기 언급한 바와 같이, 위상 파라미터를 부호화 할지 여부는 전송될 스테레오 신호에서의 위상 정보의 중요성에 기초하여 결정될 수 있는데, 본 발명의 일실시예에 따르면, 파라미터 부호화부(110)는 복수 채널간의 간섭성(coherence)과 복수 채널 간의 상관성(correlation)의 차, 및 스테레오 신호에 포함된 복수의 프레임의 위상 정보의 연속성 중에서 적어도 하나를 고려하여 위상 파라미터의 부호화 여부를 결정할 수 있다.
즉, 복수 채널간의 간섭성과 복수 채널 간의 상관성의 차가 큰 경우, 위상 정보가 지각적으로 중요한 의미를 나타내므로, 이 경우, 파라미터 부호화부(110)는 위상 파라미터의 부호화를 결정한다. 복수 채널간의 간섭성은 위상 정보를 이용한 복수 채널간의 간섭성일 수 있다.
또한, 스테레오 신호에 포함된 복수의 프레임의 위상값이 연속적으로 변하는 경우, 이는 스테레오 이미지가 위상에 따라 연속적으로 변하는 것을 의미하므로, 이 경우, 파라미터 부호화부(110)는 위상 파라미터의 부호화를 결정한다. 반대로, 위상 값이 랜덤하게 변하는 경우, 파라미터 부호화부(110)는 위상 파라미터의 부호화 하지 않는 것으로 결정한다.
본 발명의 일실시예에 따르면, 비트스트림 생성부(130)에서 생성된 비트스트림은 헤더 및 복수의 프레임을 포함하고, 부호화 정보는 헤더 또는 복수의 프레임 각각에 삽입될 수 있다.
복호화 장치에서 위상 파라미터를 이용하여 모노 신호를 업 믹싱하는 경우, 위상 파라미터 뿐만 아니라, 위상 파라미터가 적용될 모노 신호의 주파수 대역에 관한 정보, 즉 어느 주파수 대역까지 위상 파라미터를 이용하여 모노 신호를 업 믹싱할 지에 대한 정보가 필요할 수 있다.
따라서, 본 발명의 일실시예에 따르면, 위상 파라미터의 부호화가 결정된 경우, 비트스트림 생성부(130)는 모노 신호의 주파수 대역 정보를 더 이용하여 상기 부호화된 비트스트림을 생성할 수 있다. 이 때, 주파수 대역 정보는 모노 신호가 업 믹싱되는 경우 위상 파라미터가 적용될 주파수 대역에 관한 정보를 의미한다. 즉, 주파수 대역 정보는 복호화 장치에서 모노 신호를 업 믹싱하는 경우, 상기 위상 파라미터가 적용될 주파수 대역에 관한 정보를 의미한다.
본 발명의 일실시예에 따르면, 주파수 대역 정보는 위상 파라미터가 적용될 주파수 대역의 개수를 포함할 수 있다. 이 경우, 상기 모노 신호의 복수의 주파수 대역 중에서 상기 개수만큼의 저 주파수 대역이 위상 파라미터가 적용될 주파수 대역으로 선택될 수 있다.
예를 들어, 모노 신호의 주파수가 28 개의 주파수 대역으로 분할되고, 상기 주파수 대역의 개수가 14인 경우, 위상 파라미터가 적용될 주파수 대역은 주파수가 작은 하위 14개의 주파수 대역일 수 있다. 이는 위상 파라미터가 저 주파수 영역에서 더욱 중요한 의미를 지닌다는 사실에 기초한 것이다.
이 때, 모노 신호의 주파수가 7 개의 이하의 주파수 대역으로 분할되는 경우에는 비트스트림의 중요성이 현저히 낮아지므로, 이 경우, 상기 주파수 대역의 개수는 0 개가 될 수 있다. 즉, 모노 신호의 업 믹싱시 위상 파라미터를 이용하지 않는다.
본 발명의 일실시예에 따르면, 파라미터 부호화부(110)는 CLD 및 ICC 중에서 적어도 하나를 더 부호화화고, 비트스트림 생성부(130)는 CLD 및 ICC 중에서 적어도 하나를 더 이용하여 상기 비트스트림을 생성하고, 상기 주파수 대역 정보를 표현하는 비트수는 모노 신호가 업 믹싱되는 경우, CLD 및 ICC 중에서 적어도 하나가 적용될 주파수 대역의 개수에 기초하여 결정될 수 있다.
즉, 위상 파라미터가 적용될 주파수 대역의 개수는 CLD 또는 ICC가 적용될 파수 대역의 개수에 기초하여 결정될 수 있다. 일례로서, 위상 파라미터가 적용될 주파수 대역의 개수는 CLD 또는 ICC가 적용될 파수 대역의 개수는 동일할 수 있고, 다른 일례로, CLD 또는 ICC가 적용될 파수 대역의 개수는 위상 파라미터가 적용될 주파수 대역의 개수의 2배가 될 수도 있다.
본 발명의 일실시예에 따르면, 주파수 대역 정보는 위상 파라미터가 적용될 주파수 대역의 개수의 갱신 여부에 대한 정보를 더 포함할 수 있다.
즉, 상기 갱신 여부에 대한 정보는 부호화하는 현재 프레임에서의 위상 파라미터가 적용될 주파수 대역의 개수와, 이전 프레임에서의 위상 파라미터가 적용될 주파수 대역의 개수가 동일한지 여부를 나타낸다.
일례로서, 상기 갱신 여부에 대한 정보는 하나의 비트에 의해 표현될 수 있다. 현재 프레임에서의 위상 파라미터가 적용될 주파수 대역의 개수와 이전 프레임에서의 위상 파라미터가 적용될 주파수 대역의 개수가 동일하지 않은 경우, 상기 비트는 "1"의 값을 가지고, 현재 프레임에서의 위상 파라미터가 적용될 주파수 대역의 개수와 이전 프레임에서의 위상 파라미터가 적용될 주파수 대역의 개수가 동일한 경우 상기 비트는 "0"의 값을 가질 수 있다.
만약, 상기 갱신 여부에 대한 정보가 "1"의 값을 갖는 경우, 주파수 대역 정보는 위상 파라미터가 적용될 모노 신호의 주파수 대역 개수를 포함한다. 반대로, 상기 갱신 여부에 대한 정보가 "0"의 값을 갖는 경우, 주파수 대역 정보는 위상 파라미터가 적용될 모노 신호의 주파수 대역 개수를 포함하지 않는다.
이와 같이, 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치(100)는 위상 파라미터가 적용될 주파수 대역의 개수의 갱신 여부에 대한 정보를 사용함으로써, 불필요한 정보를 중복하여 부호화하는 것을 방지하고, 전송되는 데이터량을 줄일 수 있다.
본 발명의 일실시예에 따르면, 주파수 대역 정보는 헤더 또는 복수의 프레임 각각에 삽입될 수 있다. 일례로서, 부호화 정보가 헤더에 삽입되는 경우, 주파수 대역 정보 역시 헤더에 삽입될 수 있고, 부호화 정보가 복수의 프레임 각각에 삽입되는 경우, 주파수 대역 정보 역시 복수의 프레임 각각에 삽입될 수 있다.
본 발명의 일실시예에 따르면, 파라미터 부호화부(110)는 멀티 채널 신호에 포함된 복수의 프레임의 위상 정보를 비교하여 위상 파라미터의 부호화 여부를 결정할 수 있다.
즉, 부호화하는 현재 프레임에서의 위상 정보가 이전 프레임에서의 위상 정보와 동일한 경우, 파라미터 부호화부(110)는 위상 파라미터를 부호화하지 않을 수 있다. 이 경우, 파라미터 부호화부(110)은 위상 파라미터가 갱신되지 않음을 나타내는 위상 파라미터 갱신 정보를 생성할 수 있고, 위상 파라미터 갱신 정보는 비트스트림에 포함되어 전송될 수 있다. 위상 파라미터가 갱신되지 않은 경우, 복호화 장치는 이전 프레임의 위상 파라미터를 이용하여 모노 신호를 업믹싱할 수 있다.
도 2는 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치의 상세한 구성을 도시한 블록도이다.
본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 장치(200)는 모노 신호 복호화부(210), 주파수 대역 결정부 (220), 파라미터 복호화부(230), 및 업 믹싱부(240)을 포함한다. 이하, 각 구성 요소 별로 그 기능을 상술하기로 한다.
이하에서도, 설명의 편의상, 멀티 채널 신호의 복호화 장치(200)에 입력되는 비트스트림은 스테레오 신호의 부호화된 비트스트림인 것으로 가정한다.
또한, 입력되는 비트스트림은 부호화된 모노 신호, 부호화된 스테레오 파라미터, 및 부호화된 주파수 대역 정보로 역다중화 된 것으로 가정한다.
모노 신호 복호화부(210)는 스테레오 신호 또는 멀티 채널 신호(이하 스테레오 신호라고 한다)의 부호화된 비트스트림으로부터 상기 멀티 채널 신호의 다운 믹스 신호인 모노 신호를 복원한다. 구체적으로, 모노 신호 복호화부(210)는 모노 신호가 시간 도메인에서 부호화된 경우에는 부호화된 모노 신호를 시간 도메인에서 복호화하고, 모노 신호가 주파수 도메인에서 부호화된 경우에는 부호화된 모노 신호를 주파수 도메인에서 복호화할 수 있다.
다음으로, 주파수 대역 결정부(220)는 멀티 채널 신호를 구성하는 복수 채널의 위상 파라미터가 비트스트림에 존재하는지 여부를 확인하고, 위상 파라미터가 비트스트림에 존재하는 경우 위상 파라미터가 적용될 모노 신호의 주파수 대역을 결정한다.
일례로서, 주파수 대역 결정부(220)는 비트스트림에 포함된 부호화 정보를 확인하여 위상 파라미터가 비트스트림에 존재하는지 여부를 확인할 수 있다.
파라미터 복호화부(230)는 비트스트림으로부터 상기 멀티 채널 신호를 구성하는 복수 채널의 위상 파라미터를 복원한다. 일례로서, 파라미터 복호화부(230)는 비트스트림에 포함된 부호화 정보를 복원하여, 비트스트림에 위상 파라미터가 포함되었는지 여부를 판단하고, 포함된 경우, 위상 파라미터의 복원을 수행할 수 있다.
또한, 파라미터 복호화부(230)는 위상 파라미터 이외에, CLD, ICC 등과 같이 비트스트림에 포함된 다른 스테레오 파라미터도 복원한다.
상기 언급한 바와 같이, 위상 파라미터는 IPD와 OPD를 모두 포함할 수 있고, IPD만을 포함할 수 있는데, 위상 파라미터가 IPD와 OPD를 모두 포함하는 경우, 파라미터 복호화부(230)은 비트스트림으로부터 IPD와 OPD를 복원할 수 있다.
위상 파라미터가 IPD만을 포함하는 경우, OPD는 IPD 및 다른 스테레오 파라미터들로부터 추정될 수 있다. 이하에서, OPD의 추정은 파라미터 복호화부(230)에 포함된 OPD 추정부에 의해 수행되는 것으로 가정하고, OPD 추정부의 동작을 자세히 설명하기로 한다. 여기서, 후술된 수학식들은 본 발명의 일 실시예에 불과하고, 후술된 수학식들은 변형이 가능함은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명하다고 할 수 있다.
먼저, OPD 추정부는 IID를 이용하여 제1 중간 변수 c를 다음 수학식 1에 따라 구할 수 있다.
[수학식 1]
Figure PCTKR2009006247-appb-I000001
여기서, b는 주파수 밴드의 인덱스를 나타낸다. 수학식 1과 같이, 제1 중간 변수 c는 특정 주파수 밴드에서의 IID 값을 20으로 나눈 수를 10의 지수 형태로 표현함으로써 구할 수 있다. 이 때, 제1 중간 변수 c를 이용하여 다음 수학식 5 및 6과 같이 제2 중간 변수 c1 및 제3 중간 변수 c2를 구할 수 있다.
[수학식 2]
Figure PCTKR2009006247-appb-I000002
[수학식 3]
Figure PCTKR2009006247-appb-I000003
즉, 제3 중간 변수 c2는 제2 중간 변수 c1의 값에 c(b)를 곱한 값으로 구할 수 있다.
다음으로, OPD 추정부는 복원된 모노 신호 및 수학식 2 및 수학식 3에서 구한 제2 중간 변수 및 제3 중간 변수를 이용하여 제1 우채널 신호와 제1 좌채널 신호를 다음 수학식 4 및 수학식 5과 같이 나타낼 수 있다.
[수학식 4]
[규칙 제26조에 의한 보정 10.12.2009] 
Figure WO-DOC-79
[규칙 제26조에 의한 보정 10.12.2009] 
여기서, n은 시간 슬롯 인덱스이며, k는 파라미터 밴드 인덱스를 나타낸다. 제1 우채널 신호
Figure WO-DOC-80
는 제2 중간 변수 c1과 복원된 모노 신호 M의 곱으로 나타낼 수 있다.
[수학식 5]
[규칙 제26조에 의한 보정 10.12.2009] 
Figure WO-DOC-82
[규칙 제26조에 의한 보정 10.12.2009] 
제1 좌채널 신호
Figure WO-DOC-83
는 제2 중간 변수 c2와 복원된 모노 신호 M의 곱으로 나타낼 수 있다.
[규칙 제26조에 의한 보정 10.12.2009] 
이 때, IPD를
Figure WO-DOC-84
라고 하면, 제1 모노 신호
Figure WO-DOC-841
는 제1 우채널 신호
Figure WO-DOC-842
및 제2 좌채널 신호
Figure WO-DOC-843
를 이용하여 다음 수학식 6와 같이 나타낼 수 있다.
[수학식 6]
[규칙 제26조에 의한 보정 10.12.2009] 
Figure WO-DOC-86
또한, 수학식 3 내지 6을 이용하여, 시간 슬롯과 파라미터 밴드에 따른 제4 중간 변수 p는 다음 수학식 7과 같이 구할 수 있다.
[수학식 7]
[규칙 제26조에 의한 보정 10.12.2009] 
Figure WO-DOC-89
[규칙 제26조에 의한 보정 10.12.2009] 
여기서, 제4 중간 변수 p는 제1 좌채널 신호, 제1 우채널 신호, 및 제1 모노 신호의 크기의 합을 2로 나눈 값으로 한다. 이 때, OPD의 값을
Figure WO-DOC-90
라 할 때, OPD는 다음 수학식 8과 같이 구할 수 있다.
[수학식 8]
[규칙 제26조에 의한 보정 10.12.2009] 
Figure WO-DOC-92
[규칙 제26조에 의한 보정 10.12.2009] 
또한, OPD와 IPD의 차에 해당하는 값을
Figure WO-DOC-93
라 할 때,
Figure WO-DOC-931
은 다음 수학식 9와 같이 구할 수 있다.
[수학식 9]
[규칙 제26조에 의한 보정 10.12.2009] 
Figure WO-DOC-95
[규칙 제26조에 의한 보정 10.12.2009] 
수학식 8에서 구한 OPD의 값인
Figure WO-DOC-96
은 복호화된 모노 신호와 업믹싱될 좌채널 신호 사이의 위상 차이고, 수학식 9에서 구한 값인
Figure WO-DOC-961
는 복호화된 모노 신호와 업믹싱될 우채널 신호 사이의 위상 차를 나타낸다.
이와 같이, OPD 추정부는 스테레오 신호의 채널 간 크기 차를 나타내는 IID를 이용하여 복원된 모노 신호로부터 좌채널 신호 및 우채널 신호에 대한 제1 좌채널 신호 및 제1 우채널 신호를 생성하고, 스테레오 신호의 채널 간 위상 차를 나타내는 IPD를 이용하여 제1 좌채널 신호 및 제1 우채널 신호로부터 제1 모노 신호를 생성하며, 생성된 제1 좌채널 신호, 제1 우채널 신호, 및 제1 모노 신호를 이용하여 복원된 모노 신호와 스테레오 신호의 위상 차를 나타내는 OPD의 값을 추정할 수 있다.
업 믹싱부(240)는 위상 파라미터를 상기 주파수 대역에 적용하여 상기 모노 신호를 업 믹싱하여 스테레오 신호를 복원한다.
업 믹싱은 한 채널의 모노 신호로부터 두 채널 이상의 스테레오 신호를 생성하는 것으로 다운 믹싱과 대응된다.
업 믹싱부(240)는 모노 신호 업 믹싱시 CLD, ICC 등의 다른 스테레오 파라미터를 함께 적용하여 모노 신호를 업 믹싱한다. 이하에서는 CLD, ICC, IPD 및 OPD를 이용하여 모노 신호를 업 믹싱하는 업 믹싱부(240)의 구체적인 동작에 대해 설명하기로 한다.
먼저, 업 믹싱부(240)는 IIC의 값이
Figure PCTKR2009006247-appb-I000021
일 때, 제2 및 제3 중간 변수 c1 및 c2를 이용하여 제1 위상
Figure PCTKR2009006247-appb-I000022
및 제2 위상
Figure PCTKR2009006247-appb-I000023
을 다음 수학식 10 및 11와 같이 구할 수 있다.
[수학식 10]
Figure PCTKR2009006247-appb-I000024
[수학식 11]
Figure PCTKR2009006247-appb-I000025
다음으로, 업 믹싱부(240)는 복원된 모노 신호가 M이고, 디코릴레이션된 신호가 D일 때, 수학식 10 및 수학식 11을 통해 구한 제1 및 제2 위상, 제2 및 제3 중간 변수 c1 및 c2 및 수학식 8에서 구한 OPD의 값인
Figure PCTKR2009006247-appb-I000026
, 수학식 9에서 구한 값인
Figure PCTKR2009006247-appb-I000027
을 이용하여 아래의 수학식 12 및 수학식 13과 같이 업 믹싱된 좌채널 신호 및 우채널 신호를 구할 수 있다.
[수학식 12]
Figure PCTKR2009006247-appb-I000028
[수학식 13]
Figure PCTKR2009006247-appb-I000029
이와 같이, 본 발명의 일 실시예에 따른 멀티 채널 신호의 복호화 장치(200)는멀티 채널 신호의 부호화 장치로부터 OPD 값을 수신하지 않음에도 불구하고, 부호화단으로부터 전송된 다른 파라미터들을 이용하여 OPD 값을 추정함으로써, 업 믹싱에 이용되는 파라미터의 종류가 증가시켜 업 믹싱된 스테레오 신호의 음질을 향상시킬 수 있다.
본 발명의 일실시예에 따르면, 멀티 채널 신호의 복호화 장치(200)는 주파수 대역에 관한 주파수 대역 정보가 저장된 테이블을 포함하고, 주파수 대역 결정부(220)는 테이블로부터 상기 모노 신호에 상응하는 주파수 대역 정보를 선택하여 상기 주파수 대역을 결정할 수 있다.
즉, 멀티 채널 신호의 부호화 장치 및 복호화 장치가 주파수 대역 정보가 저장된 테이블을 공유하고 있는 경우, 멀티 채널 신호의 부호화 장치 및 복호화 장치는 테이블을 참고하여 위상 파라미터가 적용될 주파수 대역에 관한 정보를 선택하고, 이에 따라 위상 파라미터가 적용될 주파수 대역을 결정할 수 있다.
또한, 본 발명의 일실시예에 따르면, 주파수 대역 결정부(220)는 비트스트림으로부터 주파수 대역에 관한 주파수 대역 정보를 복원하고, 복원된 주파수 대역 정보에 기초하여 주파수 대역을 결정할 수 있다.
즉, 주파수 대역 결정부(220)는 비트스트림으로부터 직접 주파수 대역 정보를 복원하고, 이를 이용하여 주파수 대역을 결정할 수 있다.
본 발명의 일실시예에 따르면, 주파수 대역 결정부(220)는 비트스트림의 헤더, 또는 복수의 프레임 각각으로부터 주파수 대역 정보를 복원할 수 있다.
즉, 주파수 대역 정보는 입력된 비트스트림의 헤더 또는 복수의 프레임 각각에 삽입될 수 있고, 이 경우, 주파수 대역 결정부(220)는 비트스트림의 헤더 또는 복수의 프레임으로부터 주파수 대역 정보를 복원할 수 있다.
본 발명의 일실시예에 따르면, 주파수 대역 정보는 위상 파라미터가 적용될 주파수 대역의 개수를 포함할 수 있다.
주파수 대역 정보가 위상 파라미터가 적용될 주파수 대역의 개수를 포함하는 경우, 주파수 대역 결정부(220)는 모노 신호의 복수의 주파수 대역 중에서 상기 개수만큼의 저 주파수 대역을 위상 파라미터가 적용될 주파수 대역으로 결정할 수 있다.
예를 들어, 모노 신호의 주파수가 28 개의 주파수 대역으로 분할되고, 상기 주파수 대역의 개수가 14인 경우, 주파수가 작은 하위 14개의 주파수 대역이 위상 파라미터가 적용될 주파수 대역으로 결정될 수 있다. 이 때, 상기 언급한 바와 같이 상기 개수가 0개인 경우, 모노 신호의 업 믹싱시 위상 파라미터를 이용하지 않는다.
또한, 본 발명의 일실시예에 따르면, 주파수 대역 정보는 위상 파라미터가 적용될 주파수 대역의 개수의 갱신 여부에 대한 정보를 더 포함할 수 있다.
이 경우, 우선, 주파수 대역 결정부(220)는 상기 갱신 여부에 대한 정보를 분석한다.
만약, 위상 파라미터가 적용될 주파수 대역의 개수가 갱신된 경우, 주파수 대역 결정부(220)는 비트스트림으로부터 위상 파라미터가 적용될 주파수 대역의 개수를 추출하고, 상기 갱신된 주파수 대역의 개수에 기초하여 위상 파라미터가 적용될 주파수 대역을 결정할 수 있다.
반대로, 위상 파라미터가 적용될 주파수 대역의 개수가 갱신되지 않은 경우, 주파수 대역 결정부(220)는 이전 프레임의 주파수 대역의 개수에 기초하여 위상 파라미터가 적용될 주파수 대역을 결정할 수 있다.
도 3은 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치에 의해 부호화된 멀티 채널 신호의 비트스트림의 구조를 도시한 도면이다.
상기 언급한 바와 같이, 부호화 정보 및 주파수 대역 정보는 비트스트림의 헤더 또는 프레임에 삽입될 수 있다.
먼저, 도 3의 (a)은 부호화 정보 및 주파수 대역 정보가 비트스트림의 헤더에 삽입된 비트스트림의 구조를 도시하고 있다. 도 3의 (a)에 도시된 비트스트림은 헤더(310)는 부가 정보 필드(311), 부호화 정보 필드(312), 및 주파수 대역 정보 필드(313)을 포함하여 구성된다.
부가 정보 필드(311)는 멀티 채널 데이터의 부호화/복호화시 사용되는 여러 가지 정보를 포함하고 있다. 일례로서, 부가 정보 필드(311)는 CLD 및 ICC의 주파수 대역의 개수를 나타내는 정보를 포함할 수 있다.
부호화 정보 필드(312)는 비트스트림에 위상 파라미터가 존재하는지 여부에 대한 정보를 포함한다. 상기 언급한 바와 같이, 부호화 정보 필드(312)는 하나의 비트로 표현될 수 있고, 또한, 비트스트림에 위상 파라미터가 포함된 경우, 상기 비트는 "1"의 값을 가지고, 비트스트림에 위상 파라미터가 포함되지 않는 경우, 상기 비트는 "0"의 값을 가질 수 있다. 위상 파라미터는 복수의 프레임(320) 각각의 위상 파라미터 필드(322)에 저장될 수 있다.
주파수 대역 정보 필드(313)는 모노 신호가 업 믹싱되는 경우 위상 파라미터가 적용될 주파수 대역에 관한 정보를 포함한다. 일례로서, 상기 주파수 대역에 관한 정보가 위상 파라미터가 적용될 주파수 대역의 개수를 의미하는 경우, 위상 파라미터가 적용될 주파수 대역은 최대 28개의 주파수 대역으로 표현될 수 있으므로, 주파수 대역 정보 필드는 5비트의 크기를 가질 수 있다.
위상 파라미터는 복수의 프레임(320) 각각의 위상 파라미터 필드(322)에 저장된다.
도 3의 (b)는 부호화 정보만이 비트스트림의 헤더에 삽입된 비트스트림의 구조를 도시하고 있다. 따라서, 도 3의 (b)에 도시된 비트스트림은 헤더(330)는 부가 정보 필드(331), 부호화 정보 필드(332)만을 포함하고, 주파수 대역 정보 필드는 포함하지 않는다.
이 경우, 멀티 채널 신호의 부호화 장치 및 복호화 장치는 주파수 대역 정보가 저장된 테이블(table)을 가지고 있다. 이 때, 멀티 채널 신호의 부호화 장치 및 복호화 장치는 테이블을 참고하여 위상 파라미터가 적용될 주파수 대역에 관한 정보를 선택하고, 이에 따라 주파수 대역을 결정할 수 있다. 일례로서, 멀티 채널 신호의 부호화 장치 및 복호화 장치는 헤더의 부가 정보 필드(331)에 존재하는 CLD 및 ICC의 주파수 대역의 개수를 나타내는 정보를 기초로 테이블을 검색하여 주파수 대역 정보를 결정할 수 있다.
도 3의 (c)는 부호화 정보 및 주파수 대역 정보가 프레임에 삽입된 비트스트림의 구조를 도시하고 있다.
이 경우, 헤더(350)는 부가 정보 필드만을 포함하고, 프레임(360)은 데이터 필드(361), 부호화 정보 필드(362), 주파수 대역 정보의 갱신 여부 정보 필드(363), 주파수 대역 정보 필드(364), 및 위상 파라미터 필드(365)를 포함한다.
부호화 정보 필드(362), 주파수 대역 정보 필드(364), 및 위상 파라미터 필드(365)는 도 3의 (a)의 경우와 동일하므로, 이에 대한 자세한 설명을 생략한다.
주파수 대역 정보의 갱신 여부 정보 필드(363)는 현재 프레임에서의 위상 파라미터가 적용될 주파수 대역의 주파수 대역 정보와, 이전 프레임에서의 위상 파라미터가 적용될 주파수 대역의 주파수 대역 정보가 동일한지 여부에 대한 정보를 포함한다.
상기 언급한 바와 같이, 상기 갱신 여부에 대한 정보 필드는 하나의 비트에 의해 표현될 수 있다. 현재 프레임에서의 주파수 대역 정보와 이전 프레임에서의 주파수 대역 정보가 동일하지 않은 경우, 상기 비트는 "1"의 값을 가지고, 현재 프레임에서의 주파수 대역 정보와 이전 프레임에서의 주파수 대역 정보가 동일한 경우 상기 비트는 "0"의 값을 가질 수 있다.
만약, 상기 갱신 여부에 대한 정보가 "0"의 값을 갖는 경우, 현재 프레임에서의 주파수 대역 정보와 이전 프레임에서의 주파수 대역 정보가 동일하므로, 주파수 대역 정보 필드(364)는 "0"의 값으로 세팅될 수 있다. 이 경우, 멀티 채널 신호의 복호화 장치는 이전 프레임의 주파수 대역 정보를 이용하여 복호화를 수행하게 된다.
이와 같이, 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치는 위상 파라미터가 적용될 주파수 대역의 개수의 갱신 여부에 대한 정보를 더 사용함으로써, 불필요한 정보를 중복하여 부호화하는 것을 방지하고, 전송되는 데이터량을 줄일 수 있다.
도 3의 (d)는 부호화 정보만이 프레임에 삽입된 비트스트림의 구조를 도시하고 있다. 주파수 대역 정보 및 주파수 대역 정보의 갱신 여부에 대한 정보는 비트스트림에 포함되지 않는다.
이 경우, 상기 언급한 바와 같이 멀티 채널 신호의 부호화 장치 및 복호화 장치 상호간에 주파수 대역 정보가 저장된 테이블을 가지고 있는 경우, 멀티 채널 신호의 부호화 장치 및 복호화 장치는 테이블을 참고하여 위상 파라미터가 적용될 주파수 대역에 관한 정보를 선택하고, 이에 따라 주파수 대역을 결정한다.
도 4 내지 도 8은 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 장치에 의해 생성된 비트스트림과 관련된 신택스를 도시한 도면이다.
이하에서 설명하는 신택스들은 MPEG Surround와 MPEG Unified Speech and audio Coding 기술에서 사용되고 있는 신택스를 기초로 일부 내용을 추가한 것이다.
먼저, 도 4 내지 도 6에서는 부호화 정보가 비트스트림의 헤더에 삽입된 경우와 관련된 신택스를 도시하고 있다. 즉, 도 4 내지 도 6에 도시된 신택스는 도 3의 (a) 및 (b)에서 도시한 비트스트림과 관련된 신택스이다.
도 4는 비트스트림의 헤더와 관련된 신택스이다. 도 4를 통해 알 수 있듯이, bsPhaseMode(410)라는 정보가 더 추가되었다.
bsPhaseMode는 위상 파라미터를 부호화하여 전송할지 여부에 대한 정보 즉 부호화 정보를 의미한다. 상기에서 설명한 것과 같이 bsPhaseMode는 하나의 비트로 표현이 가능하다.
만약, 비트스트림의 헤더 부분에 주파수 대역 정보를 삽입하는 경우 즉, 도 3의 (a)에서 도시된 비트스트림을 생성하는 경우, 도 5의 (a)와 같이 OttConfig(420)의 신택스가 변경된다.
도 5의 (a)는 OttConfig의 신택스를 도시한 도면이다. 도 5의 (a)를 통해 알 수 있듯이, bsOttBandsPhase[i](510)의 정보가 더 추가되었다.
bsOttBandsPhase[i](510)는 위상 파라미터가 적용될 주파수 대역의 개수를 의미한다. bsOttBandsPhase[i](510)는 nBitsBandsPhase의 크기를 갖는 비트로 표현할 수 있다.
Ott(One-To-Two)는 스테레오 업믹스에 사용된다. OttConfig에서는 Ott에서의 위상 파라미터가 적용될 주파수 대역의 개수를 결정한다. 만약 bsPhaseMode가 "1"이 되는 경우(즉 위상 파라미터를 사용하는 경우)에는 어느 주파수 대역까지 위상 파라미터를 이용하여 모노 신호를 업 믹싱하는 지에 대한 정보가 필요한데, 상기 주파수 대역에 대한 정보를 비트스트림에 삽입하는 경우, 이에 대한 정보는 bsOttBandsPhase를 이용하여 표현한다. bsFreqRes는 CLD와 ICC의 주파수 밴드 개수를 나타내는 정보로 헤더에 전송되며 보통 최대 28 밴드(numBands)로 표현이 되므로 일반적인 밴드 표현 방식은 5비트가 필요하다. nBitsBandsPhase를 이용하여 위상 파라미터가 적용될 주파수 대역을 표현할 경우, bsFreqRes에 따라 최대 밴드개수가 결정되므로, 이에 따라 동적으로 비트를 할당할 수 있다.
예를 들어 bsFreqRes가 4일 경우에는 최대 CLD 밴드의 개수가 10이므로 도 5의 (b)에 도시된 테이블의 nBitsBandsPhase(full band)에 표시된 바와 같이 4비트로도 주파수 대역의 개수를 표현할 수 있다.
또한, 상기 언급한 바와 같이, 위상 파라미터는 저 주파수 대역에만 적용될 수 있는데, 이 경우, 도 5의 (b)에 도시된 테이블의 nBitsBandsPhase(low band)에 표시된 바와 같이 주파수 대역을 결정하고 이에 따라 동적으로 비트를 할당할 수 있다. 이 경우, 모든 주파수 대역에 위상 파라미터를 적용하는 경우와는 달리 5비트를 모두 사용할 필요가 없다. 또한 bsFreqRes이 5이상의 값을 갖는 경우, CLD의 밴드 개수가 7이므로 이럴 경우에는 위상 파라미터를 이용하지 않고 nBitsBandsPhase를 "0"으로 하여 정보를 전송하지 않는다.
만약, 비트스트림의 헤더에 주파수 대역 정보를 삽입하지 않는 경우, 즉, 도 3의 (b)에서 도시된 비트스트림을 생성하는 경우에는 상기 언급한 바와 같이 멀티 채널 신호의 부호화 장치 및 복호화 장치는 주파수 대역 정보가 저장된 테이블을 가지고 있는데, 도 5의 (c)는 주파수 대역 저장 정보가 저장된 테이블의 일례를 도시하고 있다.
도 6에서는 위상 파라미터가 부호화되어 각 프레임에 삽입되는 경우에 사용되는 OttData에 대한 신택스를 도시하고 있다. 이 경우, bsPhaseMode는 "1"이 된다. EcDataIPD(610)는 위상 파라미터를 무손실 부호화한 결과를 나타낸다.
EcDataIPD에서는 bsIPDdataMode라는 비트를 사용하여 이전 프레임의 값을 그대로 유지할지 아니면 무손실 부호화를 통해 현재 프레임의 정보를 부호화할지를 결정한다. 만일 위상 파라미터가 어느 특정 오디오 구간에서 의미가 없는 경우에는 위상파라미터를 모두 0으로 세팅하여 부호화하고, 이후 프레임부터는 bsIPDDataMode를 "0"으로 세팅하여 전송함으로써, 불필요한 위상 파라미터를 보내지 않을 수 있다. 반대로, bsIPDDataMode가 "1"인 경우, 위상 파라미터를 부호화하여 전송한다.
도 7 및 도 8에서는 부호화 정보가 비트스트림의 프레임에 삽입된 경우와 관련된 신택스를 도시하고 있다. 즉, 도 7 및 도 8에 도시된 신택스는 도 3의 (c) 및 (d)에서 도시한 비트스트림과 관련된 신택스이다.
도 7은 비트스트림의 프레임과 관련된 신택스이다. 도 7를 통해 알 수 있듯이, bsPhaseMode(710)라는 정보가 더 추가되었다.
도 8의 (a)는 도 7의 신택스에 포함된 OttData에 관한 신택스이다.
프레임에 주파수 대역 정보 및 주파수 대역 정보의 갱신 여부 정보를 삽입하는 경우, 도면 부호(810)의 신택스가 부가된다.
bsUpdateOttBandsPhase는 현재 프레임에서 위상 파라미터를 적용할 주파수 대역의 개수를 갱신할지 여부를 정보로서, bsUpdateOttBandsPhase가 "1"인 경우, 주파수 대역의 개수를 갱신하여야 하고, 이 경우, 추가적으로 bsOttBandsPhase를 이용하여 주파수 대역의 전송하여 주파수 대역의 개수를 갱신한다. 반대로, bsUpdateOttBandsPhase가 "0"인 경우, 이전 프레임에서 사용되었던 위상 파라미터를 적용할 주파수 대역의 개수를 이용하여 위상 파라미터를 복원한다.
만약 bsPhaseMode가 "1"이 되는 경우(즉 위상 파라미터를 사용하는 경우)에는 어느 주파수 대역까지 위상 파라미터를 이용하여 모노 신호를 업 믹싱하는 지에 대한 정보가 필요한데, 상기 주파수 대역에 대한 정보를 비트스트림에 삽입하는 경우, 이에 대한 정보는 bsOttBandsPhase를 이용하여 표현한다. bsFreqRes는 CLD와 ICC의 주파수 밴드 개수를 나타내는 정보로 헤더에 전송되며 보통 최대 28 밴드(numBands)로 표현이 되므로 일반적인 밴드 표현 방식은 5비트가 필요하다. nBitsBandsPhase를 이용하여 위상 파라미터가 적용될 주파수 대역을 표현할 경우, bsFreqRes에 따라 최대 밴드개수가 결정되므로, 이에 따라 동적으로 비트를 할당할 수 있다.
예를 들어 bsFreqRes가 4일 경우에는 최대 CLD 밴드의 개수가 10이므로 도 8의 (b)에 도시된 테이블의 nBitsBandsPhase(full band)에 표시된 바와 같이 4비트로도 주파수 대역의 개수를 표현할 수 있다.
또한, 상기 언급한 바와 같이, 위상 파라미터는 저 주파수 대역에만 적용될 수 있는데, 이 경우, 도 8의 (b)에 도시된 테이블의 nBitsBandsPhase(low band)에 표시된 바와 같이 주파수 대역을 결정하고 이에 따라 동적으로 비트를 할당할 수 있다. 이 경우, 모든 주파수 대역에 위상 파라미터를 적용하는 경우와는 달리 5비트를 모두 사용할 필요가 없다. 또한 bsFreqRes이 5이상의 값을 갖는 경우, CLD의 밴드 개수가 7이므로 이럴 경우에는 위상 파라미터를 이용하지 않고 nBitsBandsPhase를 "0"으로 하여 정보를 전송하지 않는다. bsUpdateOttBandsPhase가 "1"로 세팅되어 갱신 되지 전에는 도 8의 (b)에 도시된 테이블의 Initial bsOttBandsPhase 값으로 초기화하여 동작한다.
EcDataIPD(820)는 위상 파라미터를 무손실 부호화한 결과를 나타낸다.
만약, 비트스트림의 프레임에 주파수 대역 정보를 삽입하지 않는 경우, 즉, 도 3의 (d)에서 도시된 비트스트림을 생성하는 경우에는 상기 언급한 바와 같이 멀티 채널 신호의 부호화 장치 및 복호화 장치는 주파수 대역 정보가 저장된 테이블을 가지고 있는데, 이 경우 역시 도 5의 (c)에 도시된 테이블이 사용된다.
도 9는 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 방법의 흐름도를 도시한 도면이다.
도 9을 참고하면, 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 방법은 도 1에 도시된 멀티 채널 신호의 부호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 1에 도시된 멀티 채널 신호의 부호화 장치에 관하여 이상에서 기술된 내용은 본 발명의 일실시예에 따른 멀티 채널 신호의 부호화 방법에도 적용된다.
단계(S910)에서는 멀티 채널 신호를 구성하는 복수 채널의 위상 정보를 나타내는 위상 파라미터의 부호화 여부를 결정하여 부호화 정보를 생성한다.
본 발명의 일실시예에 따르면, 위상 파라미터는 IPD와 OPD를 모두 포함할 수 있고, IPD만을 포함할 수 있다.
또한, 본 발명의 일실시예에 따르면, 단계(S910)은 복수 채널간의 간섭성과 복수 채널 간의 상관성의 차, 및 스테레오 신호에 포함된 복수의 프레임의 위상 정보의 연속성 중에서 적어도 하나를 고려하여 위상 파라미터의 부호화 여부를 결정할 수 있다.
단계(S920)에서는 멀티 채널 신호를 다운 믹싱한 모노 신호를 부호화한다.
단계(S930)에서는 위상 파라미터가 부호화되었는지 여부를 판단한다.
단계(S930)에서 위상 파라미터가 부호화 된 것으로 판단된 경우, 단계(S940)에서는 부호화된 모노 신호, 부호화된 위상 파라미터 및 부호화 정보를 이용하여 멀티 채널 신호에 대한 부호화된 비트스트림을 생성한다.
만약, 단계(S930)에서 위상 파라미터가 부호화 되지 않은 것으로 판단된 경우, 단계(S950)에서는 부호화된 모노 신호 및 부호화 정보를 이용하여 멀티 채널 신호에 대한 부호화된 비트스트림을 생성한다.
본 발명의 일실시예에 따르면, 단계(S940) 및 단계(S950)에서 생성된 비트스트림은 헤더 및 복수의 프레임을 포함하고, 부호화 정보는 헤더 또는 복수의 프레임 각각에 삽입될 수 있다.
또한, 본 발명의 일실시예에 따르면, 단계(S940)에서는 모노 신호의 주파수 대역 정보를 더 이용하여 상기 부호화된 비트스트림을 생성할 수 있다.
또한, 본 발명의 일실시예에 따르면, 주파수 대역 정보는 위상 파라미터가 적용될 주파수 대역의 개수를 포함할 수 있고, 위상 파라미터가 적용될 주파수 대역의 개수의 갱신 여부에 대한 정보를 더 포함할 수 있다.
도 10은 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 방법의 흐름도를 도시한 도면이다.
도 10을 참고하면, 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 방법은 도 2에 도시된 멀티 채널 신호의 복호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 2에 도시된 멀티 채널 신호의 복호화 장치에 관하여 이상에서 기술된 내용은 본 발명의 일실시예에 따른 멀티 채널 신호의 복호화 방법에도 적용된다.
단계(S1010)에서는 멀티 채널 신호의 부호화된 비트스트림으로부터 멀티 채널 신호의 다운 믹스 신호인 모노 신호를 복원한다.
단계(S1020)에서는 위상 파라미터가 비트스트림에 존재하는지 여부를 판단한다.
만약, 단계(S1020)에서 위상 파라미터가 비트스트림에 존재하는 것으로 판단한 경우, 단계(S1030)에서는 위상 파라미터가 적용될 모노 신호의 주파수 대역을 결정한다.
이 후, 단계(1040)에서는 비트스트림으로부터 위상 파라미터를 복원하고, 단계(S1050)에서는 위상 파라미터를 상기 주파수 대역에 적용하여 모노 신호를 업 믹싱한다.
본 발명의 일실시예에 따르면, 단계(S1040)에서는 주파수 대역에 관한 주파수 대역 정보가 저장된 테이블로부터 상기 모노 신호에 상응하는 주파수 대역 정보를 선택하여 상기 주파수 대역을 결정할 수 있다.
또한, 본 발명의 일실시예에 따르면, 단계(S1040)는 비트스트림으로부터 주파수 대역에 관한 주파수 대역 정보를 복원할 수 있다.
또한, 본 발명의 일실시예에 따르면, 단계(S1040)은 비트스트림의 헤더, 또는 복수의 프레임 각각으로부터 주파수 대역 정보를 복원할 수 있다.
이 때, 본 발명의 일실시예에 따르면, 주파수 대역 정보는 위상 파라미터가 적용될 주파수 대역의 개수를 포함할 수 있고, 위상 파라미터가 적용될 주파수 대역의 개수의 갱신 여부에 대한 정보를 더 포함할 수 있다.
만약, 단계(S1020)에서 위상 파라미터가 비트스트림에 존재하지 않는 것으로 판단한 경우, 다른 스테레오 파라미터만을 이용하여 모노 신호를 업 믹싱한다.
도 11 내지 도 13은 본 발명의 다른 일실시예에 따른 멀티 채널 신호의 부호화 방법의 흐름도를 도시한 도면이다.
도 11은 도 3의 (a) 및 (b)에 도시된 비트스트림을 복호화 하는 방법의 흐름도를 도시한 도면이다.
단계(S1101)에서는 멀티 채널 신호의 부호화된 비트스트림으로부터 상기 멀티 채널 신호의 다운 믹스 신호인 모노 신호를 복원한다.
단계(S1102)에서는 비트스트림에 헤더 정보가 존재하는지 여부를 판단한다.
만약, 단계(S1102)에서 비트스트림에 헤더 정보가 존재하는 것으로 판단한 경우, 이후 설명할 단계(S1108)가 수행된다.
만약, 단계(S1102)에서 비트스트림에 헤더 정보가 존재하는 것으로 판단한 경우, 단계(S1103)에서 헤더 정보가 복원되고, 단계(S1104)에서는 위상 파라미터가 사용되었는지 여부에 대한 정보가 복원된다.
이후, 단계(S1105)에서는 복원된 위상 파라미터의 사용 여부에 대한 정보에 기초하여 위상 파라미터가 사용되었는지 여부를 판단한다.
만약, 단계(S1105)에서 위상 파라미터가 사용되지 않은 것으로 판단한 경우, 단계(S1107)에서는 위상 파라미터가 사용될 주파수 대역의 개수 및 위상 파라미터를 각각 "0"으로 초기화 한다.
단계(S1105)에서 위상 파라미터가 사용된 것으로 판단한 경우, 비트스트림이 도 3의 (a)에 도시된 비트스트림의 구조를 가진다면 단계(S1106)에서는 위상 파라미터가 사용될 주파수 대역의 개수를 복원하고, 비트스트림이 도 3의 (b)에 도시된 비트스트림의 구조를 가진다면, 단계(S1106)에서는 주파수 대역에 관한 주파수 대역 정보가 저장된 테이블로부터 상기 모노 신호에 상응하는 주파수 대역 정보를 선택하여 상기 주파수 대역을 결정한다.
이후, 단계(S1108)에서는 채널간의 에너지 차이를 나타내는 정보(CLD)를 복원하고, 단계(S1109)에서는 채널간의 유사도를 나타내는 정보(ICC)를 복원한다.
단계(S1111)에서는 위상 파라미터가 사용되었는지 여부를 판단한다.
만약, 단계(S1111)에서 위상 파라미터가 사용된 것으로 판단된 경우, 단계(S1111)에서는 위상 파라미터가 사용될 주파수 대역의 개수만큼 위상 파라미터를 복원하고, 단계(S1112)에서는 상기 복원된 위상 파라미터에 기초하여 복원된 모노 신호를 업 믹싱한다.
만약, 단계(S1111)에서 위상 파라미터가 사용되지 않은 것으로 판단된 경우, 단계(S1111)은 수행되지 않고, 단계(S1112)에서는 위상 파라미터를 사용하지 않고 복원된 모노 신호를 업 믹싱한다.
도 12는 도 3의 (d)에 도시된 비트스트림을 복호화 하는 방법의 흐름도를 도시한 도면이다.
단계(S1210) 멀티 채널 신호의 부호화된 비트스트림으로부터 상기 멀티 채널 신호의 다운 믹스 신호인 모노 신호를 복원한다.
단계(S1220)에서는 비트스트림에 헤더 정보가 존재하는지 여부를 판단한다.
만약, 단계(S1220)에서는 비트스트림에 헤더 정보가 존재하지 않는 것으로 판단된 경우, 이후 설명할 단계(S1250)가 수행된다.
만약, 단계(S1220)에서는 비트스트림에 헤더 정보가 존재하는 것으로 판단된 경우, 단계(S1230)에서는 헤더 정보 복원한다.
이후, 단계(S1240)에서는 위상 파라미터가 사용되었는지 여부에 대한 정보를 복원하고, 단계(S1250)에서는 채널간의 에너지 차이를 나타내는 정보(CLD)를 복원하고, 단계(S1260)에서는 채널간의 유사도를 나타내는 정보(ICC)를 복원한다.
단계(S1270)에서는 위상 파라미터가 사용되었는지 여부를 판단한다.
만약, 단계(S1270)에서 위상 파라미터가 사용된 것으로 판단된 경우, 단계(S1280)에서는 위상 파라미터가 사용될 주파수 대역의 개수만큼 위상 파라미터를 복원하고, 단계(S1290)에서는 상기 복원된 위상 파라미터에 기초하여 복원된 모노 신호를 업 믹싱한다.
만약, 단계(S1270)에서는 위상 파라미터가 사용되지 않은 것으로 판단된 경우, 단계(S1280)은 수행되지 않고, 단계(S1290)에서는 위상 파라미터를 사용하지 않고 복원된 모노 신호를 업 믹싱한다.
도 13은 도 3의 (c)에 도시된 비트스트림을 복호화 하는 방법의 흐름도를 도시한 도면으로서, 도 12의 흐름도에서 부가되는 단계만을 도시하고 있다.
단계(S1270)에서 위상 파라미터가 사용된 것으로 판단된 경우, 단계(S1271)에서는 위상 파라미터가 적용될 주파수 대역의 개수의 갱신 여부에 대한 정보를 복원한다.
이후, 단계(S1272)에서는 위상 파라미터가 적용될 주파수 대역의 개수가 갱신되는지 여부를 판단한다.
만약 단계(S1272)에서 위상 파라미터가 적용될 주파수 대역의 개수가 갱신되는 것으로 판단한 경우, 단계(S1273)에서는 위상 파라미터가 적용될 주파수 대역의 개수를 복원한다. 이 경우, 단계(S1280)에서는 복원된 주파수 대역의 개수를 이용하여 위상 파라미터를 복원한다.
만약 단계(S1272)에서 위상 파라미터가 적용될 주파수 대역의 개수가 갱신되지 않는 것으로 판단한 경우, 단계(S1273)은 수행되지 않고, 단계(S1280)에서는 이전 프레임에서의 위상 파라미터가 적용될 주파수 대역의 개수를 이용하여 위상 파라미터를 복원한다.
또한, 본 발명에 따른 멀티 채널 신호의 부호화/복호화 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 안되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.

Claims (21)

  1. 멀티 채널 신호를 구성하는 복수 채널의 위상 정보를 나타내는 위상 파라미터의 부호화 여부를 결정하여 부호화 정보를 생성하고, 상기 위상 파라미터의 부호화가 결정된 경우 상기 위상 파라미터를 부호화하는 파라미터 부호화부;
    상기 멀티 채널 신호를 다운 믹싱한 모노 신호를 부호화하는 모노 신호 부호화부; 및
    상기 위상 파라미터의 부호화가 결정된 경우, 상기 부호화된 모노 신호, 상기 부호화된 위상 파라미터, 및 상기 부호화 정보를 이용하여 상기 멀티 채널 신호에 대한 부호화된 비트스트림을 생성하는 비트스트림 생성부
    를 포함하는 것을 특징으로 하는 부호화 장치.
  2. 제1항에 있어서,
    상기 위상 파라미터의 부호화를 하지 않는 것으로 결정된 경우,
    상기 비트스트림 생성부는 상기 부호화된 모노 신호 및 상기 부호화 정보를 이용하여 상기 멀티 채널 신호에 대한 부호화된 비트스트림을 생성하는 것을 특징으로 하는 부호화 장치.
  3. 제1항에 있어서,
    상기 위상 정보는 상기 복수 채널간의 위상 차를 포함하는 것을 특징으로 하는 부호화 장치.
  4. 제1항에 있어서,
    상기 파라미터 부호화부는 상기 복수 채널간의 간섭성(coherence)과 상기 복수 채널 간의 상관성(correlation)의 차, 및 상기 멀티 채널 신호에 포함된 복수의 프레임의 위상 정보의 연속성 중에서 적어도 하나를 고려하여 상기 위상 파라미터의 부호화 여부를 결정하는 것을 특징으로 하는 부호화 장치.
  5. 제1항에 있어서,
    상기 비트스트림은 헤더 및 복수의 프레임을 포함하고,
    상기 부호화 정보는 상기 헤더 또는 상기 복수의 프레임에 삽입되는 것을 특징으로 하는 부호화 장치.
  6. 제1항에 있어서,
    상기 위상 파라미터의 부호화가 결정된 경우,
    상기 비트스트림 생성부는 상기 모노 신호의 주파수 대역 정보 - 상기 주파수 대역 정보는 상기 모노 신호가 업 믹싱되는 경우 상기 위상 파라미터가 적용될 주파수 대역에 관한 정보를 나타냄 - 를 더 이용하여 상기 부호화된 비트스트림을 생성하는 것을 특징으로 하는 부호화 장치.
  7. 제6항에 있어서,
    상기 주파수 대역 정보는 상기 위상 파라미터가 적용될 주파수 대역의 개수를 포함하는 것을 특징으로 하는 부호화 장치.
  8. 제7항에 있어서,
    상기 주파수 대역 정보는 상기 위상 파라미터가 적용될 주파수 대역의 개수의 갱신 여부에 대한 정보를 더 포함하는 것을 특징으로 하는 부호화 장치.
  9. 제6항에 있어서,
    상기 파라미터 부호화부는 상기 복수 채널간의 에너지 차에 관한 파라미터(CLD: Channel Level Differences) 및 상기 복수 채널간의 유사도에 관한 파라미터(ICC: Inter Channel Coherence) 중에서 적어도 하나를 더 부호화화고,
    상기 비트스트림 생성부는 상기 에너지 차에 관한 파라미터 및 상기 유사도에 관한 파라미터 중에서 적어도 하나를 더 이용하여 상기 비트스트림을 생성하고,
    상기 주파수 대역 정보를 표현하는 비트수는 상기 모노 신호가 업 믹싱되는 경우, 상기 에너지 차에 관한 파라미터 및 상기 유사도에 관한 파라미터 중에서 적어도 하나가 적용될 주파수 대역의 개수에 기초하여 결정되는 것을 특징으로 하는 부호화 장치.
  10. 제6항에 있어서,
    상기 비트스트림은 헤더 및 복수의 프레임을 포함하고,
    상기 주파수 대역 정보는 상기 헤더 또는 상기 복수의 프레임에 삽입되는 것을 특징으로 하는 부호화 장치.
  11. 제1항에 있어서,
    상기 파라미터 부호화부는 상기 멀티 채널 신호에 포함된 복수의 프레임의 위상 정보를 비교하여 상기 위상 파라미터의 부호화 여부를 결정하는 것을 특징으로 하는 부호화 장치.
  12. 멀티 채널 신호의 부호화된 비트스트림으로부터 상기 멀티 채널 신호의 다운 믹스 신호인 모노 신호를 복원하는 모노 신호 복호화부;
    상기 멀티 채널 신호를 구성하는 복수 채널의 위상 파라미터가 상기 비트스트림에 존재하는지 여부를 확인하고, 상기 위상 파라미터가 상기 비트스트림에 존재하는 경우 상기 위상 파라미터가 적용될 상기 모노 신호의 주파수 대역을 결정하는 주파수 대역 결정부;
    상기 비트스트림으로부터 상기 위상 파라미터를 복원하는 파라미터 복호화부; 및
    상기 위상 파라미터를 상기 주파수 대역에 적용하여 상기 모노 신호를 업 믹싱하는 업 믹싱부
    를 포함하는 것을 특징으로 하는 복호화 장치.
  13. 제12항에 있어서,
    상기 위상 정보는 상기 복수 채널간의 위상 차를 포함하는 것을 특징으로 하는 복호화 장치.
  14. 제12항에 있어서,
    상기 주파수 대역에 관한 주파수 대역 정보가 저장된 테이블(table)을 포함하고,
    상기 주파수 대역 결정부는 상기 테이블로부터 상기 모노 신호에 상응하는 주파수 대역 정보를 선택하여 상기 주파수 대역을 결정하는 것을 특징으로 하는 복호화 장치.
  15. 제12항에 있어서,
    상기 주파수 대역 결정부는 상기 비트스트림으로부터 상기 주파수 대역에 관한 주파수 대역 정보를 복원하고, 상기 복원된 주파수 대역 정보에 기초하여 상기 주파수 대역을 결정하는 것을 특징으로 하는 복호화 장치.
  16. 제15항에 있어서,
    상기 비트스트림은 헤더 및 복수의 프레임을 포함하고,
    상기 주파수 대역 결정부는 상기 헤더, 또는 상기 복수의 프레임 각각으로부터 상기 주파수 대역 정보를 복원하는 것을 특징으로 하는 복호화 장치.
  17. 제14항 또는 제15항에 있어서,
    상기 주파수 대역 정보는 상기 위상 파라미터가 적용될 상기 모노 신호의 주파수 대역의 개수를 포함하는 것을 특징으로 하는 부호화 장치.
  18. 제17항에 있어서,
    상기 주파수 대역 정보는 상기 위상 파라미터가 적용될 주파수 대역의 개수의 갱신 여부에 대한 정보를 더 포함하는 것을 특징으로 하는 복호화 장치.
  19. 멀티 채널 신호를 구성하는 복수 채널의 위상 정보를 나타내는 위상 파라미터의 부호화 여부를 결정하여 부호화 정보를 생성하는 단계;
    상기 위상 파라미터의 부호화가 결정된 경우, 상기 위상 파라미터를 부호화하는 단계;
    상기 멀티 채널 신호를 다운 믹싱한 모노 신호를 부호화하는 단계; 및
    상기 위상 파라미터의 부호화가 결정된 경우, 상기 부호화된 모노 신호, 상기 부호화된 위상 파라미터 및 상기 부호화 정보를 이용하여 상기 멀티 채널 신호에 대한 부호화된 비트스트림을 생성하는 단계
    를 포함하는 것을 특징으로 하는 부호화 방법.
  20. 멀티 채널 신호의 부호화된 비트스트림으로부터 상기 멀티 채널 신호의 다운 믹스 신호인 모노 신호를 복원하는 단계;
    상기 멀티 채널 신호를 구성하는 복수 채널의 위상 파라미터가 상기 비트스트림에 존재하는지 여부를 확인하는 단계;
    상기 위상 파라미터가 상기 비트스트림에 존재하는 경우 상기 위상 파라미터가 적용될 상기 모노 신호의 주파수 대역을 결정하는 단계;
    상기 비트스트림으로부터 상기 위상 파라미터를 복원하는 단계; 및
    상기 위상 파라미터를 상기 주파수 대역에 적용하여 상기 모노 신호를 업 믹싱하는 단계
    를 포함하는 것을 특징으로 하는 복호화 방법.
  21. 제19항 및 제20항 중에서 어느 한 항의 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능 기록 매체
PCT/KR2009/006247 2008-10-30 2009-10-28 멀티 채널 신호의 부호화/복호화 장치 및 방법 Ceased WO2010050740A2 (ko)

Priority Applications (7)

Application Number Priority Date Filing Date Title
PL09823820T PL2352152T3 (pl) 2008-10-30 2009-10-28 Urządzenie i sposób dekodowania sygnału wielokanałowego
ES09823820T ES2754925T3 (es) 2008-10-30 2009-10-28 Aparato y procedimiento de decodificación de una señal multicanal
EP09823820.7A EP2352152B1 (en) 2008-10-30 2009-10-28 Apparatus and method for decoding multichannel signal
US13/126,947 US8959026B2 (en) 2008-10-30 2009-10-28 Apparatus and method for encoding/decoding multichannel signal
CN200980153531.1A CN102292772B (zh) 2008-10-30 2009-10-28 多声道信号的编码/解码装置和方法
US13/483,954 US8452018B2 (en) 2008-10-30 2012-05-30 Apparatus and method for encoding/decoding multichannel signal using phase information
US14/623,431 US9384743B2 (en) 2008-10-30 2015-02-16 Apparatus and method for encoding/decoding multichannel signal

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020080107240A KR101600352B1 (ko) 2008-10-30 2008-10-30 멀티 채널 신호의 부호화/복호화 장치 및 방법
KR10-2008-0107240 2008-10-30

Related Child Applications (3)

Application Number Title Priority Date Filing Date
US13/126,947 A-371-Of-International US8959026B2 (en) 2008-10-30 2009-10-28 Apparatus and method for encoding/decoding multichannel signal
US13/483,954 Continuation US8452018B2 (en) 2008-10-30 2012-05-30 Apparatus and method for encoding/decoding multichannel signal using phase information
US14/623,431 Continuation US9384743B2 (en) 2008-10-30 2015-02-16 Apparatus and method for encoding/decoding multichannel signal

Publications (2)

Publication Number Publication Date
WO2010050740A2 true WO2010050740A2 (ko) 2010-05-06
WO2010050740A3 WO2010050740A3 (ko) 2010-06-24

Family

ID=42129457

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2009/006247 Ceased WO2010050740A2 (ko) 2008-10-30 2009-10-28 멀티 채널 신호의 부호화/복호화 장치 및 방법

Country Status (8)

Country Link
US (3) US8959026B2 (ko)
EP (1) EP2352152B1 (ko)
KR (1) KR101600352B1 (ko)
CN (1) CN102292772B (ko)
ES (1) ES2754925T3 (ko)
HU (1) HUE047440T2 (ko)
PL (1) PL2352152T3 (ko)
WO (1) WO2010050740A2 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016003206A1 (ko) * 2014-07-01 2016-01-07 한국전자통신연구원 다채널 오디오 신호 처리 방법 및 장치
US9883308B2 (en) 2014-07-01 2018-01-30 Electronics And Telecommunications Research Institute Multichannel audio signal processing method and device

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
CN102446507B (zh) 2011-09-27 2013-04-17 华为技术有限公司 一种下混信号生成、还原的方法和装置
WO2014007096A1 (ja) 2012-07-02 2014-01-09 ソニー株式会社 復号装置および方法、符号化装置および方法、並びにプログラム
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
AU2013284703B2 (en) * 2012-07-02 2019-01-17 Sony Corporation Decoding device and method, encoding device and method, and program
RU2652468C2 (ru) 2012-07-02 2018-04-26 Сони Корпорейшн Декодирующее устройство, способ декодирования, кодирующее устройство, способ кодирования и программа
JP6088626B1 (ja) * 2015-11-20 2017-03-01 東芝テック株式会社 決済装置
JP2018092012A (ja) * 2016-12-05 2018-06-14 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
CN108269577B (zh) * 2016-12-30 2019-10-22 华为技术有限公司 立体声编码方法及立体声编码器

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5796844A (en) 1996-07-19 1998-08-18 Lexicon Multichannel active matrix sound reproduction with maximum lateral separation
JP2004507904A (ja) 1997-09-05 2004-03-11 レキシコン 5−2−5マトリックス・エンコーダおよびデコーダ・システム
US6108622A (en) * 1998-06-26 2000-08-22 Lsi Logic Corporation Arithmetic logic unit controller for linear PCM scaling and decimation in an audio decoder
EP1427252A1 (en) 2002-12-02 2004-06-09 Deutsche Thomson-Brandt Gmbh Method and apparatus for processing audio signals from a bitstream
CA3026276C (en) * 2004-03-01 2019-04-16 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
DE102004042819A1 (de) * 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
US8179977B2 (en) * 2005-10-13 2012-05-15 Lg Electronics Inc. Method of apparatus for processing a signal
TWI329465B (en) * 2006-02-07 2010-08-21 Lg Electronics Inc Apparatus and method for encoding / decoding signal
KR20080052813A (ko) * 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
EP2595150A3 (en) * 2006-12-27 2013-11-13 Electronics and Telecommunications Research Institute Apparatus for coding multi-object audio signals
CA2645913C (en) * 2007-02-14 2012-09-18 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
KR101453732B1 (ko) * 2007-04-16 2014-10-24 삼성전자주식회사 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
EP2215629A1 (en) * 2007-11-27 2010-08-11 Nokia Corporation Multichannel audio coding
KR101444102B1 (ko) * 2008-02-20 2014-09-26 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
EP2169665B1 (en) * 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
US8346380B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
None
See also references of EP2352152A4

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016003206A1 (ko) * 2014-07-01 2016-01-07 한국전자통신연구원 다채널 오디오 신호 처리 방법 및 장치
US9883308B2 (en) 2014-07-01 2018-01-30 Electronics And Telecommunications Research Institute Multichannel audio signal processing method and device
US10264381B2 (en) 2014-07-01 2019-04-16 Electronics And Telecommunications Research Institute Multichannel audio signal processing method and device
US10645515B2 (en) 2014-07-01 2020-05-05 Electronics And Telecommunications Research Institute Multichannel audio signal processing method and device

Also Published As

Publication number Publication date
US20120294447A1 (en) 2012-11-22
US20150199972A1 (en) 2015-07-16
US8452018B2 (en) 2013-05-28
KR101600352B1 (ko) 2016-03-07
CN102292772B (zh) 2016-08-31
KR20100048202A (ko) 2010-05-11
EP2352152B1 (en) 2019-09-18
CN102292772A (zh) 2011-12-21
HUE047440T2 (hu) 2020-05-28
PL2352152T3 (pl) 2019-12-31
EP2352152A4 (en) 2015-05-13
EP2352152A2 (en) 2011-08-03
US20120010891A1 (en) 2012-01-12
WO2010050740A3 (ko) 2010-06-24
US8959026B2 (en) 2015-02-17
US9384743B2 (en) 2016-07-05
ES2754925T3 (es) 2020-04-21

Similar Documents

Publication Publication Date Title
WO2010050740A2 (ko) 멀티 채널 신호의 부호화/복호화 장치 및 방법
WO2010087614A2 (ko) 오디오 신호의 부호화 및 복호화 방법 및 그 장치
WO2010062123A2 (ko) 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
WO2014175669A1 (ko) 음상 정위를 위한 오디오 신호 처리 방법
WO2015142073A1 (ko) 오디오 신호 처리 방법 및 장치
KR101566055B1 (ko) 다객체 오디오 부호화 및 복호화 방법과 그 장치
WO2013141638A1 (ko) 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치
WO2015152663A2 (ko) 오디오 신호 처리 방법 및 장치
WO2015099429A1 (ko) 오디오 신호 처리 방법, 이를 위한 파라메터화 장치 및 오디오 신호 처리 장치
WO2010008229A1 (ko) 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
WO2011034385A2 (en) Method and apparatus for encoding and decoding mode information
EP2617033A2 (en) Apparatus and method for encoding and decoding signal for high frequency bandwidth extension
WO2015156654A1 (ko) 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
WO2015060654A1 (ko) 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치
WO2013058635A2 (ko) 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치
KR20100132913A (ko) 다객체 오디오 신호를 부호화하는 방법 및 부호화 장치, 복호화 방법 및 복호화 장치, 그리고 트랜스코딩 방법 및 트랜스코더
WO2014185569A1 (ko) 오디오 신호의 부호화, 복호화 방법 및 장치
KR20090117868A (ko) He-aac 디코더와 mpeg 서라운드 디코더를 이용하여 멀티채널 오디오 신호를 복원하는 장치 및 방법
WO2017222356A1 (ko) 잡음 환경에 적응적인 신호 처리방법 및 장치와 이를 채용하는 단말장치
WO2017039422A2 (ko) 음질 향상을 위한 신호 처리방법 및 장치
WO2009116815A2 (en) Apparatus and method for encoding and decoding using bandwidth extension in portable terminal
WO2018174310A1 (ko) 잡음 환경에 적응적인 음성 신호 처리방법 및 장치
WO2019054559A1 (ko) Brir/rir 파라미터화(parameterization)를 적용한 오디오 인코딩 방법 및 파라미터화된 brir/rir 정보를 이용한 오디오 재생 방법 및 장치
WO2015093742A1 (en) Method and apparatus for encoding/decoding an audio signal
WO2016204581A1 (ko) 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200980153531.1

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09823820

Country of ref document: EP

Kind code of ref document: A2

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2009823820

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 13126947

Country of ref document: US