RU2777660C2 - Method and device for formation from representation of hoa signals in domain of mixed representation coefficients of mentioned hoa signals in spatial domain/coefficient domain - Google Patents
Method and device for formation from representation of hoa signals in domain of mixed representation coefficients of mentioned hoa signals in spatial domain/coefficient domain Download PDFInfo
- Publication number
- RU2777660C2 RU2777660C2 RU2018135962A RU2018135962A RU2777660C2 RU 2777660 C2 RU2777660 C2 RU 2777660C2 RU 2018135962 A RU2018135962 A RU 2018135962A RU 2018135962 A RU2018135962 A RU 2018135962A RU 2777660 C2 RU2777660 C2 RU 2777660C2
- Authority
- RU
- Russia
- Prior art keywords
- vector
- signals
- domain
- hoa
- coefficient
- Prior art date
Links
Images
Abstract
Description
Область техники, к которой относится изобретениеThe technical field to which the invention belongs
Настоящее изобретение относится к способу и к устройству для формирования из представления HOA-сигналов в области коэффициентов смешанного представления упомянутых HOA-сигналов в пространственной области/области коэффициентов, в котором количество HOA-сигналов может быть переменным.The present invention relates to a method and apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals, in which the number of HOA signals can be variable.
Уровень техникиState of the art
Обозначаемые в качестве HOA (Higher Order Ambisonics) Амбиофонические Звуки Высокого Порядка являются математическим описанием двух- или трехмерного звукового поля. Звуковое поле может быть захвачено набором микрофонов, образовано из синтетических звуковых источников либо представляет собой сочетание обоих вариантов. HOA могут использоваться в качестве транспортного формата для двух- или трехмерного объемного звука. В отличие от основанных на громкоговорителе представлений объемного звука преимущество HOA заключается в воспроизведении звукового поля на разных установках громкоговорителей. Поэтому, HOA подходят для универсального звукового формата.Referred to as HOA (Higher Order Ambisonics), High Order Ambiophonic Sounds are a mathematical description of a two- or three-dimensional sound field. The sound field can be captured by a set of microphones, generated from synthetic sound sources, or a combination of both. HOA can be used as a transport format for 2D or 3D surround sound. Unlike loudspeaker-based surround sound presentations, the advantage of HOA is the reproduction of the sound field in different speaker setups. Therefore, HOA is suitable for a universal audio format.
Пространственное разрешение HOA определяется порядком HOA. Данный порядок задает количество HOA-сигналов, которые описывают звуковое поле. Существует два представления для HOA, которые называются пространственной областью и областью коэффициентов, соответственно. В большинстве случаев HOA первоначально представлены в области коэффициентов, и такое представление может быть преобразовано в пространственную область посредством матричного умножения (или преобразования), как описано в документе EP 2469742 A2. Пространственная область состоит из одного и того же количества сигналов, что и область коэффициентов. Однако в пространственной области каждый сигнал относится к направлению, причем направления равномерно распределены по единичной сфере. Это содействует анализу пространственного распределения HOA-представления. Представления в области коэффициентов, так же как и представления в пространственной области являются представлениями во временной области.The spatial resolution of a HOA is determined by the order of the HOA. This order specifies the number of HOA signals that describe the sound field. There are two representations for HOA, which are called the spatial domain and coefficient domain, respectively. In most cases, HOAs are initially represented in coefficient domain and such a representation can be converted to spatial domain by matrix multiplication (or transformation) as described in EP 2469742 A2. The spatial domain consists of the same number of signals as the coefficient domain. However, in the spatial domain, each signal is relative to a direction, with the directions evenly distributed over the unit sphere. This facilitates the analysis of the spatial distribution of the HOA representation. Representations in the coefficient domain, just like representations in the spatial domain, are representations in the time domain.
Раскрытие изобретенияDisclosure of invention
В нижеследующем, в основном, цель состоит в максимально возможном использовании для PCM-передачи HOA-представлений пространственной области для обеспечения идентичного динамического диапазона для каждого направления. Это означает, что дискретные PCM-отсчеты HOA-сигналов в пространственной области должны быть пронормированы до диапазона предварительно заданных значений. Однако недостаток такого нормирования состоит в том, что динамический диапазон HOA-сигналов в пространственной области меньше, чем в области коэффициентов. Это обуславливается матрицей преобразования, которая формирует сигнал в пространственной области из сигналов в области коэффициентов.In the following, in general, the goal is to use as much as possible for the PCM transmission of HOA representations of the spatial domain to provide the same dynamic range for each direction. This means that discrete PCM samples of HOA signals in the spatial domain must be normalized to a range of predefined values. However, the disadvantage of such normalization is that the dynamic range of HOA signals in the spatial domain is less than in the coefficient domain. This is due to the transform matrix, which generates the signal in the spatial domain from the signals in the coefficient domain.
В некоторых применениях HOA-сигналы передаются в области коэффициентов, например, при обработке, описанной в документе EP 13305558.2, в которой все сигналы передаются в области коэффициентов, потому что должно быть передано постоянное количество HOA-сигналов и переменное количество дополнительных HOA-сигналов. Однако, как уже упомянуто выше и показано в документе EP 2469742 A2, передача в области коэффициентов не выгодна. В качестве решения, постоянное количество HOA-сигналов может быть передано в пространственной области, и лишь дополнительные HOA-сигналы с переменным количеством передается в области коэффициентов. Передача дополнительных HOA-сигналов в пространственной области не возможна, так как изменяющееся во времени количество HOA-сигналов приведет в результате к изменяющимся во времени матрицам преобразования из области коэффициентов в пространственную область, и во всех сигналах в пространственной области могут возникать разрывы, которые являются неоптимальными для последующего перцепционного кодирования PCM-сигналов.In some applications, HOA signals are transmitted in the gain domain, such as in the processing described in EP 13305558.2, in which all signals are transmitted in the gain domain because a constant number of HOA signals and a variable number of additional HOA signals must be transmitted. However, as already mentioned above and shown in EP 2469742 A2, transmission in the coefficient domain is not advantageous. As a solution, a constant number of HOA signals may be transmitted in the spatial domain, and only additional HOA signals with a variable number are transmitted in the coefficient domain. The transmission of additional HOA signals in the spatial domain is not possible, since the time varying number of HOA signals will result in time varying transformation matrices from the coefficient domain to the spatial domain, and discontinuities may occur in all signals in the spatial domain, which are suboptimal for subsequent perceptual encoding of PCM signals.
Для обеспечения передачи этих дополнительных HOA-сигналов без превышения диапазона предварительно заданных значений может использоваться обработка обратимого нормирования, которая разработана для предотвращения таких разрывов сигналов, и которая также достигает эффективной передачи инверсионных параметров.To ensure that these additional HOA signals are transmitted without exceeding the range of predetermined values, reversible normalization processing can be used, which is designed to prevent such signal gaps, and which also achieves efficient transmission of inversion parameters.
Относительно динамического диапазона упомянутых двух HOA-представлений и нормирования HOA-сигналов для PCM-кодирования в нижеследующем делается вывод о том, должно ли такое нормирование иметь место в области коэффициентов или в пространственной области.Regarding the dynamic range of the two HOA representations and normalization of HOA signals for PCM encoding, the following concludes whether such normalization should take place in the coefficient domain or in the spatial domain.
Во временной области коэффициентов HOA-представление состоит из последовательных кадров состоящих из N коэффициентов сигналов d n ( k ), n =0, …, N -1, где k обозначает индекс дискретного отсчета, а n обозначает индекс сигнала.In the coefficient time domain, the HOA representation consists of successive frames consisting of N signal coefficients d n ( k ), n =0, ..., N -1 , where k denotes the sample index and n denotes the signal index.
Эти состоящие из коэффициентов сигналы собраны в вектор d ( k )=[ d 0 ( k ), …, d N -1 ( k )] T для получения компактного представления.These coefficient signals are assembled into a vector d ( k )=[ d 0 ( k ), …, d N -1 ( k )] T to obtain a compact representation.
Преобразование в пространственную область выполняется посредством матрицы N x N преобразованияThe transformation to the spatial domain is performed by means of an N x N transformation matrix
как это определено в документе EP 12306569.0, см. определение для Ξ GRID совместно с уравнениями (21) и (22).as defined in EP 12306569.0, see the definition for Ξ GRID in conjunction with equations (21) and (22).
Вектор w ( k )=[ w 0 ( k ), …, w N -1 ( k )] T в пространственной области получается из w ( k )=Ψ -1 d ( k ), (1)The vector w ( k )=[ w 0 ( k ), …, w N -1 ( k )] T in the spatial domain is obtained from w ( k ) = Ψ -1 d ( k ) , (1)
где Ψ -1 является обратной матрицей матрицы Ψ.where Ψ -1 is the inverse of the matrix Ψ .
Обратное преобразование из пространственной области в область коэффициентов выполняется посредствомThe reverse transformation from the spatial domain to the coefficient domain is performed by
d ( k )=Ψ w ( k ). (2) d ( k )=Ψ w ( k ). (2)
Если диапазон значений дискретных отсчетов задан в одной области, то матрица Ψ преобразования автоматически задает диапазон значений другой области. Термин ( k ) для k -ого дискретного отсчета далее опускается.If the range of values of discrete samples is set in one area, then the transformation matrix Ψ automatically sets the range of values of another area. The term ( k ) for the kth discrete sample is omitted further.
Поскольку HOA-представление фактически воспроизводится в пространственной области, то диапазон значений, громкость и динамический диапазон задаются в данной области. Динамический диапазон задается битовым разрешением PCM-кодирования. В данной заявке «PCM–кодирование» означает преобразование дискретных отсчетов в представлении с плавающей запятой в дискретные отсчеты в целочисленном представлении в обозначении с фиксированной запятой.Because the HOA representation is actually rendered in the spatial domain, the value range, loudness, and dynamic range are set in that domain. The dynamic range is given by the bit resolution of the PCM encoding. In this application, "PCM encoding" means converting discrete samples in floating point representation to discrete samples in integer representation in fixed point notation.
Для PCM-кодирования HOA-представления, N сигналов в пространственной области должны быть отнормированы до диапазона значений -1 ≤ w n < 1 так, чтобы они могли быть отмасштабированы до максимального PCM-значения W max и округлены до целочисленного PCM-обозначения с фиксированной запятойFor PCM encoding of a HOA representation, the N signals in the spatial domain must be normalized to the range of -1 ≤ w n < 1 so that they can be scaled to the maximum PCM value W max and rounded to a fixed-point integer PCM notation
(3) (3)
Замечание: это обобщенное представление PCM-кодирования.Note: This is a generalized representation of PCM encoding.
Диапазон значений для дискретных отсчетов в области коэффициентов может быть вычислен посредством бесконечной матричной нормой матрицы Ψ, которая определена следующим образомThe range of values for discrete samples in the coefficient domain can be calculated using the infinite matrix norm of the matrix Ψ , which is defined as follows
, (4) , (four)
и максимальное абсолютное значение в пространственной области w max =1 для -║Ψ║∞ w max ≤ d n < ║Ψ║∞ w max . Поскольку значение ║Ψ║∞ больше '1' для используемого определения матрицы Ψ, то диапазон значений d n увеличивается.and the maximum absolute value in the spatial domain w max = 1 for - ║ Ψ ║ ∞ w max ≤ d n < ║ Ψ ║ ∞ w max . Since the value of ║ Ψ ║ ∞ is greater than '1' for the definition of the matrix Ψ used, then the range of values of d n increases.
Обратный ход означает, что нормирование на ║Ψ║∞ необходимо для PCM-кодирования сигналов в области коэффициентов поскольку -1 ≤ d n /║Ψ║∞ < 1. Однако данное нормирование уменьшает динамический диапазон сигналов в области коэффициентов, что приведет в результате к пониженному соотношению сигнала к шуму квантования. Поэтому предпочтительным должно быть PCM-кодирование сигналов в пространственной области.The reverse move means that normalization to ║ Ψ ║ ∞ is necessary for PCM-coding of signals in the coefficient domain since -1 ≤ d n / ║ Ψ ║ ∞ < 1 . However, this normalization reduces the dynamic range of the signals in the gain domain, which will result in a reduced quantization signal-to-noise ratio. Therefore, PCM coding of signals in the spatial domain should be preferred.
Проблема, которая должна быть решена посредством настоящего изобретения, состоит в том, как передать в области коэффициентов часть желаемых HOA-сигналов в пространственной области с использованием нормирования без уменьшения динамического диапазона в области коэффициентов. Дополнительно, нормированные сигналы не должны содержать скачки уровня сигнала так, чтобы они могли быть подвержены перцепционному кодированию без вызываемых скачками потерь качества. Данная проблема решается с помощью способов, раскрытых в пунктах 1 и 6 формулы изобретения. Устройства, которые используют эти способы, раскрыты в пунктах 2 и 7 формулы изобретения, соответственно.The problem to be solved by the present invention is how to convey in the coefficient domain a portion of the desired HOA signals in the spatial domain using normalization without reducing the dynamic range in the coefficient domain. Additionally, the normalized signals should not contain signal level jumps so that they can be perceptually encoded without the loss of quality caused by the jumps. This problem is solved using the methods disclosed in
В принципе, заявляемый способ формирования пригоден для формирования из представления HOA-сигналов в области коэффициентов смешанного представления упомянутых HOA-сигналов в пространственной области/области коэффициентов, причем количество упомянутых HOA-сигналов может быть переменным во времени в последовательных кадрах коэффициентов, отличающийся этапами, на которых:In principle, the inventive generation method is suitable for generating from the representation of HOA signals in the coefficient domain a mixed representation of the mentioned HOA signals in the spatial domain/coefficient domain, and the number of said HOA signals can be variable in time in successive frames of the coefficients, differing in steps, which:
- разделяют вектор HOA-сигналов в области коэффициентов на первый вектор сигналов в области коэффициентов, имеющий постоянное количество HOA-коэффициентов, и второй вектор сигналов в области коэффициентов, имеющий переменное во времени количество HOA-коэффициентов;dividing the coefficient domain HOA signal vector into a first coefficient domain signal vector having a constant number of HOA coefficients and a second coefficient domain signal vector having a time-varying number of HOA coefficients;
- преобразовывают упомянутый первый вектор сигналов в области коэффициентов в соответствующий вектор сигналов в пространственной области посредством умножения упомянутого вектора сигналов в области коэффициентов на обратную матрицу матрицы преобразования;converting said first coefficient domain signal vector to a corresponding spatial domain signal vector by multiplying said coefficient domain signal vector by an inverse transform matrix;
- подвергают PCM-кодированию упомянутый вектор сигналов в пространственной области для получения вектора подвергшихся PCM-кодированию сигналов в пространственной области;PCM-encoding said vector of signals in the spatial domain to obtain a vector of PCM-encoded signals in the spatial domain;
- нормируют упомянутый второй вектор сигналов в области коэффициентов на нормировочный множитель, причем упомянутое нормирование является адаптивным нормированием по отношению к диапазону текущих значений HOA-коэффициентов упомянутого второго вектора сигналов в области коэффициентов, и при упомянутом нормировании диапазон доступных значений для HOA-коэффициентов вектора не превышается, и при этом при упомянутом нормировании к коэффициентам текущего второго вектора применяют равномерно непрерывную передаточную функцию с целью непрерывного изменения коэффициента усиления внутри этого вектора с коэффициента усиления в предыдущем втором векторе на коэффициент усиления в следующем втором векторе, и причем упомянутое нормирование предоставляет вспомогательную информацию для соответствующего денормирования на стороне декодера;- normalizing said second signal vector in the coefficient domain by a normalization factor, wherein said normalization is an adaptive normalization with respect to the range of current values of the HOA coefficients of said second signal vector in the coefficient domain, and with said normalization the range of available values for the HOA coefficients of the vector is not exceeded , and while under said normalization, a uniformly continuous transfer function is applied to the coefficients of the current second vector in order to continuously change the gain within this vector from the gain in the previous second vector to the gain in the next second vector, and moreover, said normalization provides auxiliary information for the corresponding denormalization on the decoder side;
- подвергают PCM-кодированию упомянутый вектор нормированных сигналов в области коэффициентов для получения вектора подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов;- PCM-encoding said vector of normalized signals in the coefficient domain to obtain a vector of PCM-encoded and normalized signals in the coefficient domain;
- мультиплексируют упомянутый вектор подвергшихся PCM-кодированию сигналов в пространственной области и упомянутый вектор подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов.- multiplexing said vector of PCM-encoded signals in the spatial domain and said vector of PCM-encoded and normalized signals in the coefficient domain.
В принципе заявляемое устройство формирования пригодно для формирования из представления HOA-сигналов в области коэффициентов смешанного представления упомянутых HOA-сигналов в пространственной области/области коэффициентов, причем количество упомянутых HOA-сигналов может быть переменным во времени в последовательных кадрах коэффициентов, при этом упомянутое устройство включает в себя:In principle, the inventive generating device is suitable for generating from the coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals, wherein the number of said HOA signals can be time-varying in successive coefficient frames, said device comprising into yourself:
- средство, выполненное с возможностью разделения вектора HOA-сигналов в области коэффициентов на первый вектор сигналов в области коэффициентов, имеющий постоянное количество HOA-коэффициентов, и второй вектор сигналов в области коэффициентов, имеющий переменное во времени количество HOA-коэффициентов;means configured to divide the coefficient domain HOA signal vector into a first coefficient domain signal vector having a constant number of HOA coefficients and a second coefficient domain signal vector having a time-varying number of HOA coefficients;
- средство, выполненное с возможностью преобразования упомянутого первого вектора сигналов в области коэффициентов в соответствующий вектор сигналов в пространственной области посредством умножения упомянутого вектора сигналов в области коэффициентов на обратную матрицу матрицы преобразования;means configured to convert said first coefficient domain signal vector to a corresponding spatial domain signal vector by multiplying said coefficient domain signal vector by an inverse transformation matrix;
- средство, выполненное с возможностью PCM-кодирования упомянутого вектора сигналов в пространственной области для получения вектора подвергшихся PCM-кодированию сигналов в пространственной области;means configured to PCM encode said vector of signals in the spatial domain to obtain a vector of PCM encoded signals in the spatial domain;
- средство, выполненное с возможностью нормирования упомянутого второго вектора сигналов в области коэффициентов на нормировочный множитель, причем упомянутое нормирование является адаптивным нормированием по отношению к диапазону текущих значений HOA-коэффициентов упомянутого второго вектора сигналов в области коэффициентов, и при упомянутом нормировании диапазон доступных значений для HOA-коэффициентов вектора не превышается, и причем при упомянутом нормировании к коэффициентам текущего второго вектора применена равномерно непрерывная передаточная функция с целью непрерывного изменения коэффициента усиления внутри этого вектора с коэффициента усиления в предыдущем втором векторе на коэффициент усиления в следующем втором векторе, и при этом упомянутое нормирование предоставляет вспомогательную информацию для соответствующего денормирования на стороне декодера;- means configured to normalize said second signal vector in the coefficient domain by a normalization factor, wherein said normalization is an adaptive normalization with respect to a range of current values of HOA coefficients of said second signal vector in the coefficient domain, and with said normalization, the range of available values for HOA -coefficients of the vector is not exceeded, and moreover, with the mentioned normalization, a uniformly continuous transfer function is applied to the coefficients of the current second vector in order to continuously change the gain inside this vector from the gain in the previous second vector to the gain in the next second vector, and at the same time, the mentioned normalization provides ancillary information for appropriate denormalization at the decoder side;
- средство, выполненное с возможностью PCM-кодирования упомянутого вектора нормированных сигналов в области коэффициентов для получения вектора подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов;means configured to PCM-code said vector of normalized signals in the coefficient domain to obtain a vector of PCM-encoded and normalized signals in the coefficient domain;
- средство, выполненное с возможностью мультиплексирования упомянутого вектора подвергшихся PCM-кодированию сигналов в пространственной области и упомянутого вектора подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов.means for multiplexing said vector of PCM-encoded signals in the spatial domain and said vector of PCM-encoded and normalized signals in the coefficient domain.
В принципе, заявляемый способ декодирования пригоден для декодирования смешанного представления кодированных HOA-сигналов в пространственной области/области коэффициентов, в котором количество упомянутых HOA-сигналов может быть переменным во времени в последовательных кадрах коэффициентов и в котором упомянутое смешанное представление кодированных HOA-сигналов в пространственной области/области коэффициентов сформировано согласно выше упомянутому заявляемому способу формирования, при этом упомянутое декодирование включает в себя этапы, на которых:In principle, the inventive decoding method is suitable for decoding a mixed representation of encoded HOA signals in the spatial/coefficient domain, in which the number of said HOA signals can be time-varying in successive frames of coefficients, and in which said mixed representation of the encoded HOA signals in the spatial area/region of coefficients is formed according to the above-mentioned inventive method of formation, while said decoding includes the steps of:
- демультиплексируют упомянутые мультиплексированные векторы подвергшихся PCM-кодированию сигналов в пространственной области и подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов;demultiplexing said multiplexed vectors of PCM-encoded signals in the spatial domain and PCM-encoded and normalized signals in the coefficient domain;
- преобразовывают упомянутый вектор подвергшихся PCM-кодированию сигналов в пространственной области в соответствующий вектор сигналов в области коэффициентов посредством умножения упомянутого вектора подвергшихся PCM-кодированию сигналов в пространственной области на упомянутую матрицу преобразования;converting said vector of PCM-encoded signals in the spatial domain to a corresponding vector of signals in the coefficient domain by multiplying said vector of PCM-encoded signals in the spatial domain by said transformation matrix;
- денормируют упомянутый вектор подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов, при этом упомянутый этап денормирования включает в себя этапы, на которых:- denormalizing said vector of PCM-encoded and normalized signals in the coefficient domain, wherein said denormalizing step includes the steps of:
-- вычисляют, с использованием соответствующего показателя степени (exponent) e n ( j -1) из принятой вспомогательной информации и рекурсивно вычисленного значения g n ( j -2) коэффициента усиления, вектор h n ( j -1) передаточной функции, причем сохраняют значение g n ( j -1) коэффициента усиления для соответствующей обработки следующего вектора подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов, подлежащих обработке, при этом j является переменным (running, пробегающим) индексом входной матрицы векторов HOA-сигналов;-- calculate, using the appropriate exponent (exponent) e n ( j -1) from the received auxiliary information and the recursively calculated value g n ( j -2) of the gain, the vector h n ( j -1) of the transfer function, and save the gain value g n ( j -1) of the gain for the corresponding processing of the next vector of PCM-encoded and normalized signals in the area of the coefficients to be processed, while j is a variable (running, running) index of the input matrix of HOA signal vectors;
-- применяют соответствующее значение обратного коэффициента усиления к текущему вектору подвергшегося PCM-кодированию и нормированного сигнала для получения соответствующего вектора подвергшегося PCM-кодированию и денормированного сигнала;-- apply the corresponding reciprocal gain value to the current PCM-encoded and normalized signal vector to obtain the corresponding PCM-encoded and denormalized signal vector;
- объединяют упомянутый вектор сигналов в области коэффициентов и вектор денормированных сигналов в области коэффициентов для получения объединенного вектора HOA-сигналов в области коэффициентов, который может иметь переменное количество HOA-коэффициентов.combining said coefficient-domain signal vector and the denormalized coefficient-domain signal vector to obtain a combined coefficient-domain HOA signal vector, which may have a variable number of HOA coefficients.
В принципе заявляемое устройство декодирования пригодно для декодирования смешанного представления кодированных HOA-сигналов в пространственной области/области коэффициентов, в котором количество упомянутых HOA-сигналов может быть переменным во времени в последовательных кадрах коэффициентов и в котором упомянутое смешанное представление кодированных HOA-сигналов в пространственной области/области коэффициентов сформировано согласно вышеупомянутому способу формирования, причем упомянутое устройство декодирования включает в себя:In principle, the inventive decoding apparatus is suitable for decoding a mixed representation of encoded HOA signals in the spatial/coefficient domain, in which the number of said HOA signals can be time-varying in successive frames of coefficients, and in which said mixed representation of the encoded HOA signals in the spatial domain /coefficient region is formed according to the above-mentioned generation method, wherein said decoding device includes:
- средство, выполненное с возможностью демультиплексирования упомянутых мультиплексированных векторов подвергшихся PCM-кодированию сигналов в пространственной области и подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов;means for demultiplexing said multiplexed vectors of PCM-encoded signals in the spatial domain and PCM-encoded and normalized signals in the coefficient domain;
- средство, выполненное с возможностью преобразования упомянутого вектора подвергшихся PCM-кодированию сигналов в пространственной области в соответствующий вектор сигналов в области коэффициентов посредством умножения упомянутого вектора подвергшихся PCM-кодированию сигналов в пространственной области на упомянутую матрицу преобразования;means for converting said vector of PCM-encoded spatial domain signals to a corresponding vector of coefficient-domain signals by multiplying said vector of PCM-encoded spatial domain signals by said transformation matrix;
- средство, выполненное с возможностью денормирования упомянутого вектора подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов, причем упомянутое денормирование включает в себя:- means configured to denormalize said vector of PCM-encoded and normalized signals in the coefficient domain, said denormalization comprising:
-- вычисление, с использованием соответствующего показателя e n ( j -1) степени из принятой вспомогательной информации и рекурсивно вычисленного значения g n ( j -2) коэффициента усиления, вектора h n ( j -1) передаточной функции, причем выполнена возможность сохранения значения g n ( j -1) коэффициента усиления для соответствующей обработки следующего вектора подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов, подлежащих обработке, при этом j является переменным индексом входной матрицы векторов HOA-сигналов;-- calculation, using the appropriate exponent e n ( j -1) of the received auxiliary information and the recursively calculated value g n ( j -2) of the gain, the vector h n ( j -1) of the transfer function, and the ability to save the value g n ( j -1) gain for the corresponding processing of the next vector of PCM-encoded and normalized signals in the area of the coefficients to be processed, while j is a variable index of the input matrix of vectors of HOA signals;
-- применение соответствующего значения обратного коэффициента усиления к текущему вектору подвергшегося PCM-кодированию и нормированного сигнала для получения соответствующего вектора подвергшегося PCM-кодированию и денормированного сигнала;-- applying the corresponding reciprocal gain value to the current PCM-encoded and normalized signal vector to obtain the corresponding PCM-encoded and denormalized signal vector;
- средство, выполненное с возможностью объединения упомянутого вектора сигналов в области коэффициентов и вектора денормированных сигналов в области коэффициентов для получения объединенного вектора HOA-сигналов в области коэффициентов, который может иметь переменное количество HOA-коэффициентов.means configured to combine said coefficient domain signal vector and the coefficient domain denormalized signal vector to obtain a combined coefficient domain HOA signal vector, which may have a variable number of HOA coefficients.
Преимущественные дополнительные варианты осуществления настоящего изобретения раскрыты в соответствующих зависимых пунктах формулы изобретения.Preferred additional embodiments of the present invention are disclosed in the respective dependent claims.
Краткое описание чертежейBrief description of the drawings
Примерные варианты осуществления настоящего изобретения описаны со ссылкой на сопроводительные чертежи, на которых:Exemplary embodiments of the present invention are described with reference to the accompanying drawings, in which:
На Фиг.1 показана PCM-передача в пространственной области исходного HOA-представления в области коэффициентов;1 shows a PCM transmission in the spatial domain of the original HOA representation in the coefficient domain;
На Фиг.2 показана объединенная передача HOA-представления в области коэффициентов и пространственной области;2 shows the combined transmission of the HOA representation in the coefficient domain and the spatial domain;
На Фиг.3 показана объединенная передача HOA-представления в области коэффициентов и пространственной области с использованием поблочного адаптивного нормирования для сигналов в области коэффициентов;FIG. 3 shows the combined transmission of a coefficient-domain and spatial-domain HOA representation using block adaptive normalization for coefficient-domain signals;
На Фиг.4 показана обработка адаптивного нормирования для HOA-сигнала x n ( j ), представленного в области коэффициентов;4 shows adaptive normalization processing for a HOA signal x n ( j ) represented in the coefficient domain;
На Фиг.5 показана передаточная функция, используемая для плавного перехода между двумя различными значениями коэффициента усиления;5 shows the transfer function used to smoothly transition between two different gain values;
На Фиг.6 показана обработка адаптивного денормирования;Fig. 6 shows adaptive denormalization processing;
На Фиг.7 показан частотный FFT-спектр передаточных функций h n ( l ) с использованием различных показателей степени e n , в котором максимальная амплитуда каждой функции нормирована до 0 дБ;Figure 7 shows the frequency FFT spectrum of the transfer functions h n ( l ) using various exponents e n , in which the maximum amplitude of each function is normalized to 0 dB;
На Фиг.8 показаны примерные передаточные функции для трех последовательных векторов сигнала.8 shows exemplary transfer functions for three successive signal vectors.
Описание вариантов осуществленияDescription of Embodiments
Относительно PCM-кодирования HOA-представления в пространственной области предполагается, что (в представлении с плавающей запятой) -1 ≤ w n < 1 выполняется так, чтобы PCM-передача HOA-представления могла быть выполнена согласно тому, как это показано на Фиг.1. На этапе или стадии 11 преобразователя на входе HOA-кодера сигнал d в области коэффициентов текущего входного кадра сигнала преобразовывается в сигнал w в пространственной области с использованием уравнения (1). На этапе или стадии 12 PCM-кодирования дискретные отсчеты w с плавающей запятой преобразовываются в подвергшиеся PCM-кодированию целочисленные дискретные отсчеты w’ в обозначении с фиксированной запятой с использованием уравнения (3). На этапе или стадии 13 мультиплексора дискретные отсчеты w’ мультиплексируются в формат HOA-передачи.Regarding the PCM encoding of the HOA representation in the spatial domain, it is assumed that (in floating point representation) -1 ≤ w n < 1 is performed so that the PCM transmission of the HOA representation can be performed as shown in FIG. . In the transform step or step 11 at the input of the HOA encoder, the signal d in the coefficient domain of the current input frame of the signal is converted to the signal w in the spatial domain using equation (1). In the PCM encoding step or step 12, the floating-point discrete samples w are converted to PCM-encoded integer discrete samples w' in fixed-point notation using equation (3). In step or step 13 of the multiplexer, the discrete samples w' are multiplexed into the HOA transmission format.
HOA-декодер демультиплексирует сигналы w’ из принятого формата HOA-передачи на этапе или стадии 14 демультиплексора, и повторно преобразовывает их на этапе или стадии 15 в сигналы d ’ в области коэффициентов с использованием уравнения (2). Данное обратное преобразование увеличивает динамический диапазон d ’ так, что такое преобразование из пространственной области в область коэффициентов всегда включает в себя преобразование формата из целочисленного (PCM) в формат с плавающей запятой.The HOA decoder demultiplexes the signals w' from the received HOA transmission format in demultiplexer step or step 14, and reconverts them in step or step 15 to coefficient domain signals d ' using equation (2). This inverse transform increases the dynamic range d ' such that such a spatial-to-coefficient-domain conversion always includes a format conversion from integer (PCM) to floating point.
Стандартная HOA-передача с Фиг.1 не будет успешно осуществлена, если матрица Ψ будет изменяющейся во времени, что имеет место, если количество или индекс HOA-сигналов является изменяющимся во времени для последовательных последовательностей HOA-коэффициентов, то есть последовательных входных кадров сигнала. Как упомянуто выше, один пример такого случая является обработкой HOA-сжатия, описанной в документе EP 13305558.2: постоянное количество HOA-сигналов передается непрерывно, а переменное количество HOA-сигналов с изменяющимся индексами n сигналов передается параллельно. Все сигналы передаются в области коэффициентов, которая является неоптимальной, как объяснено выше.The standard HOA transmission of FIG. 1 will not succeed if the matrix Ψ is time-varying, which is the case if the number or index of HOA signals is time-varying for successive sequences of HOA coefficients, i.e., successive signal input frames. As mentioned above, one example of such a case is the HOA compression processing described in EP 13305558.2: a constant number of HOA signals are transmitted continuously, and a variable number of HOA signals with varying signal indices n are transmitted in parallel. All signals are transmitted in the gain region, which is not optimal, as explained above.
Согласно настоящему изобретению, обработка, описанная совместно с Фиг.1, расширяется так, как показано на Фиг.2.According to the present invention, the processing described in conjunction with FIG. 1 is extended as shown in FIG.
На этапе или стадии 20 HOA-кодер разделяет HOA-вектор d на два вектора d 1 и d 2, при этом количество M HOA-коэффициентов для вектора d 1 является постоянным, а вектор d 2 содержит переменное количество K HOA-коэффициентов. Поскольку индексы n сигнала не изменяются во времени для вектора d 1, PCM-кодирование выполняется в пространственной области на этапах или стадиях 21, 22, 23, 24 и 25 с сигналами, соответствующими w 1 и w’ 1, изображенных в нижнем сигнальном тракте Фиг.2, соответствующем этапам/стадиям 11-15 с Фиг.1. Однако на этап/стадии 23 мультиплексора происходит получение дополнительного входного сигнала d ”2, а на этапе/стадии 24 демультиплексора в HOA-декодере происходит предоставление другого выходного сигнала d ”2.In step or step 20, the HOA encoder divides the HOA vector d into two vectors d 1 and d 2 , where the number M of HOA coefficients for vector d 1 is constant and vector d 2 contains a variable number K of HOA coefficients. Because signal indices n do not change over time for vector d 1 , PCM encoding is performed in the spatial domain in steps or
Количество HOA-коэффициентов, или размер, K вектора d 2 является изменяющимся во времени, и индексы переданных HOA-сигналов n могут изменяться во времени. Это предотвращает передачу в пространственной области, так как потребуется изменяющаяся во времени матрица преобразования, что в результате приведет к разрывам сигнала во всех перцепционно кодированных HOA-сигналах (этап или стадия перцепционного кодирования не показаны). Однако таких разрывов сигнала следует избегать, потому что они снижают качество перцепционного кодирования переданных сигналов. Таким образом, d 2 должен быть передан в области коэффициентов. Вследствие большего диапазона значений сигналов в области коэффициентов сигналы должны быть отмасштабированы на этапе или стадии 26 на множитель 1/║Ψ║∞ прежде, чем PCM-кодирование сможет быть применено на этапе или стадии 27. Однако, недостаток такого масштабирования заключается в том, что максимальное абсолютное значение для ║Ψ║∞ является оценкой для наихудшего случая, максимальное абсолютное значение дискретного отсчета которого не будет возникать очень часто, потому что обычно диапазон ожидаемых значений более мал. В результате доступное разрешение для PCM-кодирования не используется эффективно, и соотношение сигнала к шуму квантования является низким.The number of HOA coefficients, or size, K of vector d 2 is time-varying, and transmitted HOA-signal indices n may be time-varying. This prevents transmission in the spatial domain, as a time-varying transform matrix would be required, resulting in signal gaps in all perceptually encoded HOA signals (perceptual encoding step or step not shown). However, such signal breaks should be avoided because they reduce the quality of the perceptual encoding of the transmitted signals. Thus, d 2 must be transmitted in the coefficient domain. Due to the larger range of signal values in the coefficient domain, the signals must be scaled in step or step 26 by a factor of 1/║ Ψ ║ ∞ before PCM encoding can be applied in step or
Выходной сигнал d ”2 этапа/стадии 24 демультиплексора обратно масштабируется на этапе или стадии 28 с использованием множителя ║Ψ║∞. Результирующий сигнал d ’’’2 объединяется на этапе или стадии 29 с сигналом d ’1, приводя в результате к декодированному HOA-сигналу d ’ в области коэффициентов.The output signal d ” 2 stage/
Согласно настоящему изобретению эффективность PCM-кодирования в области коэффициентов может быть повышена посредством использования адаптивного к сигналам нормирования сигналов. Однако такое нормирование должно быть обратимым и равномерно непрерывным от одного дискретного отсчета к другому дискретному отсчету. Необходимая поблочная адаптивная обработка изображена на Фиг.3. j -ая входная матрица D ( j )=[ d ( jL+ 0) … d ( jL + L - 1)] содержит L векторов d HOA-сигнала (индекс j не изображен на Фиг.3). Матрица D разделяется на две матрицы D 1 и D 2 подобно обработке на Фиг.2. Обработка для D 1 на этапах или стадиях 31-35 соответствует обработке в пространственной области, описанной совместно с Фиг.2 и Фиг.1. Однако кодирование сигнала в области коэффициентов включает в себя этап или стадию 36 поблочного адаптивного нормирования, который автоматически адаптируется к диапазону текущих значений сигнала, за которым следует этап или стадия 37 PCM-кодирования. Требуемая вспомогательная информация для денормирования каждого подвергшегося PCM-кодированию сигнала в матрице D ”2 хранится и передается в векторе e . Вектор e =[ e n 1 … e nK ] T содержит одно значение на сигнал. На этапе или стадии 38 соответствующего адаптивного денормирования декодера на приемной стороне происходит обращение нормирования сигналов D ”2 в D ’’’2 с использованием информации из переданного вектора e . Результирующий сигнал D ’’’2 объединяется на этапе или стадии 39 с сигналом D’ 1, приводя в результате к декодированному HOA-сигналу D' в области коэффициентов.According to the present invention, coefficient-domain PCM coding efficiency can be improved by using signal-adaptive signal conditioning. However, such normalization must be reversible and uniformly continuous from one discrete sample to another discrete sample. The required block adaptive processing is depicted in FIG. j -th input matrix D ( j )=[ d ( jL+ 0) ... d ( jL + L - one)] contains L vectors d HOA signal (index j not shown in figure 3). Matrix D split into two matrices D one and D 2 similar to the processing in Fig.2. Processing for D onein steps or steps 31-35 corresponds to the spatial domain processing described in conjunction with FIG. 2 and FIG. However, coefficient-domain signal coding includes a block adaptive normalization step or step 36 that automatically adapts to a range of current signal values, followed by a PCM coding step or
В адаптивном нормировании на этапе/стадии 36 равномерно непрерывная передаточная функция применяется к дискретным отсчетам текущего входного блока коэффициентов с целью постоянного изменения коэффициента усиления с последнего входного блока коэффициентов на коэффициент усиления следующего входного блока коэффициентов. Данный вид обработки требует задержки одного блока, потому что изменение коэффициента усиления нормирования (коэффициента нормирования) должно быть обнаружено на один входной блок коэффициентов вперед. Преимущество состоит в том, что вводимая амплитудная модуляция является малой, так что перцепционное кодирование модулированного сигнала почти не оказывает никакого влияния на денормированный сигнал.In adaptive normalization, in step/
Что касается варианта реализации адаптивного нормирования, то оно выполняется независимо для каждого HOA-сигнала D 2 ( j ). Сигналы представлены векторами-строками x n T матрицыAs for the implementation of adaptive normalization, it is performed independently for each HOA signal D 2 ( j ) . Signals are represented by row vectors x n T matrices
где n обозначает индексы переданных HOA-сигналов. x n является транспонированным, потому что первоначально он является вектором-столбцом, но здесь требуется вектор-строка.where n denotes the indices of the transmitted HOA signals. x n is transposed because it is originally a column vector, but here a row vector is required.
На Фиг.4 показано данное адаптивное нормирование на этапе/стадии 36 более подробно. Входные значения обработки представляют собой следующее:4 shows this adaptive normalization at step/
- сглаженное во времени максимальное значение x n ,max,s m ( j -2),- time-smoothed maximum value x n ,max,s m ( j -2) ,
- значение g n ( j -2) коэффициента усиления, то есть коэффициент усиления, который был применен к последнему коэффициенту соответствующего блока x n ( j -2) вектора сигнала,is the value g n ( j -2) of the gain, i.e. the gain that was applied to the last gain of the corresponding block x n ( j -2) of the signal vector,
- вектор сигнала текущего блока x n ( j ),- signal vector of the current block x n ( j ) ,
- вектор сигнала предыдущего блока x n ( j -1).- signal vector of the previous block x n ( j -1) .
В начале обработки первого блока x n (0) рекурсивные входные значения инициализируется предварительно заданными значениями: коэффициенты вектора x n (-1) могут быть обнулены, значение g n (-2) коэффициента усиления должно быть установлено в '1', а x n ,max,s m (-2) должно быть установлено в предварительно заданное среднее амплитудное значение.At the start of processing the first block x n (0), the recursive input values are initialized to the predefined values: the coefficients of the vector x n (-1) can be set to zero, the value g n (-2) of the gain must be set to '1', and x n ,max,s m (-2) must be set to the predefined average peak value.
После этого, значение g n ( j -1) коэффициента усиления последнего блока, соответствующее значение e n ( j -1) вектора e ( j -1) вспомогательной информации, сглаженное во времени максимальное значение x n ,max,s m ( j -1) и нормированный вектор x’ n ( j -1) сигнала представляют собой выходные результаты обработки.After that, the value g n ( j -1) of the gain of the last block, the corresponding value e n ( j -1) of the vector e ( j -1) of the auxiliary information, the time-smoothed maximum value x n ,max,s m ( j - 1) and the normalized vector x' n ( j -1) of the signal are the output results of processing.
Цель данной обработки состоит в непрерывном изменении значений коэффициента усиления, примененных к вектору x n ( j -1) сигнала, с g n ( j -2) на g n ( j -1) так, чтобы значение g n ( j -1) коэффициента усиления нормировало вектор x n ( j ) сигнала до диапазона подходящих значений.The purpose of this processing is to continuously change the gain values applied to the vector x n ( j -one)signal, s g n ( j -2) on the g n ( j -one) so that the value g n ( j -one)gain normalized vector x n ( j )signal to a range of suitable values.
На первом этапе или стадии 41 обработки каждый коэффициент вектора x n ( j )=[ x n ,0 ( j )… x n, L -1 ( j )] сигнала умножается на значение g n ( j -2) коэффициента усиления, при этом g n ( j -2) было сохранено из обработки нормирования вектора x n ( j -1) сигнала в качестве основы для нового коэффициента усиления нормирования. Из результирующего нормированного вектора x n ( j ) сигнала на этапе или стадии 42 с использованием уравнения (5) получается максимум x n ,max абсолютных значений:In the first processing step or step 41, each coefficient of the vector x n ( j )=[ x n ,0 ( j ) ... x n, L -1 ( j )] of the signal is multiplied by the value g n ( j -2) of the gain, with this g n ( j -2) was retained from the normalization processing of the signal vector x n ( j -1) as the basis for the new normalization gain. From the resulting normalized signal vector x n ( j ) in step or step 42, using equation (5), the maximum x n ,max absolute values are obtained:
x n , max =max 0≤ l < L │ g n ( j -2) x n , l ( j )│ (5) x n , max =max 0≤ l < L │ g n ( j -2) x n , l ( j )│ (5)
На этапе или стадии 43 сглаживание во времени применяется к x n ,max с использованием рекурсивного фильтра, принимающего предыдущее значение x n ,max,s m ( j -2) упомянутого сглаженного максимума и приводящего в результате к текущему сглаженному во времени максимуму x n ,max,s m ( j -1). Цель такого сглаживания заключается в ослаблении адаптации коэффициента усиления нормирования во времени, что уменьшает количество изменений коэффициента усиления и поэтому амплитудную модуляцию сигнала. Сглаживание во времени применяется только в том случае, если значение x n, max находится внутри диапазона предварительно заданных значений. Иначе, x n ,max,s m ( j -1) устанавливается в x n, max (т.е. значение x n, max сохраняется таким, какое оно есть), потому что последующая обработка должна ослаблять действующее значение x n, max до диапазона предварительно заданных значений. Поэтому, сглаживание во времени задействуется только тогда, когда коэффициент усиления нормирования является постоянным или когда сигнал x n (j ) может быть усилен без покидания диапазона значений.In step or step 43, temporal smoothing is applied to x n ,max using a recursive filter taking the previous value x n ,max,s m ( j -2) of said smoothed maximum and resulting in the current temporally smoothed maximum x n , max,s m ( j -1). The purpose of this smoothing is to reduce the adaptation of the normalization gain over time, which reduces the number of gain changes and therefore the amplitude modulation of the signal. Time smoothing is only applied if x n, max is within the range of predefined values. Otherwise, x n ,max,s m ( j -1) is set to x n, max (i.e. the value of x n, max is kept as it is), because subsequent processing must weaken the effective value of x n, max up to the range of preset values. Therefore, time smoothing is only enabled when the normalization gain is constant or when the signal x n (j ) can be amplified without leaving the range of values.
( x n ,max,s m ( j -1)) вычисляется на этапе/стадии 43 следующим образом: ( x n ,max,s m ( j -1)) is calculated in step/
(6) (6)
где 0 < a ≤ 1 является постоянной ослабления.where 0 < a ≤ 1 is the attenuation constant.
С целью уменьшения битовой скорости для передачи вектора e коэффициент усиления нормирования вычисляется из текущего сглаженного во времени максимального значения x n ,max,s m ( j -1) и передается в качестве показателя степени по основанию '2'. Таким образом должно выполняться следующее условие:In order to reduce the bit rate for transmitting the vector e , the normalization gain is calculated from the current time-smoothed maximum value x n ,max,s m ( j -1) and transmitted as an exponent in base '2'. Thus, the following condition must be met:
(7) (7)
и квантованный показатель степени e n ( j -1) получается изand the quantized exponent e n ( j -1) is obtained from
(8) (eight)
на этапе или стадии 44.at step or
В периоды, в которые сигнал повторно усиливается (то есть значение общего коэффициента усиления увеличивается во времени), с целью использования доступного разрешения для эффективного PCM-кодирования, показатель e n ( j ) степени может быть ограничен (и таким образом разность коэффициента усиления между последовательными блоками) малым максимальным значением, например, '1'. Данное действие имеет два преимущественных технических результата. С одной стороны, малые разности коэффициента усиления между последовательными блоками приводят только к малым амплитудным модуляциям через передаточную функцию, приводя в результате к уменьшенной перекрестной помехе между смежными подполосами FFT-спектра (см. соответствующее описание воздействия передаточной функции на перцепционное кодирование совместно с Фиг.7). С другой стороны, битовая скорость для кодирования показателя степени уменьшается за счет ограничения диапазона его значений.In periods in which the signal is re-amplified (i.e., the value of the overall gain increases with time), in order to use the available resolution for efficient PCM coding, the exponent e n ( j ) can be limited (and thus the gain difference between successive blocks) with a small maximum value, such as '1'. This action has two advantageous technical results. On the one hand, small gain differences between successive blocks result in only small amplitude modulations across the transfer function, resulting in reduced crosstalk between adjacent subbands of the FFT spectrum (see the related description of the effect of the transfer function on perceptual coding in conjunction with FIG. 7). ). On the other hand, the bit rate for encoding the exponent is reduced by limiting the range of its values.
Значение полного максимального усиленияTotal maximum gain value
(9) (9)
может быть ограничено, например, '1'. Причина состоит в том, что, если один из сигналов коэффициентов демонстрирует большое амплитудное изменение между двумя последовательными блоками, из которых первый имеет очень малые амплитуды, а второй имеет максимально возможную амплитуду (предполагается нормирование HOA-представления в пространственной области), то очень большие разности коэффициента усиления между этими двумя блоками приведут к большим амплитудным модуляциям через передаточную функцию, приводя в результате к серьезной перекрестной помехе между смежными подполосами FFT-спектра. Это может бы быть неоптимальным для последующего перцепционного кодирования, обсуждаемого ниже.can be limited to eg '1'. The reason is that if one of the coefficient signals exhibits a large amplitude change between two successive blocks, of which the first has very small amplitudes and the second has the maximum possible amplitude (normalization of the HOA representation in the spatial domain is assumed), then very large differences gain between these two blocks will result in large amplitude modulations through the transfer function, resulting in severe crosstalk between adjacent subbands of the FFT spectrum. This might not be optimal for the subsequent perceptual encoding discussed below.
На этапе или стадии 45 значение показателя e n ( j -1) степени применяется к передаточной функции для получения текущего значения g n ( j -1) коэффициента усиления. Для непрерывного перехода от значения g n ( j -2) коэффициента усиления к значению g n ( j -1) коэффициента усиления используется функция, изображенная на Фиг.5. Вычислительное правило для этой функции состоит в следующем:In step or step 45, the value of the exponent e n ( j -1) is applied to the transfer function to obtain the current value g n ( j -1) of the gain. For a continuous transition from the value of g n ( j -2) of the gain to the value of g n ( j -1) of the gain, the function shown in Fig.5 is used. The computational rule for this function is as follows:
(10) (ten)
где l =0, 1, 2, …, L -1. Фактический вектор h n ( j -1)=[ h n (0), …, h n ( L -1)] T передаточной функции сwhere l =0, 1, 2, ..., L -1 . The actual vector h n ( j -1)=[ h n (0), ..., h n ( L -1)] T of the transfer function with
(11) (eleven)
используется для непрерывного ослабления с g n ( j -2) до g n ( j -1). Для каждого значения e n ( j -1) значение h n (0) равно e n ( j -2) поскольку f (0)=1. Последнее значение f (L-1) равно 0,5, так что будет приводить в результате к требуемому усилению g n ( j -1) для нормирования x n ( j ) из уравнения (9).used for continuous attenuation from g n ( j -2) to g n ( j -1) . For each value of e n ( j -1) the value of h n (0) is equal to e n ( j -2) since f (0)=1 . The last value of f (L-1) is 0.5 , so will result in the required gain g n ( j -1) to normalize x n ( j ) from equation (9).
На этапе или стадии 46 дискретные отсчеты вектора x n ( j -1) сигнала взвешиваются по значениям коэффициента усиления вектора h n ( j -1) передаточной функции для полученияIn step or step 46, the discrete samples of the vector x n ( j -1) of the signal are weighted by the values of the gain vector h n ( j -1) of the transfer function to obtain
x’ n ( j -1)= x n ( j -1)⊗ h n ( j -1), (12) x' n ( j -1)= x n ( j -1)⊗ h n ( j -one),(12)
где оператор «⊗» представляет собой векторное поэлементное умножение двух векторов. Данное умножение может также быть рассмотрено в качестве представления амплитудной модуляции сигнала x n ( j -1).where the operator " ⊗ " is a vector elementwise multiplication of two vectors. This multiplication can also be considered as representing the amplitude modulation of the signal x n ( j -1) .
Более подробно, коэффициенты вектора h n ( j -1)=[ h n (0), …, h n ( L -1)] T передаточной функции умножаются на соответствующие коэффициенты вектора x n ( j -1) сигнала, где значение h n (0) представляет собой h n (0)= g n ( j -2), а значение h n ( L -1) представляет собой h n ( L -1)= g n ( j -1). Поэтому передаточная функция непрерывно ослабляется от значения g n ( j -2) коэффициента усиления к значению g n ( j -1) коэффициента усиления, как это изображено в примере Фиг.8, на которой показаны значения коэффициента усиления от передаточных функций h n ( j ), h n ( j -1) и h n ( j -2), которые применяются к соответствующим векторам x n ( j ), x n ( j -1) и x n ( j -2) сигнала для трех последовательных блоков. Преимущество по отношению к последующему перцепционному кодированию состоит в том, что на границах блоков применяемые коэффициенты усиления непрерывны: передаточная функция h n ( j -1) непрерывно ослабляет коэффициенты усиления для коэффициентов x n ( j -1) с g n ( j -2) к g n ( j -1).In more detail, the coefficients of the vector h n ( j -1)=[ h n (0), ..., h n ( L -1)] T of the transfer function are multiplied by the corresponding coefficients of the vector x n ( j -1) of the signal, where the value of h n (0) is h n (0) = g n ( j -2) , and the value of h n ( L -1) is h n ( L -1)= g n ( j -1) . Therefore, the transfer function is continuously attenuated from the gain value g n ( j -2) to the gain value g n ( j -1) as shown in the example of Fig. 8, which shows the gain values from the transfer functions h n ( j ) , h n ( j -1) and h n ( j -2) which are applied to the respective signal vectors x n ( j ) , x n ( j -1) and x n ( j -2) for three consecutive blocks. The advantage over subsequent perceptual encoding is that at block boundaries the applied gains are continuous: the transfer function h n ( j -1) continuously attenuates the gains for the coefficients x n ( j -1) with g n ( j -2) to g n ( j -1) .
Обработка адаптивного денормирования на стороне декодера или приемника показана на Фиг.6. Входными значениями являются подвергшиеся PCM-кодированию и нормированные сигналы x” n ( j -1), подходящий показатель e n ( j -1) степени и значение g n ( j -2) коэффициента усиления последнего блока. Значение g n ( j -2) коэффициента усиления последнего блока вычисляется рекурсивно, причем g n ( j -2) должно быть инициализировано предварительно заданным значением, которое также уже использовалось в кодере. Выходными результатами являются значение g n ( j -1) коэффициента усиления с этапа/стадии 61 и денормированный сигнал x’’’ n ( j -1) с этапа/стадии 62.The adaptive denormalization processing at the decoder or receiver side is shown in FIG. Input values are PCM-encoded and normalized signals x” n ( j -one), a suitable indicator e n ( j -one) degrees and meaning g n ( j -2) gain of the last block. Meaning g n ( j -2) gain of the last block is calculated recursively, and g n ( j -2) must be initialized with a predefined value that was also already used in the encoder. The output results are the value g n ( j -one)gain from step/
На этапе или стадии 61 показатель степени применяется к передаточной функции. Для восстановления диапазона значений x n ( j -1), в уравнении (11) вычисляется вектор h n ( j -1) передаточной функции из принятого показателя e n ( j -1) степени и рекурсивно вычисленного коэффициента усиления g n ( j -2). Коэффициент усиления g n ( j -1) для обработки следующего блока устанавливается равным h n ( L -1).In step or step 61, the exponent is applied to the transfer function. To restore the range of values x n ( j -1) , in equation (11) the transfer function vector h n ( j -1) is calculated from the received exponent e n ( j -1) of the degree and the recursively calculated gain g n ( j -2 ) . The gain g n ( j -1) for processing the next block is set to h n ( L -1) .
На этапе или стадии 62 применяется обратный коэффициент усиления. Примененная амплитудная модуляция обработки нормирования обращается посредством x’’’ n ( j -1)= x” n ( j -1)⊗ h n ( j -1) -1 , (13)In step or step 62, an inverse gain is applied. The applied amplitude modulation of normalization processing is inverted by x''' n ( j -1)= x” n ( j -1)⊗ h n ( j -1) -1 , (13)
где , а «⊗» является векторным поэлементным умножением, которое было использовано на стороне кодера или передатчика. Дискретные отсчеты x’ n ( j -1) не могут быть представлены входным PCM-форматом x” n ( j -1), так что денормированию требуется преобразование в формат диапазона больших значений, как например формат с плавающей запятой.where , and " ⊗ " is the elementwise vector multiplication that was used on the encoder or transmitter side. Discrete samples x' n ( j -1) cannot be represented by the input PCM format x” n ( j -1), so denormalization needs to be converted to a large range format, such as floating point format.
Что касается передачи вспомогательной информации, то для передачи показателей e n ( j -1) степени нельзя предположить, что их вероятность является равномерной, потому что применяемый коэффициент усиления нормирования будет постоянным для последовательных блоков одного и тот же диапазона значений. Таким образом энтропийное кодирование, как например Кодирование методом Хаффмана, может быть применено к значениям показателя степени для уменьшения требуемой скорости передачи данных.With regard to the transmission of ancillary information, for the transmission of exponents e n ( j -1) of the degree, their probability cannot be assumed to be uniform, because the applied normalization gain will be constant for successive blocks of the same range of values. Thus, entropy encoding, such as Huffman encoding, can be applied to exponent values to reduce the required data rate.
Один недостаток описанной обработки может заключаться в рекурсивном вычислении значения g n ( j -2) коэффициента усиления. Следовательно, обработка денормирования может начинаться только с начала HOA-потока.One disadvantage of the described processing may be the recursive calculation of the gain value g n ( j -2) . Therefore, denormalization processing can only start from the beginning of the HOA stream.
Решение для данной проблемы состоит в добавлении блоков доступа в HOA-формат с целью предоставления информации для регулярного вычисления g n ( j -2). В данном случае блок доступа должен обеспечивать показатели e n,access =log 2 g n ( j -2) (14)The solution to this problem is to add access blocks to the HOA format to provide information for regular computation. g n ( j -2). In this case, the access block must provide indicators e n, access =log 2 g n ( j -2) (fourteen)
степени для каждого t -ого блока так, чтобы могло быть вычислено и денормирование могло начаться в каждом t -ом блоке.degree for each t -th block so that could be computed and denormalization could start at every tth block.
Воздействие на перцепционное кодирование нормированного сигнала x’ n ( j -1) анализируется по абсолютному значению частотной характеристики (15)The impact on the perceptual coding of the normalized signal x' n ( j -1) is analyzed by the absolute value of the frequency response (fifteen)
функции h n ( l ). Частотная характеристика задается Быстрым Преобразованием Фурье (FFT) над h n ( l ), как показано в уравнении (15).functions h n ( l ) . The frequency response is given by a Fast Fourier Transform (FFT) over h n ( l ) as shown in equation (15).
На Фиг.7 показан нормированный (до 0 дБ) амплитудный FFT-спектр H n ( u ) для прояснения спектрального искажения, вводимого амплитудной модуляцией. Затухание │ H n ( u )│ является относительно резким для малых показателей степени и становится плоским для более больших показателей степени.Figure 7 shows the normalized (to 0 dB) amplitude FFT spectrum H n ( u ) to clarify the spectral distortion introduced by amplitude modulation. Attenuation │ H n ( u )│ is relatively sharp for small exponents and becomes flat for larger exponents.
Так как амплитудная модуляция x n ( j -1) по h n ( l ) во временной области эквивалентна свертке по H n ( u ) в частотной области, то резкое затухание частотной характеристики H n ( u ) уменьшает перекрестную помеху между смежными подполосами FFT-спектра x’ n ( j -1). Это сильно связано с последующим перцепционным кодированием x’ n ( j -1), потому что подполосная перекрестная помеха влияет на оцениваемые перцепционные характеристики сигнала. Таким образом, для резкого затухания H n ( u ), предположения перцепционного кодирования для x’ n ( j -1) также действительны для ненормированного сигнала x n ( j -1).Since amplitude modulation x n ( j -1) over h n ( l ) in the time domain is equivalent to convolution over H n ( u ) in the frequency domain, the abrupt decay of the frequency response of H n ( u ) reduces crosstalk between adjacent FFT-subbands. spectrum x' n ( j -1). This is strongly related to the subsequent perceptual encoding x' n ( j -1) because subband crosstalk affects the estimated perceptual characteristics of the signal. Thus, for abrupt fading H n ( u ) , the perceptual encoding assumptions for x' n ( j -1) are also valid for the non-normalized signal x n ( j -1) .
Это показывает, что для малых показателей степени перцепционное кодирование x’ n ( j -1) почти эквивалентно перцепционному кодированию x n ( j -1) и что перцепционное кодирование нормированного сигнала почти не имеет никакого воздействия на денормированный сигнал при малой амплитуде показателя степени.This shows that for small exponents the perceptual encoding x' n ( j -1) is almost equivalent to the perceptual encoding x n ( j -1) and that the perceptual encoding of the normalized signal has almost no effect on the denormalized signal at low exponent amplitude.
Заявляемая обработка может быть выполнена одиночным процессором или электронной схемой на передающей стороне и на приемной стороне или несколькими процессорами или электронными схемами, функционирующими параллельно и/или функционирующими в различных частях заявляемой обработки. The claimed processing may be performed by a single processor or electronic circuit on the transmitting side and on the receiving side, or by several processors or electronic circuits operating in parallel and/or operating in different parts of the claimed processing.
Claims (13)
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP20130305986 EP2824661A1 (en) | 2013-07-11 | 2013-07-11 | Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals |
| EP13305986.5 | 2013-07-11 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2016104403A Division RU2670797C9 (en) | 2013-07-11 | 2014-06-24 | Method and apparatus for generating from a coefficient domain representation of hoa signals a mixed spatial/coefficient domain representation of said hoa signals |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2022119198A Division RU2817687C2 (en) | 2013-07-11 | 2022-07-14 | Method and apparatus for generating mixed representation of said hoa signals in coefficient domain from representation of hoa signals in spatial domain/coefficient domain |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| RU2018135962A RU2018135962A (en) | 2018-11-14 |
| RU2018135962A3 RU2018135962A3 (en) | 2022-03-31 |
| RU2777660C2 true RU2777660C2 (en) | 2022-08-08 |
Family
ID=
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20100198589A1 (en) * | 2008-07-29 | 2010-08-05 | Tomokazu Ishikawa | Audio coding apparatus, audio decoding apparatus, audio coding and decoding apparatus, and teleconferencing system |
| RU2422987C2 (en) * | 2006-01-20 | 2011-06-27 | Майкрософт Корпорейшн | Complex-transform channel coding with extended-band frequency coding |
| WO2012023864A1 (en) * | 2010-08-20 | 2012-02-23 | Industrial Research Limited | Surround sound system |
| EP2469742A2 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
| CN102982805A (en) * | 2012-12-27 | 2013-03-20 | 北京理工大学 | Multi-channel audio signal compressing method based on tensor decomposition |
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2422987C2 (en) * | 2006-01-20 | 2011-06-27 | Майкрософт Корпорейшн | Complex-transform channel coding with extended-band frequency coding |
| US20100198589A1 (en) * | 2008-07-29 | 2010-08-05 | Tomokazu Ishikawa | Audio coding apparatus, audio decoding apparatus, audio coding and decoding apparatus, and teleconferencing system |
| WO2012023864A1 (en) * | 2010-08-20 | 2012-02-23 | Industrial Research Limited | Surround sound system |
| EP2469742A2 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
| CN102982805A (en) * | 2012-12-27 | 2013-03-20 | 北京理工大学 | Multi-channel audio signal compressing method based on tensor decomposition |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7504174B2 (en) | Method and apparatus for generating a mixed spatial/coefficient domain representation of an HOA signal from a coefficient domain representation of the HOA signal - Patents.com | |
| RU2817687C2 (en) | Method and apparatus for generating mixed representation of said hoa signals in coefficient domain from representation of hoa signals in spatial domain/coefficient domain | |
| RU2777660C2 (en) | Method and device for formation from representation of hoa signals in domain of mixed representation coefficients of mentioned hoa signals in spatial domain/coefficient domain | |
| HK40016914B (en) | Method and apparatus for generating a mixed spatial/coefficient domain representation of hoa signals | |
| HK40012739A (en) | Method and apparatus for generating a mixed spatial/coefficient domain representation of hoa signals | |
| HK40012718A (en) | Method and apparatus for generating a mixed spatial/coefficient domain representation of hoa signals | |
| HK40012739B (en) | Method and apparatus for generating a mixed spatial/coefficient domain representation of hoa signals | |
| HK40012738A (en) | Method and apparatus for generating a mixed spatial/coefficient domain representation of hoa signals | |
| HK40012738B (en) | Method and apparatus for generating a mixed spatial/coefficient domain representation of hoa signals | |
| HK40016914A (en) | Method and apparatus for generating a mixed spatial/coefficient domain representation of hoa signals | |
| HK40012718B (en) | Method and apparatus for generating a mixed spatial/coefficient domain representation of hoa signals | |
| HK40004348A (en) | Method and apparatus for generating from a coefficient domain representation of hoa signals a mixed spatial/ coefficient domain representation of said hoa signals |