RU2628898C1 - Неравномерное квантование параметров для усовершенствованной связи - Google Patents
Неравномерное квантование параметров для усовершенствованной связи Download PDFInfo
- Publication number
- RU2628898C1 RU2628898C1 RU2016108327A RU2016108327A RU2628898C1 RU 2628898 C1 RU2628898 C1 RU 2628898C1 RU 2016108327 A RU2016108327 A RU 2016108327A RU 2016108327 A RU2016108327 A RU 2016108327A RU 2628898 C1 RU2628898 C1 RU 2628898C1
- Authority
- RU
- Russia
- Prior art keywords
- parameter
- quantized
- scalar quantization
- quantization scheme
- dequantized
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W28/00—Network traffic management; Network resource management
- H04W28/02—Traffic management, e.g. flow control or congestion control
- H04W28/06—Optimizing the usage of the radio link, e.g. header compression, information sizing, discarding information
- H04W28/065—Optimizing the usage of the radio link, e.g. header compression, information sizing, discarding information using assembly or disassembly of packets
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W28/00—Network traffic management; Network resource management
- H04W28/02—Traffic management, e.g. flow control or congestion control
- H04W28/0215—Traffic management, e.g. flow control or congestion control based on user or device properties, e.g. MTC-capable devices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Error Detection And Correction (AREA)
- Stereophonic System (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Изобретение относится к звуковому кодированию, в частности оно относится к перцептивно оптимизированному квантованию параметров, используемых в системе для параметрического пространственного кодирования звуковых сигналов. Технический результат – повышение эффективности и качества кодирования звукового сигнала. Группа изобретений предусматривает неравномерное квантование параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, а также обеспечивает восстановление звукового сигнала в системе декодирования звука, учитывающей неравномерно квантованные параметры. Согласно изобретению такой подход делает возможным снижение битовых затрат без существенного снижения качества восстановленного звукового сигнала. 7 н. и 14 з.п. ф-лы, 7 ил., 4 табл.
Description
Перекрестная ссылка на родственные заявки
Настоящая заявка заявляет приоритет предварительной заявки на патент США №61/877166, поданной 12 сентября 2013 года, описание которой полностью включено в настоящее описание посредством ссылки.
Область техники изобретения
Раскрытие, описанное в настоящем документе, относится, как правило, к звуковому кодированию. В частности, оно относится к перцептивно оптимизированному квантованию параметров, используемых в системе для параметрического пространственного кодирования звуковых сигналов.
Предпосылки создания изобретения
Производительность низкоскоростных систем кодирования звука может быть значительно улучшена для стереофонических сигналов при применении инструментального средства параметрического стереофонического (PS) кодирования. В такой системе монофонический сигнал, как правило, квантуется и передается с помощью аудиокодера современного технического уровня, и стереофонические параметры оцениваются и квантуются в кодере и добавляются в качестве дополнительной информации к битовому потоку. В декодере стереофонический сигнал восстанавливается из декодированного монофонического сигнала с помощью стереофонических параметров.
Существует несколько возможных вариантов параметрического стереофонического кодирования. Соответственно существует несколько типов кодеров и в дополнение к монофоническому понижающему микшированию они генерируют разные стереофонические параметры, которые встраиваются в генерируемый битовый поток. Инструментальные средства такого кодирования также были стандартизированы. Примером такого стандарта является MPEG-4 Audio (ISO/IEC 14496-3).
Основная идея создания систем кодирования звука, в целом, и параметрического стереофонического кодирования, в частности, и одна из нескольких задач данной области техники состоит в минимизации количества информации, которая должна быть передана в битовом потоке от кодера к декодеру с одновременным получением хорошего качества звука. Высокий уровень сжатия информации битового потока может привести к недопустимому качеству звука либо из-за сложных и неудовлетворительных вычислительных процессов, либо из-за того, что информация была утрачена в процессе сжатия. Низкий уровень сжатия информации битового потока, с другой стороны, может привести к проблемам емкости, которые также могут привести к недопустимому качеству звука.
Соответственно существует потребность в улучшенных способах параметрического стереофонического кодирования.
Краткое описание графических материалов
В дальнейшем будут описаны более подробно примерные варианты осуществления со ссылками на прилагаемый графический материал на котором:
фиг. 1 раскрывает блок-схему системы параметрического стереофонического кодирования и декодирования в соответствии с примерным вариантом осуществления;
на фиг. 2 показана блок-схема, относящаяся к обработке стереофонических параметров в кодирующей части системы параметрического стереофонического кодирования, показанной на фиг. 1;
на фиг. 3 показана блок-схема, относящаяся к обработке стереофонических параметров в декодирующей части системы параметрического стереофонического кодирования, показанной на фиг. 1;
на фиг. 4 показано значение коэффициента масштабирования в зависимости от одного из стереофонических параметров;
фиг. 5 раскрывает неравномерные и равномерные квантователи (точные и грубые) в плоскости (а, b), где а и b - стереофонические параметры; и
на фиг. 6 представлена диаграмма, показывающая средние параметрические стереофонические битовые затраты для примеров равномерного точного и равномерного грубого квантования в сравнении с неравномерным точным и неравномерным грубым квантованием согласно примерного варианта осуществления;
фиг. 7 раскрывает блок-схему системы параметрического многоканального кодирования и декодирования в соответствии с другим примерным вариантом осуществления.
Все чертежи являются схематическими и, как правило, показывают лишь те части, которые необходимы для разъяснения изобретения; другие части могут быть опущены или просто подразумеваться. Если не указано иное, подобные части на разных чертежах обозначены подобными позициями.
Подробное описание
Ввиду сказанного выше, цель изобретения заключается в том, чтобы предложить кодеры, декодеры, системы, содержащие кодеры и декодеры и связанные с ними методы, которые обеспечивают повышенную эффективность и качество кодированного звукового сигнала.
I. Обзор - Кодер
Согласно первому аспекту примерные варианты осуществления предлагают способы кодирования, кодирующие устройства и компьютерные продукты для кодирования. Предлагаемые способы, кодирующие устройства и компьютерные программные продукты могут, как правило, иметь одни и те же признаки и преимущества.
Согласно примерным вариантам осуществления предусмотрен способ для квантования в аудиокодере параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, включающий: прием по меньшей мере первого параметра и второго параметра для квантования; квантование первого параметра на основе первой схемы скалярного квантования, имеющей неравномерные размеры шага, для получения первого квантованного параметра, причем неравномерные размеры шага выбираются таким образом, что меньшие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным; деквантизацию квантованного первого параметра с использованием первой схемы скалярного квантования для получения деквантованного первого параметра, являющегося приближенным представлением первого параметра; обращение к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определение коэффициента масштабирования посредством подвергания деквантованного первого параметра действию функции масштабирования; и квантование второго параметра на основе коэффициента масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения квантованного второго параметра.
Способ основан на понимании того, что человеческое восприятие звука не однородно. Вместо этого оказывается, что восприятие человеком звука выше в отношении некоторых звуковых характеристик и ниже для других звуковых характеристик. Это означает, что человеческое восприятие звука является более чувствительным для некоторых значений параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, чем для других таких значений. Согласно предложенному способу первый такой параметр квантуется с неравномерными размерами шага таким образом, что меньшие размеры шага используются там, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются там, где человеческое восприятие звука является менее чувствительным. Посредством квантования с использованием таких схем с неравномерными размерами шага можно снизить средние параметрические стереофонические битовые затраты без заметного уменьшения качества звука.
Согласно вариантам осуществления функция масштабирования согласно данному способу является кусочно-линейной функцией.
Согласно вариантам осуществления этап квантования второго параметра согласно способу основан на коэффициенте масштабирования, и вторая схема скалярного квантования включает деление второго параметра на коэффициент масштабирования до подвергания второго параметра квантованию в соответствии со второй схемой скалярного квантования.
Согласно альтернативному варианту осуществления способа неравномерные размеры шага второй схемы скалярного квантования масштабируют коэффициентом масштабирования до квантования второго параметра.
Согласно вариантам осуществления способа неравномерные размеры шага второй схемы скалярного квантования увеличивают со значением второго параметра.
Согласно вариантам осуществления способа первая схема скалярного квантования включает больше этапов квантования, чем вторая схема скалярного квантования.
Согласно вариантам осуществления способа первая схема скалярного квантования строится посредством сдвига, зеркального отображения и конкатенации второй схемы скалярного квантования.
Согласно вариантам осуществления способа наибольший размер шага первой и/или второй схемы скалярного квантования приблизительно в четыре раза больше наименьшего размера шага первой и/или второй схемы скалярного квантования.
Согласно примерным вариантам осуществления предлагается машиночитаемый носитель, содержащий команды машинного кода, предназначенные для выполнения любого способа согласно первому аспекту при выполнении на устройстве, имеющем возможность обработки.
Согласно примерным вариантам осуществления предусмотрен аудиокодер для квантования параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, содержащий: принимающий компонент, выполненный с возможностью приема по меньшей мере первого параметра и второго параметра для квантования; первый компонент квантования, расположенный ниже по потоку от принимающего компонента, выполненный с возможностью квантования первого параметра на основе первой схемы скалярного квантования, имеющей неравномерные размеры шага, для получения квантованного первого параметра, причем неравномерные размеры шага выбираются таким образом, что меньшие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным; компонент деквантования, выполненный с возможностью приема первого квантованного параметра от первого компонента квантования и деквантования квантованного первого параметра с использованием первой схемы скалярного квантования для получения деквантованного первого параметра, являющегося приближенным представлением первого параметра; компонент определения коэффициента масштабирования, выполненный с возможностью приема деквантованного первого параметра, обращения к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определения коэффициента масштабирования посредством подвергания деквантованного первого параметра воздействию функции масштабирования; и второй компонент квантования, выполненный с возможностью приема второго параметра и коэффициента масштабирования и квантования второго параметра на основе коэффициента масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения квантованного второго параметра.
II. Обзор - Декодер
Согласно второму аспекту примерные варианты осуществления предлагают способы декодирования, декодирующие устройства и компьютерные программные продукты для декодирования. Предлагаемые способы, декодирующие устройства и компьютерные программные продукты могут, как правило, иметь одни и те же признаки и преимущества.
Преимущества, касающиеся признаков и устройств, представленных в обзоре кодирующего устройства выше, могут, как правило, распространяться и на соответствующие признаки и устройства для декодирующего устройства.
Согласно примерным вариантам осуществления предусмотрен способ в аудиодекодере для деквантования квантованных параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, включающий: прием по меньшей мере первого квантованного параметра и второго квантованного параметра; деквантование квантованного первого параметра в соответствии с первой схемой скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного первого параметра, причем неравномерные размеры шага выбираются таким образом, что меньшие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным; обращение к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определение коэффициента масштабирования посредством подвергания деквантованного первого параметра воздействию функции масштабирования; и деквантование второго квантованного параметра на основе функции масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного второго параметра.
Согласно вариантам осуществления способа функция масштабирования является кусочно-линейной функцией.
Согласно варианту осуществления этап деквантования второго параметра на основе коэффициента масштабирования и второй схемы скалярного квантования включает деквантование второго квантованного параметра в соответствии со второй схемой скалярного квантования и умножение его результата на коэффициент масштабирования.
Согласно альтернативному варианту осуществления неравномерные размеры шага второй схемы скалярного квантования масштабируются коэффициентом масштабирования до деквантования второго квантованного параметра.
Согласно дополнительным вариантам осуществления неравномерный размер шага второй схемы скалярного квантования возрастает со значением второго параметра.
Согласно варианту осуществления первая схема скалярного квантования включает больше этапов квантования, чем вторая схема скалярного квантования.
Согласно варианту осуществления первая схема скалярного квантования строится посредством сдвига, зеркального отображения и конкатенации второй схемы скалярного квантования.
Согласно варианту осуществления наибольший размер шага первой и/или второй схемы скалярного квантования приблизительно в четыре раза больше наименьшего размера шага первой и/или второй схемы скалярного квантования.
Согласно примерным вариантам осуществления предлагается машиночитаемый носитель, содержащий команды машинного кода, предназначенные для выполнения способа любого способа согласно второму аспекту при выполнении посредством устройства, имеющего возможность обработки.
Согласно примерным вариантам осуществления предусмотрен аудиодекодер для деквантования квантованных параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, содержащий: принимающий компонент, выполненный с возможностью приема по меньшей мере первого квантованного параметра и второго квантованного параметра; первый компонент деквантования, расположенный ниже по потоку от принимающего компонента и выполненный с возможностью деквантования квантованного первого параметра в соответствии с первой схемой скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного первого параметра, причем неравномерные размеры шага выбираются таким образом, что меньшие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным; компонент определения коэффициента масштабирования, выполненный с возможностью приема деквантованного первого параметра от первого компонента деквантования, доступа к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определения коэффициента, масштабирования посредством подвергания деквантованного первого параметра действию функции масштабирования; и второй компонент деквантования, выполненный с возможностью приема коэффициента масштабирования и второго квантованного параметра и деквантования второго квантованного параметра на основе коэффициента масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного второго параметра.
III. Обзор - Система кодирования/декодирования звука
Согласно третьему аспекту примерные варианты осуществления предлагают системы декодирования/кодирования, содержащие кодер согласно первому аспекту и декодер согласно второму аспекту.
Преимущества, касающиеся признаков и устройств, представленных в обзоре кодирующего устройства и декодирующего устройства выше, могут, как правило, распространяться и на соответствующие признаки и устройства для системы.
Согласно вариантам осуществления предлагается такая система, в которой аудиокодер выполнен с возможностью передачи первого и второго квантованных параметров в аудиодекодер.
IV. Примерные варианты осуществления
Раскрытие в данном описании рассматривает перцептивно оптимизированное квантование параметров, используемых в системе для параметрического пространственного кодирования звуковых сигналов. В рассмотренных ниже примерах изложен частный случай параметрического стереофонического кодирования для 2-канальных сигналов. Такой же метод может быть также использован в параметрическом многоканальном кодировании, например, в системе, работающей в режиме 5-3-5. Примерный вариант осуществления такой системы схематически представлен на фиг. 7 и будет кратко рассмотрен ниже. Примерные варианты осуществления, представленные в данной заявке, относятся к простому неравномерному квантованию, обеспечивающему уменьшение битовой скорости передачи данных, необходимой для передачи данных параметров без влияния на качество воспринимаемого звука, и к тому же обеспечивающему продолжающееся использование установившихся методов энтропийного кодирования для скалярных параметров (например, временного или частотного дифференциального кодирования с последующим кодированием методом Хаффмана).
На фиг. 1 показана блок-схема варианта осуществления системы 100 параметрического стереофонического кодирования и декодирования, рассмотренная в данной заявке. Стереофонический сигнал, содержащий левый канал 101 (L) и правый канал 102 (R) принимается кодирующей частью 110 системы 100. Стереофонический сигнал посылается в качестве входного на кодер 112 с "Усовершенствованной связью" (ACPL), генерирующий монофоническое понижающее микширование 103 (М) и стереофонические параметры а (обозначенный на фиг. 1 как 104а) и b (обозначенный на фиг. 1 как 104b). Кроме того, кодирующая часть 110 содержит кодер 114 понижающего микширования (DMX Enc), преобразующий монофоническое понижающее микширование 103 в битовый поток 105, устройство 116 квантования стереофонических параметров (Q), генерирующее поток квантованных стереофонических параметров 106, и мультиплексор 118 (MUX), который генерирует окончательный битовый поток 108, который также содержит квантованные стереофонические параметры, которые предаются в декодирующую часть 120. Декодирующая часть 120 содержит демультиплексор 122 (DE-MUX), который принимает входящий окончательный битовый поток 108 и регенерирует битовый поток 105 и поток квантованных стереофонических параметров 106, декодер 124 понижающего микширования (DMX Dec), который принимает битовый поток 105 и выводит декодированное монофоническое понижающее микширование 103' (М'), устройство 126 деквантования стереофонических параметров (Q'), которое принимает поток квантованных стереофонических параметров 106 и выводит деквантованные стереофонические параметры а' 104а' и b' 104b', и наконец декодер 128 ACPL, который принимает декодированное монофоническое понижающее микширование 103' и деквантованные стереофонические параметры 104а', 104b' и преобразует эти входящие сигналы в восстановленные стереофонический сигналы 101' (L') и 102' (R').
Исходя из входных стереофонический сигналов 101 (L) и 102 (R), декодер 112 ACPL вычисляет монофоническое понижающее микширование 103 (М) и дополнительный сигнал (S) в соответствии со следующими уравнениями:
Стереофонические параметры а и b вычисляются время- и частотно-избирательным способом, т.е. для каждого частотно-временного элемента покрытия, как правило, с помощью блока фильтров, как блок QMF, и с использованием неравномерного группирования диапазонов QMF для формирования множества диапазонов параметров согласно перцептивной шкале частот.
В декодере ACPL декодированное монофоническое микширование М' вместе со стереофоническими параметрами а', b' и декоррелированной версией М' (decorr (М')) используются в качестве входного сигнала для восстановления приближенного представления дополнительного сигнала в соответствии со следующим уравнением:
Затем L' и R' вычисляются следующим образом:
Пара параметров (а, b) может рассматриваться как точка на двумерной плоскости (а, b). Параметры a, b связаны с воспринимаемым стереофоническим образом, где параметр а, в первую очередь, связан с положением воспринимаемого источника звука (например, слева или справа), и где параметр b, в первую очередь, связан с размером или шириной воспринимаемого источника звука (небольшой и хорошо локализованный или широкий и окружающий). В таблице 1 приведены несколько типичных примеров воспринимаемых стереофонических образов и соответствующие значения параметров а, b.
Необходимо отметить, что b не бывает отрицательным. Следует также отметить, что несмотря на то, что b и абсолютное значение а часто находятся в пределах от 0 до 1, они также могут иметь абсолютные значения больше чем 1, например, в случае сильно не совпадающих по фазе компонентов в L и R, то есть, когда корреляция между L и R является отрицательной.
В данный момент текущей проблемой является разработка метода квантования параметров a, b для передачи в качестве дополнительной информации в системе параметрического стереофонического/пространственного кодирования. Простым и непосредственным подходом известного уровня техники является использование равномерного квантования и независимое квантование а и b, т.е. с использованием двух скалярных квантователей. Типичный размер шага квантования дельта = 0,1 для точного или дельта = 0,2 для грубого квантования. На нижних левой и правой панелях фиг. 5 показаны точки на плоскости (а, b), которые могут быть представлены посредством такой схемы квантования для точного и грубого квантования. Как правило, квантованные параметры а и b независимо энтропийно кодируются с использованием временного дифференциального или частотного дифференциального кодирования в сочетании с кодированием методом Хаффмана.
Тем не менее к текущему моменту авторы изобретения установили, что эффективность (в смысле уровня искажений) параметра квантования может быть улучшена касаемо такого скалярного квантования посредством принятия во внимание аспектов, относящиеся к восприятию. В частности, чувствительность человеческой слуховой системы к малым изменениям значений параметров (как погрешность, вносимая квантованием) зависит от положения на плоскости (а, b). Эксперименты по восприятию, исследующие слышимость таких небольших изменений или "еле заметных отличий" (JND) показывают, что JND для а и b существенно меньше для источников звука с воспринимаемым стереофоническим образом, который представлен в точках (1, 0) и (-1, 0) на плоскости (а, b). Следовательно, равномерное квантование а и b может быть слишком грубым (со слышимыми артефактами) для областей, близких к (1, 0) и (-1, 0) и излишне точным (из-за излишне высокой битовой скорости передачи дополнительной информации) в других областях, таких как вблизи (0, 0) и (0, 1). Конечно, возможно учесть вектор квантования для (а, b) для достижения совместного и неравномерного квантования стереофонических параметров а и b. Тем не менее векторное квантования является вычислительно более сложным, а также (временное или частотно-дифференциальное) энтропийное кодирование должно быть адаптировано, и оно также станет более сложным.
Соответственно, в данной заявке представлена новая схема неравномерного квантования для параметров а и b. Схема неравномерного квантования для а и b применяет позиционно-зависимые JND (как могла бы применять векторное квантование), но она может быть реализована в виде небольшой модификации известного уровня техники равномерного и независимого квантования а и b. Кроме того, известный уровень техники временного или частотного дифференциального энтропийного кодирования также может оставаться практически неизменным. Только книги с кодом Хаффмана должны быть обновлены, чтобы отразить изменения в диапазонах индексов и вероятностях символов.
Полученная схема квантования показана на фиг. 2 и 3, где фиг. 2 соответствует устройству 116 квантования стереофонических параметров кодирующей части 110, а фиг. 3 соответствует устройству 126 деквантования стереофонических параметров декодирующей части 120. Схема квантования стереофонических параметров начинает с применения неравномерного скалярного квантования к параметру а (обозначенному как 104а на фиг. 2) в устройстве квантования Qa (обозначенному как 202 на фиг. 2). Квантованный параметр 106а направляется в мультиплексор 118. Квантованный параметр также деквантуется непосредственно в устройстве деквантования Qa -1 (обозначенном как 204 на фиг. 2) в параметр а'. Так как квантованный параметр 106а деквантуется в а' (обозначенный как 104а' на фиг. 3), в декодирующей части 120, а' также будет идентичен как в кодирующей части 110, так и в декодирующей части 120 системы 100. Затем а' используется для вычисления коэффициента масштабирования s (осуществляется устройством 206 масштабирования), который используется, чтобы выполнить квантование b в зависимости от фактического значения а. Параметр b (обозначенный как 104b на фиг. 2) делится на этот коэффициент масштабирования s (осуществляется устройством 208 вычисления обратной величины и устройством 210 умножения), а затем посылается в другой неравномерной скалярный квантователь Qb (обозначенный как 212 на фиг. 2), из которого передается квантованный параметр 106b. Процесс является частично обратным в устройстве 126 квантования стереофонического параметра, показанном на фиг. 3. Входящие квантованные параметры 106а и 106b деквантуются в устройстве деквантования Qa -1 (обозначенном на фиг. 3 как 304) и Qb -1 (обозначенном на фиг. 3 как 308) в а' (обозначенный как 104а' на фиг. 3) и b', предварительно разделенный на коэффициент масштабирования s в кодирующей части 110. Устройство 306 масштабирования определяет коэффициент масштабирования s на основе деквантованного параметра а' (104а) таким же образом, как устройство 206 масштабирования в кодирующей части 110. Затем коэффициент масштабирования умножается на результат деквантования квантованного параметра 106b в устройстве 310 умножения и получается деквантованный параметр b' (обозначенный 104b' на фиг. 3). Соответственно деквантование а и вычисление коэффициента масштабирования реализуется как в кодирующей части 110, так и в декодирующей части 120, с обеспечением того, что то же самое значение s используется для кодирования и декодирования b.
Неравномерное квантование для а и b основывается на простом неравномерном квантователе для значений в диапазоне от 0 до 1, где размер шага квантования для значений около 1 приблизительно в четыре раза больше, чем размер шага квантования для значений около 0, и где размер шага квантования возрастает со значением параметра. Например, размер шага квантования может возрастать приблизительно линейно с индексом, определяющим соответствующее деквантованное значение. Для квантователя с 8 интервалами (т.е. 9 индексами) могут быть получены следующие значения, когда размер шага квантования является разницей между двумя соседними деквантованными значениями.
Данная таблица является примером схемы квантования, которая может быть использована для устройства деквантования Qb -1 (обозначенного как 308 на фиг. 3). Однако для параметра а должен быть обработан больший диапазон значений. Пример схемы квантования для устройства деквантования Qa -1 (обозначенным как 304 на фиг. 3) может быть просто построен посредством зеркального отображения и конкатенации неравномерных интервалов квантования, показанных в таблице 2 выше, с получением квантователя, который может представлять значения в диапазоне от -2 до 2, где размер шага квантования для значений около -2, 0 и 2 приблизительно в четыре раза больше размера шага квантования для значений около -1 и 1. Полученные значения приведены в таблице 3 ниже.
На фиг. 4 показано значение коэффициента масштабирования в зависимости от а. Это кусочно-линейная функция при s = 1 (т.е. без масштабирования) для а = -1 и а = 1 и при s = 4 (4-кратном грубом квантовании b) для а = -2, а = 0 и а = 2. Следует указать, что функция на фиг. 4 является примером, и что теоретически возможны другие такие функции. Такое же рассуждение применимо к схемам квантования.
Полученное неравномерное квантование а и b показано на верхней левой панели фиг. 5, где каждая точка на плоскости (а, b), которая может быть представлена данным квантователем, отмечена крестом. Около наиболее чувствительных точек (1, 0) и (-1, 0) размер шага квантования как для а, так для b составляет приблизительно 0,06, в то время как он составляет приблизительно 0,2 для а и b около (0, 0). Следовательно, этапы квантования гораздо более адаптированы к JND, чем равномерное скалярное квантование а и b.
Если необходимо грубое квантование, то можно просто удалить каждое второе деквантованное значение неравномерных квантователей, тем самым удвоив размер шага квантования. В таблице 4 показано, что следующие грубые неравномерные квантователи для параметра b и неравномерные квантователи для параметра а получаются аналогично тому, что было показано выше.
Функция масштабирования, показанная на фиг. 4, остается неизменной во время грубого квантования, и полученный грубый квантователь для (а, b) показан на верхней правой панели фиг. 5. Такое грубое квантование может быть необходимым, если система кодирования работает при очень низких целевых битовых скоростях передачи данных, где оно может быть выгодным для использования битов, сохраненных посредством грубого квантования стереофонических параметров, для кодирования вместо понижающего микширования монофонического сигнала М (обозначенного как 103 на фиг. 1).
Различия в эффективности неравномерного и равномерного квантования стереофонических параметров а и b показана на фиг. 6. Различия показаны для точного и грубого квантования. Показаны средние битовые затраты в секунду, соответствующие 11 часам музыки. Из фиг. 6 можно сделать вывод, что битовые затраты для неравномерного квантования существенно ниже, чем для равномерного квантования. Кроме того, можно сделать вывод, что грубое неравномерное квантование снижает битовые затраты в секунду больше, чем грубое равномерное квантование.
В заключение, блок-схема примерного варианта осуществления системы 700 параметрического многоканального кодирования и декодирования 5-3-5 раскрыта на фиг. 7. Многоканальный сигнал, содержащий левый передний канал 701, левый окружающий канал 702, центральный передний канал 703, правый передний канал 704 и правый окружающий канал 705, получен посредством кодирующей части 710 системы 700. Сигналы левого переднего канала 701 и левого окружающего канала 702 посылаются в качестве входных на первый кодер 712 с "Усовершенствованной связью" (ACPL), генерирующий левое понижающее микширование 706 и стереофонические параметры aL (обозначенные как 708а) и bL (обозначенные как 708b). Аналогичным образом сигналы правого переднего канала 704 и правого окружающего канала 705 посылаются в качестве входных на второй кодер 713 с "Усовершенствованной связью" (ACPL), генерирующий правое понижающее микширование 707 и стереофонические параметры aR (обозначенные как 709а) и bR (обозначенные как 709b). Кроме того, кодирующая часть 710 содержит 3-канальный кодер 714 понижающего микширования, преобразующий сигналы левого понижающего микширования 706, центрального переднего канала 703 и правого понижающего микширования 707 в битовый поток 722, первое устройство 715 квантования стереофонических параметров, генерирующее первый поток квантованных стереофонических параметров 720 на основе стереофонических параметров 708а и 708b, второе устройство 716 квантования стереофонических параметров, генерирующее второй поток квантованных стереофонических параметров 724 на основе стереофонических параметров 709а и 709b, и мультиплексор 730, который генерирует окончательный битовый поток 735, который также включает квантованные стереофонические параметры, которые передаются в декодирующую часть 740. Декодирующая часть 740 содержит демультиплексор 742, который принимает входящий окончательный битовый поток 735 и регенерирует битовый поток 722, первый поток квантованных стереофонических параметров 720 и второй поток квантованных стереофонических параметров 724. Первый поток квантованных стереофонических параметров 720 принимается первым устройством 745 деквантования стереофонических параметров, которое выводит деквантованные стереофонические параметры 708а' и 708b'. Второй поток квантованных стереофонических параметров 724 принимается вторым устройством 746 деквантования стереофонических параметров, которое выводит деквантованные стереофонические параметры 709а' и 709b'. Битовый поток 722 принимается 3-канальным декодером 744 понижающего микширования, который выводит регенерированное левое понижающее микширование 706', восстановленный центральный передний канал 703' и регенерированное правое микширование 707'. Первый декодер 747 ACPL принимает деквантованные стереофонические параметры 708а' и 708b', а также регенерированное левое понижающее микширование 706' и выходные сигналы восстановленного левого переднего канала 701 и восстановленного левого окружающего канала 702'. Аналогичным образом второй декодер 748 ACPL принимает деквантованные стереофонические параметры 709а', 709b' и регенерированное правое понижающее микширование 707' и выходные сигналы восстановленного правого переднего канала 704' и восстановленного правого окружающего канала 705'.
Эквиваленты, дополнения, альтернативы и прочее
Дополнительные варианты осуществления раскрытия будут очевидны. для специалиста в данной области техники после изучения описания, приведенного выше. Несмотря на то, что настоящее описание и графические материалы раскрывают варианты осуществления и примеры, раскрытие не ограничивается данными конкретными примерами. Возможны многочисленные модификации и изменения в пределах объема настоящего раскрытия, определенного прилагаемой формулой изобретения. Любые ссылочные позиции, встречающиеся в формуле изобретения, не должны рассматриваться как ограничивающие ее объем.
Кроме того, после изучения графических материалов, описания и прилагаемой формулы изобретения специалисту могут быть понятными изменения раскрытых вариантов осуществления и могут использоваться им при практической реализации раскрытия. В формуле изобретения слово «содержащий» не исключает другие элементы или этапы, и единственное число не исключает множественное. Сам факт, что некоторые признаки упоминаются во взаимно отличных зависимых пунктах формулы изобретения, не говорит о том, что не может быть использована с выгодой комбинация этих признаков.
Системы и способы, раскрытые выше, могут быть осуществлены в виде программного обеспечения, программно-аппаратного обеспечения, аппаратного обеспечения или их комбинации. При осуществлении в виде аппаратного обеспечения разделение задач между функциональными узлами, о которых говорилось в вышеприведенном описании, не обязательно соответствует разделению на физические узлы; наоборот, один физический компонент может выполнять несколько функций, а одно задание может выполняться несколькими физическими компонентами во взаимодействии. Некоторые компоненты или все компоненты могут быть осуществлены в виде программного обеспечения, выполняемого процессором цифровых сигналов или микропроцессором, или быть осуществлены в виде аппаратного обеспечения или в виде зависимой от приложения интегральной микросхемы. Такое программное обеспечение может распространяться на машиночитаемых носителях, которые могут содержать компьютерные носители данных (или постоянные носители) и средства коммуникации (или временные носители). Как хорошо известно специалисту в области техники, термин «компьютерные носители данных» включает энергозависимые и энергонезависимые, съемные и несъемные носители, реализованные любым способом или технологией для хранения информации, такой как машиночитаемые команды, структуры данных, программные модули или другие данные. Компьютерные носители данных включают, кроме прочего, ОЗУ, ПЗУ, ЭСППЗУ, флеш-память или другую технологию памяти, компакт-диски, компакт-диски формата DVD или другие оптические диски для хранения информации, магнитные кассеты, магнитную ленту, магнитный диск для хранения информации или другие магнитные дисковые устройства хранения информации, или любой другой носитель, который может быть использован для хранения желаемой информации, и который может быть доступным с помощью компьютера. Кроме того, специалисту хорошо известно, что в средствах коммуникации, как правило, выполняются машиночитаемые команды, структуры данных, программные модули или другие данные в виде модулированного сигнала данных, такого как несущая волна или другой механизм переноса, и содержатся любые средства для доставки информации.
Claims (39)
1. Способ в аудиокодере для квантования параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, включающий:
прием по меньшей мере первого параметра и второго параметра для квантования;
квантование первого параметра на основе первой схемы скалярного квантования, имеющей неравномерные размеры шага, для получения квантованного первого параметра, причем неравномерные размеры шага выбирают таким образом, что меньшие размеры шага используют для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используют для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным;
деквантование квантованного первого параметра с использованием первой схемы скалярного квантования для получения деквантованного первого параметра, являющегося приближенным представлением первого параметра;
обращение к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определение коэффициента масштабирования посредством подвергания деквантованного первого параметра действию функции масштабирования; и
квантование второго параметра на основе коэффициента масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения квантованного второго параметра.
2. Способ по п. 1, отличающийся тем, что функция масштабирования является кусочно-линейной функцией.
3. Способ по п. 1, отличающийся тем, что этап квантования второго параметра на основе коэффициента масштабирования и второй схемы скалярного квантования включает деление второго параметра на коэффициент масштабирования до подвергания второго параметра квантованию в соответствии со второй схемой скалярного квантования.
4. Способ по п. 1, отличающийся тем, что неравномерные размеры шага второй схемы скалярного квантования масштабируют коэффициентом масштабирования до квантования второго параметра.
5. Способ по п. 1, отличающийся тем, что неравномерные размеры шага второй схемы скалярного квантования возрастают со значением второго параметра.
6. Способ по п. 1, отличающийся тем, что первая схема скалярного квантования включает больше этапов квантования, чем вторая схема скалярного квантования.
7. Способ по п. 1, отличающийся тем, что первую схему скалярного квантования строят посредством сдвига, зеркального отображения и конкатенации второй схемы скалярного квантования.
8. Способ по любому из предыдущих пунктов, отличающийся тем, что наибольший размер шага первой и/или второй схемы скалярного квантования приблизительно в четыре раза больше наименьшего размера шага первой и/или второй схемы скалярного квантования.
9. Машиночитаемый носитель, содержащий команды машинного кода, предназначенные для выполнения способа по любому из пп. 1-8 при выполнении посредством устройства, имеющего возможность обработки.
10. Аудиокодер для квантования параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, содержащий:
принимающий компонент, выполненный с возможностью приема по меньшей мере первого параметра и второго параметра для квантования;
первый компонент квантования, расположенный ниже по потоку от принимающего компонента, выполненный с возможностью квантования первого параметра на основе первой схемы скалярного квантования, имеющей неравномерные размеры шага, для получения квантованного первого параметра, причем неравномерные размеры шага выбраны таким образом, что меньшие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным;
компонент деквантования, выполненный с возможностью приема первого квантованного параметра от первого компонента квантования и деквантования квантованного первого параметра с использованием первой схемы скалярного квантования для получения деквантованного первого параметра, являющегося приближенным представлением первого параметра;
компонент определения коэффициента масштабирования, выполненный с возможностью приема деквантованного первого параметра, обращения к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определения коэффициента масштабирования посредством подвергания деквантованного первого параметра действию функции масштабирования; и
второй компонент квантования, выполненный с возможностью приема второго параметра и коэффициента масштабирования и квантования второго параметра на основе коэффициента масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения квантованного второго параметра.
11. Способ в аудиодекодере для деквантования квантованных параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, включающий:
прием по меньшей мере первого квантованного параметра и второго квантованного параметра;
деквантование квантованного первого параметра в соответствии с первой схемой скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного первого параметра, причем неравномерные размеры шага выбираются таким образом, что меньшие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным;
обращение к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определение коэффициента масштабирования посредством подвергания деквантованного первого параметра действию функции масштабирования; и
деквантование второго квантованного параметра на основе функции масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного второго параметра.
12. Способ по п. 11, отличающийся тем, что функция масштабирования является кусочно-линейной функцией.
13. Способ по любому из пп. 11 и 12, отличающийся тем, что этап деквантования второго параметра на основе коэффициента масштабирования и второй схемы скалярного квантования включает деквантование второго квантованного параметра в соответствии со второй схемой скалярного квантования и умножение его результата на коэффициент масштабирования.
14. Способ по любому из пп. 11 и 12, отличающийся тем, что неравномерные размеры шага второй схемы скалярного квантования масштабируют коэффициентом масштабирования до деквантования второго квантованного параметра.
15. Способ по п. 12, отличающийся тем, что неравномерный размер шага второй схемы скалярного квантования возрастает с величиной второго параметра.
16. Способ по п. 12, отличающийся тем, что первая схема скалярного квантования включает больше этапов квантования, чем вторая схема скалярного квантования.
17. Способ по п. 12, отличающийся тем, что первую схему скалярного квантования строят посредством сдвига, зеркального отображения и конкатенации второй схемы скалярного квантования.
18. Способ по п. 12, отличающийся тем, что наибольший размер шага первой и/или второй схемы скалярного квантования приблизительно в четыре раза больше наименьшего размера шага первой и/или второй схемы скалярного квантования.
19. Машиночитаемый носитель, содержащий команды машинного кода, предназначенные для выполнения способа по любому из пп. 11-18 при выполнении посредством устройства, имеющего возможность обработки.
20. Аудиодекодер для деквантования квантованных параметров, относящихся к параметрическому пространственному кодированию звуковых сигналов, содержащий:
принимающий компонент, выполненный с возможностью приема по меньшей мере первого квантованного параметра и второго квантованного параметра;
первый компонент деквантования, расположенный ниже по потоку от принимающего компонента и выполненный с возможностью деквантования квантованного первого параметра в соответствии с первой схемой скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного первого параметра, причем неравномерные размеры шага выбираются таким образом, что меньшие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является наиболее чувствительным, а большие размеры шага используются для диапазонов первого параметра, где человеческое восприятие звука является менее чувствительным;
компонент определения коэффициента масштабирования, выполненный с возможностью приема деквантованного первого параметра, обращения к функции масштабирования, которая отображает значения деквантованного первого параметра на коэффициенты масштабирования, которые возрастают с размерами шага, соответствующими значениям деквантованного первого параметра, и определения коэффициента масштабирования посредством подвергания деквантованного первого параметра действию функции масштабирования; и
второй компонент деквантования, выполненный с возможностью приема коэффициента масштабирования и второго квантованного параметра и деквантования второго квантованного параметра на основе коэффициента масштабирования и второй схемы скалярного квантования, имеющей неравномерные размеры шага, для получения деквантованного второго параметра.
21. Система кодирования/декодирования звука, содержащая кодер по п. 10 и аудиодекодер по п. 20, отличающаяся тем, что аудиокодер выполнен с возможностью передачи первого и второго квантованных параметров в аудиодекодер.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201361877166P | 2013-09-12 | 2013-09-12 | |
| US61/877,166 | 2013-09-12 | ||
| PCT/EP2014/069040 WO2015036349A1 (en) | 2013-09-12 | 2014-09-08 | Non-uniform parameter quantization for advanced coupling |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| RU2628898C1 true RU2628898C1 (ru) | 2017-08-22 |
Family
ID=51518765
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2016108327A RU2628898C1 (ru) | 2013-09-12 | 2014-09-08 | Неравномерное квантование параметров для усовершенствованной связи |
Country Status (22)
| Country | Link |
|---|---|
| US (8) | US9672837B2 (ru) |
| EP (2) | EP3321932B1 (ru) |
| JP (1) | JP6201057B2 (ru) |
| KR (1) | KR101777631B1 (ru) |
| CN (1) | CN105531763B (ru) |
| AR (3) | AR097618A1 (ru) |
| AU (1) | AU2014320538B2 (ru) |
| BR (1) | BR112016005192B1 (ru) |
| CA (1) | CA2922256C (ru) |
| CL (1) | CL2016000571A1 (ru) |
| DK (1) | DK3044788T3 (ru) |
| ES (1) | ES2645839T3 (ru) |
| IL (1) | IL244153A (ru) |
| MX (1) | MX356805B (ru) |
| MY (2) | MY204045A (ru) |
| NO (1) | NO2996227T3 (ru) |
| PL (1) | PL3044788T3 (ru) |
| RU (1) | RU2628898C1 (ru) |
| SG (1) | SG11201601144WA (ru) |
| TW (1) | TWI579831B (ru) |
| UA (1) | UA116482C2 (ru) |
| WO (1) | WO2015036349A1 (ru) |
Families Citing this family (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP3067886A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
| AU2017357453B2 (en) | 2016-11-08 | 2021-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain |
| GB2559199A (en) * | 2017-01-31 | 2018-08-01 | Nokia Technologies Oy | Stereo audio signal encoder |
| GB2559200A (en) | 2017-01-31 | 2018-08-01 | Nokia Technologies Oy | Stereo audio signal encoder |
| CN117612542A (zh) | 2017-07-28 | 2024-02-27 | 弗劳恩霍夫应用研究促进协会 | 用于使用宽频带滤波器生成的填充信号对已编码的多声道信号进行编码或解码的装置 |
| CN111316353B (zh) * | 2017-11-10 | 2023-11-17 | 诺基亚技术有限公司 | 确定空间音频参数编码和相关联的解码 |
| US10827173B2 (en) * | 2017-11-13 | 2020-11-03 | Electronics And Telecommunications Research Institute | Method and apparatus for quantization |
| US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
| US10559315B2 (en) | 2018-03-28 | 2020-02-11 | Qualcomm Incorporated | Extended-range coarse-fine quantization for audio coding |
| US10762910B2 (en) | 2018-06-01 | 2020-09-01 | Qualcomm Incorporated | Hierarchical fine quantization for audio coding |
| GB2590651A (en) * | 2019-12-23 | 2021-07-07 | Nokia Technologies Oy | Combining of spatial audio parameters |
| BR112022025109A2 (pt) * | 2020-06-11 | 2022-12-27 | Dolby Laboratories Licensing Corp | Quantização e codificação por entropia de parâmetros para um codec de áudio de baixa latência |
| CN113206673B (zh) * | 2021-05-24 | 2024-04-02 | 上海海事大学 | 用于网络化控制系统信号量化的差分缩放方法及终端 |
Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5621855A (en) * | 1991-02-01 | 1997-04-15 | U.S. Philips Corporation | Subband coding of a digital signal in a stereo intensity mode |
| EP2077551A1 (en) * | 2008-01-04 | 2009-07-08 | Dolby Sweden AB | Audio encoder and decoder |
| RU2376655C2 (ru) * | 2005-04-19 | 2009-12-20 | Коудинг Текнолоджиз Аб | Зависящее от энергии квантование для эффективного кодирования пространственных параметров звука |
| WO2010000313A1 (en) * | 2008-07-01 | 2010-01-07 | Nokia Corporation | Apparatus and method for adjusting spatial cue information of a multichannel audio signal |
| RU2422987C2 (ru) * | 2006-01-20 | 2011-06-27 | Майкрософт Корпорейшн | Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой |
| US8069052B2 (en) * | 2002-09-04 | 2011-11-29 | Microsoft Corporation | Quantization and inverse quantization for audio |
| GB2485979A (en) * | 2010-11-26 | 2012-06-06 | Univ Surrey | Spatial audio coding |
| WO2012141635A1 (en) * | 2011-04-15 | 2012-10-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive gain-shape rate sharing |
| RU2464649C1 (ru) * | 2011-06-01 | 2012-10-20 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ обработки звукового сигнала |
Family Cites Families (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6253165B1 (en) | 1998-06-30 | 2001-06-26 | Microsoft Corporation | System and method for modeling probability distribution functions of transform coefficients of encoded signal |
| SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
| US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
| ES2300567T3 (es) | 2002-04-22 | 2008-06-16 | Koninklijke Philips Electronics N.V. | Representacion parametrica de audio espacial. |
| JP4245606B2 (ja) * | 2003-06-10 | 2009-03-25 | 富士通株式会社 | 音声符号化装置 |
| KR100554680B1 (ko) * | 2003-08-20 | 2006-02-24 | 한국전자통신연구원 | 크기 변화에 강인한 양자화 기반 오디오 워터마킹 장치 및방법 |
| JP4303135B2 (ja) * | 2004-01-09 | 2009-07-29 | 独立行政法人科学技術振興機構 | 歪みあり符号方法及び装置、歪みあり符号化プログラム及び記録媒体 |
| US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
| SE0402650D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
| US7751572B2 (en) | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
| US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
| US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
| WO2009048239A2 (en) | 2007-10-12 | 2009-04-16 | Electronics And Telecommunications Research Institute | Encoding and decoding method using variable subband analysis and apparatus thereof |
| ES3032483T3 (en) | 2008-07-11 | 2025-07-21 | Fraunhofer Ges Forschung | Method for decoding an audio signal and computer program |
| WO2010075895A1 (en) | 2008-12-30 | 2010-07-08 | Nokia Corporation | Parametric audio coding |
| MX2011009660A (es) | 2009-03-17 | 2011-09-30 | Dolby Int Ab | Codificacion estereo avanzada basada en una combinacion de codificacion izquierda/derecha o media/lateral seleccionable de manera adaptable y de codificacion estereo parametrica. |
| CN101673549B (zh) * | 2009-09-28 | 2011-12-14 | 武汉大学 | 一种移动音源空间音频参数预测编解码方法及系统 |
| WO2011073600A1 (fr) | 2009-12-18 | 2011-06-23 | France Telecom | Codage/decodage parametrique stereo avec optimisation du traitement de reduction des canaux |
-
2014
- 2014-08-20 TW TW103128646A patent/TWI579831B/zh active
- 2014-09-08 US US14/916,534 patent/US9672837B2/en active Active
- 2014-09-08 WO PCT/EP2014/069040 patent/WO2015036349A1/en not_active Ceased
- 2014-09-08 MY MYPI2019002184A patent/MY204045A/en unknown
- 2014-09-08 EP EP17185212.2A patent/EP3321932B1/en active Active
- 2014-09-08 JP JP2016541900A patent/JP6201057B2/ja active Active
- 2014-09-08 CA CA2922256A patent/CA2922256C/en active Active
- 2014-09-08 KR KR1020167006488A patent/KR101777631B1/ko active Active
- 2014-09-08 DK DK14761831.8T patent/DK3044788T3/da active
- 2014-09-08 ES ES14761831.8T patent/ES2645839T3/es active Active
- 2014-09-08 CN CN201480050109.4A patent/CN105531763B/zh active Active
- 2014-09-08 AU AU2014320538A patent/AU2014320538B2/en active Active
- 2014-09-08 PL PL14761831T patent/PL3044788T3/pl unknown
- 2014-09-08 SG SG11201601144WA patent/SG11201601144WA/en unknown
- 2014-09-08 EP EP14761831.8A patent/EP3044788B1/en active Active
- 2014-09-08 RU RU2016108327A patent/RU2628898C1/ru active
- 2014-09-08 UA UAA201602283A patent/UA116482C2/uk unknown
- 2014-09-08 MX MX2016002793A patent/MX356805B/es active IP Right Grant
- 2014-09-08 MY MYPI2016700684A patent/MY187124A/en unknown
- 2014-09-08 BR BR112016005192-0A patent/BR112016005192B1/pt active IP Right Grant
- 2014-09-10 AR ARP140103377A patent/AR097618A1/es active IP Right Grant
-
2015
- 2015-08-19 NO NO15181552A patent/NO2996227T3/no unknown
-
2016
- 2016-02-16 IL IL244153A patent/IL244153A/en active IP Right Grant
- 2016-03-10 CL CL2016000571A patent/CL2016000571A1/es unknown
-
2017
- 2017-05-02 US US15/584,534 patent/US10057808B2/en active Active
-
2018
- 2018-08-10 US US16/101,220 patent/US10383003B2/en active Active
-
2019
- 2019-06-27 US US16/454,649 patent/US10694424B2/en active Active
- 2019-07-19 AR ARP190102045A patent/AR115819A2/es active IP Right Grant
- 2019-07-19 AR ARP190102046A patent/AR115820A2/es active IP Right Grant
-
2020
- 2020-06-19 US US16/905,920 patent/US11297533B2/en active Active
-
2022
- 2022-04-01 US US17/711,191 patent/US11838798B2/en active Active
-
2023
- 2023-11-06 US US18/503,083 patent/US12213004B2/en active Active
-
2025
- 2025-01-16 US US19/023,373 patent/US20250261039A1/en active Pending
Patent Citations (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5621855A (en) * | 1991-02-01 | 1997-04-15 | U.S. Philips Corporation | Subband coding of a digital signal in a stereo intensity mode |
| US8069052B2 (en) * | 2002-09-04 | 2011-11-29 | Microsoft Corporation | Quantization and inverse quantization for audio |
| RU2376655C2 (ru) * | 2005-04-19 | 2009-12-20 | Коудинг Текнолоджиз Аб | Зависящее от энергии квантование для эффективного кодирования пространственных параметров звука |
| US8054981B2 (en) * | 2005-04-19 | 2011-11-08 | Coding Technologies Ab | Energy dependent quantization for efficient coding of spatial audio parameters |
| RU2422987C2 (ru) * | 2006-01-20 | 2011-06-27 | Майкрософт Корпорейшн | Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой |
| EP2077551A1 (en) * | 2008-01-04 | 2009-07-08 | Dolby Sweden AB | Audio encoder and decoder |
| WO2010000313A1 (en) * | 2008-07-01 | 2010-01-07 | Nokia Corporation | Apparatus and method for adjusting spatial cue information of a multichannel audio signal |
| GB2485979A (en) * | 2010-11-26 | 2012-06-06 | Univ Surrey | Spatial audio coding |
| WO2012141635A1 (en) * | 2011-04-15 | 2012-10-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive gain-shape rate sharing |
| RU2464649C1 (ru) * | 2011-06-01 | 2012-10-20 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ обработки звукового сигнала |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| RU2628898C1 (ru) | Неравномерное квантование параметров для усовершенствованной связи | |
| US10290304B2 (en) | Reconstruction of audio scenes from a downmix | |
| EP2261897A1 (en) | Quantization and inverse quantization for audio | |
| US20080252510A1 (en) | Method and Apparatus for Encoding/Decoding Multi-Channel Audio Signal | |
| JP2015506653A (ja) | オーディオ処理 | |
| JP2016522445A (ja) | オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ | |
| WO2024194493A1 (en) | Joint stereo coding in complex-valued filter bank domain | |
| HK1247432B (en) | Non-uniform parameter quantization for advanced coupling | |
| HK1220037B (en) | Non-uniform parameter quantization for advanced coupling |