[go: up one dir, main page]

RU2368018C2 - Кодирование аудиосигнала с низкой скоростью передачи битов - Google Patents

Кодирование аудиосигнала с низкой скоростью передачи битов Download PDF

Info

Publication number
RU2368018C2
RU2368018C2 RU2006105017/09A RU2006105017A RU2368018C2 RU 2368018 C2 RU2368018 C2 RU 2368018C2 RU 2006105017/09 A RU2006105017/09 A RU 2006105017/09A RU 2006105017 A RU2006105017 A RU 2006105017A RU 2368018 C2 RU2368018 C2 RU 2368018C2
Authority
RU
Russia
Prior art keywords
sinusoidal
phase
value
frequency
codes
Prior art date
Application number
RU2006105017/09A
Other languages
English (en)
Other versions
RU2006105017A (ru
Inventor
Андреас Й. ГЕРРИТС (NL)
Андреас Й. ГЕРРИТС
БРИНКЕР Альбертус С. ДЕН (NL)
БРИНКЕР Альбертус С. ДЕН
Original Assignee
Конинклейке Филипс Электроникс Н.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Конинклейке Филипс Электроникс Н.В. filed Critical Конинклейке Филипс Электроникс Н.В.
Publication of RU2006105017A publication Critical patent/RU2006105017A/ru
Application granted granted Critical
Publication of RU2368018C2 publication Critical patent/RU2368018C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к кодированию и декодированию широкополосных сигналов, таких как отдельные аудиосигналы. В аудиокодере оценивают количество синусоид на один аудиосегмент. Синусоиду представляют частотой, амплитудой и фазой. Обычно фазу квантуют независимо от частоты. В изобретении частота используется независимо от квантования фазы, и, в частности, низкие частоты квантуют с использованием меньших интервалов квантования, чем более высокие частоты. Таким образом, развернутые фазы более низких частот квантуют более точно, возможно с меньшим диапазоном квантования, чем фазы более высоких частот. Технический результат - значительно повышается качество декодированного сигнала, особенно для квантователей с низкой скоростью передачи битов. 5 н. и 12 з.п. ф-лы, 3 табл., 9 ил.

Description

Область техники, к которой относится изобретение
Настоящее изобретение относится к кодированию и декодированию широкополосных сигналов, таких как отдельные аудиосигналы.
Уровень техники
При передаче широкополосных сигналов, например аудиосигналов, таких как речь, для уменьшения полосы пропускания или скорости передачи битов сигнала используют способы сжатия или кодирования.
На фиг.1 показана известная схема параметрического кодирования, а именно синусоидальный кодер, который используется в настоящем изобретении и который описан в WO 01/69593. В этом кодере входной аудиосигнал x(t) разделен на несколько временных сегментов или кадров (возможно перекрывающихся), причем длительность каждого из них обычно составляет 20 мс. Каждый сегмент раскладывается на переходную, синусоидальную и шумовую компоненты. Также можно извлечь другие компоненты входного аудиосигнала, такие как гармонические комплексные составляющие, хотя они не имеют отношения к целям настоящего изобретения.
В синусоидальном анализаторе 130 сигнал х2 для каждого сегмента моделируется с использованием нескольких синусоид, представленных амплитудой, частотой и фазой. Эту информацию обычно выделяют на временном интервале анализа в результате выполнения преобразования Фурье (FT), которое обеспечивает спектральное представление интервала, включающее: частоты, амплитуды для каждой частоты и фазы для каждой частоты, где каждая фаза «свернута», то есть лежит в диапазоне {-π;π}. Как только получена оценка синусоидальной информации для сегмента, инициируется алгоритм слежения. Этот алгоритм использует функцию стоимости для связывания друг с другом синусоид в различных сегментах на посегментной основе для получения так называемых «дорожек». Таким образом, алгоритм слежения приводит к созданию синусоидальных кодов СS, содержащихся в синусоидальной дорожке, которые начинаются с определенного момента времени, существуют в течение некоторого времени на множестве временных сегментов, а затем прекращаются.
При таком синусоидальном кодировании информация о частоте обычно передается применительно к дорожкам, сформированным в кодере. Это можно сделать достаточно просто и с относительно низкими затратами, поскольку дорожки содержат только медленно изменяющуюся частоту. Следовательно, информацию о частоте можно эффективно передавать посредством временного дифференциального кодирования. В общем случае дифференциальное кодирование во времени можно также использовать и для амплитуды.
В отличие от частоты фаза быстрее изменяется во времени. Если частота постоянна, то фаза изменяется во времени линейно, а изменения частоты приведут к соответствующим отклонениям изменения фазы от линейного закона. Изменение фазы в функции индекса сегмента дорожки будет носить приблизительно линейный характер. Следовательно, передача кодированной фазы является более сложной задачей. Однако при передаче фаза ограничена диапазоном {-π;π}, то есть фаза «свернута», как это представлено в преобразовании Фурье. Из-за представления фазы по модулю 2π теряется структурное межкадровое соотношение для фазы, и, на первый взгляд, она ведет себя как случайная переменная.
Однако, поскольку фаза является интегралом частоты, она является избыточной, и, в принципе, в ее передаче нет необходимости. Это обстоятельство носит название «продолжение фазы», при этом оно значительно уменьшает скорость передачи битов.
При продолжении фазы для сохранения скорости передачи битов передается только первая синусоида каждой дорожки. Каждую последующую фазу вычисляют из начальной фазы и частот дорожки. Поскольку частоты квантуют и их оценки не всегда отличаются высокой точностью, непрерывное значение фазы будет отклоняться от измеренного значения. Эксперименты показывают, что продолжение фазы снижает качество аудиосигнала.
Передача фазы для каждой синусоиды повышает качество декодированного сигнала на приемной стороне, но это также приводит к значительному увеличению скорости передачи битов/полосы пропускания. Таким образом, объединенный квантователь частоты/фазы, в котором измеренные фазы синусоидальной дорожки, имеющие значения от -π до π, разворачиваются с использованием измеренных частот и информации для связывания, выдает развернутые фазы, монотонно возрастающие вдоль дорожки. В таком кодере развернутые фазы квантуют, используя квантователь с адаптивной дифференциальной импульсно-кодовой модуляцией (ADPCM), и передают в декодер. Декодер извлекает частоты и фазы синусоидальной дорожки из траектории развернутой фазы.
При продолжении фазы передается только кодированная частота, а фаза восстанавливается в декодере из данных о частоте путем использования интегрального соотношения между фазой и частотой. Однако известно, что при использовании продолжения фазы фаза не может быть восстановлена совершенным образом. При появлении ошибок по частоте, например, из-за ошибок измерения частоты или из-за шума квантования, фаза, восстанавливаемая с использованием интегрального соотношения, обычно содержит ошибку, которая носит дрейфовый характер. Это происходит потому, что ошибки по частоте имеют приблизительно случайный характер. Низкочастотные ошибки усиливаются в результате интегрирования, и, следовательно, восстановленная фаза будет иметь тенденцию дрейфа от действительного измеренного значения. Это приводит к акустическим искажениям.
Это показано на фиг.2а, где Ω и ψ являются соответственно реальной частотой и реальной фазой для дорожки. Как в кодере, так и в декодере частота и фаза связаны интегральным соотношением, представленным символом «I». Процесс квантования в кодере моделируется в виде добавленного шума n. Таким образом, в декодере восстановленная фаза
Figure 00000001
включает в себя две компоненты: реальную фазу ψ и шумовую компоненту ε2, причем спектр восстановленной фазы и функция спектральной плотности мощности шума ε2 имеют явно выраженный низкочастотный характер.
Таким образом, очевидно, что при продолжении фазы, поскольку восстановленная фаза является интегралом низкочастотного сигнала, восстановленная фаза сама является низкочастотным сигналом. Однако шум, наведенный в процессе восстановления, также доминирует в низкочастотном диапазоне. Следовательно, будет трудно разделить эти источники с точки зрения фильтрации шума n, наведенного во время кодирования.
В стандартных способах квантования частота и фаза квантуются независимо друг от друга. В общем случае для параметра фазы используется равномерный скалярный квантователь. Учитывая особенности восприятия, низкие частоты следует квантовать более точно, чем высокие частоты. Поэтому частоты преобразуются с получением неоднородного представления путем использования ERB или функции Bark, а затем их равномерно квантуют, в результате чего получается однородный квантователь. Также, исходя из физических представлений, можно прийти к следующему выводу: в гармонических комплексных составляющих более высокие гармонические частоты склонны к большим вариациям частоты, чем более низкие частоты.
При совместном квантовании частоты и фазы точность квантования зависит от частоты опосредованно. Использование подхода на основе равномерного квантования приводит к низкокачественному восстановлению звука. Кроме того, что касается высоких частот, для которых точность квантования может быть снижена, можно разработать квантователь, для которого потребуется меньше битов. Аналогичный механизм желательно иметь для развернутых фаз.
Раскрытие изобретения
Изобретение обеспечивает способ кодирования широкополосного сигнала, в частности аудиосигнала, такого как речевой сигнал, использующий низкую скорость передачи битов. В синусоидальном кодере количество синусоид оценивается на один аудиосегмент. Синусоиду представляют частотой, амплитудой и фазой. Обычно фазу квантуют независимо от частоты. В изобретении используется квантование фазы, не зависящее от частоты, и, в частности, низкие частоты квантуют, используя меньшие интервалы квантования, чем для более высоких частот. Таким образом, развернутые фазы более низких частот квантуются более точно, возможно при меньшем диапазоне квантования, чем фазы более высоких частот. Изобретение обеспечивает значительное повышение качества декодированного сигнала, особенно для квантователей с низкой скоростью передачи битов.
Изобретение позволяет использовать совместное квантование частоты и фазы при неравномерном квантовании частоты. Это дает преимущество при передаче информации о фазе с низкой скоростью передачи битов, при поддержании высокой точности для фазы и хорошего качества сигнала на всех частотах, в частности на низких частотах.
Преимущество этого способа заключается в повышенной точности для фазы, в частности на более низких частотах, где ошибка по фазе соответствует большей ошибке по времени, чем на более высоких частотах. Это важно, поскольку человеческое ухо чувствительно не только к частоте и фазе, но также к абсолютным временным характеристикам, как в переходных составляющих, при этом способ согласно изобретению обеспечивает повышение качества звука особенно в тех случаях, когда для квантования значений фазы и частоты используют лишь небольшое количество битов. С другой стороны, требуемое качество звука можно получить, используя меньшее количество битов. Поскольку низкие частоты изменяются медленно, диапазон квантования можно больше ограничить, чтобы обеспечить более точное квантование. Кроме того, гораздо быстрее происходит адаптация к более точному квантованию.
Изобретение можно применить в аудиокодере, где используются синусоиды. Изобретение относится как к кодеру, так и к декодеру.
Краткое описание чертежей
Фиг.1 - известный аудиокодер, в котором реализуется вариант изобретения;
Фиг.2а - взаимосвязь между фазой и частотой в известных системах;
Фиг.2b - взаимосвязь между фазой и частотой в аудиосистемах согласно настоящему изобретению;
Фиг.3а и 3b - предпочтительный вариант компоненты синусоидального кодера в аудиокодере по фиг.1;
Фиг.4 - аудиоплеер, в котором реализован вариант изобретения;
Фиг.5а и 5b - предпочтительный вариант компоненты синусоидального синтезатора в аудиоплеере по фиг.4; и
Фиг.6 - система, содержащая аудиокодер и аудиоплеер согласно изобретению.
Осуществление изобретения
Далее описываются предпочтительные варианты изобретения со ссылками на сопроводительные чертежи, где одинаковым ссылочным позициям соответствуют одинаковые компоненты и, если не указано иное, они выполняют аналогичные функции. В предпочтительном варианте настоящего изобретения кодер 1 является синусоидальным кодером того типа, который описан в WO 01/69593, фиг.1. Функционирование этого известного кодера и соответствующего декодера раскрыто во всех подробностях, в связи с чем описание их работы приводится здесь только тогда, когда это уместно с точки зрения настоящего изобретения.
Как в известной системе, так и в предпочтительном варианте настоящего изобретения аудиокодер 1 дискретизирует входной аудиосигнал с определенной частотой дискретизации, в результате чего получают цифровое представление x(t) аудиосигнала. Затем кодер 1 разделяет дискретизированный входной сигнал на три компоненты: переходные компоненты сигнала, установившиеся детерминированные компоненты и установившиеся стохастические компоненты. Аудиокодер 1 содержит кодер 11 переходных компонент, синусоидальный кодер 13 и шумовой кодер 14.
Кодер 11 переходных компонент содержит детектор (TD) 110 переходных компонент, анализатор (TA) 11 переходных компонент и синтезатор (TS) 112 переходных компонент. Сначала сигнал x(t) поступает на вход детектора 110 переходных компонент. Этот детектор 110 оценивает, имеется ли переходная компонента сигнала, а также ее положение. Эта информация подается в анализатор 111 переходных компонент. Если положение переходной компоненты сигнала определено, то анализатор 111 переходных компонент пытается выделить основную часть переходной компоненты сигнала. Он сопоставляет функцию формы с сигнальным сегментом, начиная предпочтительно с оцененного начального положения, и определяет контент в зависимости от функции формы, используя, например, некоторое (небольшое) количество синусоидальных компонент. Эта информация содержится в коде СT переходной составляющей, причем более подробная информация о создании кода СТ переходной составляющей приведена в WO 01/69593.
Код СT переходной составляющей подается в синтезатор 112 переходных компонент. Синтезированная переходная компонента сигнала вычитается в вычитателе 16 из входного сигнала x(t), в результате чего получается сигнал х1. Для получения х2 из х1 используется механизм GC (12) управления усилением.
Сигнал х2 подается в синусоидальный кодер 13, где он анализируется в синусоидальном анализаторе (SA) 130, который определяет (детерминированные) синусоидальные компоненты. Таким образом понятно, что, хотя наличие анализатора переходных компонент желательно, это не является обязательным, и изобретение можно реализовать без указанного анализатора. В альтернативном варианте, как упоминалось выше, изобретение также можно реализовать, например, с анализатором комплексных гармоник. Короче говоря, синусоидальный кодер кодирует входной сигнал х2 в виде дорожек синусоидальных компонент, связывающих один кадровый сегмент со следующим.
Обратимся теперь к фиг.3а, где так же, как и в известном уровне техники, каждый сегмент входного сигнала х2 в предпочтительном варианте изобретения преобразуется в частотную область в блоке 40 преобразования Фурье (FT). Для каждого сегмента блок FT выдает измеренные значения амплитуды А, фазы ϕ и частоты ω. Как упоминалось ранее, диапазон фаз, обеспечиваемых преобразованием Фурье, ограничивается неравенством
Figure 00000002
Блок 42 алгоритма слежения (ТА) берет информацию для каждого сегмента и, используя подходящую функцию стоимости, связывает синусоиды из одного сегмента с синусоидами следующего сегмента, в результате чего создается последовательность измеренных фаз φ(k) и частот ω(k) для каждой дорожки.
В отличие от известного уровня техники, синусоидальные коды СS, созданные, в конце концов, анализатором 130, включают в себя информацию о фазе, и из этой информации в декодере восстанавливается частота.
Однако, как упоминалось выше, измеренная фаза свернута, что означает, что она сведена к представлению по модулю 2π. Таким образом, в предпочтительном варианте анализатор содержит блок 44 развертывания фазы (PU), где представление фазы по модулю 2π разворачивается, чтобы показать структурное поведение фазы ψ от кадра к кадру для одной дорожки. Так как частота в синусоидальных дорожках практически постоянна, очевидно, что развернутая фаза ψ, как правило, будет представлять собой практически линейную возрастающую (или убывающую) функцию, что удешевляет передачу фазы, то есть возможна передача с низкой скоростью передачи битов. Развернутая фаза ψ подается в качестве входного сигнала в фазовый кодер (PE) 46, который выдает выходные квантованные уровни r представления, подходящие для передачи.
Обратимся теперь к работе блока 44 разворачивания фазы, упомянутого выше, где непрерывная фаза ψ и мгновенная частота Ω для дорожки связаны соотношением:
Figure 00000003
(1)
где Т0 - опорный момент времени.
Синусоидальная дорожка в кадрах k=K, K+1…, K+L-1 имеет измеренные частоты ω(k) (выраженные в радианах в секунду) и измеренные фазы ϕ(k) (выраженные в радианах). Расстояние между центрами кадров задается величиной U (скорость обновления, выраженная в секундах). Предполагается, что измеренные частоты представляют собой предполагаемые отсчеты основной частоты Ω дорожки в непрерывном времени, причем ω(k)=Ω(kU), и аналогичным образом измеренные фазы представляют собой отсчеты соответствующей фазы ψ дорожки в непрерывном времени, причем φ(k)=ψ(kU)mod(2π). Для синусоидального кодирования предполагается, что Ω является приблизительно постоянной функцией.
Если допустить, что частоты в сегменте практически постоянны, то уравнение 1 можно аппроксимировать следующим образом:
Figure 00000004
(2)
Таким образом очевидно, что, зная фазу и частоту для данного сегмента и частоту следующего сегмента, можно оценить значение развернутой фазы для следующего сегмента и далее для каждого сегмента дорожки.
В предпочтительном варианте блок разворачивания фазы определяет коэффициент разворачивания m(k) в момент времени k:
Figure 00000005
(3)
Коэффициент разворачивания m(k) указывает блоку 44 разворачивания фазы количество циклов, которое следует добавить, чтобы получить развернутую фазу.
Используя совместно уравнения 2 и 3, блок разворачивания фазы определяет значение коэффициента пошагового разворачивания e(k) следующим образом:
Figure 00000006
где е должно быть целым числом. Однако из-за ошибок измерения и моделирования коэффициент пошагового разворачивания не будет в точности целым, а именно:
Figure 00000007
в предположении, что ошибки моделирования и измерений малы.
Если имеется коэффициент е пошагового разворачивания, то m(k) из уравнения (3) вычисляют как кумулятивную сумму, где без потери общности блок разворачивания фазы начинает работу с первого кадра K при m(K)=0, и из m(k) и ϕ(k) определяют (развернутую) фазу ψ(kU).
На практике дискретизированные данные ψ(kU) и Ω(kU) искажаются ошибками измерения:
Figure 00000008
Figure 00000009
где ε1 и ε2 - ошибки фазы и частоты соответственно. Для предотвращения неоднозначности в определении коэффициента разворачивания данные измерений необходимо определять с достаточной точностью. Таким образом, в предпочтительном варианте слежение ограничивается таким образом, чтобы:
Figure 00000010
где δ - ошибка при операции округления. Ошибка δ определяется главным образом ошибками в ω из-за умножения на U. Положим, что ω определяется из максимума абсолютного значения преобразования Фурье исходя из дискретизированной версии входного сигнала с частотой дискретизации FS, и что разрешение преобразования Фурье составляет 2π/La при длине анализа La. Исходя из необходимости удовлетворения рассмотренного ограничения, имеем:
Figure 00000011
Это означает, что длина анализа должна быть в несколько раз больше длины обновления, чтобы разворачивание фазы было точным; например, если установить δ0=1/4, то длина анализа должна быть в четыре раза больше длины обновления (если пренебречь ошибками ε1 при измерении фазы).
Второе, о чем следует помнить, чтобы избежать ошибок при операции округления, это то, что дорожки определяются приблизительно. В блоке 42 слежения синусоидальные дорожки обычно определяются путем рассмотрения приращений амплитуд и частот. Вдобавок, можно также учесть информацию о фазе в критерии связывания. Например, можно определить ошибку ε прогнозирования фазы как разность между измеренным значением и прогнозируемым значением
Figure 00000012
согласно выражению
Figure 00000013
где прогнозируемое значение может быть получено как
Figure 00000014
Таким образом, целесообразно, чтобы блок 42 слежения запрещал дорожки, для которых ε превышает некоторое значение (например, ε>π/2), что приводит к однозначному определению e(k).
Вдобавок кодер может вычислять фазы и частоты, которые будут доступны в декодере. Если фазы или частоты, которые будут доступны декодеру, слишком сильно отличаются от фаз и/или частот, которые имеются в кодере, может быть принято решение прервать дорожку, то есть сигнализировать о конце дорожки и начать новую дорожку, используя текущие частоту и фазу и связанные с ними синусоидальные данные.
Дискретизированная развернутая фаза ψ(kU), созданная блоком 44 разворачивания фазы (PU), является входным сигналом для кодера (PE) 46 фазы для создания набора уровней r представления. Известны способы эффективной передачи обычно монотонно изменяющейся характеристики, такой как развернутая фаза. В предпочтительном варианте, показанном на фиг.3b, используется адаптивная дифференциальная импульсно-кодовая модуляция (ADPCM). Здесь блок (PF) 48 прогнозирования используется для оценки фазы следующего сегмента дорожки и кодирования только приращения в квантователе (Q) 50. Поскольку предполагается, что ψ является практически линейной функцией, а также в целях упрощения, блок 48 прогнозирования выбран в виде фильтра второго порядка:
y(k+1)=2x(k)-x(k-1),
где х - входной сигнал, а y - выходной сигнал. Однако очевидно, что можно применить также другие функциональные соотношения (в том числе соотношения более высокого порядка), а также ввести (обратную или прямую) адаптацию коэффициентов фильтра. В предпочтительном варианте для упрощения управления квантователем 50 используют механизм 52 управления с обратной адаптацией (QC). Также возможно прямое адаптивное управление, но для этого потребуются дополнительные издержки на увеличение скорости передачи битов.
Очевидно, что инициализация кодера (и декодера) для дорожки начинается с обработки сведений о начальной фазе ϕ(0) и частоте ω(0). Они квантуются и передаются посредством отдельного механизма. Вдобавок, передается шаг начального квантования, используемый в контроллере 52 квантования для кодера и соответствующем контроллере 62 в декодере (см. фиг.5b), либо он устанавливается равным определенному значению, как в кодере, так и в декодере. Наконец, сигнализация о конце дорожки может быть передана в отдельном побочном потоке или в виде уникального символа в потоке битов фаз.
Начальная частота развернутой фазы известна как в кодере, так и в декодере. На основе этой частоты выбирают точность квантования. Для траекторий развернутой фазы, начинающихся с низкой частоты, выбирают более точную координатную сетку квантования, то есть более высокое разрешение, чем для траектории развернутой фазы, начинающейся с более высокой частоты.
В квантователе ADPCM исходя из предыдущих фаз на дорожке прогнозируется/оценивается развернутая фаза ψ(k), где k представляет индекс на дорожке. Затем квантуются и передаются разность между прогнозируемой фазой
Figure 00000015
и развернутой фазой ψ(k). Квантователь адаптируется для каждой развернутой фазы на дорожке. Когда ошибка прогнозирования мала, квантователь ограничивает диапазон возможных значений, и квантование может оказаться более точным. С другой стороны, когда ошибка прогнозирования велика, квантователь использует более грубое квантование.
Квантователь Q (на фиг.3b) квантует ошибку прогнозирования Δ, которая вычисляется как
Figure 00000016
Ошибку прогнозирования Δ можно квантовать, используя справочную таблицу. Для этой цели поддерживается таблица Q. Например, для 2-битового квантователя ADPCM начальная таблица для Q может выглядеть, как Таблица 1.
Таблица 1: Таблица квантования Q, используемая для первого продолжения
Индекс i Нижние границы bl Верхняя граница bu
0 -∞ -3,0
1 -3,0 0
2 0 3,0
3 3,0
Квантование выполняется следующим образом. Ошибку прогнозирования Δ сравнивают с границами b, так чтобы удовлетворялось следующее неравенство:
bli<Δ≤bui.
Исходя из значения i, удовлетворяющего вышеуказанному соотношению, вычисляют уровень r представления, полагая r=i.
Соответствующие уровни представления запоминают в таблице R представления, показанной в виде Таблицы 2.
Таблица 2: Таблица представления R, используемая для первого продолжения
Уровень представления r Таблица представления R Тип уровня
0 -3,0 Внешний уровень
1 -0,75 Внутренний уровень
2 0,75 Внутренний уровень
3 3,0 Внешний уровень
Записи в Таблицах Q умножаются на коэффициент с для квантования следующей синусоидальной компоненты на дорожке.
Q(k+1)=Q(k)·c,
R(k+1)=R(k)·c.
Во время декодирования дорожки обе таблицы масштабируют в соответствии с созданными уровнями r представления. Если r равен 1 или 2 (внутренний уровень) для текущего субкадра, то тогда коэффициент с масштабирования для таблицы квантования устанавливается равным
с=2-1/4.
Поскольку с<1, частота и фаза следующей синусоиды на дорожке становится более точной. Если r равен 0 или 3 (внешний уровень), то коэффициент масштабирования устанавливается равным
с=21/2.
Поскольку с>1, точность квантования для следующей синусоиды на дорожке уменьшается. Используя эти коэффициенты, можно выполнить одно увеличение масштаба с последующим его аннулированием на двух шагах уменьшения масштаба. Отличие в коэффициентах увеличения и уменьшения масштаба дает быстрое увеличение масштаба, в то время как соответствующее уменьшение масштаба потребует двух шагов.
Для того чтобы избежать очень маленьких или очень больших записей в таблице квантования, адаптация выполняется только в том случае, если абсолютное значение внутреннего уровня находится между π/64 и 3/4π. В этом случае с устанавливают равным 1.
В декодере для преобразования полученных уровней r представления в квантованную ошибку прогнозирования должна поддерживаться только таблица R. Эта операция обратного квантования выполняется блоком DQ на фиг.5b.
При использовании вышеуказанных установок качество восстановленного звука нуждается в улучшении. Согласно изобретению для дорожек развернутой фазы в зависимости от начальной частоты используют разные начальные таблицы. Этим достигается более высокое качество звука. Выполняется это следующим образом. Начальные таблицы Q и R масштабируют на основе первой частоты дорожки. В Таблице 3 даны масштабные коэффициенты вместе с диапазонами частот. Если первая частота дорожки лежит в конкретном частотном диапазоне, то выбирается соответствующий масштабный коэффициент, а таблицы R и Q делятся на этот масштабный коэффициент. Конечные точки могут также зависеть от первой частоты дорожки. В декодере для того, чтобы начать с правильной начальной таблицы R, выполняется соответствующая процедура.
Таблица 3: Масштабные коэффициенты, зависящие от частоты, и начальные таблицы
Диапазон частот Масштабный коэффициент Начальная таблица Q Начальная таблица R
0-500 Гц 8 -∞ -0,19 0 0,19 ∞ -0,38 -0,09 0,09 0,38
500-1000 Гц 4 -∞ -0,37 0 0,37 ∞ -0,75 -0,19 0,19 0,75
1000-4000 Гц 2 -∞ -0,75 0 0,75 ∞ -1,5, -0,38 0,38 1,5
4000-22050 Гц 1 -∞ -1,5 0 1,5 ∞ -3 -0,75 0,75 3
В таблице 3 показан пример масштабных коэффициентов, зависящих от частоты, и соответствующих начальных таблиц Q и R для 2-битового квантователя ADPCM. Диапазон звуковых частот 0-22050 Гц делится на четыре частотных поддиапазона. Понятно, что точность фазы возрастает в диапазонах более низких частот по отношению к диапазонам более высоких частот.
Количество частотных поддиапазонов и масштабных коэффициентов, зависящих от частоты, может варьироваться, и его можно выбрать исходя из конкретной цели и предъявляемых требований. Как было описано выше, масштаб начальных таблиц Q и R в таблице 3, зависящих от частоты, можно динамически увеличивать и уменьшать для адаптации к изменениям фазы от одного временного сегмента к следующему.
Например, в 3-битовом квантователе ADPCM начальные границы восьми интервалов квантования, заданных тремя битами, могут быть определены следующим образом: Q={-∞ -1,41 -0,707 -0,35 0 0,35, 0,707 1,41 ∞}, причем минимальный размер координатной сетки может составлять π/64, а максимальный размер координатной сетки π/2.
Таблица представления R может выглядеть следующим образом:
R= {-2,117, -1,0585, -0,5285, -0,1750, 0, 0,1750, 0,5285, 1,0585, 2,117}. В этом случае можно использовать такую же инициализацию в зависимости от частоты, как в таблице Q и К, показанной в Таблице 3.
Исходя из синусоидального кода (CS), созданного синусоидальным кодером, синусоидальный синтезатор (SS) 131 восстанавливает синусоидальную компоненту сигнала таким же образом, как это будет описано для синусоидального синтезатора (SS) 32 декодера. Этот сигнал вычитается в вычитателе 17 из входного сигнала x2 синусоидального кодера 13, в результате чего получают остаточный сигнал х3. Остаточный сигнал х3, созданный синусоидальным кодером 13, поступает в шумовой анализатор 14 предпочтительного варианта изобретения, который создает шумовой код СN, представляющий этот шум, как описано, например, в международной патентной заявке № PCT/EP00/04599.
Наконец, в мультиплексоре 15 образуется аудиопоток АС который включает в себя коды СT, CS и СN. Аудиопоток АС подается, например, в шину данных, антенную систему, запоминающую среду и т.д.
На фиг.4 показан аудиоплеер 3, подходящий для декодирования аудиопотока AS', например, созданного кодером 1 по фиг.1, который получают из шины данных, антенной системы, запоминающей среды и т.д. Аудиопоток AS' демультиплексируется в демультиплексоре 30 для получения кодов СT, CS и СN. Эти коды подаются в синтезатор 31 переходных компонент, синусоидальный синтезатор 32 и шумовой синтезатор 33 соответственно. Исходя из кода СТ в синтезаторе 31 переходных компонент, вычисляют переходные компоненты сигнала. В случае, когда код переходной компоненты указывает функцию формы, вычисляется форма на основе принятых параметров. Далее на основе частот и амплитуд синусоидальных компонент вычисляют контент формы. Если код СТ переходной компоненты указывает шаг, то тогда переходная компонента не вычисляется. Результирующий переходный сигнал yT представляет собой сумму всех переходных компонент.
Синусоидальный код (CS), включающий в себя информацию, закодированную анализатором 130, используется синусоидальным синтезатором 32 для создания сигнала yS. Обратимся теперь к фигурам 5а и b, где синусоидальный синтезатор 32 содержит фазовый декодер (PD) 56, совместимый с фазовым кодером 46. Здесь обратный квантователь (DQ) 60 вместе с прогнозирующим фильтром (PF) 64 второго порядка создает (оценку) развернутую фазу
Figure 00000017
исходя из уровней r представления, начальной информации
Figure 00000018
(0),
Figure 00000019
(0), обеспеченных прогнозирующим фильтром (PF) 64, и начального шага квантования для контроллера (QC) 62 квантования.
Как показано на фиг.2b, частоту можно восстановить из развернутой фазы
Figure 00000020
путем дифференцирования. Положим, что фазовая ошибка в декодере приблизительно представляет собой белый шум, и поскольку дифференцирование усиливает высокие частоты, его можно объединить с фильтрацией нижних частот для уменьшения шума и получения таким образом точной оценки частоты в декодере.
В предпочтительном варианте блок (FR) 58 фильтрации аппроксимирует операцию дифференцирования, которое необходимо для получения частоты
Figure 00000021
из развернутой фазы посредством таких процедур, как вычисление правосторонней, левосторонней и центральной разностей. Это позволяет декодеру создавать (в качестве выходного сигнала) фазы
Figure 00000022
и частоты
Figure 00000023
, которые можно использовать известным образом для синтеза синусоидальной компоненты кодированного сигнала.
В то же время, при синтезе синусоидальных компонент сигнала в шумовой синтезатор NS 33, который является по сути фильтром, имеющим частотную характеристику, аппроксимирующую спектр шума, подают шумовой код СN. Синтезатор NS 33 генерирует восстановленный шум yN путем фильтрации сигнала белого шума с помощью шумового кода СN. Результирующий сигнал y(t) содержит сумму переходного сигнала yT и произведения (g) на сумму синусоидального сигнала yS и шумового сигнала yN. Аудиоплеер содержит два сумматора 36 и 37 для суммирования соответствующих сигналов. Общий сигнал подается в выходной блок 35, представляющий собой, например, динамик.
На фиг.6 показана аудиосистема согласно изобретению, содержащая аудиокодер 1, показанный на фиг.1, и аудиоплеер 3, показанный на фиг.4. Указанная система предлагает функции воспроизведения и записи. Аудиопоток AS подается из аудиокодера в аудиоплеер по каналу 2 связи, который может представлять собой беспроводное соединение, шину 20 данных или носитель данных. В случае, если канал 2 связи представляет собой носитель данных, он может быть неотъемлемой частью системы либо представлять собой съемный диск, карту памяти и т.д. Канал 2 связи может являться частью аудиосистемы, но, однако, чаще всего он находится вне аудиосистемы.
Кодированные данные из нескольких последовательных сегментов связаны между собой. Это выполняется следующим образом. Для каждого сегмента определяется количество синусоид (например, с использованием быстрого преобразования Фурье (FFT)). Синусоида характеризуется частотой, амплитудой и фазой. Количество синусоид меняется от сегмента к сегменту. Как только определены синусоиды для сегмента, выполняется анализ для связывания с синусоидами из предыдущего сегмента. Это называется «связывание» или «слежение». Указанный анализ основан на отличии синусоиды текущего сегмента от всех синусоид предыдущего сегмента. Связывание/слежение выполняется применительно к синусоиде в предшествующем сегменте, который имеет минимальное отличие. Если даже это минимальное отличие больше определенного порогового значения, то соединение с синусоидами предыдущего сегмента не выполняется. Таким путем создается или «рождается» новая синусоида.
Различие между синусоидами определяется с использованием «функции стоимости», которая использует частоту, амплитуду и фазу синусоид. Этот анализ выполняется для каждого сегмента. Результатом является большое количество дорожек для аудиосигнала. «Зарождение» дорожки представляет собой синусоиду, не имеющую соединений с синусоидами из предыдущих сегментов. Зарожденная синусоида кодируется без использования дифференцирования. Синусоиды, которые соединены с синусоидами из предыдущих сегментов, называются продолжениями, и они кодируются не так, как синусоиды из предыдущего сегмента. Это позволяет сэкономить много битов, поскольку кодируются только приращения, а не абсолютные значения.
Если f(n-1) является частотой синусоиды из предыдущего сегмента, а f(n) является подсоединенной синусоидой из текущего сегмента, то тогда в декодер передается приращение f(n)-f(n+1). Число n представляет номер на дорожке: n=1 - «зарождение», n=2 - первое продолжение и т.д. То же самое верно для амплитуд. Передается значение фазы начальной синусоиды (=зарожденная синусоида), в то время как для продолжения фаза не передается, поскольку эта фаза может быть получена на основе значений частоты. Если дорожка не имеет продолжения в следующем сегменте, то она заканчивается или «умирает».

Claims (17)

1. Способ кодирования аудиосигнала, причем способ содержит обеспечение соответствующего набора значений дискретизированного сигнала (x(t)) для каждого из множества последовательных сегментов;
анализ значений дискретизированного сигнала (x(t)) для определения одной или нескольких синусоидальных компонент для каждого из множества последовательных сегментов, причем каждая синусоидальная компонента включает в себя значение частоты (Ω) и значение фазы (ψ);
объединение синусоидальных компонент на множестве последовательных сегментов для обеспечения синусоидальных дорожек;
определение для каждой синусоидальной дорожки в каждом из множества синусоидальных сегментов прогнозируемого значения фазы
Figure 00000024
в функции значения фазы, по меньшей мере, для предыдущего сегмента;
определение для каждой синусоидальной дорожки измеренного значения фазы (ψ), содержащего обычно монотонно изменяющееся значение;
квантование синусоидальных кодов (CS) в функции прогнозируемого значения фазы
Figure 00000025
и измеренного значения фазы (ψ) для сегмента, в котором синусоидальные коды квантованы в зависимости, по меньшей мере, от значения частоты (Ω) соответствующей синусоидальной дорожки; и
кодирование сигнала (AS), включающего в себя синусоидальные коды (CS), представляющие частоту и фазу.
2. Способ по п.1, в котором в первой синусоидальной дорожке, включающей в себя первую синусоидальную компоненту с первым значением частоты, синусоидальные коды (CS) квантуют с использованием первой точности квантования, а во второй синусоидальной дорожке, включающей в себя вторую синусоидальную компоненту со вторым значением частоты, превышающем первое значение частоты, синусоидальные коды (CS) квантуют с использованием второй точности квантования, которая меньше или равна первой точности квантования.
3. Способ по п.1, в котором синусоидальные коды (CS) для дорожки включают в себя начальное значение фазы и начальное значение частоты, и при прогнозировании используют начальное значение частоты и начальное значение фазы для обеспечения первого прогноза.
4. Способ по п.1, в котором значение фазы каждого связанного сегмента определяют в функции интеграла частоты для предыдущего сегмента и частоты связанного сегмента, а также фазы предыдущего сегмента, в котором синусоидальные компоненты включают в себя значение фазы (ψ) в диапазоне {-π;π}.
5. Способ по п.1, в котором квантование синусоидальных кодов включает в себя определение разности фаз между каждым прогнозируемым значением
Figure 00000025
и соответствующим наблюдаемым значением (ψ).
6. Способ по п.4, в котором шаг кодирования содержит управление квантованием в функции квантованных синусоидальных кодов (CS).
7. Способ по п.6, в котором синусоидальные коды (CS) включают в себя индикатор конца дорожки.
8. Способ по п.1, который также содержит
синтез синусоидальных компонент с использованием синусоидальных кодов (CS);
вычитание значений синтезированного сигнала из дискретизированных значений (x(t)) сигнала для обеспечения набора значений (х3), представляющих остаточную компоненту аудиосигнала;
моделирование остаточной компоненты аудиосигнала путем определения параметров, аппроксимирующих остаточную компоненту; и
включение упомянутых параметров в аудиопоток (AS).
9. Способ по п.1, в котором значения (хi) дискретизированного сигнала представляют аудиосигнал, из которого были удалены переходные компоненты.
10. Способ декодирования аудиопотока (AS′), включающего в себя синусоидальные коды (CS), представляющие частоту и фазу и информацию о связывании, причем способ содержит
прием сигнала, включающего в себя аудиопоток (AS′);
деквантование синусоидальных кодов (CS) с получением таким образом значения
Figure 00000026
развернутой деквантованной фазы, где синусоидальные коды
(CS) деквантуют в зависимости, по меньшей мере, от одного значения частоты соответствующей синусоидальной дорожки;
вычисление значения
Figure 00000027
частоты исходя из значений (ψ) деквантованной развернутой фазы; и
использование значений
Figure 00000028
деквантованных частоты и фазы для синтеза синусоидальных компонент аудиосигнала (y(t)).
11. Способ по п.10, в котором в первой синусоидальной дорожке, включающей в себя первую синусоидальную компоненту с первым значением частоты, синусоидальные коды (CS) деквантуют с использованием первой точности квантования, а во второй синусоидальной дорожке, включающей в себя вторую синусоидальную компоненту со вторым значением частоты, превышающем первое значение частоты, синусоидальные коды (CS) деквантуют с использованием второй точности квантования, которая меньше или равна первой точности квантования.
12. Способ по п.10, в котором значение фазы каждой связанной синусоидальной компоненты определяют в функции интеграла частоты для предыдущего сегмента и частоты связанного сегмента, а также фазы предыдущего сегмента, и в котором синусоидальные компоненты включают в себя значение фазы (ψ) в диапазоне {-π;π}.
13. Способ по п.12, в котором управление точностью квантования осуществляют в функции квантованных синусоидальных кодов.
14. Аудиокодер, выполненный для обработки соответствующего набора значений дискретизированного сигнала для каждого из множества последовательных сегментов, причем кодер содержит
анализатор для анализа значений дискретизированного сигнала для определения одной или нескольких синусоидальных компонент для каждого из множества последовательных сегментов, причем каждая синусоидальная компонента включает в себя значение частоты и значение фазы;
блок (13) объединения синусоидальных компонент на всем множестве последовательных сегментов для обеспечения синусоидальных дорожек;
блок (44) разворачивания фазы для определения для каждой синусоидальной дорожки в каждом из множества последовательных сегментов прогнозируемого значения
Figure 00000025
в функции значения фазы, по меньшей мере, для предыдущего сегмента и для определения для каждой синусоидальной дорожки измеренного значения (ψ) фазы, содержащего обычно монотонно изменяющееся значение;
квантователь (50) для квантования синусоидальных кодов в функции прогнозируемого значения
Figure 00000025
фазы и измеренного значения (ψ) фазы для сегмента, где синусоидальные коды квантуют в зависимости, по меньшей мере, от одного значения частоты соответствующей синусоидальной дорожки; и
средство (15) для кодирования аудиосигнала, включающего в себя синусоидальные коды (CS), представляющие частоту и фазу.
15. Аудиокодер по п.14, в котором квантователь (50) адаптируется в первой синусоидальной дорожке, включающей первую синусоидальную компоненту с первым значением частоты, для квантования синусоидальных кодов (CS) с использованием первой точности квантования, и во второй синусоидальной дорожке, включающей в себя вторую синусоидальную компоненту со вторым значением частоты, превышающем первое значение частоты, для квантования синусоидальных кодов (CS) с использованием второй точности квантования, которая меньше или равна первой точности квантования.
16. Аудиоплеер, содержащий
средство для считывания кодированного аудиосигнала, включающего в себя синусоидальные коды, представляющие частоту и фазу для каждой дорожки связанных синусоидальных компонент;
деквантователь синусоидальных кодов (CS) с получением таким образом значения
Figure 00000026
развернутой деквантованной фазы, причем синусоидальные коды
(CS) деквантуют в зависимости, по меньшей мере, от одного значения частоты соответствующей синусоидальной дорожки и вычисление значения
Figure 00000027
частоты исходя из значений (ψ) деквантованной развернутой фазы; и
синтезатор, скомпонованный для использования созданных значений фазы и частоты для синтеза синусоидальных компонент аудиосигнала.
17. Аудиосистема, содержащая аудиокодер по п.14 и аудиоплеер по п.16.
RU2006105017/09A 2003-07-18 2004-07-08 Кодирование аудиосигнала с низкой скоростью передачи битов RU2368018C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03102225.4 2003-07-18
EP03102225 2003-07-18

Publications (2)

Publication Number Publication Date
RU2006105017A RU2006105017A (ru) 2006-06-27
RU2368018C2 true RU2368018C2 (ru) 2009-09-20

Family

ID=34072659

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2006105017/09A RU2368018C2 (ru) 2003-07-18 2004-07-08 Кодирование аудиосигнала с низкой скоростью передачи битов

Country Status (11)

Country Link
US (1) US7640156B2 (ru)
EP (1) EP1649453B1 (ru)
JP (1) JP4782006B2 (ru)
KR (1) KR101058064B1 (ru)
CN (1) CN1826634B (ru)
AT (1) ATE425533T1 (ru)
BR (1) BRPI0412717A (ru)
DE (1) DE602004019928D1 (ru)
ES (1) ES2322264T3 (ru)
RU (1) RU2368018C2 (ru)
WO (1) WO2005008628A1 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2742739C1 (ru) * 2017-11-10 2021-02-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Выбор задержки основного тона
CN116993799A (zh) * 2023-04-17 2023-11-03 中国科学院长春光学精密机械与物理研究所 一种相位展开误差校正方法、系统及终端

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
CN101116136B (zh) * 2005-02-10 2011-05-18 皇家飞利浦电子股份有限公司 声音合成的装置和方法
WO2007004186A2 (en) * 2005-07-06 2007-01-11 Koninklijke Philips Electronics N.V. Parametric multi-channel decoding
DE102006022346B4 (de) 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
KR20080073925A (ko) * 2007-02-07 2008-08-12 삼성전자주식회사 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치
KR101149448B1 (ko) * 2007-02-12 2012-05-25 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법
KR101317269B1 (ko) * 2007-06-07 2013-10-14 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치
KR20090008611A (ko) * 2007-07-18 2009-01-22 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치
KR101410229B1 (ko) 2007-08-20 2014-06-23 삼성전자주식회사 오디오 신호의 연속 정현파 신호 정보를 인코딩하는 방법및 장치와 디코딩 방법 및 장치
KR101425355B1 (ko) * 2007-09-05 2014-08-06 삼성전자주식회사 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법
WO2009059633A1 (en) 2007-11-06 2009-05-14 Nokia Corporation An encoder
KR101325760B1 (ko) * 2009-12-17 2013-11-08 한국전자통신연구원 오디오/음성 신호 처리 장치의 복부호화 장치 및 방법
EP2943953B1 (en) * 2013-01-08 2016-11-16 Dolby International AB Model based prediction in a critically sampled filterbank
KR20160087827A (ko) * 2013-11-22 2016-07-22 퀄컴 인코포레이티드 고대역 코딩에서의 선택적 위상 보상
PL232466B1 (pl) 2015-01-19 2019-06-28 Zylia Spolka Z Ograniczona Odpowiedzialnoscia Sposób kodowania, sposób dekodowania, koder oraz dekoder sygnału audio
WO2017064264A1 (en) 2015-10-15 2017-04-20 Huawei Technologies Co., Ltd. Method and appratus for sinusoidal encoding and decoding
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
US10847172B2 (en) 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
CA3153258A1 (en) * 2019-09-03 2021-03-11 Dolby Laboratories Licensing Corporation Low-latency, low-frequency effects codec
CN114627882B (zh) * 2022-04-12 2025-06-06 腾讯音乐娱乐科技(深圳)有限公司 音频处理方法、电子设备及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2123728C1 (ru) * 1993-05-05 1998-12-20 Филипс Электроникс Н.В. Система передачи, терминальный блок, кодирующее устройство, декодирующее устройство и адаптивный фильтр
RU2141166C1 (ru) * 1989-04-17 1999-11-10 Фраунхофер Гезельшафт цур Фердерунг дер ангевандтен Форшунг е.В. Способ цифрового кодирования для передачи и/или накопления акустических сигналов
WO2001069593A1 (en) * 2000-03-15 2001-09-20 Koninklijke Philips Electronics N.V. Laguerre fonction for audio coding
US6577995B1 (en) * 2000-05-16 2003-06-10 Samsung Electronics Co., Ltd. Apparatus for quantizing phase of speech signal using perceptual weighting function and method therefor

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
JPH11224099A (ja) * 1998-02-06 1999-08-17 Sony Corp 位相量子化装置及び方法
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
EP1088304A1 (en) * 1999-04-05 2001-04-04 Hughes Electronics Corporation A frequency domain interpolative speech codec system
CN1193347C (zh) * 2000-06-20 2005-03-16 皇家菲利浦电子有限公司 正弦编码
BR0109237A (pt) * 2001-01-16 2002-12-03 Koninkl Philips Electronics Nv Codificador paramétrico, método de codificação paramétrica, decodificador paramétrico, método de decodificação, fluxo de dados incluindo dados de código senoidais, e, meio de armazenamento
CN1213403C (zh) * 2001-01-16 2005-08-03 皇家菲利浦电子有限公司 产生参数编码中的连接信息的连接装置和方法
PL365018A1 (en) * 2001-04-18 2004-12-27 Koninklijke Philips Electronics N.V. Audio coding
ES2248549T3 (es) * 2001-06-08 2006-03-16 Koninklijke Philips Electronics N.V. Edicion de señales de audio.
JP2006526161A (ja) * 2003-05-27 2006-11-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2141166C1 (ru) * 1989-04-17 1999-11-10 Фраунхофер Гезельшафт цур Фердерунг дер ангевандтен Форшунг е.В. Способ цифрового кодирования для передачи и/или накопления акустических сигналов
RU2123728C1 (ru) * 1993-05-05 1998-12-20 Филипс Электроникс Н.В. Система передачи, терминальный блок, кодирующее устройство, декодирующее устройство и адаптивный фильтр
WO2001069593A1 (en) * 2000-03-15 2001-09-20 Koninklijke Philips Electronics N.V. Laguerre fonction for audio coding
US6577995B1 (en) * 2000-05-16 2003-06-10 Samsung Electronics Co., Ltd. Apparatus for quantizing phase of speech signal using perceptual weighting function and method therefor

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2742739C1 (ru) * 2017-11-10 2021-02-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Выбор задержки основного тона
CN116993799A (zh) * 2023-04-17 2023-11-03 中国科学院长春光学精密机械与物理研究所 一种相位展开误差校正方法、系统及终端

Also Published As

Publication number Publication date
ATE425533T1 (de) 2009-03-15
EP1649453A1 (en) 2006-04-26
WO2005008628A1 (en) 2005-01-27
JP2007519027A (ja) 2007-07-12
US20070112560A1 (en) 2007-05-17
ES2322264T3 (es) 2009-06-18
US7640156B2 (en) 2009-12-29
RU2006105017A (ru) 2006-06-27
KR101058064B1 (ko) 2011-08-22
BRPI0412717A (pt) 2006-09-26
JP4782006B2 (ja) 2011-09-28
DE602004019928D1 (de) 2009-04-23
EP1649453B1 (en) 2009-03-11
KR20060037375A (ko) 2006-05-03
CN1826634B (zh) 2010-12-01
CN1826634A (zh) 2006-08-30

Similar Documents

Publication Publication Date Title
RU2368018C2 (ru) Кодирование аудиосигнала с низкой скоростью передачи битов
RU2696292C2 (ru) Аудиокодер и декодер
US8843798B2 (en) Frame error concealment method and apparatus and decoding method and apparatus using the same
KR100603167B1 (ko) 시간 동기식 파형 보간법을 이용한 피치 프로토타입파형으로부터의 음성 합성
RU2505921C2 (ru) Способ и устройство кодирования и декодирования аудиосигналов (варианты)
CN1702974B (zh) 用于对数字信号编码/解码的方法和设备
US7596490B2 (en) Low bit-rate audio encoding
JP2004310088A (ja) 半レート・ボコーダ
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
EP1181687B1 (en) Multipulse interpolative coding of transition speech frames
US20060122828A1 (en) Highband speech coding apparatus and method for wideband speech coding system
RU2353980C2 (ru) Аудиокодирование
US7197454B2 (en) Audio coding
US20130101028A1 (en) Encoding method, decoding method, device, program, and recording medium
US20060009967A1 (en) Sinusoidal audio coding with phase updates
KR100789368B1 (ko) 잔차 신호 부호화 및 복호화 장치와 그 방법
WO2002025639A1 (en) Speech coding exploiting a power ratio of different speech signal components
KR20070019650A (ko) 오디오 인코딩
KR20080034817A (ko) 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20120709