[go: up one dir, main page]

TW201603005A - 在一裝置處切換寫碼技術之系統及方法 - Google Patents

在一裝置處切換寫碼技術之系統及方法 Download PDF

Info

Publication number
TW201603005A
TW201603005A TW104110334A TW104110334A TW201603005A TW 201603005 A TW201603005 A TW 201603005A TW 104110334 A TW104110334 A TW 104110334A TW 104110334 A TW104110334 A TW 104110334A TW 201603005 A TW201603005 A TW 201603005A
Authority
TW
Taiwan
Prior art keywords
frame
encoder
signal
decoder
encoding
Prior art date
Application number
TW104110334A
Other languages
English (en)
Inventor
凡卡特拉曼S 阿堤
文卡特什 克里希南
Original Assignee
高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 高通公司 filed Critical 高通公司
Publication of TW201603005A publication Critical patent/TW201603005A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本發明揭示一種特定方法,其包括使用一第一編碼器編碼一音訊信號之一第一訊框。該方法亦包括在該第一訊框之編碼期間產生包括對應於該音訊信號之一高頻帶部分的內容之一基頻信號。該方法進一步包括使用一第二編碼器編碼該音訊信號之一第二訊框,其中編碼該第二訊框包括處理該基頻信號以產生與該第二訊框相關聯之高頻帶參數。

Description

在一裝置處切換寫碼技術之系統及方法 優先權主張
本申請案主張2014年3月31日申請的標題為「SYSTEMS AND METHODS OF SWITCHING CODING TECHNOLOGIES AT A DEVICE(在一裝置處切換寫碼技術之系統及方法)」的美國臨時申請案第61/973,028號之優先權,該申請案之內容以全文引用的方式併入本文中。
本發明大體上係關於在裝置處切換寫碼技術。
技術之進步已帶來較小且較強大之計算裝置。舉例而言,當前存在多種攜帶型個人計算裝置,包括無線計算裝置,諸如攜帶型無線電話、個人數位助理(PDA)及傳呼裝置,其體積小,重量輕且易於由使用者攜帶。更特定言之,諸如蜂巢式電話及網際網路協定(IP)電話之攜帶型無線電話可經由無線網路傳達語音及資料封包。另外,許多此等無線電話包括併入其中的其他類型之裝置。舉例而言,無線電話亦可包括數位靜態相機、數位視訊攝影機、數位記錄器及音訊檔案播放器。
無線電話發送並接收表示人類語音(例如,話語)之信號。藉由數位技術傳輸語音係普遍的,尤其在長距離及數位無線電電話應用中。 判定可經由頻道發送之最少資訊量同時維持經重建構話語之所感知品質可係重要的。若藉由取樣及數位化傳輸話語,則大約六十四千位元每秒(kbps)之資料速率可用於達成類比電話之話語品質。經由使用話語分析,接著進行寫碼、傳輸及在接收器處重新合成,可達成資料速率的顯著減少。
用於壓縮話語之裝置可用於許多電信領域中。例示性領域為無線通信。無線通信之領域具有許多應用,包括(例如)室內無線電話(cordless telephone)、傳呼、無線區域迴路、諸如蜂巢式及個人通信服務(PCS)電話系統之無線電話、行動IP電話及衛星通信系統。特定應用為用於行動用戶之無線電話。
已開發用於無線通信系統之各種空中介面,包括(例如)分頻多重存取(FDMA)、分時多重存取(TDMA)、分碼多重存取(CDMA)及分時同步CDMA(TD-SCDMA)。已建立與其有關的各種國內及國際標準,包括(例如)先進行動電話服務(AMPS)、全球行動通信系統(GSM)及臨時標準95(IS-95)。例示性無線電話通信系統為CDMA系統。由電信行業協會(TIA)及其他標準機構頒佈IS-95標準及其衍生物IS-95A、美國國家標準學會(ANSI)J-STD-008及IS-95B(本文中統稱為IS-95)以指定用於蜂巢式或PCS電話通信系統之CDMA空中介面的使用。
IS-95標準隨後演進為提供較大容量及高速封包資料服務之「3G」系統(諸如,cdma2000及寬頻CDMA(WCDMA))。cdma2000之兩個變體由TIA發佈之文件IS-2000(cdma2000 1xRTT)及IS-856(cdma2000 1xEV-DO)呈現。cdma2000 1xRTT通信系統提供153kbps之峰值資料速率,而cdma2000 1xEV-DO通信系統定義範圍從38.4kbps至2.4Mbps之資料速率集合。WCDMA標準體現於第三代合作夥伴計劃「3GPP」(文件第3G TS 25.211號、第3G TS 25.212號、第3G TS 25.213號及第3G TS 25.214號)中。先進國際行動電信(IMT-先進)規 範陳述了「4G」標準。對於高行動性通信(例如,來自火車及汽車),IMT-先進規範將4G服務的峰值資料速率設定在100百萬位元每秒(Mbit/s),且對於低行動性通信(例如,來自行人及固定使用者),其將4G服務的峰值資料速率設定在1十億位元每秒(Gbit/s)。
使用藉由提取關於人類話語產生模型之參數來壓縮話語之技術的裝置被稱為話語寫碼器。話語寫碼器可包括編碼器及解碼器。編碼器將傳入話語信號劃分成時間區塊(或分析訊框)。可將每一時間分段(或「訊框」)之持續時間選擇為足夠短,使得可預期信號之頻譜包絡保持相對固定。舉例而言,一個訊框長度為20毫秒,其對應於8千赫茲(kHz)取樣速率下之160個樣本,但可使用被認為適於特定應用之任何訊框長度或取樣速率。
編碼器分析傳入話語訊框以提取某些相關參數,且接著將參數量化成二進位表示(例如,位元集合或二進位資料封包)。將資料封包經由通信頻道(例如,有線及/或無線網路連接)傳輸至接收器及解碼器。解碼器處理資料封包,解量化經處理資料封包以產生參數,並使用經解量化參數重新合成話語訊框。
話語寫碼器之功能為藉由移除話語中固有之自然冗餘而將經數位化話語信號壓縮成低位元速率信號。可藉由用參數集合表示輸入話語訊框並使用量化以用位元集合表示參數來達成數位壓縮。若輸入話語訊框具有位元數目Ni且由話語寫碼器所產生之資料封包具有位元數目No,則由話語寫碼器達成之壓縮因數為Cr=Ni/No。挑戰為在達成目標壓縮因數時保持經解碼話語之高語音品質。話語寫碼器之效能取決於:(1)話語模型或上文所描述的分析及合成程序之組合執行的良好程度及(2)在No位元每訊框之目標位元速率下參數量化程序執行的良好程度。因此,話語模型之目標為用每一訊框的較小參數集合擷取話語信號之本質或目標語音品質。
話語寫碼器大體上利用參數集合(包括向量)來描述話語信號。良好參數集合理想地為感知上準確的話語信號之重建構提供低系統頻寬。音調、信號功率、頻譜包絡(或共振峰)、振幅及相譜為話語寫碼參數之實例。
話語寫碼器可實施為時域寫碼器,其試圖藉由使用高時間解析度處理來擷取時域話語波形以便每次編碼較小話語片段(例如,5毫秒(ms)之子訊框)。借助於搜尋演算法自碼簿空間發現每一子訊框的高精確度代表。替代性地,話語寫碼器可實施為頻域寫碼器,其試圖藉由參數集合(分析)擷取輸入話語訊框之短期話語頻譜,並使用對應合成程序以自頻譜參數重新產生話語波形。參數量化器藉由根據已知量化技術用碼向量之所儲存表示來表示參數而保留參數。
一個時域話語寫碼器為碼激勵線性預測(CELP)寫碼器。在CELP寫碼器中,藉由發現短期共振峰濾波器之係數的線性預測(LP)分析來移除話語信號中之短期相關性或冗餘。將短期預測濾波器應用於傳入話語訊框會產生LP殘餘信號,藉由長期預測濾波器參數及後續隨機碼簿對LP殘餘信號進行進一步模型化及量化。因此,CELP寫碼將編碼時域話語波形之任務劃分成編碼LP短期濾波器係數及編碼LP殘餘之單獨任務。可以固定速率(例如,對於每一訊框,使用相同位元數目No)或可變速率(其中,不同位元速率用於不同類型之訊框內容)執行時域寫碼。可變速率寫碼器試圖使用將編碼解碼器參數編碼至足以獲得目標品質之程度所需的位元量。
諸如CELP寫碼器之時域寫碼器可依賴於每訊框大量位元N0以保留時域話語波形之準確性。假如每訊框位元數目No相對較大(例如,8kbps或高於8kbps),則此等寫碼器可提供極好的語音品質。在低位元速率(例如,4kbps及低於4kbps)下,歸因於受限數目個可用位元,時域寫碼器可不能保持高品質及穩健的效能。在低位元速率下,受限碼 簿空間截割在較高速率商業應用中所部署的時域寫碼器的波形匹配能力。因此,儘管隨時間推移進行改良,但以低位元速率操作之許多CELP寫碼系統仍遭受表徵為噪音之感知上明顯的失真。
低位元速率之CELP寫碼器的替代物為根據類似於CELP寫碼器之原理操作的「雜訊激勵線性預測」(NELP)寫碼器。NELP寫碼器使用經濾波偽隨機雜訊信號以模型化話語而非使用碼簿。由於NELP使用用於經寫碼話語之較簡單模型,因此NELP達成比CELP低之位元速率。NELP可用於壓縮或表示無聲話語或靜默。
以大約2.4kbps之速率操作的寫碼系統在本質上大體上係參數的。亦即,此等寫碼系統藉由以規則間隔傳輸描述話語信號之音調週期及頻譜包絡(或共振峰)的參數進行操作。此等所謂的參數寫碼器的例子有LP聲碼器系統。
LP聲碼器藉由每音調週期單一脈衝來模型化有聲話語信號。可增強此基本技術以包括尤其關於頻譜包絡之傳輸資訊。儘管LP聲碼器提供大體合理之效能,但其可引入表徵為蜂音之感知上明顯的失真。
近年來,已出現為波形寫碼器及參數寫碼器兩者之混合的寫碼器。此等所謂的混合寫碼器的例子有原型波形內插(PWI)話語寫碼系統。PWI寫碼系統亦可被稱為原型音調週期(PPP)話語寫碼器。PWI寫碼系統提供用於寫碼有聲話語之有效方法。PWI之基本概念為以固定間隔提取代表性音調循環(原型波形),傳輸其描述,及藉由在原型波形之間進行內插而重建構話語信號。PWI方法可對LP殘餘信號抑或話語信號進行操作。
通信裝置可接收具有低於最佳語音品質之話語信號。舉例而言,通信裝置可在語音通話期間自另一通信裝置接收話語信號。歸因於各種原因(諸如,環境噪音(例如,風、街道噪音)、通信裝置之介面 的限制、由通信裝置進行之信號處理、封包丟失、頻寬限制、位元速率限制等),語音通話品質可受損。
在傳統電話系統(例如,公共交換電話網路(PSTN))中,信號頻寬限於300赫茲(Hz)至3.4kHz之頻率範圍。在寬頻(WB)應用(諸如,蜂巢式電話及網際網路通信協定語音(VoIP))中,信號頻寬可跨越50Hz至7kHz之頻率範圍。超寬頻(SWB)寫碼技術支援延展至大約16kHz之頻寬。將信號頻寬自3.4kHz之窄頻電話延展至16kHz之SWB電話可改良信號重建構之品質、可懂度及逼真度。
一個WB/SWB寫碼技術為頻寬延展(BWE),其涉及編碼及傳輸信號之較低頻率部分(例如,0Hz至6.4kHz,亦被稱為「低頻帶」)。舉例而言,可使用濾波器參數及/或低頻帶激勵信號表示低頻帶。然而,為了改良寫碼效率,可並不完全編碼及傳輸信號之較高頻率部分(例如,6.4kHz至16kHz,亦被稱為「高頻帶」)。實情為,接收器可利用信號模型化以預測高頻帶。在一些實施中,可將與高頻帶相關聯之資料提供至接收器以幫助預測。此資料可被稱為「旁側資訊」,且可包括增益資訊、線譜頻率(LSF,亦被稱為線譜對(LSP))等。
在一些無線電話中,多個寫碼技術係可用的。舉例而言,不同寫碼技術可用於編碼不同類型之音訊信號(例如,語音信號對音樂信號)。當無線電話自使用第一編碼技術編碼音訊信號切換至使用第二編碼技術編碼音訊信號時,歸因於編碼器內之記憶體緩衝器的重設,可在音訊信號之訊框邊界處產生聲訊偽影。
揭示當於一裝置處切換寫碼技術時減少訊框邊界偽影及能量失配之系統及方法。舉例而言,一裝置可使用一第一編碼器(諸如,一經修改離散餘弦變換(MDCT)編碼器)編碼含有大量高頻分量之一音訊信號的一訊框。舉例而言,該訊框可含有背景噪音、嘈雜話語或音 樂。該裝置可使用一第二編碼器(諸如,一代數碼激勵線性預測(ACELP)編碼器)編碼並不含有大量高頻分量之一話語訊框。該等編碼器中之一或兩者可應用一BWE技術。當在該MDCT編碼器與該ACELP編碼器之間切換時,可重設(例如,藉由零填充)用於BWE之記憶體緩衝器且可重設濾波器狀態,此情況可帶來訊框邊界偽影及能量失配。
根據所描述技術,一個編碼器可基於來自另一編碼器之資訊填充一緩衝器並判定濾波器設定,而非重設(或「清零」)該緩衝器並重設濾波器。舉例而言,當編碼一音訊信號之一第一訊框時,該MDCT編碼器可產生對應於一高頻帶「目標」之一基頻信號且該ACELP編碼器可使用該基頻信號以填充一目標信號緩衝器並產生用於該音訊信號之一第二訊框的高頻帶參數。作為另一實例,可基於該MDCT編碼器之一經合成輸出填充該目標信號緩衝器。作為又一實例,該ACELP編碼器可使用外插技術、信號能量、訊框類型資訊(例如,該第二訊框及/或該第一訊框是否為一無聲訊框、一有聲訊框、一暫態訊框或一泛型訊框)等估計該第一訊框之一部分。
在信號合成期間,解碼器亦可執行操作以減少歸因於寫碼技術之切換的訊框邊界偽影及能量失配。舉例而言,一裝置可包括一MDCT解碼器及一ACELP解碼器。當該ACELP解碼器解碼一音訊信號之一第一訊框時,該ACELP解碼器可產生對應於該音訊信號之一第二(亦即,下一)訊框的一「重疊」樣本集合。若在該第一訊框與該第二訊框之間的訊框邊界處出現一寫碼技術切換,則該MDCT解碼器可在該第二訊框之解碼期間基於來自該ACELP解碼器之該等重疊樣本執行一平滑(例如,交叉衰落(crossfade))操作以增加該訊框邊界處之所感知信號連續性。
在一特定態樣中,一種方法包括使用一第一編碼器編碼一音訊 信號之一第一訊框。該方法亦包括在該第一訊框之編碼期間產生包括對應於該音訊信號之一高頻帶部分的內容之一基頻信號。該方法進一步包括使用一第二編碼器編碼該音訊信號之一第二訊框,其中編碼該第二訊框包括處理該基頻信號以產生與該第二訊框相關聯之高頻帶參數。
在另一特定態樣中,一種方法包括在包括一第一解碼器及一第二解碼器之一裝置處使用該第二解碼器解碼一音訊信號之一第一訊框。該第二解碼器產生對應於該音訊信號之一第二訊框的一開始部分之重疊資料。該方法亦包括使用該第一解碼器解碼該第二訊框。解碼該第二訊框包括使用來自該第二解碼器之該重疊資料應用一平滑操作。
在另一特定態樣中,一種設備包括一第一編碼器,其經組態以編碼一音訊信號之一第一訊框並在該第一訊框之編碼期間產生包括對應於該音訊信號之一高頻帶部分的內容之一基頻信號。該設備亦包括經組態以編碼該音訊信號之一第二訊框的一第二編碼器。編碼該第二訊框包括處理該基頻信號以產生與該第二訊框相關聯之高頻帶參數。
在另一特定態樣中,一種設備包括經組態以編碼一音訊信號之一第一訊框的一第一編碼器。該設備亦包括經組態以在該音訊信號之一第二訊框的編碼期間估計該第一訊框之一第一部分的一第二編碼器。該第二編碼器亦經組態以基於該第一訊框之該第一部分及該第二訊框填充該第二編碼器之一緩衝器,並產生與該第二訊框相關聯之高頻帶參數。
在另一特定態樣中,一種設備包括一第一解碼器及一第二解碼器。該第二解碼器經組態以解碼一音訊信號之一第一訊框並產生對應於該音訊信號之一第二訊框的一部分之重疊資料。該第一解碼器經組態以在該第二訊框之解碼期間使用來自該第二解碼器之該重疊資料應 用一平滑操作。
在另一特定態樣中,一種電腦可讀儲存裝置儲存當由一處理器執行時導致該處理器執行操作之指令,該等操作包括使用一第一編碼器編碼一音訊信號之一第一訊框。該等操作亦包括在該第一訊框之編碼期間產生包括對應於該音訊信號之一高頻帶部分的內容之一基頻信號。該等操作進一步包括使用一第二編碼器編碼該音訊信號之一第二訊框。編碼該第二訊框包括處理該基頻信號以產生與該第二訊框相關聯之高頻帶參數。
由該等所揭示實例中之至少一者所提供的特定優勢包括當在一裝置處切換於編碼器或解碼器之間時減少訊框邊界偽影及能量失配之一能力。舉例而言,可基於另一編碼器或解碼器之操作判定一個編碼器或解碼器之一或多個記憶體(諸如,緩衝器)或濾波器狀態。本發明之其他態樣、優勢及特徵將在審閱整個申請案之後變得顯而易見,該申請案包括以下部分:附圖說明、實施方式及申請專利範圍。
100‧‧‧系統
102‧‧‧音訊信號
104‧‧‧第一訊框
106‧‧‧第二訊框
108‧‧‧訊框
109‧‧‧訊框
110‧‧‧編碼器選擇器
120‧‧‧MDCT編碼器
121‧‧‧MDCT分析模組
122‧‧‧「全」MDCT模組
123‧‧‧低頻帶模組
124‧‧‧高頻帶模組
125‧‧‧「輕型」目標信號產生器
126‧‧‧本端解碼器
130‧‧‧基頻信號
140‧‧‧能量資訊
150‧‧‧ACELP編碼器
151‧‧‧目標信號緩衝器
152‧‧‧第一部分
153‧‧‧第二部分
154‧‧‧第三部分
155‧‧‧目標信號產生器
156‧‧‧計算模組
157‧‧‧估計器
158‧‧‧本端解碼器
159‧‧‧時域ACELP分析模組
160‧‧‧低頻帶分析模組
161‧‧‧高頻帶分析模組
199‧‧‧輸出位元串流
200‧‧‧ACELP編碼系統
202‧‧‧輸入音訊信號
210‧‧‧分析濾波器組
222‧‧‧低頻帶信號
224‧‧‧高頻帶信號
230‧‧‧低頻帶分析模組
232‧‧‧LP分析及寫碼模組
234‧‧‧線性預測係數(LPC)至線譜對(LSP)變換模組
236‧‧‧量化器
242‧‧‧低頻帶位元串流
244‧‧‧低頻帶激勵信號
250‧‧‧高頻帶分析模組
252‧‧‧LP分析及寫碼模組
254‧‧‧LPC至LSP變換模組
256‧‧‧量化器
260‧‧‧高頻帶激勵產生器
262‧‧‧本端解碼器
263‧‧‧碼簿
264‧‧‧目標信號產生器
266‧‧‧MDCT資訊
272‧‧‧高頻帶參數
280‧‧‧多工器(MUX)
298‧‧‧傳輸器
299‧‧‧輸出位元串流
300‧‧‧系統
301‧‧‧接收器
302‧‧‧位元串流
310‧‧‧解碼器選擇器
320‧‧‧MDCT解碼器
322‧‧‧平滑模組
340‧‧‧重疊資料
350‧‧‧ACELP解碼器
352‧‧‧LPC合成模組
399‧‧‧經合成音訊信號
400‧‧‧方法
500‧‧‧方法
600‧‧‧方法
700‧‧‧方法
800‧‧‧裝置
802‧‧‧數位/類比轉換器(DAC)
804‧‧‧類比/數位轉換器(ADC)
806‧‧‧處理器
808‧‧‧話語及音樂編碼器解碼器(編碼解碼器)
810‧‧‧額外處理器
812‧‧‧回音消除器
822‧‧‧系統單晶片裝置
826‧‧‧顯示器控制器
828‧‧‧顯示器
830‧‧‧輸入裝置
832‧‧‧記憶體
834‧‧‧編碼解碼器
836‧‧‧聲碼器編碼器
838‧‧‧聲碼器解碼器
840‧‧‧無線控制器
842‧‧‧天線
844‧‧‧電源供應器
846‧‧‧麥克風
848‧‧‧揚聲器
850‧‧‧收發器
856‧‧‧指令
860‧‧‧MDCT編碼器
862‧‧‧ACELP編碼器
864‧‧‧編碼器選擇器
870‧‧‧MDCT解碼器
872‧‧‧ACELP解碼器
874‧‧‧解碼器選擇器
圖1為說明可操作以支援在編碼器之間進行切換同時減少訊框邊界偽影及能量失配的系統之特定實例的方塊圖;圖2為說明ACELP編碼系統之特定實例的方塊圖;圖3為說明可操作以支援在解碼器之間進行切換同時減少訊框邊界偽影及能量失配的系統之特定實例的方塊圖;圖4為說明在編碼器裝置處操作之方法的特定實例之流程圖;圖5為說明在編碼器裝置處操作之方法的另一特定實例之流程圖;圖6為說明在編碼器裝置處操作之方法的另一特定實例之流程圖;圖7為說明在解碼器裝置處操作的方法之特定實例的流程圖;及 圖8為可操作以根據圖1至圖7之系統及方法執行操作的無線裝置之方塊圖。
參看圖1,描繪可操作以切換編碼器(例如,編碼技術)同時減少訊框邊界偽影及能量失配的系統之特定實例,並將其大體上指定為100。在說明性實例中,系統100整合於諸如無線電話、平板電腦等之電子裝置中。系統100包括編碼器選擇器110、基於變換之編碼器(例如,MDCT編碼器120)及基於LP之編碼器(例如,ACELP編碼器150)。在替代性實例中,不同類型之編碼技術可實施於系統100中。
在以下描述中,將由圖1之系統100所執行之各種功能描述為由某些組件或模組執行。然而,組件及模組之此劃分僅係為了說明。在替代性實例中,由特定組件或模組所執行之功能可替代地劃分於多個組件或模組之中。此外,在替代性實例中,圖1之兩個或兩個以上組件或模組可整合於單一組件或模組中。可使用硬體(例如,特殊應用積體電路(ASIC)、數位信號處理器(DSP)、控制器、場可程式化閘陣列(FPGA)裝置等)、軟體(例如,可由處理器執行之指令)或其任何組合來實施圖1中所說明之每一組件或模組。
另外,應注意,儘管圖1說明單獨MDCT編碼器120及ACELP編碼器150,但不應將此情況視為限制性。在替代性實例中,電子裝置之單一編碼器可包括對應於MDCT編碼器120及ACELP編碼器150之組件。舉例而言,編碼器可包括一或多個低頻帶(LB)「核心」模組(例如,MDCT核心及ACELP核心)及一或多個高頻帶(HB)/BWE模組。取決於訊框之特性(例如,訊框是否含有話語、噪音、音樂等),可將音訊信號102之每一訊框的低頻帶部分提供至特定低頻帶核心模組以用於編碼。可將每一訊框之高頻帶部分提供至特定HB/BWE模組。
編碼器選擇器110可經組態以接收音訊信號102。音訊信號102可 包括話語資料、非話語資料(例如,音樂或背景噪音)或兩者。在說明性實例中,音訊信號102為SWB信號。舉例而言,音訊信號102可佔據大約跨越0Hz至16kHz之頻率範圍。音訊信號102可包括複數個訊框,其中每一訊框具有特定持續時間。在說明性實例中,每一訊框之持續時間為20ms,但在替代性實例中可使用不同訊框持續時間。編碼器選擇器110可判定音訊信號102之每一訊框將由MDCT編碼器120還是ACELP編碼器150編碼。舉例而言,編碼器選擇器110可基於對訊框之頻譜分析分類音訊信號102之訊框。在特定實例中,編碼器選擇器110將包括大量高頻分量之訊框發送至MDCT編碼器120。舉例而言,此等訊框可包括背景噪音、嘈雜話語或音樂信號。編碼器選擇器110可將不包括大量高頻分量之訊框發送至ACELP編碼器150。舉例而言,此等訊框可包括話語信號。
因此,在系統100之操作期間,可將音訊信號102之編碼自MDCT編碼器120切換至ACELP編碼器150,且反之亦然。MDCT編碼器120及ACELP編碼器150可產生對應於經編碼訊框之輸出位元串流199。為易於說明,藉由交叉影線圖案展示待由ACELP編碼器150編碼之訊框,且不用圖案展示待由MDCT編碼器120編碼之訊框。在圖1之實例中,自ACELP編碼至MDCT編碼之切換出現於訊框108與109之間的訊框邊界處。自MDCT編碼至ACELP編碼之切換出現於訊框104與106之間的訊框邊界處。
MDCT編碼器120包括在頻域中執行編碼之MDCT分析模組121。若MDCT編碼器120並不執行BWE,則MDCT分析模組121可包括「全」MDCT模組122。「全」MDCT模組122可基於對音訊信號102之整個頻率範圍(例如,0Hz至16kHz)的分析而編碼音訊信號102之訊框。替代性地,若MDCT編碼器120執行BWE,則可單獨處理LB資料及高HB資料。低頻帶模組123可產生音訊信號102之低頻帶部分的經 編碼表示,且高頻帶模組124可產生待由解碼器使用以重建構音訊信號102之高頻帶部分(例如,8kHz至16kHz)的高頻帶參數。MDCT編碼器120亦可包括用於封閉迴路估計之本端解碼器126。在說明性實例中,本端解碼器126用於合成音訊信號102(或其部分,諸如高頻帶部分)之表示。經合成信號可儲存於合成緩衝器中,且可由高頻帶模組124在判定高頻帶參數期間使用。
ACELP編碼器150可包括時域ACELP分析模組159。在圖1之實例中,ACELP編碼器150執行頻寬延展,且包括低頻帶分析模組160及單獨高頻帶分析模組161。低頻帶分析模組160可編碼音訊信號102之低頻帶部分。在說明性實例中,音訊信號102之低頻帶部分佔據大約跨越0Hz至6.4kHz之頻率範圍。在替代性實例中,不同交越頻率可分離低頻帶與高頻帶部分及/或該等部分可重疊,如參考圖2進一步描述。在特定實例中,低頻帶分析模組160藉由量化由對低頻帶部分之LP分析所產生的LSP而編碼音訊信號102之低頻帶部分。量化可係基於低頻帶碼簿。進一步參考圖2描述ACELP低頻帶分析。
ACELP編碼器150之目標信號產生器155可產生對應於音訊信號102之高頻帶部分的基頻版本之目標信號。舉例而言,計算模組156可藉由對音訊信號102執行一或多個翻轉、降低取樣、高階濾波、降混及/或減少取樣操作來產生目標信號。在產生目標信號時,目標信號可用於填充目標信號緩衝器151。在特定實例中,目標信號緩衝器151儲存1.5個訊框之資料,且包括第一部分152、第二部分153及第三部分154。因此,當訊框之持續時間為20ms時,目標信號緩衝器151表示歷時音訊信號之30ms的高頻帶資料。第一部分152可表示1ms至10ms中的高頻帶資料,第二部分153可表示11ms至20ms中的高頻帶資料且第三部分154可表示21ms至30ms中的高頻帶資料。
高頻帶分析模組161可產生可由解碼器使用以重建構音訊信號 102之高頻帶部分的高頻帶參數。舉例而言,音訊信號102之高頻帶部分可佔據大約跨越6.4kHz至16kHz之頻率範圍。在說明性實例中,高頻帶分析模組161量化(例如,基於碼簿)由對高頻帶部分之LP分析所產生的LSP。高頻帶分析模組161亦可自低頻帶分析模組160接收低頻帶激勵信號。高頻帶分析模組161可自低頻帶激勵信號產生高頻帶激勵信號。可將高頻帶激勵信號提供至產生經合成高頻帶部分之本端解碼器158。高頻帶分析模組161可基於目標信號緩衝器151中之高頻帶目標及/或來自本端解碼器158之經合成高頻帶部分,判定諸如訊框增益、增益因數等之高頻帶參數。進一步參考圖2描述ACELP高頻帶分析。
在音訊信號102之編碼在訊框104與106之間的訊框邊界處自MDCT編碼器120切換至ACELP編碼器150之後,目標信號緩衝器151可係空的、可經重設或可包括來自過去若干訊框(例如,訊框108)之高頻帶資料。另外,ACELP編碼器中之濾波器狀態(諸如,計算模組156、LB分析模組160及/或HB分析模組161中之濾波器的濾波器狀態)可反映來自過去若干訊框之操作。若在ACELP編碼期間使用此重設或「過時」資訊,則在第一訊框104與第二訊框106之間的訊框邊界處可產生惱人的偽影(例如,卡嗒聲)。另外,收聽者可感知到能量失配(例如,音量或其他音訊特性突然增加或降低)。根據所描述技術,可基於與第一訊框104(亦即,由MDCT編碼器120在切換至ACELP編碼器150之前編碼之最後訊框)相關聯之資料填充目標信號緩衝器151且判定濾波器狀態,而非重設或使用舊濾波器狀態及目標資料。
在特定態樣中,基於由MDCT編碼器120所產生之「輕型」目標信號來填充目標信號緩衝器151。舉例而言,MDCT編碼器120可包括「輕型」目標信號產生器125。「輕型」目標信號產生器125可產生表示待由ACELP編碼器150使用之目標信號的估計的基頻信號130。在特 定態樣中,藉由對音訊信號102執行翻轉操作及降低取樣操作產生基頻信號130。在一個實例中,「輕型」目標信號產生器125在MDCT編碼器120之操作期間持續執行。為減少計算複雜性,「輕型」目標信號產生器125可產生基頻信號130而無需執行高階濾波操作或降混操作。基頻信號130可用於填充目標信號緩衝器151之至少一部分。舉例而言,可基於基頻信號130填充第一部分152,且可基於由第二訊框106所表示的20ms之高頻帶部分填充第二部分153及第三部分154。
在特定實例中,可基於MDCT本端解碼器126之輸出(例如,最近10ms之經合成輸出)而非「輕型」目標信號產生器125之輸出填充目標信號緩衝器151之一部分(例如,第一部分152)。在此實例中,基頻信號130可對應於音訊信號102之經合成版本。舉例而言,可自MDCT本端解碼器126之合成緩衝器產生基頻信號130。若MDCT分析模組121進行「全」MDCT,則本端解碼器126可執行「全」反MDCT(IMDCT)(0Hz至16kHz),且基頻信號130可對應於音訊信號102之高頻帶部分以及音訊信號之額外部分(例如,低頻帶部分)。在此實例中,可對合成輸出及/或基頻信號130進行濾波(例如,經由高通濾波器(HPF)、翻轉及降低取樣操作等)以產生近似為(例如,包括)高頻帶資料(例如,8kHz至16kHz頻帶中)之結果信號。
若MDCT編碼器120執行BWE,則本端解碼器126可包括高頻帶IMDCT(8kHz至16kHz)以合成僅高頻帶信號。在此實例中,基頻信號130可表示經合成僅高頻帶信號,且可被複製至目標信號緩衝器151之第一部分152中。在此實例中,無需使用濾波操作而係僅藉由資料複製操作填充目標信號緩衝器151之第一部分152。可基於由第二訊框106所表示的20ms之高頻帶部分填充目標信號緩衝器151之第二部分153及第三部分154。
因此,在某些態樣中,可基於基頻信號130填充目標信號緩衝器 151,該基頻信號130表示在第一訊框104已由ACELP編碼器150而非MDCT編碼器120編碼的情況下將已由目標信號產生器155或本端解碼器158產生的目標或經合成信號資料。亦可基於基頻信號130判定諸如ACELP編碼器150中之濾波器狀態(例如,LP濾波器狀態、抽取器狀態等)的其他記憶體元素,而非回應於編碼器切換將該等記憶體元素重設。藉由使用目標或經合成信號資料之近似,相比於重設目標信號緩衝器151,可減少訊框邊界偽影及能量失配。另外,ACELP編碼器150中之濾波器可較快到達「固定」狀態(例如,聚合)。
在特定態樣中,可由ACELP編碼器150估計對應於第一訊框104之資料。舉例而言,目標信號產生器155可包括經組態以估計第一訊框104之一部分以便填充目標信號緩衝器151之一部分的估計器157。在特定態樣中,估計器157基於第二訊框106之資料執行外插操作。舉例而言,表示第二訊框106之高頻帶部分的資料可儲存於目標信號緩衝器151之第二及第三部分153、154中。估計器157可將藉由外插(替代性地被稱作「反向傳播」)儲存於第二部分153及(視情況)第三部分154中之資料所產生的資料儲存於第一部分152中。作為另一實例,估計器157可基於第二訊框106執行反向LP以估計第一訊框104或其部分(例如,第一訊框104之最後10ms或5ms)。
在特定態樣中,估計器157基於指示與第一訊框104相關聯之能量的能量資訊140估計第一訊框104之部分。舉例而言,可基於與第一訊框104之經本端解碼(例如,在MDCT本端解碼器126處)的低頻帶部分、第一訊框104之經本端解碼(例如,在MDCT本端解碼器126處)的高頻帶部分或該兩者相關聯的能量估計第一訊框104之部分。藉由考慮能量資訊140,估計器157可有助於減少當自MDCT編碼器120切換至ACELP編碼器150時訊框邊界處之能量失配(諸如,增益形狀突降)。在說明性實例中,基於與MDCT編碼器中之緩衝器(諸如, MDCT合成緩衝器)相關聯的能量判定能量資訊140。可由估計器157使用合成緩衝器之整個頻率範圍(例如,0Hz至16kHz)的能量或僅合成緩衝器之高頻帶部分(例如,8kHz至16kHz)的能量。估計器157可基於第一訊框104之所估計能量將逐步縮減(tapering)操作應用於第一部分152中之資料。逐步縮減可減少訊框邊界處之能量失配(諸如在出現「非作用中」或低能量訊框與「作用中」或高能量訊框之間的轉變之狀況下)。由估計器157應用於第一部分152之逐步縮減可係線性的或可基於另一數學函數。
在特定態樣中,估計器157至少部分基於第一訊框104之訊框類型估計第一訊框104之部分。舉例而言,估計器157可基於第一訊框104之訊框類型及/或第二訊框106之訊框類型(替代性地被稱作「寫碼類型」)估計第一訊框104之部分。訊框類型可包括有聲訊框類型、無聲訊框類型、暫態訊框類型及泛型訊框類型。取決於訊框類型,估計器157可將不同逐步縮減操作(例如,使用不同逐步縮減係數)應用於第一部分152中之資料。
因此,在某些態樣中,可基於信號估計及/或與第一訊框104或其部分相關聯之能量填充目標信號緩衝器151。替代性地或另外,可在估計程序期間使用第一訊框104及/或第二訊框106之訊框類型,諸如用於信號逐步縮減。亦可基於估計判定諸如ACELP編碼器150中之濾波器狀態(例如,LP濾波器狀態、抽取器狀態等)的其他記憶體元素,而非回應於編碼器切換重設該等記憶體元素,此情況可使得濾波器狀態能夠較快到達「固定」狀態(例如,聚合)。
當在第一編碼模式或編碼器(例如,MDCT編碼器120)與第二編碼模式或編碼器(例如,ACELP編碼器150)之間切換時,圖1之系統100可以減少訊框邊界偽影及能量失配之方式處置記憶體更新。使用圖1之系統100可帶來經改良信號寫碼品質以及經改良使用者體驗。
參看圖2,描繪ACELP編碼系統200之特定實例,且將其大體上指定為200。系統200之一或多個組件可對應於圖1之系統100的一或多個組件,如本文中進一步所描述。在說明性實例中,系統200整合於諸如無線電話、平板電腦等之電子裝置中。
在以下描述中,將由圖2之系統200執行之各種功能描述為由某些組件或模組執行。然而,組件及模組之此劃分僅係為了說明。在替代性實例中,由特定組件或模組執行之功能可替代地劃分於多個組件或模組之中。此外,在替代性實例中,圖2之兩個或兩個以上組件或模組可整合於單一組件或模組中。可使用硬體(例如,ASIC、DSP、控制器、FPGA裝置等)、軟體(例如,可由處理器執行之指令)或其任何組合實施圖2中所說明之每一組件或模組。
系統200包括經組態以接收輸入音訊信號202之分析濾波器組210。舉例而言,輸入音訊信號202可由麥克風或其他輸入裝置提供。在說明性實例中,當圖1之編碼器選擇器110判定音訊信號102待由圖1之ACELP編碼器150編碼時,輸入音訊信號202可對應於圖1之音訊信號102。輸入音訊信號202可為包括自大約0Hz至16kHz之頻率範圍中的資料之超寬頻(SWB)信號。分析濾波器組210可基於頻率將輸入音訊信號202濾波成多個部分。舉例而言,分析濾波器組210可包括用以產生低頻帶信號222及高頻帶信號224之低通濾波器(LPF)及高通濾波器(HPF)。低頻帶信號222及高頻帶信號224可具有相等或不等頻寬,且可重疊或不重疊。當低頻帶信號222及高頻帶信號224重疊時,分析濾波器組210之低通濾波器及高通濾波器可具有平滑滾降,此情況可簡化低通濾波器及高通濾波器之設計並降低成本。將低頻帶信號222與高頻帶信號224重疊亦可使得能夠在接收器處平滑摻合低頻帶與高頻帶信號,此情況可帶來較少聲訊偽影。
應注意,儘管本文中在處理SWB信號之文理中描述某些實例, 但此情況僅係為了說明。在替代性實例中,所描述技術可用於處理具有大約0Hz至8kHz之頻率範圍的WB信號。在此實例中,低頻帶信號222可對應於大約0Hz至6.4kHz之頻率範圍,且高頻帶信號224可對應於大約6.4kHz至8kHz之頻率範圍。
系統200可包括經組態以接收低頻帶信號222之低頻帶分析模組230。在特定態樣中,低頻帶分析模組230可代表ACELP編碼器之實例。舉例而言,低頻帶分析模組230可對應於圖1之低頻帶分析模組160。低頻帶分析模組230可包括LP分析及寫碼模組232、線性預測係數(LPC)至線譜對(LSP)變換模組234及量化器236。LSP亦可被稱作LSF,且兩個術語可在本文中互換使用。LP分析及寫碼模組232可將低頻帶信號222之頻譜包絡編碼為LPC之集合。可針對音訊之每一訊框(例如,在16kHz之取樣速率下對應於320個樣本的20ms之音訊)、音訊之每一子訊框(例如,5ms之音訊)或其任何組合產生LPC。可由所執行LP分析之「階數」判定針對每一訊框或子訊框所產生之LPC的數目。在特定態樣中,LP分析及寫碼模組232可產生對應於第十階LP分析的十一個LPC之集合。
變換模組234可將由LP分析及寫碼模組232所產生的LPC之集合變換成對應LSP集合(例如,使用一對一變換)。替代性地,LPC之集合可經一對一變換成部分自相關係數、對數面積比率值、導抗譜對(ISP)或導抗譜頻率(ISF)之對應集合。LPC集合與LSP集合之間的變換可係可逆的而不存在誤差。
量化器236可量化由變換模組234所產生之LSP集合。舉例而言,量化器236可包括或耦接至包括多個項(例如,向量)之多個碼簿。為量化LSP集合,量化器236可識別「最接近」(例如,基於諸如最小平方或均方誤差之失真度量)LSP集合的碼簿之項。量化器236可輸出對應於碼簿中的所識別項之位置的索引值或一系列索引值。因此,量化 器236之輸出可表示包括於低頻帶位元串流242中之低頻帶濾波器參數。
低頻帶分析模組230亦可產生低頻帶激勵信號244。舉例而言,低頻帶激勵信號244可為藉由量化在由低頻帶分析模組230執行之LP程序期間產生的LP殘餘信號而產生的經編碼信號。LP殘餘信號可表示預測誤差。
系統200可進一步包括經組態以自分析濾波器組210接收高頻帶信號224並自低頻帶分析模組230接收低頻帶激勵信號244之高頻帶分析模組250。舉例而言,高頻帶分析模組250可對應於圖1之高頻帶分析模組161。高頻帶分析模組250可基於高頻帶信號224及低頻帶激勵信號244產生高頻帶參數272。舉例而言,高頻帶參數272可包括高頻帶LSP及/或增益資訊(例如,至少基於高頻帶能量與低頻帶能量之比),如本文中進一步描述。
高頻帶分析模組250可包括高頻帶激勵產生器260。高頻帶激勵產生器260可藉由將低頻帶激勵信號244之頻譜延展至高頻帶頻率範圍(例如,8kHz至16kHz)而產生高頻帶激勵信號。高頻帶激勵信號可用於判定包括於高頻帶參數272中的一或多個高頻帶增益參數。如所說明,高頻帶分析模組250亦可包括LP分析及寫碼模組252、LPC至LSP變換模組254及量化器256。LP分析及寫碼模組252、變換模組254及量化器256中之每一者可如上文參考低頻帶分析模組230之對應組件所描述但以相對減少之解析度(例如,對於每一係數、LSP等使用較少位元)起作用。LP分析及寫碼模組252可產生由變換模組254變換成LSP並由量化器256基於碼簿263量化的LPC之集合。舉例而言,LP分析及寫碼模組252、變換模組254及量化器256可使用高頻帶信號224以判定包括於高頻帶參數272中之高頻帶濾波器資訊(例如,高頻帶LSP)。在特定態樣中,高頻帶參數272可包括高頻帶LSP以及高頻帶增益參 數。
高頻帶分析模組250亦可包括本端解碼器262及目標信號產生器264。舉例而言,本端解碼器262可對應於圖1之本端解碼器158,且目標信號產生器264可對應於圖1之目標信號產生器155。高頻帶分析模組250可進一步自MDCT編碼器接收MDCT資訊266。舉例而言,MDCT資訊266可包括圖1之基頻信號130及/或圖1之能量資訊140,且當由圖2之系統200執行自MDCT編碼至ACELP編碼之切換時,其可用於減少訊框邊界偽影及能量失配。
低頻帶位元串流242及高頻帶參數272可由多工器(MUX)280多工以產生輸出位元串流299。輸出位元串流299可表示對應於輸入音訊信號202之經編碼音訊信號。舉例而言,輸出位元串流299可由傳輸器298(例如,經由有線、無線或光學頻道)傳輸及/或儲存。在接收器裝置處,可由解多工器(DEMUX)、低頻帶解碼器、高頻帶解碼器及濾波器組執行逆向操作以產生經合成音訊信號(例如,提供至揚聲器或其他輸出裝置之輸入音訊信號202的經重建構版本)。用於表示低頻帶位元串流242之位元數目可實質上大於用於表示高頻帶參數272之位元數目。因此,輸出位元串流299中之大部分位元可表示低頻帶資料。高頻帶參數272可用於接收器處以根據信號模型自低頻帶資料再生高頻帶激勵信號。舉例而言,信號模型可表示低頻帶資料(例如,低頻帶信號222)與高頻帶資料(例如,高頻帶信號224)之間的關係或相關性之預期集合。因此,不同信號模型可用於不同種類之音訊資料,且可在傳達經編碼音訊資料之前由傳輸器及接收器協商(或由行業標準定義)所使用的特定信號模型。藉由使用信號模型,傳輸器處之高頻帶分析模組250可能夠產生高頻帶參數272,使得接收器處之對應高頻帶分析模組能夠使用信號模型自輸出位元串流299重建構高頻帶信號224。
因此,圖2說明當編碼輸入音訊信號202時使用來自MDCT編碼器之MDCT資訊266的ACELP編碼系統200。藉由使用MDCT資訊266,可減少訊框邊界偽影及能量失配。舉例而言,MDCT資訊266可用於執行目標信號估計、反向傳播、逐步縮減等。
參看圖3,展示可操作以支援解碼器之間的切換同時減少訊框邊界偽影及能量失配之系統的特定實例,且將其大體上指定為300。在說明性實例中,系統300整合於諸如無線電話、平板電腦等之電子裝置中。
系統300包括接收器301、解碼器選擇器310、基於變換之解碼器(例如,MDCT解碼器320)及基於LP之解碼器(例如,ACELP解碼器350)。因此,儘管未展示,但MDCT解碼器320及ACELP解碼器350可包括執行分別參考圖1之MDCT編碼器120及圖1之ACELP編碼器150的一或多個組件所描述之彼等操作的反操作之一或多個組件。另外,描述為由MDCT解碼器320執行之一或多個操作亦可由圖1之MDCT本端解碼器126執行,且描述為由ACELP解碼器350執行之一或多個操作亦可由圖1之ACELP本端解碼器158執行。
在操作期間,接收器301可接收位元串流302並將其提供至解碼器選擇器310。在說明性實例中,位元串流302對應於圖1之輸出位元串流199或圖2之輸出位元串流299。解碼器選擇器310可基於位元串流302之特性判定MDCT解碼器320還是ACELP解碼器350待用於解碼位元串流302以產生經合成音訊信號399。
當選擇ACELP解碼器350時,LPC合成模組352可處理位元串流302或其部分。舉例而言,LPC合成模組352可解碼對應於音訊信號之第一訊框的資料。在解碼期間,LPC合成模組352可產生對應於音訊信號之第二(例如,下一)訊框的重疊資料340。在說明性實例中,重疊資料340可包括20個音訊樣本。
當解碼器選擇器310將解碼自ACELP解碼器350切換至MDCT解碼器320時,平滑模組322可使用重疊資料340以執行平滑函數。平滑函數可平滑歸因於回應於自ACELP解碼器350切換至MDCT解碼器320而重設MDCT解碼器320中之濾波器記憶體及合成緩衝器的訊框邊界不連續性。作為說明性非限制性實例,平滑模組322可基於重疊資料340執行交叉衰落操作,使得基於重疊資料340之經合成輸出與音訊信號之第二訊框的經合成輸出之間的轉變被收聽者感知為較連續的。
因此,當在第一解碼模式或解碼器(例如,ACELP解碼器350)與第二解碼模式或解碼器(例如,MDCT解碼器320)之間切換時,圖3之系統300可以減少訊框邊界不連續性之方式處置濾波器記憶體及緩衝器更新。使用圖3之系統300可帶來經改良信號重建構品質以及經改良使用者體驗。
因此,圖1至圖3之系統中之一或多者可修改濾波器記憶體及預看緩衝器且反向預測「先前」核心的合成的訊框邊界音訊樣本以與「當前」核心的合成組合。舉例而言,如參考圖1所描述,可自MDCT「輕型」目標或合成緩衝器預測緩衝器中之內容,而非將ACELP預看緩衝器重設為零。替代性地,可進行訊框邊界樣本之反向預測,如參考圖1至圖2所描述。可視情況使用諸如MDCT能量資訊(例如,圖1之能量資訊140)、訊框類型等的額外資訊。另外,為了限制時間不連續性,可在MDCT解碼期間於訊框邊界處平滑地混合諸如ACELP重疊樣本之某些合成輸出,如參考圖3所描述。在特定實例中,「先前」合成之最後幾個樣本可用於計算訊框增益及其他頻寬延展參數。
參看圖4,描繪在編碼器裝置處的操作方法的特定實例,且將其大體上指定為400。在說明性實例中,方法400可在圖1之系統100處執行。
方法400可包括在402處使用第一編碼器編碼音訊信號之第一訊框。第一編碼器可為MDCT編碼器。舉例而言,在圖1中,MDCT編碼器120可編碼音訊信號102之第一訊框104。
方法400亦可包括在404處在第一訊框之編碼期間,產生包括對應於音訊信號之高頻帶部分的內容之基頻信號。基頻信號可對應於基於「輕型」MDCT目標產生或MDCT合成輸出之目標信號估計。舉例而言,在圖1中,MDCT編碼器120可基於由「輕型」目標信號產生器125產生之「輕型」目標信號或基於本端解碼器126之經合成輸出產生基頻信號130。
方法400可進一步包括在406處使用第二編碼器編碼音訊信號之第二(例如,依序下一)訊框。第二編碼器可為ACELP編碼器,且編碼第二訊框可包括處理基頻信號以產生與第二訊框相關聯之高頻帶參數。舉例而言,在圖1中,ACELP編碼器150可基於對基頻信號130之處理產生高頻帶參數以填充目標信號緩衝器151之至少一部分。在說明性實例中,可如參考圖2之高頻帶參數272所描述地產生高頻帶參數。
參看圖5,描繪在編碼器裝置處的操作方法的另一特定實例,且將其大體上指定為500。方法500可執行於圖1之系統100處。在特定實施中,方法500可對應於圖4之404。
方法500包括在502處對基頻信號執行翻轉操作及降低取樣操作以產生近似音訊信號之高頻帶部分的結果信號。基頻信號可對應於音訊信號之高頻帶部分及音訊信號之額外部分。舉例而言,可自MDCT本端解碼器126之合成緩衝器產生圖1之基頻信號130,如參考圖1所描述。舉例而言,MDCT編碼器120可基於MDCT本端解碼器126之經合成輸出產生基頻信號130。基頻信號130可對應於音訊信號120之高頻帶部分以及音訊信號120之額外(例如,低頻帶)部分。可對基頻信號 130執行翻轉操作及降低取樣操作以產生包括高頻帶資料之結果信號,如參考圖1所描述。舉例而言,ACELP編碼器150可對基頻信號130執行翻轉操作及降低取樣操作以產生結果信號。
方法500亦包括在504處基於結果信號填充第二編碼器之目標信號緩衝器。舉例而言,可基於結果信號填充圖1之ACELP編碼器150的目標信號緩衝器151,如參考圖1所描述。舉例而言,ACELP編碼器150可基於結果信號填充目標信號緩衝器151。ACELP編碼器150可基於儲存於目標信號緩衝器151中之資料產生第二訊框106之高頻帶部分,如參考圖1所描述。
參看圖6,描繪在編碼器裝置處的操作方法的另一特定實例,且將其大體上指定為600。在說明性實例中,方法600可在圖1之系統100處執行。
方法600可包括在602處使用第一編碼器編碼音訊信號之第一訊框且包括在604處使用第二編碼器編碼音訊信號之第二訊框。第一編碼器可為MDCT編碼器(諸如,圖1之MDCT編碼器120),且第二編碼器可為ACELP編碼器(諸如,圖1之ACELP編碼器150)。第二訊框可依序跟在第一訊框之後。
編碼第二訊框可包括在606處在第二編碼器處估計第一訊框之第一部分。舉例而言,參看圖1,估計器157可基於外插、線性預測、MDCT能量(例如,能量資訊140)、訊框類型等估計第一訊框104之部分(例如,最後10ms)。
編碼第二訊框亦可包括在608處基於第一訊框之第一部分及第二訊框填充第二緩衝器之緩衝器。舉例而言,參看圖1,可基於第一訊框104之所估計部分填充目標信號緩衝器151之第一部分152,且可基於第二訊框106填充目標信號緩衝器151之第二及第三部分153、154。
編碼第二訊框可進一步包括在610處產生與第二訊框相關聯之高 頻帶參數。舉例而言,在圖1中,ACELP編碼器150可產生與第二訊框106相關聯之高頻帶參數。在說明性實例中,可如參考圖2之高頻帶參數272所描述地產生高頻帶參數。
參看圖7,描繪在解碼器裝置處之操作方法的特定實例,且將其大體上指定為700。在說明性實例中,方法700可在圖3之系統300處執行。
方法700可包括在702處在包括第一解碼器及第二解碼器之裝置處使用第二解碼器解碼音訊信號之第一訊框。第二解碼器可為ACELP解碼器,且可產生對應於音訊信號之第二訊框的一部分之重疊資料。舉例而言,參看圖3,ACELP解碼器350可解碼第一訊框並產生重疊資料340(例如,20個音訊樣本)。
方法700亦可包括在704處使用第一解碼器解碼第二訊框。第一解碼器可為MDCT解碼器,且解碼第二訊框可包括使用來自第二解碼器之重疊資料應用平滑(例如,交叉衰落)操作。舉例而言,參看圖1,MDCT解碼器320可解碼第二訊框並使用重疊資料340應用平滑操作。
在特定態樣中,可經由處理單元(諸如,中央處理單元(CPU)、DSP或控制器)之硬體(例如,FPGA裝置、ASIC等)、經由韌體裝置或其任何組合實施圖4至圖7之方法中之一或多者。作為實例,可由執行指令之處理器執行圖4至圖7之方法中之一或多者,如關於圖8所描述。
參看圖8,描繪裝置(例如,無線通信裝置)之特定說明性實例的方塊圖,且將其大體上指定為800。在各種實例中,裝置800可具有比圖8中所說明的組件較少或較多之組件。在說明性實例中,裝置800可對應於圖1至圖3之系統中之一或多者。在說明性實例中,裝置800可根據圖4至圖7之方法中之一或多者進行操作。
在特定態樣中,裝置800包括處理器806(例如,CPU)。裝置800可包括一或多個額外處理器810(例如,一或多個DSP)。處理器810可包括話語及音樂編碼器解碼器(編碼解碼器)808及回音消除器812。話語及音樂編碼解碼器808可包括聲碼器編碼器836、聲碼器解碼器838或該兩者。
在特定態樣中,聲碼器編碼器836可包括MDCT編碼器860及ACELP編碼器862。MDCT編碼器860可對應於圖1之MDCT編碼器120,且ACELP編碼器862可對應於圖1之ACELP編碼器150或圖2之ACELP編碼系統200的一或多個組件。聲碼器編碼器836亦可包括編碼器選擇器864(例如,對應於圖1之編碼器選擇器110)。聲碼器解碼器838可包括MDCT解碼器870及ACELP解碼器872。MDCT解碼器870可對應於圖3之MDCT解碼器320且ACELP解碼器872可對應於圖1之ACELP解碼器350。聲碼器解碼器838亦可包括解碼器選擇器874(例如,對應於圖3之解碼器選擇器310)。儘管話語及音樂編碼解碼器808被說明為處理器810之組件,但在其他實例中,話語及音樂編碼解碼器808之一或多個組件可包括於處理器806、編碼解碼器834、另一處理組件或其組合中。
裝置800可包括記憶體832及經由收發器850耦接至天線842之無線控制器840。裝置800可包括耦接至顯示器控制器826之顯示器828。揚聲器848、麥克風846或該兩者可耦接至編碼解碼器834。編碼解碼器834可包括數位/類比轉換器(DAC)802及類比/數位轉換器(ADC)804。
在特定態樣中,編碼解碼器834可自麥克風846接收類比信號,使用類比/數位轉換器804將類比信號轉換成數位信號,並將數位信號(諸如)以脈碼調變(PCM)格式提供至話語及音樂編碼解碼器808。話語及音樂編碼解碼器808可處理數位信號。在特定態樣中,話語及音樂 編碼解碼器808可將數位信號提供至編碼解碼器834。編碼解碼器834可使用數位/類比轉換器802將數位信號轉換成類比信號,且可將類比信號提供至揚聲器848。
記憶體832可包括可由處理器806、處理器810、編碼解碼器834、裝置800之另一處理單元或其組合執行以執行本文中所揭示之方法及程序(諸如,圖4至圖7之方法中之一或多者)的指令856。可經由專用硬體(例如,電路系統)、由執行指令(例如,指令856)以執行一或多個任務之處理器或其組合實施圖1至圖3之系統的一或多個組件。作為實例,記憶體832或處理器806、處理器810及/或編碼解碼器834之一或多個組件可為記憶體裝置,諸如隨機存取記憶體(RAM)、磁阻式隨機存取記憶體(MRAM)、自旋力矩轉移MRAM(STT-MRAM)、快閃記憶體、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可抹除可程式化唯讀記憶體(EPROM)、電可抹除可程式化唯讀記憶體(EEPROM)、暫存器、硬碟、抽換式磁碟或光碟唯讀記憶體(CD-ROM)。記憶體裝置可包括當由電腦(例如,編碼解碼器834中之處理器、處理器806及/或處理器810)執行時可導致電腦執行圖4至圖7之方法中之一或多者的至少一部分之指令(例如,指令856)。作為實例,記憶體832或處理器806、處理器810、編碼解碼器834之一或多個組件可為非暫時性電腦可讀媒體,其包括當由電腦(例如,編碼解碼器834中之處理器、處理器806及/或處理器810)執行時導致電腦執行圖4至圖7之方法中之一或多者的至少一部分之指令(例如,指令856)。
在特定態樣中,裝置800可包括於系統級封裝或系統單晶片裝置822(諸如,行動台數據機(MSM))中。在特定態樣中,處理器806、處理器810、顯示器控制器826、記憶體832、編碼解碼器834、無線控制器840及收發器850包括於系統級封裝或系統單晶片裝置822中在特定態樣中,諸如觸控螢幕及/或小鍵盤之輸入裝置830及電源供應器844 耦接至系統單晶片裝置822。此外,在如圖8中所說明之特定態樣中,顯示器828、輸入裝置830、揚聲器848、麥克風846、天線842及電源供應器844在系統單晶片裝置822外部。然而,顯示器828、輸入裝置830、揚聲器848、麥克風846、天線842及電源供應器844中之每一者可耦接至系統單晶片裝置822之組件(諸如,介面或控制器)。在說明性實例中,裝置800對應於行動通信裝置、智慧型電話、蜂巢式電話、膝上型電腦、電腦、平板電腦、個人數位助理、顯示裝置、電視、遊戲主機、音樂播放器、收音機、數位視訊播放器、光碟播放器、調諧器、相機、導航裝置、解碼器系統、編碼器系統或其任何組合。
在說明性態樣中,處理器810可操作以根據所描述技術執行信號編碼及解碼操作。舉例而言,麥克風846可擷取音訊信號(例如,圖1之音訊信號102)。ADC 804可將所擷取音訊信號自類比波形轉換成包括數位音訊樣本之數位波形。處理器810可處理數位音訊樣本。回音消除器812可減少可已由揚聲器848之進入麥克風846的輸出所產生的回音。
聲碼器編碼器836可壓縮對應於經處理話語信號之數位音訊樣本,且可形成傳輸封包(例如,數位音訊樣本之經壓縮位元的表示)。舉例而言,傳輸封包可對應於圖1之輸出位元串流199或圖2之輸出位元串流299之至少一部分。傳輸封包可儲存於記憶體832中。收發器850可調變某形式之傳輸封包(例如,可將其他資訊附加至傳輸封包)且可經由天線842傳輸經調變資料。
作為另一實例,天線842可接收包括接收封包之傳入封包。可由另一裝置經由網路發送接收封包。舉例而言,接收封包可對應於圖3之位元串流302的至少一部分。聲碼器解碼器838可解壓縮並解碼接收封包以產生經重建構音訊樣本(例如,對應於經合成音訊信號399)。 回音消除器812可移除來自經重建構音訊樣本之回音。DAC 802可將聲碼器解碼器838之輸出自數位波形轉換成類比波形且可將經轉換波形提供至揚聲器848以用於輸出。
結合所描述態樣,揭示一種包括用於編碼音訊信號之第一訊框的第一構件之設備。舉例而言,用於編碼之第一構件可包括圖1之MDCT編碼器120、圖8之處理器806、處理器810、MDCT編碼器860、經組態以編碼音訊信號之第一訊框的一或多個裝置(例如,執行儲存於電腦可讀儲存裝置處之指令的處理器)或其任何組合。用於編碼之第一構件可經組態以在第一訊框之編碼期間產生包括對應於音訊信號之高頻帶部分的內容之基頻信號。
設備亦包括用於編碼音訊信號之第二訊框的第二構件。舉例而言,用於編碼之第二構件可包括圖1之ACELP編碼器150、圖8之處理器806、處理器810、ACELP編碼器862、經組態以編碼音訊信號之第二訊框的一或多個裝置(例如,執行儲存於電腦可讀儲存裝置處之指令的處理器)或其任何組合。編碼第二訊框可包括處理基頻信號以產生與第二訊框相關聯之高頻帶參數。
熟習此項技術者將進一步瞭解,結合本文中所揭示態樣所描述之各種說明性邏輯區塊、組態、模組、電路及演算法步驟可實施為電子硬體、由處理裝置(諸如,硬體處理器)執行之電腦軟體或兩者的組合。上文已大體上在功能性方面描述各種說明性組件、區塊、組態、模組、電路及步驟。此功能性實施為硬體還是可執行軟體取決於特定應用及強加於整個系統上之設計約束。熟習此項技術者可針對每一特定應用以變化方式實施所描述功能性,但此等實施決策不應被解譯為導致偏離本發明之範疇。
結合本文中所揭示之態樣所描述的方法或演算法之步驟可直接體現於硬體、由處理器執行之軟體模組或該兩者之組合中。軟體模組 可駐留於記憶體裝置中,諸如RAM、MRAM、STT-MRAM、快閃記憶體、ROM、PROM、EPROM、EEPROM、暫存器、硬碟、抽換式磁碟或CD-ROM。例示性記憶體裝置耦接至處理器,使得處理器可自記憶體裝置讀取資訊並將資訊寫入至記憶體裝置。在替代例中,記憶體裝置可與處理器成一體式。處理器及儲存媒體可駐留於ASIC中。ASIC可駐留於計算裝置或使用者終端機中。在替代例中,處理器及儲存媒體可作為離散組件駐留於計算裝置或使用者終端機中。
提供所揭示實例之先前描述以使得熟習此項技術者能夠製作或使用所揭示實例。熟習此項技術者將容易地顯而易見對此等實例之各種修改,且在不脫離本發明之範疇的情況下本文中所定義之原理可應用於其他實例。因此,本發明並不意欲限於本文中所展示態樣,而應符合與如以下申請專利範圍所定義之原理及新穎特徵相一致的可能的最廣泛範疇。
100‧‧‧系統
102‧‧‧音訊信號
104‧‧‧第一訊框
106‧‧‧第二訊框
108‧‧‧訊框
109‧‧‧訊框
110‧‧‧編碼器選擇器
120‧‧‧MDCT編碼器
121‧‧‧MDCT分析模組
122‧‧‧「全」MDCT模組
123‧‧‧低頻帶模組
124‧‧‧高頻帶模組
125‧‧‧「輕型」目標信號產生器
126‧‧‧本端解碼器
130‧‧‧基頻信號
140‧‧‧能量資訊
150‧‧‧ACELP編碼器
151‧‧‧目標信號緩衝器
152‧‧‧第一部分
153‧‧‧第二部分
154‧‧‧第三部分
155‧‧‧目標信號產生器
156‧‧‧計算模組
157‧‧‧估計器
158‧‧‧本端解碼器
159‧‧‧時域ACELP分析模組
160‧‧‧低頻帶分析模組
161‧‧‧高頻帶分析模組
199‧‧‧輸出位元串流

Claims (40)

  1. 一種方法,其包含:使用一第一編碼器編碼一音訊信號之一第一訊框;在該第一訊框之編碼期間產生包括對應於該音訊信號之一高頻帶部分的內容之一基頻信號;及使用一第二編碼器編碼該音訊信號之一第二訊框,其中編碼該第二訊框包括處理該基頻信號以產生與該第二訊框相關聯之高頻帶參數。
  2. 如請求項1之方法,其中該第二訊框在該音訊信號中依序跟在該第一訊框之後。
  3. 如請求項1之方法,其中該第一編碼器包含一基於變換之編碼器。
  4. 如請求項3之方法,其中該基於變換之編碼器包含一經修改離散餘弦變換(MDCT)編碼器。
  5. 如請求項1之方法,其中該第二編碼器包含一基於線性預測(LP)之編碼器。
  6. 如請求項5之方法,其中該基於線性預測(LP)之編碼器包含一代數碼激勵線性預測(ACELP)編碼器。
  7. 如請求項1之方法,其中產生該基頻信號包括執行一翻轉操作及一降低取樣操作。
  8. 如請求項1之方法,其中產生該基頻信號並不包括執行一高階濾波操作且並不包括執行一降混操作。
  9. 如請求項1之方法,其進一步包含至少部分基於該基頻信號且至少部分基於該第二訊框之一特定高頻帶部分填充該第二編碼器之一目標信號緩衝器。
  10. 如請求項1之方法,其中使用該第一編碼器之一本端解碼器產生該基頻信號,且其中該基頻信號對應於該音訊信號之至少一部分的一經合成版本。
  11. 如請求項10之方法,其中該基頻信號對應於該音訊信號之該高頻帶部分並被複製至該第二編碼器之一目標信號緩衝器。
  12. 如請求項10之方法,其中該基頻信號對應於該音訊信號之該高頻帶部分及該音訊信號之一額外部分,且其進一步包含:對該基頻信號執行一翻轉操作及一降低取樣操作以產生近似該高頻帶部分之一結果信號;及基於該結果信號填充該第二編碼器之一目標信號緩衝器。
  13. 一種方法,其包含:在包括一第一解碼器及一第二解碼器之一裝置處使用該第二解碼器解碼一音訊信號之一第一訊框,其中該第二解碼器產生對應於該音訊信號之一第二訊框的一部分之重疊資料;及使用該第一解碼器解碼該第二訊框,其中解碼該第二訊框包括使用來自該第二解碼器之該重疊資料應用一平滑操作。
  14. 如請求項13之方法,其中該第一解碼器包含一經修改離散餘弦變換(MDCT)解碼器,且其中該第二解碼器包含一代數碼激勵線性預測(ACELP)解碼器。
  15. 如請求項13之方法,其中該重疊資料包含該第二訊框之20個音訊樣本。
  16. 如請求項13之方法,其中該平滑操作包含一交叉衰落操作。
  17. 一種設備,其包含:一第一編碼器,其經組態以:編碼一音訊信號之一第一訊框;及在該第一訊框之編碼期間產生包括對應於該音訊信號之一 高頻帶部分的內容之一基頻信號;及一第二編碼器,其經組態以編碼該音訊信號之一第二訊框,其中編碼該第二訊框包括處理該基頻信號以產生與該第二訊框相關聯之高頻帶參數。
  18. 如請求項17之設備,其中該第二訊框在該音訊信號中依序跟在該第一訊框之後。
  19. 如請求項17之設備,其中該第一編碼器包含一經修改離散餘弦變換(MDCT)編碼器且其中該第二編碼器包含一代數碼激勵線性預測(ACELP)編碼器。
  20. 如請求項17之設備,其中產生該基頻信號包括執行一翻轉操作及一降低取樣操作,其中產生該基頻信號並不包括執行一高階濾波操作,且其中產生該基頻信號並不包括執行一降混操作。
  21. 一種設備,其包含:一第一編碼器,其經組態以編碼一音訊信號之一第一訊框;及一第二編碼器,其經組態以在該音訊信號之一第二訊框的編碼期間:估計該第一訊框之一第一部分;基於該第一訊框之該第一部分及該第二訊框填充該第二編碼器之一緩衝器;及產生與該第二訊框相關聯之高頻帶參數。
  22. 如請求項21之設備,其中估計該第一訊框之該第一部分包括基於該第二訊框之資料執行一外插操作。
  23. 如請求項21之設備,其中估計該第一訊框之該第一部分包括執行一反向線性預測。
  24. 如請求項21之設備,其中基於與該第一訊框相關聯之一能量估 計該第一訊框之該第一部分。
  25. 如請求項24之設備,其進一步包含耦接至該第一編碼器之一第一緩衝器,其中基於與該第一緩衝器相關聯之一第一能量判定與該第一訊框相關聯之該能量。
  26. 如請求項25之設備,其中基於與該第一緩衝器之一高頻帶部分相關聯的一第二能量判定與該第一訊框相關聯之該能量。
  27. 如請求項21之設備,其中至少部分基於該第一訊框之一第一訊框類型、該第二訊框之一第二訊框類型或該兩者估計該第一訊框之該第一部分。
  28. 如請求項27之設備,其中該第一訊框類型包含一有聲訊框類型、一無聲訊框類型、一暫態訊框類型或一泛型訊框類型,且其中該第二訊框類型包含該有聲訊框類型、該無聲訊框類型、該暫態訊框類型或該泛型訊框類型。
  29. 如請求項21之設備,其中該第一訊框之該第一部分之持續時間大約為5毫秒,且其中該第二訊框之持續時間大約為20毫秒。
  30. 如請求項21之設備,其中基於與該第一訊框之一經本端解碼低頻帶部分、該第一訊框之一經本端解碼高頻帶部分或該兩者相關聯的一能量估計該第一訊框之該第一部分。
  31. 一種設備,其包含:一第一解碼器;及一第二解碼器,其經組態以:解碼一音訊信號之一第一訊框;及產生對應於該音訊信號之一第二訊框的一部分之重疊資料,其中該第一解碼器經組態以在該第二訊框之解碼期間使用來自該第二解碼器之該重疊資料應用一平滑操作。
  32. 如請求項31之設備,其中該平滑操作包含一交叉衰落操作。
  33. 一種電腦可讀儲存裝置,其儲存當由一處理器執行時導致該處理器執行包含以下各者之操作的指令:使用一第一編碼器編碼一音訊信號之一第一訊框;在該第一訊框之編碼期間產生包括對應於該音訊信號之一高頻帶部分的內容之一基頻信號;及使用一第二編碼器編碼該音訊信號之一第二訊框,其中編碼該第二訊框包括處理該基頻信號以產生與該第二訊框相關聯之高頻帶參數。
  34. 如請求項33之電腦可讀儲存裝置,其中該第一編碼器包含一基於變換之編碼器,且其中該第二編碼器包含一基於線性預測(LP)之編碼器。
  35. 如請求項33之電腦可讀儲存裝置,其中產生該基頻信號包括執行一翻轉操作及一降低取樣操作,且其中該等操作進一步包含至少部分基於該基頻信號且至少部分基於該第二訊框之一特定高頻帶部分填充該第二編碼器之一目標信號緩衝器。
  36. 如請求項33之電腦可讀儲存裝置,其中使用該第一編碼器之一本端解碼器產生該基頻信號,且其中該基頻信號對應於該音訊信號之至少一部分的一經合成版本。
  37. 一種設備,其包含:用於編碼一音訊信號之一第一訊框的第一構件,該用於編碼之第一構件經組態以在該第一訊框之編碼期間產生包括對應於該音訊信號之一高頻帶部分的內容之一基頻信號;及用於編碼該音訊信號之一第二訊框的第二構件,其中編碼該第二訊框包括處理該基頻信號以產生與該第二訊框相關聯之高頻帶參數。
  38. 如請求項37之設備,其中該用於編碼之第一構件及該用於編碼之第二構件整合於一行動通信裝置、一智慧型電話、一蜂巢式電話、一膝上型電腦、一電腦、一平板電腦、一個人數位助理、一顯示裝置、一電視、一遊戲主機、一音樂播放器、一收音機、一數位視訊播放器、一光碟播放器、一調諧器、一相機、一導航裝置、一解碼器系統或一編碼器系統中之至少一者中。
  39. 如請求項37之設備,其中該用於編碼之第一構件進一步經組態以藉由執行一翻轉操作及一降低取樣操作來產生該基頻信號。
  40. 如請求項37之設備,其中該用於編碼之第一構件進一步經組態以藉由使用一本端解碼器來產生該基頻信號,且其中該基頻信號對應於該音訊信號之至少一部分的一經合成版本。
TW104110334A 2014-03-31 2015-03-30 在一裝置處切換寫碼技術之系統及方法 TW201603005A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201461973028P 2014-03-31 2014-03-31
US14/671,757 US9685164B2 (en) 2014-03-31 2015-03-27 Systems and methods of switching coding technologies at a device

Publications (1)

Publication Number Publication Date
TW201603005A true TW201603005A (zh) 2016-01-16

Family

ID=54191285

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104110334A TW201603005A (zh) 2014-03-31 2015-03-30 在一裝置處切換寫碼技術之系統及方法

Country Status (25)

Country Link
US (1) US9685164B2 (zh)
EP (1) EP3127112B1 (zh)
JP (1) JP6258522B2 (zh)
KR (1) KR101872138B1 (zh)
CN (1) CN106133832B (zh)
AU (1) AU2015241092B2 (zh)
BR (1) BR112016022764B1 (zh)
CA (1) CA2941025C (zh)
CL (1) CL2016002430A1 (zh)
DK (1) DK3127112T3 (zh)
ES (1) ES2688037T3 (zh)
HU (1) HUE039636T2 (zh)
MX (1) MX355917B (zh)
MY (1) MY183933A (zh)
NZ (1) NZ723532A (zh)
PH (1) PH12016501882B1 (zh)
PL (1) PL3127112T3 (zh)
PT (1) PT3127112T (zh)
RU (1) RU2667973C2 (zh)
SA (1) SA516371927B1 (zh)
SG (1) SG11201606852UA (zh)
SI (1) SI3127112T1 (zh)
TW (1) TW201603005A (zh)
WO (1) WO2015153491A1 (zh)
ZA (1) ZA201606744B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108701464A (zh) * 2016-02-12 2018-10-23 高通股份有限公司 多个音频信号的编码

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
US9984699B2 (en) 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
JP6807033B2 (ja) * 2015-11-09 2021-01-06 ソニー株式会社 デコード装置、デコード方法、およびプログラム
CN111709872B (zh) * 2020-05-19 2022-09-23 北京航空航天大学 一种图三角形计数算法的自旋存内计算架构

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5673412A (en) * 1990-07-13 1997-09-30 Hitachi, Ltd. Disk system and power-on sequence for the same
SE504010C2 (sv) 1995-02-08 1996-10-14 Ericsson Telefon Ab L M Förfarande och anordning för prediktiv kodning av tal- och datasignaler
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
AU3372199A (en) * 1998-03-30 1999-10-18 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US7236688B2 (en) * 2000-07-26 2007-06-26 Matsushita Electric Industrial Co., Ltd. Signal processing method and signal processing apparatus
JP2005244299A (ja) * 2004-02-24 2005-09-08 Sony Corp 記録再生装置、記録方法および再生方法、並びに、プログラム
US7463901B2 (en) * 2004-08-13 2008-12-09 Telefonaktiebolaget Lm Ericsson (Publ) Interoperability for wireless user devices with different speech processing formats
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
CN101925953B (zh) * 2008-01-25 2012-06-20 松下电器产业株式会社 编码装置、解码装置以及其方法
EP2304723B1 (en) * 2008-07-11 2012-10-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus and a method for decoding an encoded audio signal
PL2311034T3 (pl) 2008-07-11 2016-04-29 Fraunhofer Ges Forschung Koder i dekoder audio do kodowania ramek próbkowanego sygnału audio
EP2146343A1 (en) * 2008-07-16 2010-01-20 Deutsche Thomson OHG Method and apparatus for synchronizing highly compressed enhancement layer data
WO2010036061A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
JP4977157B2 (ja) 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
RU2591661C2 (ru) * 2009-10-08 2016-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Многорежимный декодировщик аудио сигнала, многорежимный кодировщик аудио сигналов, способы и компьютерные программы с использованием кодирования с линейным предсказанием на основе ограничения шума
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
US9037456B2 (en) 2011-07-26 2015-05-19 Google Technology Holdings LLC Method and apparatus for audio coding and decoding
WO2014108738A1 (en) * 2013-01-08 2014-07-17 Nokia Corporation Audio signal multi-channel parameter encoder

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108701464A (zh) * 2016-02-12 2018-10-23 高通股份有限公司 多个音频信号的编码

Also Published As

Publication number Publication date
PT3127112T (pt) 2018-10-19
BR112016022764A8 (pt) 2021-07-06
DK3127112T3 (en) 2018-09-17
PH12016501882A1 (en) 2016-12-19
ZA201606744B (en) 2018-05-30
RU2016137922A3 (zh) 2018-05-30
NZ723532A (en) 2019-05-31
RU2667973C2 (ru) 2018-09-25
BR112016022764B1 (pt) 2022-11-29
US20150279382A1 (en) 2015-10-01
WO2015153491A1 (en) 2015-10-08
JP2017511503A (ja) 2017-04-20
CA2941025A1 (en) 2015-10-08
PL3127112T3 (pl) 2018-12-31
US9685164B2 (en) 2017-06-20
PH12016501882B1 (en) 2022-09-02
SI3127112T1 (en) 2018-08-31
HUE039636T2 (hu) 2019-01-28
MX355917B (es) 2018-05-04
CN106133832B (zh) 2019-10-25
CN106133832A (zh) 2016-11-16
AU2015241092B2 (en) 2018-05-10
MY183933A (en) 2021-03-17
HK1226546A1 (zh) 2017-09-29
MX2016012522A (es) 2017-01-09
CA2941025C (en) 2018-09-25
CL2016002430A1 (es) 2017-02-17
JP6258522B2 (ja) 2018-01-10
EP3127112A1 (en) 2017-02-08
SG11201606852UA (en) 2016-10-28
SA516371927B1 (ar) 2020-05-31
ES2688037T3 (es) 2018-10-30
AU2015241092A1 (en) 2016-09-08
KR101872138B1 (ko) 2018-06-27
RU2016137922A (ru) 2018-05-07
KR20160138472A (ko) 2016-12-05
EP3127112B1 (en) 2018-06-20
BR112016022764A2 (pt) 2017-08-15

Similar Documents

Publication Publication Date Title
CN106256000B (zh) 高频带激励信号生成
KR101809866B1 (ko) 고대역 신호 특성에 기초한 시간 이득 조정
KR101988710B1 (ko) 미스매치된 주파수 범위들을 이용한 고-대역 신호 코딩
JP6396538B2 (ja) 複数のサブバンドを使用するハイバンド信号コーディング
CN106133832B (zh) 在装置处切换译码技术的设备及方法
HK1226546B (zh) 在装置处切换译码技术的设备及方法
HK1227164B (zh) 高频带激励信号生成