KR20080063386A - Vliw 아키텍처를 갖는 dsp에 대한 고속 dct알고리즘 - Google Patents
Vliw 아키텍처를 갖는 dsp에 대한 고속 dct알고리즘 Download PDFInfo
- Publication number
- KR20080063386A KR20080063386A KR1020087010725A KR20087010725A KR20080063386A KR 20080063386 A KR20080063386 A KR 20080063386A KR 1020087010725 A KR1020087010725 A KR 1020087010725A KR 20087010725 A KR20087010725 A KR 20087010725A KR 20080063386 A KR20080063386 A KR 20080063386A
- Authority
- KR
- South Korea
- Prior art keywords
- data set
- dct
- discrete cosine
- cosine transform
- input data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/147—Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Discrete Mathematics (AREA)
- Computing Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Complex Calculations (AREA)
- Advance Control (AREA)
- Executing Machine-Instructions (AREA)
Abstract
Description
Claims (25)
- 이산 코사인 변환 오퍼레이션을 수행하기 위한 단일 스테이지 연산 방법으로서,디지털 신호 프로세서를 사용하여 복수의 VLIW(very large instruction words)를 실행함으로써 상기 이산 코사인 변환 오퍼레이션을 수행하는 단계를 포함하며,상기 복수의 VLIW는 승산의 제 1 횟수와 가산의 제 2 횟수를 포함하고,상기 제 1 횟수는 상기 제 2 횟수보다 큰, 단일 스테이지 연산 방법.
- 제 1 항에 있어서,상기 이산 코사인 변환 오퍼레이션은 8 포인트 데이터 세트에 대해 수행되는, 단일 스테이지 연산 방법.
- 제 1 항에 있어서,상기 이산 코사인 변환 오퍼레이션은 8×8 포인트 매트릭스 데이터 세트에 대해 수행되는, 단일 스테이지 연산 방법.
- 제 1 항에 있어서,상기 복수의 VLIW의 명령은, 상기 이산 코사인 변환 오퍼레이션이 단일 스테 이지의 실행으로 수행될 수 있도록 데이터 의존성이 없는, 단일 스테이지 연산 방법.
- 제 1 항에 있어서,상기 이산 코사인 변환 오퍼레이션을 수행하는 단계는,1차원 8 포인트 DCT 변환 오퍼레이션을 입력 매트릭스 데이터 세트의 각각의 컬럼에 적용하여, 중간 매트릭스를 생성하는 단계; 및상기 1차원 8 포인트 DCT 변환 오퍼레이션을 상기 중간 매트릭스의 각각의 로우에 적용하여, 변환된 매트릭스 데이터 세트를 생성하는 단계를 포함하는, 단일 스테이지 연산 방법.
- 제 1 항에 있어서,상기 승산의 제 1 횟수는 30회의 승산 오퍼레이션을 포함하고,상기 가산의 제 2 횟수는 12회의 가산을 포함하는, 단일 스테이지 연산 방법.
- 입력 데이터 세트를 수신하는 단계;상기 입력 데이터 세트에 대해 단일 스테이지 이산 코사인 변환 오퍼레이션을 수행하여 변환된 데이터 세트를 생성하기 위해, 복수의 VLIW(very large instruction words)를 실행함으로써 상기 입력 데이터 세트를 프로세싱하는 단계를 포함하는, 이산 코사인 변환 오퍼레이션을 수행하기 위한 방법.
- 제 7 항에 있어서,상기 입력 데이터 세트를 프로세싱하는 단계는,상기 입력 데이터 세트에 관련된 복수의 스칼라를 계산하는 단계;상기 복수의 스칼라를 커널 매트릭스와 승산하여, 복수의 곱들을 생성하는 단계; 및상기 복수의 곱들을 합산하여, 상기 변환된 데이터 세트를 생성하는 단계를 포함하는, 이산 코사인 변환 오퍼레이션을 수행하기 위한 방법.
- 제 7 항에 있어서,상기 복수의 VLIW는 승산의 제 1 횟수와 가산의 제 2 횟수를 포함하고,상기 제 1 횟수는 상기 제 2 횟수보다 큰, 이산 코사인 변환 오퍼레이션을 수행하기 위한 방법.
- 제 7 항에 있어서,상기 입력 데이터 세트를 수신하는 단계는 8 포인트 데이터 세트를 수신하는 단계를 포함하는, 이산 코사인 변환 오퍼레이션을 수행하기 위한 방법.
- 제 7 항에 있어서,상기 입력 데이터 세트를 수신하는 단계는 8×8 매트릭스 데이터 세트를 수신하는 단계를 포함하는, 이산 코사인 변환 오퍼레이션을 수행하기 위한 방법.
- 단일 스테이지 이산 코사인 변환 오퍼레이션을 실행하기 위해 VLIW(very large instruction words)의 세트를 저장하기 위한 메모리; 및상기 VLIW의 세트를 실행하여 입력 데이터 세트로부터 변환된 데이터 세트를 생성하도록 구성된 디지털 신호 프로세서를 구비하는, 통신 디바이스.
- 제 12 항에 있어서,상기 디지털 신호 프로세서는, 단일 클록 사이클에서, 2회의 승산-누산 오퍼레이션, 산술 로직 유닛 오퍼레이션, 및 메모리 로드/저장 오퍼레이션을 수행하도록 구성된, 통신 디바이스.
- 제 12 항에 있어서,상기 디지털 신호 프로세서는 JPEG(Joint Photographic Experts Group) 포맷에 따라 압축된 이미지를 프로세싱하도록 구성된, 통신 디바이스.
- 제 12 항에 있어서,상기 디지털 신호 프로세서는 MPEG(Moving Picture Experts Group) 포맷에 따라 압축된 비디오를 프로세싱하도록 구성된, 통신 디바이스.
- 제 12 항에 있어서,상기 디지털 신호 프로세서는 300 미만의 클록 사이클에서 8×8 변환을 수행하는, 통신 디바이스.
- 제 12 항에 있어서,상기 통신 디바이스는 이동 전화기를 포함하는, 통신 디바이스.
- 제 12 항에 있어서,상기 통신 디바이스는 VoIP(Voice over Internet Protocol) 전화기를 포함하는, 통신 디바이스.
- 가산 오퍼레이션보다 더 많은 승산 오퍼레이션을 갖는 이산 코사인 변환(DCT) 오퍼레이션을 실행하기 위한 VLIW(very large instruction words)의 명령 세트; 및입력 데이터 세트에 대해 상기 DCT 오퍼레이션을 수행하여 변환 데이터 세트를 생성하기 위해 상기 명령 세트를 실행하도록 구성된 프로세서를 구비하는, 디지털 신호 프로세서.
- 제 19 항에 있어서,상기 프로세서는 단일 스테이지에서 상기 명령 세트를 실행하는, 디지털 신호 프로세서.
- 제 19 항에 있어서,상기 DCT 오퍼레이션은 가산 오퍼레이션보다 2배 많은 승산 오퍼레이션을 포함하는, 디지털 신호 프로세서.
- 제 19 항에 있어서,상기 입력 데이터 세트는 8×8 매트릭스 데이터 세트를 포함하는, 디지털 신호 프로세서.
- 이산 코사인 변환(DCT) 오퍼레이션을 정의하는 복수의 VLIW(very large instruction words)를 포함하는 명령 세트를 저장하는 수단;입력 데이터 세트를 수신하는 수단; 및상기 입력 데이터 세트에 대해 상기 복수의 VLIW를 실행함으로써 상기 이산 코사인 변환 오퍼레이션을 수행하는 수단을 구비하며,상기 복수의 VLIW는 승산의 제 1 횟수와 가산의 제 2 횟수를 포함하고,상기 제 1 횟수는 상기 제 2 횟수보다 큰, 통신 시스템.
- 이산 코사인 변환 오퍼레이션을 수행하기 위한 단일 스테이지 연산 방법으로 서,복수의 VLIW(very large instruction words)를 복수의 기본 명령으로 분해하여 이산 코사인 변환(DCT) 오퍼레이션을 실행하는 단계;상기 복수의 기본 명령 중 적어도 2개의 기본 명령을 동시에 실행하여, 단일 스테이지에서, 입력 데이터 세트에 대해 이산 코사인 변환(DCT) 오퍼레이션을 수행하는 단계; 및상기 입력 데이터 세트에 대한 상기 DCT 오퍼레이션의 성능에 관련된 변환 데이터 세트를 생성하는 단계를 포함하는, 단일 스테이지 연산 방법.
- 제 24 항에 있어서,상기 복수의 VLIW는 승산의 제 1 횟수와 가산의 제 2 횟수를 포함하고,상기 승산의 제 1 횟수는 상기 가산의 제 2 횟수보다 적어도 2배 큰, 단일 스테이지 연산 방법.
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US72413105P | 2005-10-05 | 2005-10-05 | |
| US60/724,131 | 2005-10-05 | ||
| US11/377,134 | 2006-03-15 | ||
| US11/377,134 US7725516B2 (en) | 2005-10-05 | 2006-03-15 | Fast DCT algorithm for DSP with VLIW architecture |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20080063386A true KR20080063386A (ko) | 2008-07-03 |
| KR101041760B1 KR101041760B1 (ko) | 2011-06-17 |
Family
ID=37903117
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020087010725A Expired - Fee Related KR101041760B1 (ko) | 2005-10-05 | 2006-10-05 | Vliw 아키텍처를 갖는 dsp에 대한 고속 dct알고리즘 |
Country Status (7)
| Country | Link |
|---|---|
| US (2) | US7725516B2 (ko) |
| EP (1) | EP1952269A2 (ko) |
| JP (1) | JP4801163B2 (ko) |
| KR (1) | KR101041760B1 (ko) |
| CN (1) | CN101351792B (ko) |
| TW (1) | TW200801980A (ko) |
| WO (1) | WO2007044598A2 (ko) |
Families Citing this family (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7725516B2 (en) * | 2005-10-05 | 2010-05-25 | Qualcomm Incorporated | Fast DCT algorithm for DSP with VLIW architecture |
| US8340058B2 (en) * | 2007-10-29 | 2012-12-25 | Nvidia Corporation | Headphone with enhanced voice communication |
| US20090198976A1 (en) * | 2008-02-06 | 2009-08-06 | Austel Vernon R | Method and structure for high-performance matrix multiplication in the presence of several architectural obstacles |
| US8825015B2 (en) * | 2008-09-18 | 2014-09-02 | Nvidia Corporation | Accessing web pages on communication paths with low bandwidth |
| US9110849B2 (en) * | 2009-04-15 | 2015-08-18 | Qualcomm Incorporated | Computing even-sized discrete cosine transforms |
| US9069713B2 (en) * | 2009-06-05 | 2015-06-30 | Qualcomm Incorporated | 4X4 transform for media coding |
| US8762441B2 (en) * | 2009-06-05 | 2014-06-24 | Qualcomm Incorporated | 4X4 transform for media coding |
| US9075757B2 (en) * | 2009-06-24 | 2015-07-07 | Qualcomm Incorporated | 16-point transform for media data coding |
| US9081733B2 (en) * | 2009-06-24 | 2015-07-14 | Qualcomm Incorporated | 16-point transform for media data coding |
| US8451904B2 (en) | 2009-06-24 | 2013-05-28 | Qualcomm Incorporated | 8-point transform for media data coding |
| US9118898B2 (en) * | 2009-06-24 | 2015-08-25 | Qualcomm Incorporated | 8-point transform for media data coding |
| TWI415474B (zh) * | 2010-07-19 | 2013-11-11 | Mstar Semiconductor Inc | 視訊編/解碼器與其方法 |
| US9824066B2 (en) | 2011-01-10 | 2017-11-21 | Qualcomm Incorporated | 32-point transform for media data coding |
| US9389854B2 (en) | 2013-03-15 | 2016-07-12 | Qualcomm Incorporated | Add-compare-select instruction |
| US9870341B2 (en) * | 2016-03-18 | 2018-01-16 | Qualcomm Incorporated | Memory reduction method for fixed point matrix multiply |
Family Cites Families (22)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| NL8601183A (nl) * | 1986-05-12 | 1987-12-01 | Philips Nv | Discrete cosinus transformatie-inrichting. |
| JP2646844B2 (ja) * | 1990-11-16 | 1997-08-27 | 日本電気株式会社 | 離散コサイン変換装置 |
| JP2928684B2 (ja) * | 1991-10-31 | 1999-08-03 | 株式会社東芝 | Vliw型演算処理装置 |
| JPH0883264A (ja) * | 1994-09-12 | 1996-03-26 | Nippon Telegr & Teleph Corp <Ntt> | 1次元シストリックアレイ型演算器とそれを用いたdct/idct演算装置 |
| US5943502A (en) * | 1994-12-09 | 1999-08-24 | Neomagic Israel Ltd. | Apparatus and method for fast 1D DCT |
| CN1142162A (zh) * | 1995-01-28 | 1997-02-05 | 大宇电子株式会社 | 二维逆离散余弦变换电路 |
| US5826054A (en) * | 1996-05-15 | 1998-10-20 | Philips Electronics North America Corporation | Compressed Instruction format for use in a VLIW processor |
| AU9030298A (en) * | 1997-08-25 | 1999-03-16 | Qualcomm Incorporated | Variable block size 2-dimensional inverse discrete cosine transform engine |
| US6173389B1 (en) | 1997-12-04 | 2001-01-09 | Billions Of Operations Per Second, Inc. | Methods and apparatus for dynamic very long instruction word sub-instruction selection for execution time parallelism in an indirect very long instruction word processor |
| KR100538605B1 (ko) * | 1998-03-18 | 2005-12-22 | 코닌클리즈케 필립스 일렉트로닉스 엔.브이. | 데이터 처리 장치, 행렬 변환 방법 및 컴퓨터 판독가능한 매체 |
| US6154443A (en) | 1998-08-11 | 2000-11-28 | Industrial Technology Research Institute | FFT-based CDMA RAKE receiver system and method |
| US6839728B2 (en) * | 1998-10-09 | 2005-01-04 | Pts Corporation | Efficient complex multiplication and fast fourier transform (FFT) implementation on the manarray architecture |
| IL146183A0 (en) | 1999-04-29 | 2002-07-25 | Walter E Pelton | Computation of discrete fourier transform |
| WO2001035267A1 (en) | 1999-11-12 | 2001-05-17 | Bops, Incorporated | Methods and apparatus for efficient cosine transform implementations |
| US6754687B1 (en) * | 1999-11-12 | 2004-06-22 | Pts Corporation | Methods and apparatus for efficient cosine transform implementations |
| US6804771B1 (en) * | 2000-07-25 | 2004-10-12 | University Of Washington | Processor with register file accessible by row column to achieve data array transposition |
| US7027489B2 (en) | 2001-04-06 | 2006-04-11 | Interdigital Technology Corporation | Iterative fast fourier transform error correction |
| US7689641B2 (en) * | 2003-06-30 | 2010-03-30 | Intel Corporation | SIMD integer multiply high with round and shift |
| EP1536647A1 (en) * | 2003-11-26 | 2005-06-01 | STMicroelectronics Limited | A video decoding device |
| FI118747B (fi) | 2004-01-23 | 2008-02-29 | Abb Oy | Automaattinen ohjauslaite |
| JP4283131B2 (ja) * | 2004-02-12 | 2009-06-24 | パナソニック株式会社 | プロセッサ及びコンパイル方法 |
| US7725516B2 (en) * | 2005-10-05 | 2010-05-25 | Qualcomm Incorporated | Fast DCT algorithm for DSP with VLIW architecture |
-
2006
- 2006-03-15 US US11/377,134 patent/US7725516B2/en not_active Expired - Fee Related
- 2006-10-05 KR KR1020087010725A patent/KR101041760B1/ko not_active Expired - Fee Related
- 2006-10-05 WO PCT/US2006/039279 patent/WO2007044598A2/en not_active Ceased
- 2006-10-05 CN CN2006800445719A patent/CN101351792B/zh not_active Expired - Fee Related
- 2006-10-05 TW TW095137251A patent/TW200801980A/zh unknown
- 2006-10-05 JP JP2008534745A patent/JP4801163B2/ja not_active Expired - Fee Related
- 2006-10-05 EP EP06836224A patent/EP1952269A2/en not_active Withdrawn
-
2010
- 2010-05-25 US US12/787,102 patent/US8396916B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| CN101351792A (zh) | 2009-01-21 |
| KR101041760B1 (ko) | 2011-06-17 |
| JP2009516238A (ja) | 2009-04-16 |
| WO2007044598A3 (en) | 2008-08-14 |
| US20070078921A1 (en) | 2007-04-05 |
| JP4801163B2 (ja) | 2011-10-26 |
| WO2007044598A2 (en) | 2007-04-19 |
| TW200801980A (en) | 2008-01-01 |
| EP1952269A2 (en) | 2008-08-06 |
| CN101351792B (zh) | 2010-12-22 |
| US20100235421A1 (en) | 2010-09-16 |
| US8396916B2 (en) | 2013-03-12 |
| US7725516B2 (en) | 2010-05-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8396916B2 (en) | Fast DCT algorithm for DSP with VLIW architecture | |
| JP6073385B2 (ja) | スカラー/ベクトル命令を使用したデータ処理システムおよび方法 | |
| EP1896919B1 (en) | System and method of counting leading zeros and counting leading ones in a digital signal processor | |
| CN110263909A (zh) | 图像识别方法及装置 | |
| US20100122070A1 (en) | Combined associative and distributed arithmetics for multiple inner products | |
| MX2007012584A (es) | Archivos de registro no divididos unificados para un procesador de senales digital que opera en un ambiente intercalado de multi-ejecucion. | |
| US20040117418A1 (en) | Forward discrete cosine transform engine | |
| EP2761870A1 (en) | Systems, methods, and computer program products for a video encoding pipeline | |
| JP2009516238A5 (ko) | ||
| EP3072297A1 (en) | Implementation design for hybrid transform coding scheme | |
| EP1943588B1 (en) | Arithmethic logic and shifting device for use in a processor | |
| US8234319B2 (en) | System and method of performing two's complement operations in a digital signal processor | |
| Braatz et al. | A new hardware friendly 2D-DCT HEVC compliant algorithm and its high throughput and low power hardware design | |
| CN111200732A (zh) | 一种反量化反变换方法及装置 | |
| CN113761464A (zh) | 数据处理方法、介质及电子设备 | |
| Dang et al. | High-performance low-power BinDCT coprocessor for wireless video applications | |
| Park et al. | Architecture of an efficient area and flexible multi-codec processor | |
| Girija et al. | Analysis of the Matrix Processing (MxP) Architecture | |
| Srinivasarao et al. | A parallel architecture for successive elimination block matching algorithm |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0105 | International application |
St.27 status event code: A-0-1-A10-A15-nap-PA0105 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| A201 | Request for examination | ||
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| E13-X000 | Pre-grant limitation requested |
St.27 status event code: A-2-3-E10-E13-lim-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E90F | Notification of reason for final refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
Fee payment year number: 1 St.27 status event code: A-2-2-U10-U12-oth-PR1002 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| FPAY | Annual fee payment |
Payment date: 20140529 Year of fee payment: 4 |
|
| PR1001 | Payment of annual fee |
Fee payment year number: 4 St.27 status event code: A-4-4-U10-U11-oth-PR1001 |
|
| PR1001 | Payment of annual fee |
Fee payment year number: 5 St.27 status event code: A-4-4-U10-U11-oth-PR1001 |
|
| FPAY | Annual fee payment |
Payment date: 20160330 Year of fee payment: 6 |
|
| PR1001 | Payment of annual fee |
Fee payment year number: 6 St.27 status event code: A-4-4-U10-U11-oth-PR1001 |
|
| FPAY | Annual fee payment |
Payment date: 20170330 Year of fee payment: 7 |
|
| PR1001 | Payment of annual fee |
Fee payment year number: 7 St.27 status event code: A-4-4-U10-U11-oth-PR1001 |
|
| FPAY | Annual fee payment |
Payment date: 20180329 Year of fee payment: 8 |
|
| PR1001 | Payment of annual fee |
Fee payment year number: 8 St.27 status event code: A-4-4-U10-U11-oth-PR1001 |
|
| PC1903 | Unpaid annual fee |
Not in force date: 20190610 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE St.27 status event code: A-4-4-U10-U13-oth-PC1903 |
|
| PC1903 | Unpaid annual fee |
Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20190610 St.27 status event code: N-4-6-H10-H13-oth-PC1903 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |