KR102368970B1 - 지능형 고 대역폭 메모리 장치 - Google Patents
지능형 고 대역폭 메모리 장치 Download PDFInfo
- Publication number
- KR102368970B1 KR102368970B1 KR1020180065482A KR20180065482A KR102368970B1 KR 102368970 B1 KR102368970 B1 KR 102368970B1 KR 1020180065482 A KR1020180065482 A KR 1020180065482A KR 20180065482 A KR20180065482 A KR 20180065482A KR 102368970 B1 KR102368970 B1 KR 102368970B1
- Authority
- KR
- South Korea
- Prior art keywords
- host
- high bandwidth
- bandwidth memory
- offload processing
- logic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/16—Handling requests for interconnection or transfer for access to memory bus
- G06F13/1668—Details of memory controller
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0659—Command handling arrangements, e.g. command buffers, queues, command scheduling
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L25/00—Assemblies consisting of a plurality of semiconductor or other solid state devices
- H01L25/18—Assemblies consisting of a plurality of semiconductor or other solid state devices the devices being of the types provided for in two or more different main groups of the same subclass of H10B, H10D, H10F, H10H, H10K or H10N
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/0223—User address space allocation, e.g. contiguous or non contiguous base addressing
- G06F12/023—Free address space management
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/16—Handling requests for interconnection or transfer for access to memory bus
- G06F13/1668—Details of memory controller
- G06F13/1673—Details of memory controller using buffers
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
- G06F3/0611—Improving I/O performance in relation to response time
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
- G06F3/0613—Improving I/O performance in relation to throughput
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/062—Securing storage systems
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0658—Controller construction arrangements
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0673—Single storage device
- G06F3/0679—Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C5/00—Details of stores covered by group G11C11/00
- G11C5/02—Disposition of storage elements, e.g. in the form of a matrix array
- G11C5/04—Supports for storage elements, e.g. memory modules; Mounting or fixing of storage elements on such supports
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L25/00—Assemblies consisting of a plurality of semiconductor or other solid state devices
- H01L25/03—Assemblies consisting of a plurality of semiconductor or other solid state devices all the devices being of a type provided for in a single subclass of subclasses H10B, H10D, H10F, H10H, H10K or H10N, e.g. assemblies of rectifier diodes
- H01L25/04—Assemblies consisting of a plurality of semiconductor or other solid state devices all the devices being of a type provided for in a single subclass of subclasses H10B, H10D, H10F, H10H, H10K or H10N, e.g. assemblies of rectifier diodes the devices not having separate containers
- H01L25/065—Assemblies consisting of a plurality of semiconductor or other solid state devices all the devices being of a type provided for in a single subclass of subclasses H10B, H10D, H10F, H10H, H10K or H10N, e.g. assemblies of rectifier diodes the devices not having separate containers the devices being of a type provided for in group H10D89/00
- H01L25/0655—Assemblies consisting of a plurality of semiconductor or other solid state devices all the devices being of a type provided for in a single subclass of subclasses H10B, H10D, H10F, H10H, H10K or H10N, e.g. assemblies of rectifier diodes the devices not having separate containers the devices being of a type provided for in group H10D89/00 the devices being arranged next to each other
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0862—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches with prefetch
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/10—Providing a specific technical effect
- G06F2212/1008—Correctness of operation, e.g. memory ordering
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/10—Providing a specific technical effect
- G06F2212/1016—Performance improvement
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/10—Providing a specific technical effect
- G06F2212/1056—Simplification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/60—Details of cache memory
- G06F2212/602—Details relating to cache prefetching
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30003—Arrangements for executing specific machine instructions
- G06F9/30007—Arrangements for executing specific machine instructions to perform operations on data operands
- G06F9/3001—Arithmetic instructions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C5/00—Details of stores covered by group G11C11/00
- G11C5/02—Disposition of storage elements, e.g. in the form of a matrix array
- G11C5/025—Geometric lay-out considerations of storage- and peripheral-blocks in a semiconductor storage device
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L25/00—Assemblies consisting of a plurality of semiconductor or other solid state devices
- H01L25/03—Assemblies consisting of a plurality of semiconductor or other solid state devices all the devices being of a type provided for in a single subclass of subclasses H10B, H10D, H10F, H10H, H10K or H10N, e.g. assemblies of rectifier diodes
- H01L25/04—Assemblies consisting of a plurality of semiconductor or other solid state devices all the devices being of a type provided for in a single subclass of subclasses H10B, H10D, H10F, H10H, H10K or H10N, e.g. assemblies of rectifier diodes the devices not having separate containers
- H01L25/065—Assemblies consisting of a plurality of semiconductor or other solid state devices all the devices being of a type provided for in a single subclass of subclasses H10B, H10D, H10F, H10H, H10K or H10N, e.g. assemblies of rectifier diodes the devices not having separate containers the devices being of a type provided for in group H10D89/00
- H01L25/0652—Assemblies consisting of a plurality of semiconductor or other solid state devices all the devices being of a type provided for in a single subclass of subclasses H10B, H10D, H10F, H10H, H10K or H10N, e.g. assemblies of rectifier diodes the devices not having separate containers the devices being of a type provided for in group H10D89/00 the devices being arranged next and on each other, i.e. mixed assemblies
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Power Engineering (AREA)
- Biomedical Technology (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Neurology (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Advance Control (AREA)
- Memory System (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Abstract
Description
도 1은 지능형 HBM 장치의 예시적인 평면 블록도이다.
도 2는 도 1의 2-2 선에 따른 지능형 HBM 장치의 단면 블록도를 도시한다.
도 3은 호스트로부터 연산 작업을 오프로드하기 위한 2가지 유형의 아키텍처에 대한 프레임워크 블록도이다.
도 4는 일부 실시예들에 따라 주로 하드웨어로 구현되는 호스트 구성요소 및 지능형 HBM 스택을 포함하는 시스템의 예시적인 블록도이다.
도 5a는 일부 실시예들에 따라 주로 소프트웨어로 구현되는 호스트 구성요소 및 지능형 HBM 스택을 포함하는 시스템의 예시적인 블록도이다.
도 5b는 일부 실시예들에 따라 서로 다른 커널들이 GPU 또는 지능형 HBM 스택에서 처리될 수 있는 방법을 설명하기 위한 도면이다.
도 6은 도 1 및 도 2의 로직 다이의 마이크로아키텍처를 도시한다.
도 7은 본 명세서에 개시된 실시예들에 따른 도 1의 지능형 HBM 장치를 포함하는 컴퓨팅 시스템의 예시적인 블록도이다.
| # | 카테고리 | 함수 예 | 운영 필드 | 유스 케이스 |
| 1. | 데이터 원자성 | Read-modify-write; test & set; compare-and-swap (CAS); increment | 식별자 (ID); 주소; 조건부 연산; 값 | 높은 ML 스레드 병렬처리 |
| 2. | 데이터 복사 | Mem-copy; Mem-set | ID; 소스; 목적지 주소; 범위; 값 | 초기화; 저지연 데이터 이동 |
| 3. | 데이터 정형 | Transpose; pack/unpack (예: 벡터); swap (예: 행렬의 원소) | ID; 소스; 목적지 주소; 정형(reshaping) 연산; 데이터 스트라이드; 넘버 | 컨볼루션 신경망(CNN); 선형대수 |
| 4. | 데이터 축약 | Popcount (예: 벡터의 항목 카운트); accumulation (예: 가산); bitwise operations (예: 비트단위 AND, OR 등); sum; min; dot-product; Euclidean distance | ID; 소스; 목적지 주소; 연산; 데이터 스트라이드; 넘버 | 컨볼루션 신경망 (CNN); 이진 신경망 (BNN); 카운터 |
| 5. | 특수 함수 | Map function; hash; pattern match; reconfigurable compute blocks | ID; 소스; 목적지 주소; 연산; 데이터 스트라이드; 넘버 | 함수 맵퍼 |
110: HBM2 모듈 115: 호스트
120: 지능형 HBM 스택 205: 인터포저
210: 패키지 기판 605: 코어 아키텍처
610: 오프로드 처리 로직부 615: 호스트 관리자
620: SRAM 컨트롤러 625: HBM 컨트롤러
630: HBM2 모듈 스택 635: SRAM 메모리
Claims (25)
- 중앙처리장치(Central Processing Unit: CPU), 그래픽처리장치(Graphics Processing Unit: GPU), 주문형 집적회로(Application Specific Integrated Circuit: ASIC) 또는 필드 프로그래머블 게이트 어레이(Field Programmable Gate Array: FPGA) 중 적어도 하나를 포함하는 호스트; 및
적층된 복수의 고 대역폭 메모리(High Bandwidth Memory: HBM) 모듈들 및 상기 복수의 고 대역폭 메모리 모듈들 아래에 배치된 로직 다이를 포함하는 지능형 고 대역폭 메모리 스택을 포함하고,
상기 로직 다이는
상기 복수의 고 대역폭 메모리 모듈들과 인터페이스하는 메모리 컨트롤러를 포함하는 고 대역폭 메모리 컨트롤러; 및
상기 호스트로부터 처리 연산들을 오프로드하는 오프로드 처리 로직부를 포함하고,
상기 오프로드 처리 로직부는 상기 오프로드 처리 연산들이 개시되어야 함을 지시하는 상기 호스트에 의해서 설정된 제1 플래그를 수신하고,
상기 오프로드 처리 로직부는 상기 제1 플래그에 응답하여 상기 고 대역폭 메모리 컨트롤러를 사용하여 상기 오프로드 처리 연산들을 수행하고,
상기 고 대역폭 메모리 컨트롤러는 상기 오프로드 처리 연산들이 완료되었음을 지시하는 제2 플래그를 설정하는, 지능형 고 대역폭 메모리 시스템. - 제1항에 있어서,
상기 로직 다이는 상기 호스트로부터 상기 처리 연산들을 오프로드하는, 지능형 고 대역폭 메모리 시스템. - 제1항에 있어서,
상기 호스트 및 상기 로직 다이에 연결된 인터포저를 더 포함하는, 지능형 고 대역폭 메모리 시스템. - 제3항에 있어서,
상기 인터포저에 연결된 기판을 더 포함하는, 지능형 고 대역폭 메모리 시스템. - 제4항에 있어서,
상기 복수의 고 대역폭 메모리 모듈들은 상기 로직 다이와 통신 가능하게 연결되고, 상기 로직 다이는 상기 호스트와 통신 가능하게 연결되는, 지능형 고 대역폭 메모리 시스템. - 제1항에 있어서,
상기 지능형 고 대역폭 메모리 스택은 제1 지능형 고 대역폭 메모리 스택으로 지칭되고;
상기 복수의 고 대역폭 메모리 모듈들은 제1 복수의 고 대역폭 메모리 모듈들로 지칭되고;
상기 로직 다이는 제1 로직 다이로 지칭되며; 그리고
상기 시스템은, 적층된 제2 복수의 고 대역폭 메모리 모듈들 및 상기 제2 복수의 고 대역폭 메모리 모듈들 아래에 배치된 제2 로직 다이를 포함하는 제2 지능형 고 대역폭 메모리 스택을 더 포함하는, 지능형 고 대역폭 메모리 시스템. - 제6항에 있어서,
상기 제1 및 제2 로직 다이들은 각각 상기 호스트로부터 상기 처리 연산들을 오프로드하고;
상기 제1 복수의 고 대역폭 메모리 모듈들은 상기 제1 로직 다이에 통신 가능하게 연결되며, 상기 제1 로직 다이는 상기 호스트에 통신 가능하게 연결되고;
상기 제2 복수의 고 대역폭 메모리 모듈들은 상기 제2 로직 다이에 통신 가능하게 연결되며, 상기 제2 로직 다이는 상기 호스트에 통신 가능하게 연결되고; 그리고
상기 시스템은 상기 호스트와 상기 제1 및 제2 로직 다이들에 연결된 인터포저, 및 상기 인터포저에 연결된 기판을 더 포함하는, 지능형 고 대역폭 메모리 시스템. - 제1항에 있어서,
메모리를 더 포함하되,
상기 로직 다이는,
인터페이스 물리영역(PHY) 및 호스트 큐 관리자를 포함하며, 상기 인터페이스 물리영역을 통해 상기 호스트와 인터페이스하고 상기 호스트로부터 수신한 정보들을 큐잉하는 호스트 관리자; 및
프리페치 엔진 및 캐시 컨트롤러를 포함하며, 상기 프리페치 엔진 및 상기 캐시 컨트롤러를 통해 상기 메모리와 인터페이스하는 메모리 컨트롤러를 포함하는 지능형 고 대역폭 메모리 시스템. - 제8항에 있어서,
상기 오프로드 처리 로직부는,
상기 호스트 관리자를 통해 상기 호스트로부터 상기 오프로드 처리 연산들에 대한 정보를 수신하고;
상기 오프로드 처리 연산들에 대한 상기 수신된 정보에 따라 상기 오프로드 처리 연산들을 수행하는, 지능형 고 대역폭 메모리 시스템. - 삭제
- 제9항에 있어서,
상기 수신된 정보는 명령을 포함하는, 지능형 고 대역폭 메모리 시스템. - 제11항에 있어서,
상기 명령을 복호화하는 명령 복호화 로직부를 더 포함하는, 지능형 고 대역폭 메모리 시스템. - 제12항에 있어서,
상기 오프로드 처리 로직부는 상기 명령에 응답하여 상기 오프로드 처리 연산들을 수행하는, 지능형 고 대역폭 메모리 시스템. - 제8항에 있어서,
상기 오프로드 처리 로직부는 ALU(Arithmetic Logic Unit), FPU(Floating-Point Unit), 고정 로직 또는 재설정 가능 로직 중 적어도 하나를 포함하는, 지능형 고 대역폭 메모리 시스템 - 제8항에 있어서,
상기 오프로드 처리 로직부는 상기 복수의 고 대역폭 메모리 모듈들에 저장된 데이터에 따라 상기 오프로드 처리 연산들을 수행하는, 지능형 고 대역폭 메모리 시스템. - 제8항에 있어서,
상기 메모리 컨트롤러는 SRAM 컨트롤러이고;
상기 메모리는 SRAM인, 지능형 고 대역폭 메모리 시스템. - 인터페이스 물리영역(PHY) 및 호스트 큐 관리자를 포함하며, 상기 인터페이스 물리영역을 통해 호스트와 인터페이스하고 상기 호스트로부터 수신한 정보들을 큐잉하는 호스트 관리자;
프리페치 엔진 및 캐시 컨트롤러를 포함하며, 상기 프리페치 엔진 및 상기 캐시 컨트롤러를 통해 메모리와 인터페이스하는 메모리 컨트롤러;
고 대역폭 메모리(High Bandwidth Memory: HBM) 모듈 스택과 인터페이스하는 메모리 컨트롤러를 포함하는 고 대역폭 메모리 컨트롤러; 및
상기 호스트로부터 처리 연산들을 오프로드하는 오프로드 처리 로직부를 포함하고,
상기 수신된 정보는 상기 오프로드 처리 연산들이 개시되어야 함을 지시하는 상기 호스트에 의해서 설정된 제1 플래그를 포함하고,
상기 오프로드 처리 로직부는 상기 제1 플래그에 응답하여 상기 고 대역폭 메모리 컨트롤러를 사용하여 상기 오프로드 처리 연산들을 수행하고,
상기 고 대역폭 메모리 컨트롤러는 상기 오프로드 처리 연산들이 완료되었음을 지시하는 제2 플래그를 설정하는 로직 다이. - 제17항에 있어서,
상기 오프로드 처리 로직부는,
상기 호스트 관리자를 통해 상기 호스트로부터 상기 오프로드 처리 연산들에 대한 정보를 수신하고;
상기 오프로드 처리 연산들에 대한 상기 수신된 정보에 따라 상기 오프로드 처리 연산들을 수행하는, 로직 다이. - 삭제
- 제17항에 있어서,
상기 수신된 정보는 명령을 포함하는, 로직 다이. - 제20항에 있어서,
상기 호스트로부터 수신된 상기 명령을 복호화하는 명령 복호화 로직부를 더 포함하는, 로직 다이. - 제21항에 있어서,
상기 오프로드 처리 로직부는 상기 명령에 응답하여 상기 오프로드 처리 연산들을 수행하는, 로직 다이. - 제21항에 있어서,
상기 오프로드 처리 로직부는 ALU(Arithmetic Logic Unit), FPU(Floating-Point Unit), 고정 로직 또는 재설정 가능 로직 중 적어도 하나를 포함하는, 로직 다이. - 제21항에 있어서,
상기 오프로드 처리 로직부는 상기 고 대역폭 메모리 모듈 스택에 저장된 데이터에 따라 상기 오프로드 처리 연산들을 수행하는, 로직 다이. - 제17항에 있어서,
상기 메모리 컨트롤러는 SRAM 컨트롤러이고;
상기 메모리는 SRAM인, 로직 다이.
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201762543918P | 2017-08-10 | 2017-08-10 | |
| US62/543,918 | 2017-08-10 | ||
| US15/796,743 US10545860B2 (en) | 2017-08-10 | 2017-10-27 | Intelligent high bandwidth memory appliance |
| US15/796,743 | 2017-10-27 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20190017639A KR20190017639A (ko) | 2019-02-20 |
| KR102368970B1 true KR102368970B1 (ko) | 2022-03-02 |
Family
ID=65275225
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020180065482A Active KR102368970B1 (ko) | 2017-08-10 | 2018-06-07 | 지능형 고 대역폭 메모리 장치 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US10545860B2 (ko) |
| JP (1) | JP6974270B2 (ko) |
| KR (1) | KR102368970B1 (ko) |
| CN (1) | CN109388595B (ko) |
| TW (1) | TWI746878B (ko) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12189948B2 (en) | 2022-10-25 | 2025-01-07 | Samsung Electronics Co., Ltd. | Device and method to minimize off-chip access between host and peripherals |
Families Citing this family (51)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9997232B2 (en) * | 2016-03-10 | 2018-06-12 | Micron Technology, Inc. | Processing in memory (PIM) capable memory device having sensing circuitry performing logic operations |
| GB2553102B (en) * | 2016-08-19 | 2020-05-20 | Advanced Risc Mach Ltd | A memory unit and method of operation of a memory unit to handle operation requests |
| US10409614B2 (en) | 2017-04-24 | 2019-09-10 | Intel Corporation | Instructions having support for floating point and integer data types in the same register |
| US10474458B2 (en) | 2017-04-28 | 2019-11-12 | Intel Corporation | Instructions and logic to perform floating-point and integer operations for machine learning |
| US11301412B2 (en) * | 2017-12-22 | 2022-04-12 | Intel Corporation | Scaling interface architecture between memory and programmable logic |
| US10770129B2 (en) * | 2018-08-21 | 2020-09-08 | Intel Corporation | Pseudo-channeled DRAM |
| US11204819B2 (en) | 2018-12-21 | 2021-12-21 | Samsung Electronics Co., Ltd. | System and method for offloading application functions to a device |
| US10642946B2 (en) * | 2018-12-28 | 2020-05-05 | Intel Corporation | Modular periphery tile for integrated circuit device |
| EP3938888A1 (en) | 2019-03-15 | 2022-01-19 | INTEL Corporation | Systolic disaggregation within a matrix accelerator architecture |
| EP4024223A1 (en) | 2019-03-15 | 2022-07-06 | Intel Corporation | Systems and methods for cache optimization |
| PL3938915T3 (pl) | 2019-03-15 | 2025-10-20 | Intel Corporation | Zarządzanie pamięcią wielokafelkową |
| US10915451B2 (en) * | 2019-05-10 | 2021-02-09 | Samsung Electronics Co., Ltd. | Bandwidth boosted stacked memory |
| US11152343B1 (en) * | 2019-05-31 | 2021-10-19 | Kepler Computing, Inc. | 3D integrated ultra high-bandwidth multi-stacked memory |
| US11841803B2 (en) * | 2019-06-28 | 2023-12-12 | Advanced Micro Devices, Inc. | GPU chiplets using high bandwidth crosslinks |
| CN112151526B (zh) * | 2019-06-28 | 2024-12-03 | 桑迪士克科技股份有限公司 | 包括高速异质集成控制器和高速缓存的半导体设备 |
| US11211378B2 (en) * | 2019-07-18 | 2021-12-28 | International Business Machines Corporation | Heterogeneous integration structure for artificial intelligence computing |
| US11663746B2 (en) | 2019-11-15 | 2023-05-30 | Intel Corporation | Systolic arithmetic on sparse data |
| US12039430B2 (en) * | 2019-11-15 | 2024-07-16 | Samsung Electronics Co., Ltd. | Electronic device and method for inference binary and ternary neural networks |
| US11861761B2 (en) | 2019-11-15 | 2024-01-02 | Intel Corporation | Graphics processing unit processing and caching improvements |
| KR102793518B1 (ko) * | 2019-11-18 | 2025-04-11 | 에스케이하이닉스 주식회사 | 신경망 처리 회로를 포함하는 메모리 장치 |
| KR102791004B1 (ko) * | 2019-12-26 | 2025-04-02 | 삼성전자주식회사 | 셀 단위로 액세스 가능한 스토리지 장치 및 그 동작방법 |
| US11056179B2 (en) * | 2020-01-08 | 2021-07-06 | Intel Corporation | Techniques to couple high bandwidth memory device on silicon substrate and package substrate |
| KR102844113B1 (ko) * | 2020-01-13 | 2025-08-11 | 삼성전자주식회사 | 메모리 장치, 메모리 모듈 및 메모리 장치의 동작 방법 |
| KR102845463B1 (ko) * | 2020-01-15 | 2025-08-11 | 삼성전자주식회사 | 병렬 연산 처리를 수행하는 메모리 장치 및 그 동작방법, 그리고 메모리 장치를 제어하는 메모리 컨트롤러의 동작방법 |
| KR102831057B1 (ko) * | 2020-01-20 | 2025-07-07 | 삼성전자주식회사 | 고대역폭 메모리 및 이를 포함하는 시스템 |
| JP7270234B2 (ja) * | 2020-05-28 | 2023-05-10 | パナソニックIpマネジメント株式会社 | Aiチップ |
| KR20220032366A (ko) | 2020-09-07 | 2022-03-15 | 삼성전자주식회사 | 가변적인 모드 설정을 수행하는 메모리 장치 및 그 동작방법 |
| WO2022056757A1 (en) * | 2020-09-17 | 2022-03-24 | Alibaba Group Holding Limited | Three-dimensional stacked processing systems |
| US11238940B1 (en) * | 2020-11-19 | 2022-02-01 | Micron Technology, Inc. | Initialization techniques for memory devices |
| US11625249B2 (en) * | 2020-12-29 | 2023-04-11 | Advanced Micro Devices, Inc. | Preserving memory ordering between offloaded instructions and non-offloaded instructions |
| US12347818B2 (en) * | 2021-03-26 | 2025-07-01 | Intel Corporation | Logic die in a multi-chip package having a configurable physical interface to on-package memory |
| CN115469800A (zh) | 2021-06-10 | 2022-12-13 | 三星电子株式会社 | 数据处理系统以及用于访问异构存储器系统的方法 |
| KR102430982B1 (ko) * | 2021-06-10 | 2022-08-11 | 삼성전자주식회사 | 프로세싱부를 포함하는 이종 메모리 시스템을 억세스하는 데이터 처리 시스템 및 방법 |
| CN113760796B (zh) * | 2021-09-01 | 2023-12-22 | 山东华芯半导体有限公司 | 一种基于hbm缓存的ssd固态盘 |
| US20230077933A1 (en) * | 2021-09-14 | 2023-03-16 | Advanced Micro Devices, Inc. | Supporting processing-in-memory execution in a multiprocessing environment |
| US12274058B2 (en) * | 2022-03-21 | 2025-04-08 | Macronix International Co., Ltd. | Memory device |
| CN114706679A (zh) * | 2022-03-30 | 2022-07-05 | 深圳致星科技有限公司 | 融合计算和通信的计算网络单元、计算节点及计算网络 |
| CN114709205B (zh) * | 2022-06-02 | 2022-09-09 | 西安紫光国芯半导体有限公司 | 一种三维堆叠芯片及其数据处理方法 |
| CN117673013A (zh) * | 2022-08-10 | 2024-03-08 | 长鑫存储技术有限公司 | 半导体结构和半导体结构的制造方法 |
| CN115394768B (zh) * | 2022-09-06 | 2025-05-30 | 华进半导体封装先导技术研发中心有限公司 | 一种多层高带宽存储器及其制造方法 |
| US20240371410A1 (en) * | 2023-05-02 | 2024-11-07 | Micron Technology, Inc. | Apparatus including multiple high bandwidth memory cubes |
| KR20240173200A (ko) * | 2023-06-02 | 2024-12-10 | 구글 엘엘씨 | 3d-dram 칩렛들을 이용한 대형 언어 모델들의 서빙 |
| US12450178B2 (en) | 2023-06-02 | 2025-10-21 | Avago Technologies International Sales Pte. Limited | Aggregation of multiple memory modules for a system-on-chip |
| US20240403254A1 (en) * | 2023-06-02 | 2024-12-05 | Google Llc | Serving Large Language Models with 3D-DRAM Chiplets |
| US20250123976A1 (en) * | 2023-10-11 | 2025-04-17 | Micron Technology, Inc. | Apparatus including an array of pre-configurable memory and storage |
| KR102874491B1 (ko) * | 2023-12-07 | 2025-10-23 | 주식회사 코코링크 | 인공지능 연산처리 시스템 및 이의 제어 방법 |
| US12481608B2 (en) | 2024-01-12 | 2025-11-25 | Google Llc | Tree-based network architecture for accelerating machine learning collective operations |
| US20250231877A1 (en) * | 2024-01-12 | 2025-07-17 | Micron Technology, Inc. | Cache memories in vertically integrated memory systems and associated systems and methods |
| US20250298523A1 (en) * | 2024-03-21 | 2025-09-25 | Samsung Electronics Co., Ltd. | Systems and methods of incorporating artificial intelligence accelerators on memory base dies |
| CN120929419A (zh) * | 2024-05-11 | 2025-11-11 | 华为技术有限公司 | 计算装置、内存模块组、计算设备及计算设备集群 |
| CN119046184B (zh) * | 2024-08-27 | 2025-03-21 | 沐曦科技(成都)有限公司 | 一种gpu固件日志的存储方法 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20150155876A1 (en) * | 2012-08-06 | 2015-06-04 | Advanced Micro Devices, Inc. | Die-stacked memory device with reconfigurable logic |
Family Cites Families (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5331427B2 (ja) * | 2008-09-29 | 2013-10-30 | 株式会社日立製作所 | 半導体装置 |
| US20100174858A1 (en) * | 2009-01-05 | 2010-07-08 | Taiwan Semiconductor Manufacturing Co., Ltd. | Extra high bandwidth memory die stack |
| US9098430B2 (en) * | 2010-03-22 | 2015-08-04 | Conversant Intellectual Property Management Inc. | Composite semiconductor memory device with error correction |
| US20130073755A1 (en) * | 2011-09-20 | 2013-03-21 | Advanced Micro Devices, Inc. | Device protocol translator for connection of external devices to a processing unit package |
| WO2013081633A1 (en) * | 2011-12-02 | 2013-06-06 | Intel Corporation | Stacked memory allowing variance in device interconnects |
| KR101639989B1 (ko) * | 2011-12-22 | 2016-07-15 | 인텔 코포레이션 | 윈도우 인터포저를 갖는 3d 집적 회로 패키지 |
| US20140040532A1 (en) * | 2012-08-06 | 2014-02-06 | Advanced Micro Devices, Inc. | Stacked memory device with helper processor |
| US8737108B2 (en) * | 2012-09-25 | 2014-05-27 | Intel Corporation | 3D memory configurable for performance and power |
| KR20140131623A (ko) * | 2013-05-06 | 2014-11-14 | 에스케이하이닉스 주식회사 | 반도체 장치 |
| KR20140147218A (ko) * | 2013-06-19 | 2014-12-30 | 에스케이하이닉스 주식회사 | 메모리 장치 및 이를 포함하는 시스템 |
| US20150106574A1 (en) * | 2013-10-15 | 2015-04-16 | Advanced Micro Devices, Inc. | Performing Processing Operations for Memory Circuits using a Hierarchical Arrangement of Processing Circuits |
| US9535831B2 (en) * | 2014-01-10 | 2017-01-03 | Advanced Micro Devices, Inc. | Page migration in a 3D stacked hybrid memory |
| US20160188519A1 (en) * | 2014-12-27 | 2016-06-30 | Intel Corporation | Method, apparatus, system for embedded stream lanes in a high-performance interconnect |
| US9698790B2 (en) * | 2015-06-26 | 2017-07-04 | Advanced Micro Devices, Inc. | Computer architecture using rapidly reconfigurable circuits and high-bandwidth memory interfaces |
| KR102275812B1 (ko) * | 2015-09-04 | 2021-07-14 | 삼성전자주식회사 | 센터 패드 타입의 스택드 칩 구조에서 신호 완결성 이슈를 개선할 수 있는 온다이 터미네이션 스키마를 갖는 반도체 메모리 장치 |
| KR20180088438A (ko) * | 2015-11-30 | 2018-08-03 | 가부시키가이샤 페지 컴퓨팅 | 다이 및 패키지 |
| US11397687B2 (en) * | 2017-01-25 | 2022-07-26 | Samsung Electronics Co., Ltd. | Flash-integrated high bandwidth memory appliance |
| JP6815277B2 (ja) * | 2017-05-24 | 2021-01-20 | ルネサスエレクトロニクス株式会社 | 半導体装置及びデータ処理システム |
-
2017
- 2017-10-27 US US15/796,743 patent/US10545860B2/en active Active
-
2018
- 2018-06-07 KR KR1020180065482A patent/KR102368970B1/ko active Active
- 2018-07-26 JP JP2018139930A patent/JP6974270B2/ja active Active
- 2018-08-09 TW TW107127706A patent/TWI746878B/zh active
- 2018-08-09 CN CN201810903592.6A patent/CN109388595B/zh active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20150155876A1 (en) * | 2012-08-06 | 2015-06-04 | Advanced Micro Devices, Inc. | Die-stacked memory device with reconfigurable logic |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12189948B2 (en) | 2022-10-25 | 2025-01-07 | Samsung Electronics Co., Ltd. | Device and method to minimize off-chip access between host and peripherals |
Also Published As
| Publication number | Publication date |
|---|---|
| CN109388595A (zh) | 2019-02-26 |
| KR20190017639A (ko) | 2019-02-20 |
| CN109388595B (zh) | 2023-12-01 |
| JP2019036298A (ja) | 2019-03-07 |
| TW201918883A (zh) | 2019-05-16 |
| US20190050325A1 (en) | 2019-02-14 |
| US10545860B2 (en) | 2020-01-28 |
| TWI746878B (zh) | 2021-11-21 |
| JP6974270B2 (ja) | 2021-12-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102368970B1 (ko) | 지능형 고 대역폭 메모리 장치 | |
| US12412231B2 (en) | Graphics processing unit with network interfaces | |
| CN110582785B (zh) | 配置用于执行层描述符列表的具有功率效率的深度神经网络模块 | |
| US11500802B1 (en) | Data replication for accelerator | |
| CN107092573B (zh) | 用于异构计算系统中的工作窃取的方法和设备 | |
| CN103927270B (zh) | 一种面向多个粗粒度动态可重构阵列的共享数据缓存装置及控制方法 | |
| CN116777725A (zh) | 跨多个计算引擎的程序化控制的数据多播 | |
| US11836491B2 (en) | Data processing method and apparatus, and related product for increased efficiency of tensor processing | |
| CN115605907A (zh) | 分布式图形处理器单元架构 | |
| US11983128B1 (en) | Multidimensional and multiblock tensorized direct memory access descriptors | |
| CN117631974A (zh) | 跨越基于存储器的通信队列的多信道接口的存取请求重新排序 | |
| US20230068168A1 (en) | Neural network transpose layer removal | |
| US20230418705A1 (en) | Hardware-efficient pam-3 encoder and decoder | |
| EP4634787A1 (en) | Fused data generation and associated communication | |
| CN117631976A (zh) | 用于基于存储器的通信队列的存取请求重新排序 | |
| US20250175427A1 (en) | Multipathing with remote direct memory access connections | |
| US12481465B2 (en) | Host-preferred memory operation | |
| US20220413742A1 (en) | Loading data from memory during dispatch | |
| US20150356768A1 (en) | Mechanism for facilitating improved copying of graphics data on computing devices | |
| US20240070801A1 (en) | Processing-in-memory system with deep learning accelerator for artificial intelligence | |
| TW200617668A (en) | Cache memory management system and method | |
| US20220413804A1 (en) | Efficient complex multiply and accumulate | |
| CN116415100A (zh) | 业务处理方法、装置、处理器及计算设备 | |
| CN111382852B (zh) | 数据处理装置、方法、芯片及电子设备 | |
| US12132590B2 (en) | Hardware-efficient PAM-3 encoder and decoder |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
St.27 status event code: A-0-1-A10-A12-nap-PA0109 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| A201 | Request for examination | ||
| A302 | Request for accelerated examination | ||
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| PA0302 | Request for accelerated examination |
St.27 status event code: A-1-2-D10-D17-exm-PA0302 St.27 status event code: A-1-2-D10-D16-exm-PA0302 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
St.27 status event code: A-1-2-D10-D21-exm-PE0902 |
|
| E13-X000 | Pre-grant limitation requested |
St.27 status event code: A-2-3-E10-E13-lim-X000 |
|
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
St.27 status event code: A-2-2-U10-U11-oth-PR1002 Fee payment year number: 1 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 4 |
|
| PR1001 | Payment of annual fee |
St.27 status event code: A-4-4-U10-U11-oth-PR1001 Fee payment year number: 5 |