WO2021054990A1

WO2021054990A1 - Systèmes et procédés de génération de code parcimonieux pour réseaux neuronaux convolutifs

Info

Publication number: WO2021054990A1
Application number: PCT/US2019/063678
Authority: WO
Inventors: Aleksandar Zlateski; Justin KOPINSKY
Original assignee: Neuralmagic Inc
Current assignee: Neuralmagic Inc
Priority date: 2019-09-16
Filing date: 2019-11-27
Publication date: 2021-03-25
Anticipated expiration: 2022-03-16

Abstract

L'invention concerne un système et un procédé qui peuvent générer un code à utiliser lors de l'exécution de réseaux neuronaux (NN), par exemple des réseaux neuronaux convolutifs (CNN) qui peuvent comprendre une ou plusieurs couches de convolution. Pour au moins une couche de convolution, pour chaque élément non nul dans un tenseur de noyau ou une matrice associée à la couche convolutive, des instructions peuvent être générées ou émises. Par exemple, pour chaque élément non nul, une instruction de diffusion vectorielle peut être générée, et une instruction de multiplication-addition fusionnée (FMA) peut être générée, ayant comme paramètres un registre représentant une partie de la sortie pour la couche de convolution, un registre stockant des données d'entrée pour la couche de convolution, et un registre ou référence à la mémoire stockant l'élément non nul. Le logiciel ou le code produit peut être exécuté pendant des opérations de convolution, par exemple en tant que partie d'une application plus grande telle qu'une application d'inférence de NN.