WO2022126448A1

WO2022126448A1 - Procédé et système de recherche d'architecture neuronale basés sur un apprentissage évolutif

Info

Publication number: WO2022126448A1
Application number: PCT/CN2020/136950
Authority: WO
Inventors: 程然; 谭浩; 何成; 侯章禄; 邱畅啸; 杨帆
Original assignee: Huawei Technologies Co Ltd; Southern University of Science and Technology
Current assignee: Huawei Technologies Co Ltd; Southern University of Science and Technology
Priority date: 2020-12-16
Filing date: 2020-12-16
Publication date: 2022-06-23
Anticipated expiration: 2023-06-16
Also published as: CN116964594B; CN116964594A

Abstract

La présente invention concerne un procédé et un système de recherche d'architecture neuronale basés sur un apprentissage évolutif. Le procédé comprend les étapes suivantes consistant à : S101, initialiser une population, chaque architecture neuronale dans la population étant un code d'architecture ; S102, sélectionner de manière aléatoire deux codes d'architecture dans la population, décoder les deux codes d'architecture en deux architectures neuronales pour l'appariement, et hériter des pondérations correspondantes d'un Supernet, de façon à obtenir des premier et second modèles de réseau neuronal ; S103, évaluer les premier et second modèles de réseau neuronal qui ont été entraînés, de façon à obtenir un gagnant et un perdant ; S104, mettre à jour le Supernet selon les premier et second modèles de réseau neuronal entraînés ; S105, calculer une valeur de pseudo-gradient, de telle sorte que le perdant apprend à partir du gagnant, et obtenir un code d'architecture d'une troisième architecture neuronale ; S106, remplacer, dans la population, le code d'architecture du perdant par le code d'architecture de la troisième architecture neuronale, et mettre à jour la population ; et S107, délivrer un modèle de réseau neuronal optimal à partir de la population, et effectuer une évolution itérative sur la population mise à jour.