WO2022069059A1

WO2022069059A1 - Apprentissage d'importance variable pour modèles multi-tâches

Info

Publication number: WO2022069059A1
Application number: PCT/EP2020/077651
Authority: WO
Inventors: Rafail Nikolaos KOURDIS; Philip John GORINSKI; Gabriel Peter Albert GORDON-HALL
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2020-10-02
Filing date: 2020-10-02
Publication date: 2022-04-07
Anticipated expiration: 2023-04-02
Also published as: CN116057537A; CN116057537B

Abstract

L'invention concerne un dispositif (500) comprenant un ou plusieurs processeurs (501) configurés pour entraîner un modèle d'apprentissage automatique ayant un ensemble initial de paramètres de modèle, le dispositif étant configuré pour entraîner le modèle à l'aide d'un ensemble de données d'apprentissage respectif pour chaque tâche d'une pluralité de tâches (301, 302, 303, 304, 305), la pluralité de tâches comprenant une tâche cible (303) pour laquelle le modèle doit être entraîné et une ou plusieurs tâches auxiliaires (301, 302, 304, 305), le dispositif étant configuré pour entraîner le modèle en effectuant les étapes suivantes : attribuer (601) au moins un facteur de mise à l'échelle candidat à chaque tâche de la pluralité de tâches ; pour chaque tâche d'une ou de plusieurs tâches (301, 304) de la pluralité de tâches, effectuer (602) une ou plusieurs étapes d'optimisation pour la tâche respective en fonction du facteur de mise à l'échelle candidat respectif pour former un ensemble affiné respectif de paramètres de modèle ; effectuer (603) une opération d'apprentissage automatique, au moyen d'un ou de plusieurs critères d'évaluation prédéfinis et sur la base d'une ou de plusieurs contraintes prédéfinies, pour évaluer les performances de l'ensemble affiné de paramètres de modèle de la ou des tâches de la pluralité de tâches sur la tâche cible et déterminer ainsi un ensemble de poids de mélange ; mettre à jour (604) l'ensemble de paramètres de modèle du modèle d'apprentissage automatique en fonction des paramètres de modèle affinés pondérés par l'ensemble de poids de mélange ; et mettre à jour (605) les facteurs de mise à l'échelle candidats en fonction de l'ensemble de poids de mélange.