WO2019086120A1

WO2019086120A1 - Système et procédé de calcul parallèle universel à haute performance ayant une tolérance aux pannes et une tolérance aux temps de latence

Info

Publication number: WO2019086120A1
Application number: PCT/EP2017/078153
Authority: WO
Inventors: Bill MCCOLL
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2017-11-03
Filing date: 2017-11-03
Publication date: 2019-05-09
Anticipated expiration: 2020-05-03
Also published as: EP3701374A1

Abstract

L'invention porte sur un système de calcul distribué (200) et sur un procédé. Le système de calcul distribué (200) comprend une pluralité de nœuds de calcul (201), chaque nœud de calcul (201) étant configuré pour exécuter simultanément une sous-tâche respective d'une tâche de calcul parallèle dans une pluralité de cycles de calcul, et un réseau de communication (203) configuré pour permettre un échange de données entre la pluralité de nœuds de calcul (201). Chaque cycle de calcul comporte une phase d'exécution, une phase de communication entre la pluralité de nœuds de calcul (201) et une phase de synchronisation entre la pluralité de nœuds de calcul (201), le système de calcul distribué (200) étant configuré pour gérer un ou plusieurs nœuds de calcul qui ont un temps de latence important dans la pluralité de nœuds de calcul (201) à chaque cycle de calcul.