WO2025074369A1

WO2025074369A1 - Système et procédé d'apprentissage de marl collaboratif efficace à l'aide de réseaux de tenseur

Info

Publication number: WO2025074369A1
Application number: PCT/IN2023/050901
Authority: WO
Inventors: Saravanan M; Perepu SATHEESH KUMAR; RamKumar N
Original assignee: Telefonaktiebolaget LM Ericsson AB
Current assignee: Telefonaktiebolaget LM Ericsson AB
Priority date: 2023-10-03
Filing date: 2023-10-03
Publication date: 2025-04-10
Anticipated expiration: 2026-04-03

Abstract

L'invention concerne un procédé mis en œuvre par ordinateur pour apprendre à une pluralité d'agents (310-i) à effectuer une tâche conjointe. Le procédé consiste à apprendre, par apprentissage par renforcement multi-agent coopératif (cMARL), à une pluralité d'agents (310-i) à effectuer une tâche conjointe. L'apprentissage consiste en outre, pour chaque agent, à effectuer une approximation d'une fonction de valeur spécifique à un agent en tant que décomposition de tenseur (316-i) sur la base d'une approximation croisée adaptative (318-i). Les cas d'utilisation revendiqués comprennent l'utilisation de tels agents dans une couche cognitive d'un réseau de télécommunications. L'invention concerne également un procédé de réalisation d'une tâche à l'aide des agents entraînés, ainsi que des entités, des programmes d'ordinateur et des produits programmes d'ordinateur correspondants.