WO2025172472A1

WO2025172472A1 - Apprentissage fédéré pour la génération de données synthétiques de mobilité

Info

Publication number: WO2025172472A1
Application number: PCT/EP2025/053908
Authority: WO
Inventors: Sara KASSAN; Kahina MOKRANI
Original assignee: Orange SA
Current assignee: Orange SA
Priority date: 2024-02-16
Filing date: 2025-02-13
Publication date: 2025-08-21
Anticipated expiration: 2026-08-16
Also published as: FR3159490A1

Abstract

L'invention concerne un procédé de génération de données synthétiques à partir de données de mobilité, le procédé comprenant les étapes suivantes, mises en œuvre dans un équipement apte à communiquer avec un serveur d'un réseau cellulaire, le procédé comprenant les étapes suivantes : - obtention (201; 202) de données de mobilité; - détermination (203) de paramètres locaux optimisés d'un module de génération de données synthétiques à partir des données de mobilité obtenues; - transmission (204) des paramètres locaux optimisés au serveur; - réception (220) de paramètres globaux optimisés du serveur; - mise à jour (221) du module sur la base des paramètres globaux optimisés reçus; - génération (222) de données synthétiques par le module mis à jour.

Description

Apprentissage fédéré pour la génération de données synthétiques de mobilité

L'invention se rapporte au domaine de la génération de données synthétiques représentatives de la mobilité d’équipements connectés à un réseau de télécommunications.

Elle a notamment pour but de permettre un apprentissage fédéré pour la génération de telles données synthétiques.

Etat de la technique

Les entités connectées, appelées équipements ci-après, à un réseau de télécommunications, telles que des smartphones, véhicules, objets connectés accédant à un réseau mobile de type cellulaire par exemple, sont aptes à générer des données représentatives de leur mobilité. Chaque équipement peut notamment collecter, au cours de son déplacement dans le réseau de télécommunications, des données décrivant la trajectoire de l’équipement ainsi que des métriques représentatives de l’environnement de l’équipement.

La trajectoire peut correspondre à une suite de points géolocalisés, par lequel l’équipement est passé durant son trajet, et les métriques sont des données descriptives de l’environnement du client pour chacun de ces points. Les métriques peuvent notamment être descriptives d’états du réseau à chaque point. A cet effet, les métriques peuvent comprendre un ratio signal à bruit, ou SNR pour « Signal to Noise Ratio » en anglais, une latence, une valeur de débit, etc.

De telles métriques peuvent avoir de nombreux avantages, pour plusieurs acteurs du réseau notamment :
- pour le gestionnaire du réseau, car les métriques peuvent être utilisées pour optimiser le réseau ;
- lorsque l’équipement est un véhicule ou un terminal embarqué dans un véhicule, pour les autres véhicules connectés au réseau, les métriques pouvant être utilisées à des fins informatives ;
- lorsque l’entité est un véhicule ou un terminal embarqué dans un véhicule, pour un acteur du transport qui peut utiliser les métriques pour information et prévention.

Toutefois, il n’est pas souhaitable qu’un équipement partage ses trajets et ses métriques exactes, car ces données sont privées et potentiellement confidentielles.

Il est connu pour surmonter ce problème de générer des données synthétiques à partir des données de mobilité collectées. A cet effet, les données de mobilité sont centralisées dans un serveur central, qui est apte à générer des données synthétiques, qui peuvent ensuite être exploitées par d’autres acteurs, les données synthétiques ne comprenant pas de données privées confidentielles.

Toutefois, une telle solution requiert de chaque équipement qu’il transmette les données réelles de mobilité, données qui sont confidentielles, au serveur central, ce qui pose des problèmes de sécurité. En effet, un attaquant peut intercepter ces données confidentielles, et les corrompre (les modifier) ou les utiliser à mauvais escient.

Qui plus est la transmission de données réelles de mobilité par chaque équipement vers le serveur centralisé, puis l’envoi de données synthétiques vers d’autres acteurs du réseau, occasionnent un trafic important, par conséquent coûteux et qui peut impliquer une congestion du réseau.

L'invention offre une solution ne présentant pas les inconvénients de l'état de la technique.

A cet effet, selon un aspect fonctionnel, l'invention a pour objet un procédé de génération de données synthétiques à partir de données de mobilité, le procédé comprenant les étapes suivantes, mises en œuvre dans un équipement apte à communiquer avec un serveur d’un réseau cellulaire :
- obtention de données de mobilité ;
- détermination de paramètres locaux optimisés d’un module de génération de données synthétiques à partir des données de mobilité obtenues ;
- transmission des paramètres locaux optimisés au serveur ;
- réception de paramètres globaux optimisés du serveur;
- mise à jour du module sur la base des paramètres globaux optimisés reçus ;
- génération de données synthétiques par le module mis à jour.

Ainsi, le module de génération de données synthétiques est mis à jour à partir de paramètres globaux optimisés, reçus d’un serveur apte à recevoir des paramètres locaux optimisés de plusieurs équipements accédant à un réseau de télécommunications. Un apprentissage fédéré des paramètres du module de génération de données synthétiques est ainsi mis en œuvre. L’apprentissage fédéré permet à tous les équipements y participant de disposer des mêmes paramètres globaux optimisés, et ce quelles que soient leurs ressources de calcul : il permet ainsi d’une part que les équipements participant à l’apprentissage fédéré disposent de paramètres globaux optimisés, mais également, d’autre part, il permet que les données synthétiques de mobilité générées localement le soient à partir d’un même modèle génératif implémenté par les modules de génération de données synthétiques respectifs des équipements. Les données synthétiques de mobilité peuvent ainsi être accumulées et comparées, car elles sont issues du même modèle génératif, même lorsqu’elles sont issues de plusieurs équipements, ce qui permet d’exploiter de grandes quantités de données synthétiques. En outre, l’apprentissage fédéré accélère la convergence des modèles génératifs de données synthétiques de mobilité implémentés localement dans les équipements, comparativement à un apprentissage local du modèle génératif par chacun des équipements.

Selon des modes de réalisation, le procédé peut comprendre en outre la transmission des données synthétiques générées à un autre équipement accédant au réseau cellulaire, et/ou au serveur, et/ou à un autre serveur du réseau cellulaire.

Ainsi, les données synthétiques générées peuvent être exploitées par d’autres entités, sans que ces entités n’accèdent à des données confidentielles de l’utilisateur de l’équipement, puisque seules des données synthétiques sont transmises.

En complément, le procédé peut comprendre en outre une évaluation d’une performance du module de génération de données synthétiques mis à jour, à partir des données synthétiques générées et des données de mobilité, et les données synthétiques générées sont transmises à l’autre équipement accédant au réseau cellulaire, et/ou au serveur, et/ou à l’autre serveur du réseau cellulaire, uniquement si la performance évaluée est supérieure à un seuil de performance.

Ainsi, il est assuré une performance élevée lors de la génération des données synthétiques. Seules des données synthétiques de qualité élevée, c’est-à-dire générées par un module de génération de données synthétiques performant (dont l’évaluation de la performance est supérieure au seuil de performance), sont ainsi partagées avec d’autres entités.

Selon des modes de réalisation de l’invention, les étapes de détermination de paramètres locaux optimisés, de transmission des paramètres locaux optimisés, de réception des paramètres globaux optimisés et de mise à jour du module de génération de données synthétiques constituent un cycle d’apprentissage, et, à l’issue d’un cycle d’apprentissage courant, un cycle d’apprentissage suivant est mis en œuvre, des nouveaux paramètres locaux optimisés étant déterminés à partir du module de génération de données synthétiques mis à jour lors du cycle d’apprentissage courant.

Il est ainsi rendu possible d’itérer les cycles d’apprentissage de l’apprentissage fédéré, ce qui permet une amélioration continue des paramètres globaux optimisés, et ce qui facilite une convergence du modèle de génération de données synthétiques de chaque équipement.

Selon des modes de réalisation, le module de génération de données synthétiques peut implémenter un réseau antagoniste génératif comprenant un module générateur et un module discriminateur, et les paramètres locaux optimisés peuvent être déterminés par apprentissage non supervisé en fonction d’au moins une partie des données de mobilité utilisées comme données de mobilité d’entraînement.

Un réseau antagoniste génératif présente les avantages d’une simplicité d’implémentation ainsi que d’une non-réversibilité des données synthétiques générées : la confidentialité associée aux données de mobilité est ainsi renforcée pour l’utilisateur de l’équipement.

En complément, les paramètres locaux optimisés peuvent comprendre des premiers paramètres locaux optimisés du module générateur et/ou des deuxièmes paramètres locaux optimisés du module discriminateur.

Ainsi, l’apprentissage fédéré permet d’améliorer les performances d’un modèle génératif mis en œuvre localement par l’équipement.

En complément, le module générateur et/ou le module discriminateur peut être un réseau de neurones artificiels.

Il est ainsi rendu possible de générer des données synthétiques à partir de données de mobilité complexes, par exemple comprenant plusieurs types de données descriptives de l’environnement de l’équipement.

Selon des modes de réalisation, les données de mobilité peuvent comprendre au moins une première série temporelle de données de positions de l’équipement et de données descriptives de l’environnement de l’équipement, et les données synthétiques peuvent comprendre au moins une deuxième série temporelle de données de positions synthétiques et de données synthétiques descriptives de l’environnement de l’équipement, les données de positions synthétiques de la deuxième série temporelle étant différentes des données de position de la première série temporelle.

Ainsi, les données synthétiques ne correspondent pas à des trajectoires réelles de l’équipement, ce qui permet d’améliorer la confidentialité des données synthétiques comparativement aux données de mobilité obtenues.

En complément, les données descriptives de l’environnement peuvent comprendre l’une ou plusieurs des données suivantes :
- des données représentatives d’une qualité de service du réseau de télécommunications à une position donnée ;
- des données représentatives d’un trafic entre l’équipement et le réseau de télécommunications pour une position donnée ;
- des données descriptives d’un lieu situé à une position donnée ; et/ou
- des données descriptives de conditions météorologiques à une position donnée.

Ainsi, les données synthétiques peuvent être obtenues à partir de données de mobilité enrichies par des données descriptives de l’environnement. L’invention peut ainsi être utilisée pour la génération de données synthétiques utilisées dans des applications variées. La liste de données descriptives mentionnée ci-dessus n’est pas exhaustive : d’autres données descriptives de l’environnement peuvent être intégrées, selon l’invention, dans les données de mobilité.

Selon des modes de réalisation, le procédé peut comprendre une collecte de données brutes de mobilité, les données de mobilité peuvent être obtenues à partir des données brutes de mobilité par :
- détermination des données manquantes à partir des données brutes de mobilité et ajout des données manquantes aux données brutes de mobilité pour obtenir les données de mobilité ; et/ou
- normalisation des données brutes de mobilité pour obtenir les données de mobilité.

Ainsi, il est assuré que les données utilisées en entrée du module de génération des données synthétiques sont complètes et/ou normalisées, ce qui améliore les données synthétiques générées.

Selon un aspect matériel, l’invention concerne un équipement comprenant une interface réseau apte à communiquer avec un serveur d’un réseau cellulaire et un processeur configuré pour :
- obtenir des données de mobilité ;
- déterminer de paramètres locaux optimisés d’un module de génération de données synthétiques à partir des données de mobilité obtenues ;
- transmettre des paramètres locaux optimisés au serveur par l’interface réseau ;
- recevoir des paramètres globaux optimisés du serveur via l’interface réseau;
- mettre à jour le module sur la base des paramètres globaux optimisés reçus ;
- générer des données synthétiques par le module mis à jour.

Selon des modes de réalisation, l’équipement peut comprendre en outre au moins un capteur ou peut exécuter au moins une application, apte à obtenir au moins une partie des données de mobilité.

Selon un autre aspect matériel, l'invention concerne également un programme d'ordinateur apte à être mis en œuvre sur l’équipement défini, le programme comprenant des instructions de code qui, lorsque le programme est exécuté par un processeur, réalise les étapes du procédé défini.

De tels programmes peuvent utiliser n’importe quel langage de programmation. Ils peuvent être téléchargés depuis un réseau de communication et/ou enregistrés sur un support lisible par ordinateur.

Selon un autre aspect matériel, l’invention a trait à un support d’enregistrement de données sur lequel a été mémorisée au moins une série d’instructions de code de programme pour l’exécution du procédé défini ci-dessus.

Selon un autre aspect matériel, l’invention concerne également système comprenant un serveur et une pluralité d’équipements définis ci-dessus, aptes à communiquer dans un réseau cellulaire.

L'invention sera mieux comprise à la lecture de la description qui suit, donnée à titre d'exemple et faite en référence aux dessins annexés sur lesquels :

La illustre un exemple d’un réseau de télécommunications selon des modes de réalisation de l’invention ;
La illustre les étapes d’un procédé de génération de données synthétiques de mobilité, selon des modes de réalisation de l’invention ;
La illustre un module de génération de données synthétiques de mobilité selon des modes de réalisation de l’invention ;
La illustre un réseau de neurones artificiels formant un module générateur d’un réseau adverse génératif pour la génération de données synthétiques de mobilité, selon des modes de réalisation de l’invention.

La illustre un exemple d’environnement de mise en œuvre de l’invention selon des modes de réalisation.

Un réseau de télécommunications 100 selon l’invention comprend au moins un premier serveur 110 et au moins une première station de base 101 associée au premier serveur.

Le réseau de télécommunications 100 peut être un réseau mobile de type cellulaire, comprenant une pluralité de stations de base, dont la première station de base 101 représentée sur la , chaque station de base étant apte à couvrir une zone de couverture radio respective, appelée zone radio dans ce qui suit, c’est-à-dire à communiquer de manière bidirectionnelle avec des équipements situés dans la zone radio qu’elle couvre. Sur la , la première station de base 101 couvre une première zone radio 102 dans laquelle se trouvent un premier équipement 111.1 et un deuxième équipement 111.2.

Par exemple, le réseau de télécommunications 100 peut être un réseau de type 3G, 4G, 5G ou tout autre réseau cellulaire, notamment de génération ultérieure.

Chaque station de base du réseau de télécommunications est associée à au moins une cellule radio couverte dans la zone radio de la station de base. Par exemple, la première station de base 101 peut être associée à au moins une cellule radio, voire à plusieurs cellules radio (une cellule 2G, une cellule 3G et une cellule 4G par exemple).

Dans ce qui suit, il est considéré, à titre illustratif uniquement, que la station de base 101 n’est associée qu’à une seule cellule radio.

Le premier équipement 111.1 et le deuxième équipement 111.2 sont des équipements mobiles dans la zone radio 102 : il peut s’agir d’un équipement portatif, tel qu’un Smartphone, embarqué dans un véhicule, ou du véhicule lui-même, ou de tout autre équipement apte à accéder à un réseau de télécommunications et à être déplacé. Seuls deux équipements sont représentés sur la , afin de simplifier la compréhension de l’invention : toutefois, un ensemble plus vaste d’équipements, pouvant comprendre plusieurs dizaines ou centaines d’équipements, peuvent accéder simultanément au premier serveur 110 via la première station de base 101.

A un instant donné, un premier ensemble d’équipements comprend les équipements mobiles localisés dans la zone radio 102, aptes à accéder au premier serveur 110 et implémentant localement un modèle génératif de données synthétiques de mobilité dans un module de génération de données synthétiques de mobilité, décrit dans ce qui suit. Le premier ensemble d’équipements varie ainsi avec le temps : un équipement peut sortir de la première zone radio 102 pour entrer dans une autre zone radio associée à une autre station de base du réseau de télécommunications 100, et/ou un nouvel équipement peut entrer dans la première zone radio 102.

Le premier équipement 111.1 comprend :
- des ressources de calcul, pouvant comprendre un processeur 113.1, le processeur 113.1 comprenant un module de génération de données synthétiques de mobilité apte à implémenter un modèle génératif de données synthétiques de mobilité, comme décrit dans ce qui suit ;

- des ressources de stockage 112.1 telle qu’une mémoire de type « Random Access Memory », RAM, ou une mémoire de type « Read Only Memory », ROM, ou tout autre type de mémoire (Flash, EEPROM, etc.). En variante, la mémoire 112.1 comprend plusieurs mémoires des types précités. La mémoire 112.1 comprend au moins une mémoire non-volatile dans laquelle sont stockées, de manière temporaire ou permanente, des données de mobilité, brutes ou pré-traitées, pouvant comprendre des données de position issues d’un module de localisation 116.1, optionnellement enrichies de données descriptives de l’environnement issues d’un ensemble 114.1 d’au moins un capteur du premier équipement 111.1, et/ou d’une application exécutée sur le premier équipement 111.1 ;
- l’ensemble 114.1 comprend au moins un capteur apte à obtenir des données brutes descriptives de l’environnement du véhicule, aussi appelées « métriques » dans ce qui suit. On entend par « donnée brute » une donnée captée directement par un capteur depuis l’environnement de l’équipement 111.1 et à laquelle le pré-traitement décrit en référence à la n’a pas été appliqué. Selon l’invention, en complément ou en variante des données collectées par l’ensemble 114.1, les données brutes descriptives de l’invention peuvent être collectées par une application, ou plusieurs applications, installées et exécutées sur le premier équipement 111.1. A noter que l’acquisition des données brutes descriptives de l’environnement du véhicule est optionnelle selon l’invention : le premier équipement 111.1 peut ne pas comprendre l’ensemble 114.1, qui est donc également optionnel ;
- une interface réseau 115.1 apte à échanger de manière bidirectionnelle avec la station de base 101 ;
- un module de localisation 116.1 apte à déterminer une donnée de position qui est une localisation de l’équipement 111.1 à un instant donné, la localisation pouvant comprendre un ensemble de coordonnées localisant le premier équipement 111.1 dans la zone radio 102. Le module de localisation 116.1 peut par exemple être un module de géolocalisation par satellite.

Ainsi, le premier équipement 111.1 est apte à acquérir des données de mobilités brutes comprenant une première série temporelle de données de positions associées respectivement à des données descriptives de l’environnement du premier équipement 111.1.

Comme décrit dans ce qui suit, le module de génération de données synthétiques compris dans les ressources de calcul 113.1, peut implémenter un modèle génératif, par exemple issu d’un apprentissage machine, les paramètres du modèle génératif étant modifiés par entraînement en fonction de données de mobilité d’entraînement qui sont une partie ou l’ensemble des données de mobilité, brutes ou pré-traitées.

Le deuxième équipement 111.2 comprend également des ressources de calcul comprenant un processeur 113.2 qui comprend un module de génération de données synthétiques, des ressources de stockage 112.2, un ensemble 114.2 optionnel d’au moins un capteur, une interface réseau 115.2 et un module de localisation 116.2. Les ressources du deuxième équipement 111.2 peuvent différer des ressources du premier équipement 111.1 : la mémoire 112.1 peut avoir une capacité de stockage distincte de la capacité de stockage de la mémoire 112.2, les ressources de calcul 113.1 peuvent être plus puissantes, ou moins puissantes, que les ressources de calcul 113.2.

Selon l’invention, le premier serveur 110 est une unité centrale qui joue un rôle d’orchestrateur dans un apprentissage fédéré pour paramétrer les modèles de génération de données synthétiques du premier ensemble d’équipements, comprenant le premier équipement 111.1 et le deuxième équipement 111.2. Dans l’exemple considéré ici, le serveur 110 est associé à la première cellule radio desservie par la première station de base 101 dans la première zone radio 102. Dans une variante non décrite, le serveur 110 peut être associé à plusieurs premières cellules radio desservies par la première station de base 101 dans la première zone radio 102. Dans une autre variante non décrite, le serveur 110 peut être associé à plusieurs cellules radio desservies par plusieurs stations de base du réseau de télécommunications 100 dans plusieurs zones radio.

Un seul serveur étant représenté sur la , pour simplifier l’exposé de l’invention, le premier serveur 110 est appelé serveur 110 dans ce qui suit.

La présente les étapes d’un procédé de génération de données synthétiques de mobilité selon des modes de réalisation de l’invention.

A une étape 200, le premier équipement 111.1 initialise des paramètres du module de génération de données synthétiques. Aucune restriction n’est attachée aux paramètres initiaux du module de génération de données synthétiques, les paramètres initiaux pouvant être stockés avant la mise en fonctionnement du premier équipement 111.1, lors de l’installation du module de génération de données synthétiques, ou étant reçus depuis le serveur 110 via l’interface réseau 115.1.

A une étape 201, le premier équipement 111.1 obtient des données brutes de mobilité, les données brutes de mobilité comprenant des séries temporelles sous le format suivant , dans lequel :
- t est un instant de collecte des données brutes de mobilité ;
- (x,y) sont les données de positions indiquant la position géographique du premier équipement 111.1, à l’instant t ;
- [ ] est un ensemble de données descriptives de l’environnement à l’instant t, aussi appelées métriques, et qui sont obtenues par l’ensemble 114.1 d’au moins un capteur et/ou par une ou plusieurs applications exécutées sur le premier équipement 111.1. L’ensemble comprend n métriques, avec n entier supérieur ou égal à 1.

A noter que selon l’invention, les données descriptives de l’environnement permettant d’enrichir les données brutes de mobilité, sont optionnelles. Ainsi, selon certains modes de réalisation, les données brutes de mobilité ne comprennent pas de données descriptives de l’environnement et prennent ainsi la forme d’une série temporelle de données de position [t,(x,y)].

Dans ce qui suit, il est considéré, à titre illustratif, que les données brutes de mobilité comprennent en outre des données descriptives de l’environnement, ou métriques.

Les métriques peuvent comprendre n’importe laquelle des données suivantes, ou n’importe quelle combinaison obtenues à partir des données suivantes :
- des données représentatives d’une qualité de service du réseau de télécommunications pour la position (x,y) à l’instant t, pouvant comprendre un rapport entre un niveau de signal et un niveau de bruit, aussi appelé SINR pour « Signal to Interference + Noise Ratio » en anglais, une valeur moyenne d’une puissance reçue de signal de référence, aussi appelée RSRP, pour « Reference Signal Receive Power » en anglais, et/ou une technologie parmi les technologies 3G, 4G et 5G ;
- des données représentatives d’un trafic entre l’équipement et le réseau de télécommunications pour la position (x,y) à l’instant t;
- des données descriptives d’un lieu situé à la position (x,y) à laquelle le premier équipement 111.1 est localisé à l’instant t; et/ou
- des données descriptives de conditions météorologiques pour la position (x,y) à l’instant t.

Les données listées ci-dessus sont des exemples non-exhaustifs de données qui peuvent être intégrées dans les données de mobilité en tant que métriques.

L’étape 201 peut notamment être mise en œuvre en continu, au fur et à mesure du déplacement du premier équipement 111.1 dans la première zone radio 102, et/ou dans d’autres zones radio non représentées sur les figures. Le premier équipement 111.1 peut ainsi collecter des données brutes de mobilité pendant une durée supérieure à la durée de passage dans la première zone radio 102, par exemple sur une période de l’ordre d’une journée, d’une semaine ou d’un mois.

A une étape 202 optionnelle, le premier équipement 111.1 peut traiter les données brutes de mobilité pour obtenir des données de mobilité. Un tel traitement peut être considéré comme un pré-traitement permettant d’améliorer les données brutes de mobilité avant la mise en œuvre des étapes suivantes, permettant un apprentissage fédéré des paramètres du module de génération de données synthétiques.

L’étape de traitement 202 peut comprendre l’une ou l’autre des sous-étapes suivantes :
- une première sous-étape de détermination de données manquantes dans les données brutes de mobilité. La détermination de données manquantes peut être mise en œuvre par interpolation linéaire, ou par un lissage qui consiste à transformer les données brutes discrètes en fonctions, les fonctions étant utilisées ensuite pour déterminer les valeurs manquantes. Dans le cas où la quantité de données brutes de mobilité est importante, par exemple supérieure à un premier seuil, et que la part des données manquantes est faible, par exemple inférieure à un deuxième seuil, les données manquantes peuvent être ignorées et la première sous-étape n’est pas mise en œuvre. Les données manquantes peuvent être déterminées à la fois pour les données de position (x,y) mais également pour l’ensemble des métriques [ ], lorsque les données de mobilité brutes comprennent de telles métriques ; et/ou

- une deuxième sous-étape de normalisation des données brutes de mobilité. La normalisation consiste à ramener des données de natures et d’amplitudes différentes, à des intervalles identiques ou proches. Par exemple, les données de positions et chaque métrique sont ramenées à un même intervalle compris entre 0 et 1. Une telle normalisation permet par la suite l’amélioration de l’apprentissage machine mis en œuvre localement pour déterminer des paramètres locaux optimisés du module de génération de données synthétiques de mobilité. En effet, elle permet d’éviter des biais d’apprentissage liés aux amplitudes, le modèle génératif entraîné pouvant donner plus de poids aux données dont l’amplitude est la plus importante. Aucune restriction n’est attachée à la technique de normalisation mise en œuvre par le premier équipement 111.1, qui peut être par exemple basée sur la fonction MinMaxScaler() ou RobustScaler(), ou qui peut être basée sur une technique plus complexe telle que la normalisation des modes, appelée « Mode Normalisation » en anglais.

Ainsi, l’étape 202 peut permettre d’obtenir des données de mobilité qui sont complètes et normalisées à partir des données brutes de mobilité.

En variante, lorsque l’étape 202 n’est pas appliquée, les données brutes de mobilité sont les données de mobilité mentionnées dans la suite de la description.

A une étape 203, le premier équipement 111.1 détermine des paramètres locaux optimisés du module de génération de données synthétiques, à partir des données de mobilité obtenues aux étapes précédentes. Le module de génération de données synthétiques peut en effet implémenter un modèle génératif de données synthétiques qui peut être entraîné par apprentissage machine, en fonction des données de mobilité obtenues aux étapes précédentes. Au début de l’étape 203, le module de génération de données synthétiques est mis à jour à partir des paramètres initiaux : l’entraînement par apprentissage machine à partir des données de mobilité obtenues permet une modification des paramètres initiaux pour obtenir les paramètres locaux optimisés.

On entend par « donnée synthétique de mobilité », une série temporelle du même format que les données de mobilité acquises aux étapes précédentes, mais distinctes des données de mobilité acquises. Les données de mobilité acquises sont des données réelles, qui comportent ainsi des données personnelles confidentielles de l’utilisateur du premier équipement 111.1, telles que ses trajets notamment (les positions successives occupées sur une période donnée). Au contraire, les données synthétiques de mobilité comprennent une succession de données de positions synthétiques dont au moins une partie n’a pas été occupée par l’utilisateur du premier équipement 111.1, en association, de manière optionnelle, avec des métriques correspondant respectivement aux données de positions synthétiques. Les données synthétiques de mobilité ne permettent ainsi pas de connaître les trajets exacts effectués par l’utilisateur du premier équipement 111.1. Les données synthétiques de mobilité peuvent notamment comprendre une série temporelle de données de positions qui ne sont pas consécutives, et qui forment ainsi un nuage de points dans la zone radio 102, et non pas des trajectoires continues comme les données de positions des données réelles de mobilité.

La présente invention permet un entraînement par apprentissage fédéré d’un modèle génératif de données synthétiques. Une fois entraîné, le modèle génératif de données synthétiques peut générer des données synthétiques de mobilité, qui illustrent les évolutions des métriques dans le temps et dans l’espace, sans toutefois contenir d’informations personnelles confidentielles de l’utilisateur du premier équipement 111.1.

Aucune restriction n’est attachée au type de modèle génératif de données synthétiques implémenté par le module de génération de données synthétiques. Le modèle génératif de données synthétiques peut par exemple être :
- un réseau génératif antagoniste, aussi appelé GAN, pour « Generative Adversarial Network » en anglais ;
- un auto-encodeur, ou VAE, pour « Variational Auto-Encoder » en anglais ;
- un modèle génératif basé sur le flux, aussi appelé modèle « Flow Based » ; ou
- un modèle de diffusion.

Selon des modes de réalisation préférentiels, le modèle génératif de données synthétiques de mobilité est un GAN. En effet, un GAN présente l’avantage d’être plus aisé à implémenter qu’un auto-encodeur, qui nécessite une grande complexité pour l’obtention de résultats probants.

Dans la suite de la description, il est considéré, à titre illustratif uniquement, que le modèle génératif de données synthétiques de mobilité est un GAN. Toutefois, l’invention peut être basée sur tout type de modèle génératif.

La présente la structure d’un modèle génératif 300 de type GAN, selon des modes de réalisation de l’invention.

Comme indiqué précédemment, le GAN 300 peut être implémenté par le module de génération de données synthétiques compris dans les ressources de calcul 113.1 du premier équipement 111.1. Selon l’invention, les équipements du premier ensemble d’équipements participant à l’apprentissage fédéré, comprennent chacun leur propre modèle génératif de données synthétiques, donc leur propre GAN 300, implémenté par leurs ressources de calcul respectives.

Conformément à la structure d’un GAN, le GAN 300 comprend un module générateur 301 entraîné pour générer des données synthétiques de mobilité 311 notées X’, à partir de données bruit 310, notées Z. On entend par « données bruit » n’importe quelles données du même format que les données réelles de mobilité, mais générées de manière aléatoire ou semi-aléatoire en fonction de lois statistiques telles que la loi normale, et ne correspondant à aucune donnée réelle. Les données bruit 310 ne sont donc aucunement corrélées à des données réelles de mobilité 312, notées X, utilisées comme données d’entraînement, pour l’apprentissage non supervisé des paramètres du GAN. Les données réelles de mobilité 312 utilisées comme données d’entraînement peuvent être tout ou partie des données réelles de mobilité issues de l’étape 202 précédente.

Le GAN 300 comprend en outre un module discriminateur 302, et un module de fonction de perte 303. Le module discriminateur 302 est apte à recevoir en entrée les données synthétiques de mobilité 311 ainsi que les données réelles de mobilité d’entraînement 312. Le module discriminateur 302 est configuré pour classer les données reçues 311 et 312, en données réelles ou en données synthétiques.

Selon les principes d’un GAN, le module générateur 301 est entraîné de manière à minimiser la capacité du module discriminateur 302 à classer correctement les données réelles et synthétiques de mobilité reçues en entrée du module discriminateur 302. A l’issue d’une ou de plusieurs classifications opérées par le module discriminateur 302, le module de fonction de perte 303 évalue la performance du GAN 300, et modifie les paramètres du GAN 300 en fonction de la performance ainsi évaluée. Le processus d’entraînement pour l’apprentissage des paramètres locaux optimisés lors de l’étape 203 est ainsi itératif. Après avoir entraîné le GAN 300 avec les données réelles de mobilité d’entraînement 312, des paramètres locaux optimisés sont ainsi obtenus, suite aux itérations successives.

Selon des modes de réalisation de l’invention, les paramètres du GAN 300 sont définis par des paramètres du module générateur 301. Dans ce cas, le module discriminateur 302 peut être défini à l’avance et ses paramètres ne sont pas entraînés. En variante, les paramètres du GAN 300 comprennent à la fois des paramètres définissant le module générateur 301 mais également des paramètres définissant le module discriminateur 302. Le module discriminateur 302 et le module générateur 301 sont dans ce cas entraînés lors de l’apprentissage non supervisé sur la base des données réelles de mobilité d’entraînement 312.

Le module générateur 301 et/ou le module discriminateur 302 peut implémenter un réseau de neurones artificiels. Dans ce qui suit, il est considéré que le module générateur 301 implémente un premier réseau de neurones artificiels et le module discriminateur 302 implémente un deuxième réseau de neurones artificiels.

Le GAN 300 est entraîné pour obtenir les paramètres locaux optimisés lors de l’étape 203 par la résolution d’un problème de théorie des jeux, défini de la manière suivante :

avec

où représente la distribution des données réelles de mobilité 312, représente la distribution des données synthétiques de mobilité 311 générées par le module générateur 301, et D(x) représente la classification faite par le module discriminateur 302. V(D,G) est ainsi évalué par le module de fonction de perte 303.

L’objectif du module générateur 301 est d’apprendre à tromper le module discriminateur 302, c’est-à-dire à produire des données synthétiques de mobilité X’ telles que p(X’)=p(G(z)) n’est pas différenciable de p(X).

Le module discriminateur 302 classe les données reçues en entrée en deux catégories : réelles ou synthétiques/fausses. Les données réelles sont classées dans une classe 1 et les données fausses sont classées dans une classe 0.

Le module générateur 301 est ainsi entraîné pour générer des données synthétiques qui paraissent réelles, du point de vue du module discriminateur 302.

Chacun des premier et deuxième réseaux de neurones artificiels peuvent être des réseaux de neurones multicouches, comprenant un ou plusieurs neurones par couche, qui sont connectés aux neurones des couches suivantes.

La présente la structure d’un premier réseau de neurones artificiels formant un module générateur 301 d’un GAN 300 apte à générer des données synthétiques de mobilité, selon des modes de réalisation de l’invention.

Le premier réseau de neurones artificiels comprend une première couche 400 comprenant trois neurones 401, 402 et 403, une deuxième couche 410 comprenant deux neurones 411 et 412, ainsi qu’une troisième couche 420 comprenant un unique neurone 421.

Une telle architecture est donnée à titre illustratif, et aucune restriction n’est attachée au nombre de couches ni au nombre de neurones par couche, du premier réseau de neurones formant le module générateur 301.

Les paramètres définissant le module générateur 301 sont les poids W= [w₁₁ ¹;w₁₂ ¹;w₂₁ ¹;w₂₂ ¹;w₃₁ ¹;w₃₂ ¹;w₁₁ ²;w₁₂ ²] et les biais B=[b₁ ¹;b₂ ¹;b₁ ²], dans lequel :
- w₁₁ ¹est le poids attribué à la sortie du nœud 401 dans le nœud 411 ;
- w₁₂ ¹est le poids attribué à la sortie du nœud 401 dans le nœud 412 ;
- w₂₁ ¹est le poids attribué à la sortie du nœud 402 dans le nœud 411 ;
- w₂₂ ¹est le poids attribué à la sortie du nœud 402 dans le nœud 412 ;
- w₃₁ ¹est le poids attribué à la sortie du nœud 403 dans le nœud 411 ;
- w₃₂ ¹est le poids attribué à la sortie du nœud 403 dans le nœud 412 ;
- w₁₁ ²est le poids attribué à la sortie du nœud 411 dans le nœud 421 ;
- w₁₂ ²est le poids attribué à la sortie du nœud 412 dans le nœud 421 ;
- b₁ ¹est le biais ajouté au nœud 411 ;
- b₂ ¹est le biais ajouté au nœud 412 ;
- b₁ ²est le biais ajouté au nœud 421.

Les biais sont représentés par les flèches en pointillés sur la . Il convient de noter que les paramètres peuvent ne pas comprendre les biais, qui sont optionnels, et peuvent ne comprendre que les poids respectifs des nœuds du réseau de neurones artificiels.

Ainsi, l’entrée Z est propagée de la première couche 400 à la deuxième couche 410 : soit z_i, pour i variant de 1 à 3 les sorties respectives des neurones 401 à 403 de la première couche 400. Alors, la sortie y₁ du neurone 411 est égale à , sigma désignant une fonction d’activation, telle qu’une fonction ReLU, softmax, ou toute autre fonction d’activation.

De même, la sortie y₂ du neurone 412 est égale à .

La sortie X’ est alors égale à .

Ainsi, le modèle génératif de données synthétiques de mobilité est initialisé avec des paramètres W_in et B_in, et, lors de l’entraînement de l’étape 203, le premier équipement 111.1 détermine des paramètres locaux optimisés W_opt et B_opt. Les performances du modèle génératif de données synthétiques configurés avec W_opt et B_opt sont meilleures que dans le paramétrage initial. A cet effet, l’entraînement peut être basé sur la méthode de descente de gradient, appliquée par le module de fonction de perte 303.

Selon des modes de réalisation, le module discriminateur 302 est un deuxième réseau de neurones artificiels, pouvant comprendre une couche d’entrée apte à recevoir en entrée les données synthétiques de mobilité 311 ou les données réelles de mobilité d’entraînement 312, une couche de sortie apte à déterminer en sortie une classe 0 ou 1, et pouvant comprendre ou non une ou plusieurs couches intermédiaires entre la couche d’entrée et la couche de sortie. A nouveau, les paramètres définissant le module discriminateur sont un vecteur de poids W et un vecteur de biais B optionnel, dont le nombre de composantes dépend du nombre de couches et du nombre de neurones par couche. Ainsi, les paramètres du GAN 300 peuvent comprendre un vecteur de poids W_G du module générateur 301, un vecteur de biais B_G du module générateur 301, un vecteur de poids W_D du module discriminateur 302 et un vecteur de biais B_D du module discriminateur 302. Dans ce cas, lors de l’étape 203, le premier équipement 111.1 détermine les paramètres locaux optimisés W_G,Lopt, W_D,Lopt, B_G,Lopt, B_D,Lopt, le GAN 300 étant initialisé au début de l’étape 203 avec des paramètres initiaux W_G,in, W_D,in, B_G,in, B_D,in.

A noter que, comme précisé précédemment, le modèle génératif peut être différent d’un GAN 300, et peut être par exemple un auto-encodeur, un modèle de diffusion ou un modèle génératif basé sur le flux. Selon chacune de ces alternatives, le modèle génératif peut également comprendre un ou plusieurs réseaux de neurones artificiels, définis par des paramètres qui sont optimisés pour l’obtention de paramètres locaux optimisés.

En se référant à nouveau à la , l’étape 203 d’obtention des paramètres locaux optimisés, par entraînement du GAN 300, notamment sur la base des données réelles de mobilité d’entraînement, a été décrite.

Suite à l’étape 203, le premier équipement 111.1 transmet les paramètres locaux optimisés au serveur 110 à une étape 204, via l’interface réseau 115.1 du premier équipement 111.1.

A une étape 210, le serveur 110 reçoit les paramètres locaux optimisés transmis par le premier équipement 111.1. A une étape 211 ayant lieu avant ou après l’étape 210, le serveur 110 reçoit les paramètres locaux optimisés par le deuxième équipement 111.2. On comprend ainsi que le deuxième équipement 111.2 met en œuvre des étapes identiques aux étapes 200 à 204 décrites en référence au premier équipement 111.1. Toutefois, les ressources du deuxième équipement 111.2 et les données réelles de mobilité obtenues par le deuxième équipement 111.2 étant distinctes de celles du premier équipement 111.1, les paramètres locaux optimisés déterminés par le deuxième équipement 111.2 et reçus à l’étape 211 par le serveur 110, peuvent être différents des paramètres locaux optimisés déterminés par le premier équipement 111.1 et reçus à l’étape 210 par le serveur 110.

De manière plus générale, le serveur 110 reçoit les paramètres locaux optimisés d’une partie ou de la totalité des équipements du premier ensemble qui participent à l’apprentissage fédéré. Par exemple, le serveur 110 peut sélectionner au préalable une partie des équipements du premier ensemble pour qu’ils déterminent localement les paramètres locaux optimisés selon les étapes 200 à 204, les autres équipements du premier ensemble étant exemptés de la mise en œuvre de ces étapes. Une telle sélection peut par exemple être basée sur la quantité de données réelles de mobilité d’entraînement dont dispose chaque équipement du premier ensemble, et/ou des ressources de calcul dont dispose chaque équipement du premier ensemble.

Lorsque les paramètres locaux optimisés ont été reçus depuis la partie ou la totalité des équipements du premier ensemble, le serveur 110 met en œuvre l’étape 212. Dans l’exemple considéré ici, avec uniquement deux équipements dans le premier ensemble, le serveur 110 met en œuvre l’étape 212 suite à la réception de paramètres locaux optimisés depuis le premier équipement 111.1 et depuis le deuxième équipement 111.2.

A l’étape 212, le serveur 110 agrège les paramètres locaux optimisés reçus depuis la partie ou la totalité des équipements du premier ensemble pour obtenir des paramètres globaux optimisés. Aucune restriction n’est attachée à la fonction appliquée aux paramètres locaux optimisés reçus pour obtenir les paramètres globaux optimisés. Dans l’exemple où le module de génération de données synthétiques de mobilité est basé sur le GAN 300 considéré ci-dessus, les paramètres globaux optimisés peuvent être des vecteurs W_G,Gopt, W_D,Gopt, B_G,Gopt, B_D,Gopt.

La détermination des paramètres globaux optimisés peut être basée sur une moyenne de chacun des paramètres locaux optimisés reçus. Par exemple pour le paramètre w₁₁ ¹ décrit précédemment, en considérant que le paramètre w₁₁ ¹ⁱ a été reçu de chaque équipement d’indice i, i variant entre 1 et un entier p correspondant au nombre d’équipements ayant remonté les paramètres locaux optimisés (2 dans l’exemple décrit précédemment), le paramètre global optimisé w_11,Gopt ¹ est égal à .

En variante de l’utilisation de la moyenne décrite ci-dessus, la détermination des paramètres globaux optimisés peut être basée sur d’autres techniques d’agrégation des paramètres locaux optimisés, par exemple sur un algorithme FedMA, pour « Federated Matching Average » en anglais, ou sur un algorithme RFA, pour « Robust Federated Aggregation » en anglais.

Après obtention des paramètres globaux optimisés, le serveur 110 transmet, à une étape 213, les paramètres globaux optimisés au premier équipement 111.1, ainsi qu’à tout autre équipement du premier ensemble (donc également au deuxième équipement 111.2 dans l’exemple de la ) participant à l’apprentissage fédéré.

A une étape 220, le premier équipement 111.1 reçoit les paramètres globaux optimisés depuis le serveur 110, via l’interface réseau 115.1.

A une étape 221, le premier équipement 111.1 met à jour le module de génération de données synthétiques 300 sur la base des paramètres globaux optimisés reçus. Dans l’exemple du GAN 300, le module générateur 301 et le module discriminateur 302 peuvent ainsi être mis à jour sur la base des vecteurs W_G,Gopt, W_D,Gopt, B_G,Gopt, B_D,Gopt formant les paramètres globaux optimisés.

Suite à l’étape 221, le premier équipement 111.1 peut être sélectionné par le serveur 110 pour participer à un nouveau cycle d’apprentissage de l’apprentissage fédéré :

- sur la base de nouvelles données brutes de mobilité acquises lors de l’étape 201 ; et/ou
- sur la base des données brutes de mobilité acquises précédemment, en entraînant localement, lors de l’étape 203, le modèle de génération de données synthétiques de mobilité dont l’initialisation est cette fois-ci la mise à jour issue de l’étape 221, afin d’obtenir de nouveaux paramètres locaux optimisés. Les nouveaux paramètres locaux optimisés sont transmis lors de l’étape 204 au serveur 110, et, suite à leur agrégation avec d’autres nouveaux paramètres locaux optimisés d’autres équipements du premier ensemble, de nouveaux paramètres globaux optimisés sont obtenus à l’étape 220. Les étapes 221 à 223 sont répétées sur la base de ces nouveaux paramètres globaux optimisés.

Si le premier équipement 111.1 n’est pas sélectionné pour le nouveau cycle d’apprentissage fédéré (par exemple parce que le serveur 110 a sélectionné d’autres équipements pour le nouveau cycle d’apprentissage fédéré), il peut tout de même recevoir de nouveaux paramètres globaux optimisés lors d’une nouvelle étape 220, et peut ainsi mettre à jour le module de génération de données synthétiques lors d’une nouvelle étape 221.

L’apprentissage fédéré peut ainsi comprendre plusieurs cycles d’apprentissage qui sont mis en œuvre par itération des étapes 203, 204, 220 et 221. Aucune restriction n’est attachée au nombre de cycles d’apprentissage, l’apprentissage fédéré étant terminé lorsqu’un critère d’arrêt est atteint, le critère d’arrêt pouvant être :
- un nombre prédéfini de cycles d’apprentissage ; et/ou
- lorsqu’une valeur de la fonction de perte implémentée par le module de fonction de perte 303 est inférieure à un seuil prédéfini.

A une étape 222 à l’issue de l’apprentissage fédéré (donc du dernier cycle d’apprentissage mis en oeuvre), le premier équipement 111.1 génère des données synthétiques de mobilité par le module de génération de données synthétiques mis à jour lors de l’étape 221 (du dernier cycle d’apprentissage), et à partir d’une partie ou de l’ensemble des données brutes de mobilité collectées à l’étape 201, et optionnellement pré-traitées lors de l’étape 202.

A une étape 223, le premier équipement 111.1 évalue une performance du module de génération de données synthétiques 301 mis à jour lors de l’étape 221, à partir des données synthétiques générées lors de l’étape 222 et à partir d’une partie ou de l’ensemble des données brutes de mobilité collectées à l’étape 201, et optionnellement pré-traitées lors de l’étape 202.

La performance du module de génération de données synthétiques 301 est évaluée par la fonction de perte implémentée par le module de fonction de perte 303 décrit précédemment. La performance peut ainsi être évaluée par la fonction V(D,G) décrite précédemment.

Si la performance évaluée est inférieure à un seuil de performance donné, le premier équipement 111.1 peut ne pas transmettre les données synthétiques de mobilité générées, ce qui est indiqué par une étape 230 d’absence de transmission sur la . Dans ce cas, le modèle génératif de données synthétiques peut être amélioré lors d’un prochain apprentissage fédéré, comprenant à nouveau un ou plusieurs cycles d’apprentissage, initié par exemple lors du passage du premier équipement dans une autre zone radio du réseau cellulaire ou à l’expiration d’une période donnée.

Si la performance évaluée à l’étape 223 est supérieure au seuil de performance donné, alors le premier équipement 111.1 peut transmettre, à une étape 224, les données synthétiques de mobilité générées lors de l’étape 222, à un autre équipement accédant au réseau de télécommunications, par exemple au deuxième équipement 111.2, et/ou au serveur 110, et/ou à un autre serveur du réseau de télécommunications. Les données synthétiques de mobilité peuvent ainsi être exploitées par ces entités, sans divulguer d’informations confidentielles de l’utilisateur du premier équipement 111.1. La transmission à l’étape 224 peut être immédiatement consécutive à une comparaison positive de la performance évaluée avec le seuil de performance lors de l’étape 223, ou peut être en outre conditionnée par l’une ou plusieurs des conditions suivantes, données à titre illustratif et listées de manière non exhaustive :
- la transmission de l’étape 224 est conditionnée par la réception d’une demande de données synthétiques de la part de l’autre équipement accédant au serveur, du serveur 110 et/ou de l’autre serveur du réseau 100 ;
- la transmission de l’étape 224 est mise en œuvre de manière périodique, avec une transmission à l’issue de chaque période définie par une fréquence prédéterminée. Dans ce cas, la transmission de l’étape 224 est mise en œuvre à l’expiration d’une période courante.

A noter que les autres équipements du premier ensemble mettent en œuvre les mêmes étapes 220 à 224 de manière locale, suite à la transmission des paramètres globaux optimisés par le serveur 110 lors de l’étape 213.

Ainsi, à une étape 225, le premier équipement 111.1 peut recevoir des données synthétiques de mobilité depuis un autre équipement, par exemple depuis le deuxième équipement 111.2, qui a mis en œuvre localement les mêmes étapes 220 à 224 et qui a donc également participé à l’apprentissage fédéré.

Comme indiqué précédemment, un nouvel apprentissage fédéré peut être initié lors du passage du premier équipement dans une zone radio différente de la zone radio 102, ou à l’expiration d’un période donnée, auquel cas les étapes décrites précédemment sont réitérées pour le nouvel apprentissage fédéré.

L’invention permet ainsi la mise en œuvre d’un apprentissage fédéré pour le paramétrage d’un module de génération de données synthétiques de mobilité. Selon une telle approche, l’apprentissage est distribué entre les différents équipements y participant. Les équipements collaborent ainsi pour construire un modèle génératif global, la collaboration n’impliquant que le transfert, vers le serveur 110 commun à plusieurs équipements, de paramètres d’un modèle local, les paramètres étant optimisés localement par chaque équipement lors de l’étape 203.

L’apprentissage fédéré permet à tous les équipements y participant de disposer des mêmes paramètres globaux optimisés, et ce quelles que soient leurs ressources de calcul : il permet ainsi d’une part aux équipements du premier ensemble participant à l’apprentissage fédéré d’utiliser des paramètres optimisés globalement, mais également, d’autre part, il permet que les données synthétiques de mobilité générées localement le soient à partir d’un même modèle génératif. Les données synthétiques de mobilité peuvent ainsi être accumulées et comparées, même lorsqu’elles sont issues de plusieurs équipements, ce qui permet d’exploiter de grandes quantités de données synthétiques de mobilité.

En outre, l’apprentissage fédéré accélère la convergence des modèles génératifs de données synthétiques de mobilité implémentés localement dans les équipements, comparativement à un apprentissage uniquement local du modèle génératif par chacun des équipements.

Ainsi, les données synthétiques générées peuvent être exploitées par d’autres entités, sans que ces entités n’accèdent à des données confidentielles de l’utilisateur de l’équipement générant les données synthétiques, puisque seules des données synthétiques sont transmises.

Des exemples d’exploitation des données synthétiques de mobilité selon l’invention sont décrits ci-après, à titre illustratif.

Selon un premier exemple, les données synthétiques de mobilité générées peuvent être exploitées pour l’amélioration et l’information sur les conditions du réseau de télécommunications 100. Les équipements du premier ensemble sont des véhicules ou des téléphones embarqués dans des véhicules, et chaque équipement comprend une application apte à mesurer, de manière périodique, la qualité de service du réseau de télécommunications, pour chaque position occupée par l’équipement, la qualité de service étant intégrée dans les données brutes de mobilité en tant que métrique.

Des données synthétiques de mobilité sont ensuite générées selon l’invention, et peuvent être transmises à un serveur en charge de la gestion du réseau 100, à des fins d’amélioration de la qualité de service dans le réseau 100, et/ou à d’autres équipements qui peuvent alors adapter leurs itinéraires respectifs en fonction de la qualité de réseau indiquée dans les données synthétiques de mobilité.

Selon un deuxième exemple, les données synthétiques de mobilité générées sont exploitées pour l’amélioration du trafic routier. Dans ce deuxième exemple, la qualité de service du réseau du premier exemple est remplacée par des données représentatives d’une qualité de trafic (indiquant un état fluide du trafic, un état congestionné, des travaux), pour chaque position occupée par un équipement. Les données représentatives de la qualité de trafic sont ainsi intégrées en tant que métriques dans les données brutes de mobilité. Puis, des données synthétiques de mobilité sont générées selon l’invention et peuvent être exploitées par un serveur donné pour fournir des informations sur le trafic à certaines positions et/ou pour la planification de trafic.

Selon un troisième exemple, les données synthétiques de mobilité sont exploitées à des fins touristiques. Les équipements intègrent une application apte à fournir des indicateurs de qualité touristiques d’un itinéraire. Par exemple, au cours d’un trajet, un équipement peut collecter des métriques à des positions données du trajet, telles que le climat, la propreté, le calme, les commerces, etc. Des données synthétiques de mobilité sont ensuite générées selon l’invention, et peuvent être transmises à d’autres équipements intégrant la même application, pour les guider vers des itinéraires ayant les meilleurs indicateurs touristiques.

Selon un quatrième exemple, les données synthétiques de mobilité sont exploitées à des fins environnementales. Les équipements du premier ensemble peuvent disposer d’une application mesurant l’impact environnemental associé au trajet en cours, l’impact environnemental pouvant être les émissions de carbone générées, intégrées dans les données brutes de mobilité en tant que métriques. Les données synthétiques de mobilité sont ensuite générées selon l’invention, puis transmises à d’autres équipements embarqués dans des véhicules pour sensibiliser à prendre les itinéraires les plus respectueux de l’environnement.

Claims

Procédé de génération de données synthétiques à partir de données de mobilité, le procédé comprenant les étapes suivantes, mises en œuvre dans un équipement (111.1 ; 111.2) apte à communiquer avec un serveur (110) d’un réseau cellulaire (100) :
- obtention (201 ; 202) de données de mobilité ;
- détermination (203) de paramètres locaux optimisés d’un module de génération de données synthétiques (300) à partir des données de mobilité obtenues ;
- transmission (204) des paramètres locaux optimisés au serveur ;
- réception (220) de paramètres globaux optimisés du serveur;
- mise à jour (221) dudit module sur la base des paramètres globaux optimisés reçus ;
- génération (222) de données synthétiques par ledit module mis à jour.
Procédé selon la revendication 1, comprenant en outre la transmission (224) des données synthétiques générées à un autre équipement (111.2) accédant au réseau cellulaire, et/ou au serveur (110), et/ou à un autre serveur du réseau cellulaire.
Procédé selon la revendication 2, comprenant en outre une évaluation (223) d’une performance du module de génération de données synthétiques mis à jour, à partir des données synthétiques générées et des données de mobilité, et dans lequel les données synthétiques générées sont transmises (224) à l’autre équipement (111.2) accédant au réseau cellulaire (100), et/ou au serveur (110), et/ou à l’autre serveur du réseau cellulaire, uniquement si la performance évaluée est supérieure à un seuil de performance.
Procédé selon l’une des revendications précédentes, dans lequel les étapes de détermination (203) de paramètres locaux optimisés, de transmission (204) des paramètres locaux optimisés, de réception (220) des paramètres globaux optimisés et de mise à jour (221) du module de génération de données synthétiques constituent un cycle d’apprentissage, et dans lequel, à l’issue d’un cycle d’apprentissage courant, un cycle d’apprentissage suivant est mis en œuvre, des nouveaux paramètres locaux optimisés étant déterminés à partir du module de génération de données synthétiques mis à jour lors du cycle d’apprentissage courant.
Procédé selon l’une des revendications 1 à 4, dans lequel le module de génération de données synthétiques (300) implémente un réseau antagoniste génératif comprenant un module générateur (301) et un module discriminateur (302), et dans lequel les paramètres locaux optimisés sont déterminés par apprentissage non supervisé en fonction d’au moins une partie des données de mobilité utilisées comme données de mobilité d’entraînement (312).
Procédé selon la revendication 5, dans lequel les paramètres locaux optimisés comprennent des premiers paramètres locaux optimisés du module générateur (301) et/ou des deuxièmes paramètres locaux optimisés du module discriminateur (302).
Procédé selon la revendication 6, dans lequel le module générateur (301) et/ou le module discriminateur (302) est un réseau de neurones artificiels.
Procédé selon l’une des revendications précédentes, dans lequel les données de mobilité comprennent au moins une première série temporelle de données de positions de l’équipement et de données descriptives de l’environnement de l’équipement (111.1 ; 111.2), et dans lequel les données synthétiques comprennent au moins une deuxième série temporelle de données de positions synthétiques et de données synthétiques descriptives de l’environnement de l’équipement, les données de positions synthétiques de la deuxième série temporelle étant différentes des données de positions de la première série temporelle.
Procédé selon la revendication 8, dans lequel les données descriptives de l’environnement comprennent l’une ou plusieurs des données suivantes :
- des données représentatives d’une qualité de service du réseau de télécommunications à une position donnée ;
- des données représentatives d’un trafic entre l’équipement et le réseau cellulaire pour une position donnée ;
- des données descriptives d’un lieu situé à une position donnée ; et/ou
- des données descriptives de conditions météorologiques à une position donnée.
Procédé selon l’une des revendications précédentes, comprenant une collecte (201) de données brutes de mobilité, dans lequel les données de mobilité sont obtenues à partir des données brutes de mobilité par :
- détermination (202) des données manquantes à partir des données brutes de mobilité et ajout des données manquantes aux données brutes de mobilité pour obtenir les données de mobilité ; et/ou
- normalisation (202) des données brutes de mobilité pour obtenir les données de mobilité.
Equipement (111.1 ; 111.2) comprenant une interface réseau (115.1 ; 115.2) apte à communiquer avec un serveur (110) d’un réseau cellulaire (100) et un processeur (113.1 ; 113.2) configuré pour :
- obtenir des données de mobilité ;
- déterminer de paramètres locaux optimisés d’un module de génération de données synthétiques à partir des données de mobilité obtenues ;
- transmettre des paramètres locaux optimisés au serveur par l’interface réseau ;
- recevoir des paramètres globaux optimisés du serveur via l’interface réseau;
- mettre à jour ledit module sur la base des paramètres globaux optimisés reçus ;
- générer des données synthétiques par ledit module mis à jour.
Equipement selon la revendication 11, comprenant en outre au moins un capteur (114.1 ; 114.2) ou exécutant au moins une application, apte à obtenir au moins une partie des données de mobilité.
Programme d'ordinateur apte à être mis en œuvre dans un équipement (111.1 ; 111.2) tel que défini dans la revendication 11 ou 12, le programme comprenant des instructions de code qui, lorsqu’il est exécuté par un processeur (113.1 ; 113.2), réalise les étapes du procédé défini dans l’une des revendications 1 à 10.
Support d’enregistrement de données sur lequel a été mémorisée au moins une série d’instructions de code de programme pour l’exécution du procédé selon l’une des revendications 1 à 10.
Système comprenant un serveur (110) et une pluralité d’équipements (111.1 ; 111.2) selon la revendication 11 ou 12, aptes à communiquer dans un réseau cellulaire (100).