WO2025172472A1 - Apprentissage fédéré pour la génération de données synthétiques de mobilité - Google Patents
Apprentissage fédéré pour la génération de données synthétiques de mobilitéInfo
- Publication number
- WO2025172472A1 WO2025172472A1 PCT/EP2025/053908 EP2025053908W WO2025172472A1 WO 2025172472 A1 WO2025172472 A1 WO 2025172472A1 EP 2025053908 W EP2025053908 W EP 2025053908W WO 2025172472 A1 WO2025172472 A1 WO 2025172472A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- data
- synthetic
- equipment
- mobility
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/098—Distributed learning, e.g. federated learning
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0108—Measuring and analyzing of parameters relative to traffic conditions based on the source of data
- G08G1/0112—Measuring and analyzing of parameters relative to traffic conditions based on the source of data from the vehicle, e.g. floating car data [FCD]
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0133—Traffic data processing for classifying traffic situation
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
- G08G1/0141—Measuring and analyzing of parameters relative to traffic conditions for specific applications for traffic information dissemination
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/09—Arrangements for giving variable traffic instructions
- G08G1/0962—Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
- G08G1/0967—Systems involving transmission of highway information, e.g. weather, speed limits
- G08G1/096766—Systems involving transmission of highway information, e.g. weather, speed limits where the system is characterised by the origin of the information transmission
- G08G1/096791—Systems involving transmission of highway information, e.g. weather, speed limits where the system is characterised by the origin of the information transmission where the origin of the information is another vehicle
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/16—Anti-collision systems
- G08G1/161—Decentralised systems, e.g. inter-vehicle communication
- G08G1/162—Decentralised systems, e.g. inter-vehicle communication event-triggered
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/30—Services specially adapted for particular environments, situations or purposes
- H04W4/40—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
- H04W4/44—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P] for communication between vehicles and infrastructures, e.g. vehicle-to-cloud [V2C] or vehicle-to-home [V2H]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/02—Protecting privacy or anonymity, e.g. protecting personally identifiable information [PII]
Definitions
- the invention relates to the field of generating synthetic data representative of the mobility of equipment connected to a telecommunications network.
- Entities connected to a telecommunications network referred to hereinafter as equipment, such as smartphones, vehicles, connected objects accessing a mobile network such as cellular, for example, are capable of generating data representative of their mobility.
- equipment such as smartphones, vehicles, connected objects accessing a mobile network such as cellular, for example, are capable of generating data representative of their mobility.
- Each piece of equipment may in particular collect, during its movement in the telecommunications network, data describing the trajectory of the equipment as well as metrics representative of the equipment's environment.
- the trajectory can correspond to a series of geolocated points, through which the equipment passed during its journey, and the metrics are descriptive data of the customer's environment for each of these points.
- the metrics can notably be descriptive of network states at each point.
- the metrics can include a signal-to-noise ratio, or SNR for "Signal to Noise Ratio" in English, a latency, a throughput value, etc.
- Such metrics can have many advantages, for several network actors in particular: - for the network manager, because the metrics can be used to optimize the network; - when the equipment is a vehicle or a terminal on board a vehicle, for other vehicles connected to the network, the metrics that can be used for informational purposes; - when the entity is a vehicle or a terminal on board a vehicle, for a transport actor who can use the metrics for information and prevention.
- the mobility data is centralized in a central server, which is able to generate synthetic data, which can then be exploited by other actors, the synthetic data not including confidential private data.
- the invention offers a solution which does not have the drawbacks of the state of the art.
- the invention relates to a method for generating synthetic data from mobility data, the method comprising the following steps, implemented in equipment capable of communicating with a server of a cellular network: - obtaining mobility data; - determination of optimized local parameters of a synthetic data generation module from the mobility data obtained; - transmission of optimized local parameters to the server; - receiving optimized global settings from the server; - module update based on received optimized global parameters; - generation of synthetic data by the updated module.
- the synthetic data generation module is updated from optimized global parameters, received from a server capable of receiving optimized local parameters from several devices accessing a telecommunications network.
- a federated learning of the parameters of the synthetic data generation module is thus implemented.
- Federated learning allows all participating devices to have the same optimized global parameters, regardless of their computing resources: it thus allows, on the one hand, that the devices participating in the federated learning have optimized global parameters, but also, on the other hand, it allows the locally generated synthetic mobility data to be generated from the same generative model implemented by the respective synthetic data generation modules of the devices.
- the synthetic mobility data can thus be accumulated and compared, because they come from the same generative model, even when they come from several devices, which makes it possible to exploit large quantities of synthetic data.
- federated learning accelerates the convergence of generative models of synthetic mobility data implemented locally in the devices, compared to local learning of the generative model by each of the devices.
- the method may further comprise transmitting the generated synthetic data to another device accessing the cellular network, and/or to the server, and/or to another server of the cellular network.
- the synthetic data generated can be used by other entities, without these entities accessing confidential data of the user of the equipment, since only synthetic data is transmitted.
- the method may further comprise an evaluation of a performance of the updated synthetic data generation module, from the generated synthetic data and the mobility data, and the generated synthetic data are transmitted to the other equipment accessing the cellular network, and/or to the server, and/or to the other server of the cellular network, only if the evaluated performance is greater than a performance threshold.
- the steps of determining optimized local parameters, transmitting the optimized local parameters, receiving the optimized global parameters and updating the synthetic data generation module constitute a learning cycle, and, at the end of a current learning cycle, a following learning cycle is implemented, new optimized local parameters being determined from the synthetic data generation module updated during the current learning cycle.
- the synthetic data generation module may implement a generative adversarial network comprising a generator module and a discriminator module, and the optimized local parameters may be determined by unsupervised learning based on at least a portion of the mobility data used as training mobility data.
- a generative adversarial network has the advantages of simplicity of implementation as well as non-reversibility of the synthetic data generated: the confidentiality associated with mobility data is thus reinforced for the user of the equipment.
- the optimized local parameters may include first optimized local parameters of the generator module and/or second optimized local parameters of the discriminator module.
- federated learning makes it possible to improve the performance of a generative model implemented locally by the equipment.
- the generator module and/or the discriminator module can be an artificial neural network.
- the mobility data may comprise at least a first time series of equipment position data and descriptive data of the equipment environment
- the synthetic data may comprise at least a second time series of synthetic position data and synthetic data descriptive of the equipment environment, the synthetic position data of the second time series being different from the position data of the first time series.
- the synthetic data does not correspond to real trajectories of the equipment, which improves the confidentiality of the synthetic data compared to the mobility data obtained.
- the descriptive data of the environment may include one or more of the following data: - data representative of the quality of service of the telecommunications network at a given position; - data representative of traffic between the equipment and the telecommunications network for a given position; - descriptive data of a place located at a given position; and/or - descriptive data of weather conditions at a given position.
- synthetic data can be obtained from mobility data enriched with descriptive data of the environment.
- the invention can thus be used for the generation of synthetic data used in various applications.
- the list of descriptive data mentioned above is not exhaustive: other descriptive data of the environment can be integrated, according to the invention, into the mobility data.
- the method may comprise collecting raw mobility data, the mobility data may be obtained from the raw mobility data by: - determining missing data from raw mobility data and adding missing data to raw mobility data to obtain mobility data; and/or - standardization of raw mobility data to obtain mobility data.
- the invention relates to equipment comprising a network interface capable of communicating with a server of a cellular network and a processor configured to: - obtain mobility data; - determine optimized local parameters of a synthetic data generation module from the mobility data obtained; - transmit optimized local parameters to the server via the network interface; - receive optimized global settings from the server via the network interface; - update the module based on the received optimized global parameters; - generate synthetic data by the updated module.
- the equipment may further comprise at least one sensor or may execute at least one application, capable of obtaining at least part of the mobility data.
- the invention also relates to a computer program capable of being implemented on the defined equipment, the program comprising code instructions which, when the program is executed by a processor, carry out the steps of the defined method.
- Such programs can use any programming language. They can be downloaded from a communications network and/or stored on a computer-readable medium.
- the invention relates to a data recording medium on which at least one series of program code instructions has been stored for executing the method defined above.
- the invention also relates to a system comprising a server and a plurality of equipment defined above, capable of communicating in a cellular network.
- the telecommunications network 100 may be a cellular type mobile network, comprising a plurality of base stations, including the first base station 101 shown in the , each base station being capable of covering a respective radio coverage area, called radio area in the following, i.e. of communicating bidirectionally with equipment located in the radio area that it covers.
- the first base station 101 covers a first radio zone 102 in which there are a first equipment 111.1 and a second equipment 111.2.
- Each base station of the telecommunications network is associated with at least one radio cell covered in the radio area of the base station.
- the first base station 101 may be associated with at least one radio cell, or even several radio cells (a 2G cell, a 3G cell and a 4G cell for example).
- the base station 101 is associated with only one radio cell.
- the first equipment 111.1 and the second equipment 111.2 are mobile equipment in the radio zone 102: it can be portable equipment, such as a Smartphone, embedded in a vehicle, or the vehicle itself, or any other equipment capable of accessing a telecommunications network and being moved. Only two pieces of equipment are shown on the , in order to simplify the understanding of the invention: however, a larger set of equipment, which may include several tens or hundreds of equipment, can simultaneously access the first server 110 via the first base station 101.
- a first set of equipment comprises the mobile equipment located in the radio zone 102, capable of accessing the first server 110 and locally implementing a generative model of synthetic mobility data in a synthetic mobility data generation module, described below.
- the first set of equipment thus varies over time: an equipment can leave the first radio zone 102 to enter another radio zone associated with another base station of the telecommunications network 100, and/or a new equipment can enter the first radio zone 102.
- the first 111.1 equipment includes: - computing resources, which may comprise a processor 113.1, the processor 113.1 comprising a synthetic mobility data generation module capable of implementing a generative model of synthetic mobility data, as described below;
- - storage resources 112.1 such as a memory of the “Random Access Memory” type, RAM, or a memory of the “Read Only Memory” type, ROM, or any other type of memory (Flash, EEPROM, etc.).
- the memory 112.1 comprises several memories of the aforementioned types.
- the memory 112.1 comprises at least one non-volatile memory in which are stored, temporarily or permanently, mobility data, raw or pre-processed, which may include position data from a location module 116.1, optionally enriched with descriptive data of the environment from a set 114.1 of at least one sensor of the first equipment 111.1, and/or from an application executed on the first equipment 111.1; - the assembly 114.1 comprises at least one sensor capable of obtaining raw data descriptive of the environment of the vehicle, also called “metrics” in the following. “Raw data” means data captured directly by a sensor from the environment of the equipment 111.1 and to which the pre-processing described with reference to the has not been applied.
- the raw descriptive data of the invention may be collected by an application, or several applications, installed and executed on the first equipment 111.1.
- the acquisition of the raw descriptive data of the vehicle environment is optional according to the invention: the first equipment 111.1 may not include the assembly 114.1, which is therefore also optional; - a network interface 115.1 capable of exchanging bidirectionally with the base station 101; - a location module 116.1 capable of determining position data which is a location of the equipment 111.1 at a given time, the location being able to comprise a set of coordinates locating the first equipment 111.1 in the radio zone 102.
- the location module 116.1 can for example be a satellite geolocation module.
- the first equipment 111.1 is capable of acquiring raw mobility data comprising a first time series of position data associated respectively with descriptive data of the environment of the first equipment 111.1.
- the synthetic data generation module included in the computing resources 113.1 can implement a generative model, for example resulting from machine learning, the parameters of the generative model being modified by training according to training mobility data which is part or all of the mobility data, raw or pre-processed.
- the second device 111.2 also includes computing resources including a processor 113.2 which includes a synthetic data generation module, storage resources 112.2, an optional set 114.2 of at least one sensor, a network interface 115.2 and a location module 116.2.
- the resources of the second device 111.2 may differ from the resources of the first device 111.1: the memory 112.1 may have a storage capacity distinct from the storage capacity of the memory 112.2, the computing resources 113.1 may be more powerful, or less powerful, than the computing resources 113.2.
- the first server 110 is a central unit which plays an orchestrator role in a federated learning to parameterize the synthetic data generation models of the first set of equipment, comprising the first equipment 111.1 and the second equipment 111.2.
- the server 110 is associated with the first radio cell served by the first base station 101 in the first radio zone 102.
- the server 110 can be associated with several first radio cells served by the first base station 101 in the first radio zone 102.
- the server 110 can be associated with several radio cells served by several base stations of the telecommunications network 100 in several radio zones.
- server 110 Only one server being represented on the , to simplify the presentation of the invention, the first server 110 is called server 110 in the following.
- the first device 111.1 initializes parameters of the synthetic data generation module. No restriction is attached to the initial parameters of the synthetic data generation module, the initial parameters being able to be stored before the first device 111.1 is put into operation, during the installation of the synthetic data generation module, or being received from the server 110 via the network interface 115.1.
- the first device 111.1 obtains raw mobility data, the raw mobility data comprising time series in the following format , in which: - t is a time of collection of raw mobility data; - (x,y) are the position data indicating the geographical position of the first equipment 111.1, at time t; - [ ] is a set of descriptive data of the environment at time t, also called metrics, and which are obtained by the set 114.1 of at least one sensor and/or by one or more applications executed on the first device 111.1.
- the set comprises n metrics, with n integer greater than or equal to 1.
- the descriptive data of the environment making it possible to enrich the raw mobility data are optional.
- the raw mobility data do not include descriptive data of the environment and thus take the form of a time series of position data [t,(x,y)].
- raw mobility data also includes descriptive environmental data, or metrics.
- Metrics may include any of the following data, or any combination obtained from the following data: - data representative of a quality of service of the telecommunications network for the position (x,y) at time t, which may include a ratio between a signal level and a noise level, also called SINR for “Signal to Interference + Noise Ratio” in English, an average value of a received reference signal power, also called RSRP, for “Reference Signal Receive Power” in English, and/or a technology among 3G, 4G and 5G technologies; - data representative of traffic between the equipment and the telecommunications network for position (x,y) at time t; - descriptive data of a location located at the position (x,y) at which the first equipment 111.1 is located at time t; and/or - descriptive data of meteorological conditions for position (x,y) at time t.
- SINR Signal to Interference + Noise Ratio
- RSRP Average value of a received reference signal power
- RSRP Reference Signal Receive Power
- Step 201 may in particular be implemented continuously, as the first equipment 111.1 moves in the first radio zone 102, and/or in other radio zones not shown in the figures.
- the first equipment 111.1 may thus collect raw mobility data for a duration greater than the duration of passage in the first radio zone 102, for example over a period of the order of a day, a week or a month.
- the first device 111.1 can process the raw mobility data to obtain mobility data. Such processing can be considered as pre-processing for improving the raw mobility data before implementing the following steps, allowing federated learning of the parameters of the synthetic data generation module.
- Processing step 202 may comprise any of the following substeps: - a first sub-step of determining missing data in the raw mobility data.
- the determination of missing data can be implemented by linear interpolation, or by smoothing which consists of transforming the discrete raw data into functions, the functions then being used to determine the missing values.
- the missing data can be ignored and the first sub-step is not implemented.
- the missing data can be determined both for the position data (x,y) but also for the set of metrics [ ], where the raw mobility data includes such metrics; and/or
- Normalization consists of bringing data of different natures and amplitudes to identical or close intervals. For example, the position data and each metric are brought to the same interval between 0 and 1.
- Such normalization subsequently allows the improvement of the machine learning implemented locally to determine optimized local parameters of the synthetic mobility data generation module. Indeed, it makes it possible to avoid learning biases linked to amplitudes, the trained generative model being able to give more weight to the data whose amplitude is the greatest.
- step 202 can make it possible to obtain mobility data which is complete and standardized from the raw mobility data.
- the raw mobility data is the mobility data mentioned in the remainder of the description.
- the first device 111.1 determines optimized local parameters of the synthetic data generation module, from the mobility data obtained in the previous steps.
- the synthetic data generation module can in fact implement a generative model of synthetic data which can be trained by machine learning, according to the mobility data obtained in the previous steps.
- the synthetic data generation module is updated from the initial parameters: the training by machine learning from the mobility data obtained allows a modification of the initial parameters to obtain the optimized local parameters.
- “Synthetic mobility data” means a time series of the same format than the mobility data acquired in the previous steps, but distinct from the acquired mobility data.
- the acquired mobility data are real data, which thus include confidential personal data of the user of the first equipment 111.1, such as his journeys in particular (the successive positions occupied over a given period).
- the synthetic mobility data comprise a succession of synthetic position data of which at least a part has not been occupied by the user of the first equipment 111.1, in association, optionally, with metrics corresponding respectively to the synthetic position data.
- the synthetic mobility data thus do not make it possible to know the exact journeys made by the user of the first equipment 111.1.
- the synthetic mobility data may in particular comprise a time series of position data which are not consecutive, and which thus form a cloud of points in the radio zone 102, and not continuous trajectories like the position data of the real mobility data.
- the present invention enables federated learning training of a synthetic data generative model. Once trained, the synthetic data generative model can generate synthetic mobility data, which illustrates the evolutions of the metrics over time and space, without however containing confidential personal information of the user of the first equipment 111.1.
- the synthetic data generative model can be, for example: - a generative adversarial network, also called GAN, for “Generative Adversarial Network” in English; - an auto-encoder, or VAE, for “Variational Auto-Encoder” in English; - a flow-based generative model, also called a “Flow Based” model; or - a diffusion model.
- the generative model of synthetic mobility data is a GAN.
- a GAN has the advantage of being easier to implement than an auto-encoder, which requires great complexity to obtain convincing results.
- the generative model of synthetic mobility data is a GAN.
- the invention can be based on any type of generative model.
- the GAN 300 can be implemented by the synthetic data generation module included in the computing resources 113.1 of the first device 111.1.
- the devices of the first set of devices participating in the federated learning each comprise their own synthetic data generative model, therefore their own GAN 300, implemented by their respective computing resources.
- the GAN 300 comprises a generator module 301 trained to generate synthetic mobility data 311 denoted X’, from noise data 310, denoted Z.
- “Noise data” means any data of the same format as the real mobility data, but generated randomly or semi-randomly according to statistical laws such as the normal law, and not corresponding to any real data.
- the noise data 310 are therefore in no way correlated with real mobility data 312, denoted X, used as training data, for the unsupervised learning of the parameters of the GAN.
- the real mobility data 312 used as training data may be all or part of the real mobility data from the previous step 202.
- the GAN 300 further comprises a discriminator module 302, and a loss function module 303.
- the discriminator module 302 is capable of receiving as input the synthetic mobility data 311 as well as the real training mobility data 312.
- the discriminator module 302 is configured to classify the received data 311 and 312, into real data or synthetic data.
- the generator module 301 is trained so as to minimize the capacity of the discriminator module 302 to correctly classify the real and synthetic mobility data received as input from the discriminator module 302.
- the loss function module 303 evaluates the performance of the GAN 300, and modifies the parameters of the GAN 300 according to the performance thus evaluated.
- the training process for learning the optimized local parameters during step 203 is thus iterative. After training the GAN 300 with the real training mobility data 312, optimized local parameters are thus obtained, following successive iterations.
- the parameters of the GAN 300 are defined by parameters of the generator module 301.
- the discriminator module 302 can be defined in advance and its parameters are not trained.
- the parameters of the GAN 300 include both parameters defining the generator module 301 and parameters defining the discriminator module 302.
- the discriminator module 302 and the generator module 301 are in this case trained during unsupervised learning on the basis of the actual training mobility data 312.
- the generator module 301 and/or the discriminator module 302 may implement an artificial neural network. In the following, it is considered that the generator module 301 implements a first artificial neural network and the discriminator module 302 implements a second artificial neural network.
- the GAN 300 is trained to obtain the optimized local parameters in step 203 by solving a game theory problem, defined as follows:
- the discriminator module 302 classifies the received input data into two categories: real or synthetic/fake. Real data is classified into a class 1 and fake data is classified into a class 0.
- the generator module 301 is thus trained to generate synthetic data which appears real, from the point of view of the discriminator module 302.
- Each of the first and second artificial neural networks may be multi-layer neural networks, comprising one or more neurons per layer, which are connected to neurons in subsequent layers.
- a first artificial neural network forming a generator module 301 of a GAN 300 capable of generating synthetic mobility data, according to embodiments of the invention.
- the first artificial neural network comprises a first layer 400 comprising three neurons 401, 402 and 403, a second layer 410 comprising two neurons 411 and 412, and a third layer 420 comprising a single neuron 421.
- Such an architecture is given for illustrative purposes, and no restriction is attached to the number of layers or the number of neurons per layer, of the first neural network forming the generator module 301.
- biases are represented by the dotted arrows on the . It should be noted that the parameters may not include biases, which are optional, and may only include the respective weights of the nodes in the artificial neural network.
- the input Z is propagated from the first layer 400 to the second layer 410: let z i , for i varying from 1 to 3 the respective outputs of the neurons 401 to 403 of the first layer 400. Then, the output y 1 of the neuron 411 is equal to , sigma denoting an activation function, such as a ReLU, softmax, or any other activation function.
- an activation function such as a ReLU, softmax, or any other activation function.
- the output y 2 of neuron 412 is equal to .
- the output X' is then equal to .
- the synthetic mobility data generative model is initialized with parameters W in and B in , and, during the training of step 203, the first device 111.1 determines optimized local parameters W opt and B opt .
- the performance of the synthetic data generative model configured with W opt and B opt is better than in the initial setting.
- the training can be based on the gradient descent method, applied by the loss function module 303.
- the discriminator module 302 is a second artificial neural network, which may comprise an input layer capable of receiving as input the synthetic mobility data 311 or the real training mobility data 312, an output layer capable of determining as output a class 0 or 1, and which may or may not comprise one or more intermediate layers between the input layer and the output layer.
- the parameters defining the discriminator module are a weight vector W and an optional bias vector B, the number of components of which depends on the number of layers and the number of neurons per layer.
- the parameters of the GAN 300 may comprise a weight vector W G of the generator module 301, a bias vector B G of the generator module 301, a weight vector W D of the discriminator module 302 and a bias vector B D of the discriminator module 302.
- the first device 111.1 determines the optimized local parameters W G,Lopt , W D,Lopt , B G,Lopt , B D,Lopt , the GAN 300 being initialized at the start of step 203 with initial parameters W G,in , W D,in , B G,in , B D,in .
- the generative model may be different from a GAN 300, and may be, for example, an autoencoder, a diffusion model, or a flow-based generative model. According to each of these alternatives, the generative model may also include one or more artificial neural networks, defined by parameters that are optimized to obtain optimized local parameters.
- the first device 111.1 transmits the optimized local parameters to the server 110 in a step 204, via the network interface 115.1 of the first device 111.1.
- the server 110 receives the optimized local parameters transmitted by the first equipment 111.1.
- the server 110 receives the optimized local parameters by the second equipment 111.2.
- the second equipment 111.2 implements steps identical to steps 200 to 204 described with reference to the first equipment 111.1.
- the resources of the second equipment 111.2 and the actual mobility data obtained by the second equipment 111.2 being distinct from those of the first equipment 111.1, the optimized local parameters determined by the second equipment 111.2 and received in step 211 by the server 110 may be different from the optimized local parameters determined by the first equipment 111.1 and received in step 210 by the server 110.
- the server 110 receives the optimized local parameters of some or all of the equipment of the first set that participate in the federated learning.
- the server 110 may preselect some of the equipment of the first set so that they locally determine the optimized local parameters according to steps 200 to 204, the other equipment of the first set being exempted from implementing these steps.
- Such a selection may for example be based on the quantity of real training mobility data available to each equipment of the first set, and/or the computing resources available to each equipment of the first set.
- the server 110 When the optimized local parameters have been received from some or all of the equipment in the first set, the server 110 implements step 212. In the example considered here, with only two equipment in the first set, the server 110 implements step 212 following the reception of optimized local parameters from the first equipment 111.1 and from the second equipment 111.2.
- the server 110 aggregates the optimized local parameters received from some or all of the equipment of the first set to obtain optimized global parameters. No restriction is attached to the function applied to the optimized local parameters received to obtain the optimized global parameters.
- the optimized global parameters can be vectors W G,Gopt , W D,Gopt , B G,Gopt , B D,Gopt .
- the determination of the optimized global parameters can be based on an average of each of the optimized local parameters received. For example, for the parameter w 11 1 described previously, considering that the parameter w 11 1i was received from each device of index i, i varying between 1 and an integer p corresponding to the number of devices having sent back the optimized local parameters (2 in the example described previously), the optimized global parameter w 11,Gopt 1 is equal to .
- the determination of the optimized global parameters can be based on other techniques for aggregating the optimized local parameters, for example on a FedMA algorithm, for "Federated Matching Average” in English, or on an RFA algorithm, for "Robust Federated Aggregation” in English.
- the server 110 transmits, in a step 213, the optimized global parameters to the first equipment 111.1, as well as to any other equipment of the first set (therefore also to the second equipment 111.2 in the example of the ) participating in federated learning.
- the first device 111.1 receives the optimized global parameters from the server 110, via the network interface 115.1.
- the first device 111.1 updates the synthetic data generation module 300 on the basis of the received optimized global parameters.
- the generator module 301 and the discriminator module 302 can thus be updated on the basis of the vectors W G,Gopt , W D,Gopt , B G,Gopt , B D,Gopt forming the optimized global parameters.
- the first device 111.1 can be selected by the server 110 to participate in a new learning cycle of the federated learning:
- step 204 based on new raw mobility data acquired during step 201; and/or - on the basis of the raw mobility data acquired previously, by locally training, during step 203, the synthetic mobility data generation model whose initialization is this time the update resulting from step 221, in order to obtain new optimized local parameters.
- the new optimized local parameters are transmitted during step 204 to the server 110, and, following their aggregation with other new optimized local parameters of other equipment of the first set, new optimized global parameters are obtained in step 220. Steps 221 to 223 are repeated on the basis of these new optimized global parameters.
- the first device 111.1 If the first device 111.1 is not selected for the new federated learning cycle (for example because the server 110 has selected other devices for the new federated learning cycle), it can still receive new optimized global parameters during a new step 220, and can thus update the synthetic data generation module during a new step 221.
- Federated learning can thus comprise several learning cycles which are implemented by iterating steps 203, 204, 220 and 221. No restriction is attached to the number of learning cycles, federated learning being terminated when a stopping criterion is reached, the stopping criterion being able to be: - a predefined number of learning cycles; and/or - when a value of the loss function implemented by the loss function module 303 is lower than a predefined threshold.
- the first device 111.1 At a step 222 at the end of the federated learning (therefore the last learning cycle implemented), the first device 111.1 generates synthetic mobility data by the synthetic data generation module updated during step 221 (of the last learning cycle), and from part or all of the raw mobility data collected in step 201, and optionally pre-processed during step 202.
- the first device 111.1 evaluates a performance of the synthetic data generation module 301 updated during step 221, from the synthetic data generated during step 222 and from part or all of the raw mobility data collected in step 201, and optionally pre-processed during step 202.
- the performance of the synthetic data generation module 301 is evaluated by the loss function implemented by the loss function module 303 described above.
- the performance can thus be evaluated by the function V(D,G) described above.
- the first equipment 111.1 can transmit, in a step 224, the synthetic mobility data generated during step 222, to another equipment accessing the telecommunications network, for example to the second equipment 111.2, and/or to the server 110, and/or to another server of the telecommunications network.
- the synthetic mobility data can thus be used by these entities, without disclosing confidential information of the user of the first equipment 111.1.
- the transmission in step 224 can be immediately following a positive comparison of the performance evaluated with the performance threshold during step 223, or can further be conditioned by one or more of the following conditions, given for illustrative purposes and listed in a non-exhaustive manner: - the transmission of step 224 is conditioned by the reception of a request for synthetic data from the other equipment accessing the server, from the server 110 and/or from the other server of the network 100; - the transmission of step 224 is implemented periodically, with a transmission at the end of each period defined by a predetermined frequency. In this case, the transmission of step 224 is implemented at the end of a current period.
- the first device 111.1 can receive synthetic mobility data from another device, for example from the second device 111.2, which has locally implemented the same steps 220 to 224 and which has therefore also participated in the federated learning.
- a new federated learning can be initiated when the first equipment moves into a radio zone different from radio zone 102, or at the expiration of a given period, in which case the steps described previously are repeated for the new federated learning.
- Federated learning allows all participating devices to have the same optimized global parameters, regardless of their computing resources: on the one hand, it allows the devices in the first set participating in federated learning to use globally optimized parameters, but also, on the other hand, it allows the locally generated synthetic mobility data to be generated from the same generative model. Synthetic mobility data can thus be accumulated and compared, even when they come from several devices, which makes it possible to exploit large quantities of synthetic mobility data.
- federated learning accelerates the convergence of generative models of synthetic mobility data implemented locally in the devices, compared to only local learning of the generative model by each of the devices.
- the synthetic data generated can be used by other entities, without these entities accessing confidential data of the user of the equipment generating the synthetic data, since only synthetic data is transmitted.
- the generated synthetic mobility data can be used for the improvement and information on the conditions of the telecommunications network 100.
- the equipment of the first set is vehicles or telephones embedded in vehicles, and each equipment comprises an application capable of measuring, periodically, the quality of service of the telecommunications network, for each position occupied by the equipment, the quality of service being integrated into the raw mobility data as a metric.
- Synthetic mobility data are then generated according to the invention, and can be transmitted to a server responsible for managing the network 100, for the purposes of improving the quality of service in the network 100, and/or to other equipment which can then adapt their respective routes according to the network quality indicated in the synthetic mobility data.
- the generated synthetic mobility data are used to improve road traffic.
- the quality of service of the network of the first example is replaced by data representative of a traffic quality (indicating a fluid traffic state, a congested state, works), for each position occupied by a device.
- the data representative of the traffic quality are thus integrated as metrics in the raw mobility data.
- synthetic mobility data are generated according to the invention and can be used by a given server to provide information on the traffic at certain positions and/or for traffic planning.
- the synthetic mobility data is used for tourism purposes.
- the equipment integrates an application capable of providing tourism quality indicators for a route.
- a device can collect metrics at given positions on the journey, such as climate, cleanliness, calm, shops, etc.
- Synthetic mobility data is then generated according to the invention, and can be transmitted to other equipment integrating the same application, to guide them towards routes with the best tourism indicators.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Atmospheric Sciences (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
L'invention concerne un procédé de génération de données synthétiques à partir de données de mobilité, le procédé comprenant les étapes suivantes, mises en œuvre dans un équipement apte à communiquer avec un serveur d'un réseau cellulaire, le procédé comprenant les étapes suivantes : - obtention (201; 202) de données de mobilité; - détermination (203) de paramètres locaux optimisés d'un module de génération de données synthétiques à partir des données de mobilité obtenues; - transmission (204) des paramètres locaux optimisés au serveur; - réception (220) de paramètres globaux optimisés du serveur; - mise à jour (221) du module sur la base des paramètres globaux optimisés reçus; - génération (222) de données synthétiques par le module mis à jour.
Description
L'invention se rapporte au domaine de la génération de données synthétiques représentatives de la mobilité d’équipements connectés à un réseau de télécommunications.
Elle a notamment pour but de permettre un apprentissage fédéré pour la génération de telles données synthétiques.
Les entités connectées, appelées équipements ci-après, à un réseau de télécommunications, telles que des smartphones, véhicules, objets connectés accédant à un réseau mobile de type cellulaire par exemple, sont aptes à générer des données représentatives de leur mobilité. Chaque équipement peut notamment collecter, au cours de son déplacement dans le réseau de télécommunications, des données décrivant la trajectoire de l’équipement ainsi que des métriques représentatives de l’environnement de l’équipement.
La trajectoire peut correspondre à une suite de points géolocalisés, par lequel l’équipement est passé durant son trajet, et les métriques sont des données descriptives de l’environnement du client pour chacun de ces points. Les métriques peuvent notamment être descriptives d’états du réseau à chaque point. A cet effet, les métriques peuvent comprendre un ratio signal à bruit, ou SNR pour « Signal to Noise Ratio » en anglais, une latence, une valeur de débit, etc.
De telles métriques peuvent avoir de nombreux avantages, pour plusieurs acteurs du réseau notamment :
- pour le gestionnaire du réseau, car les métriques peuvent être utilisées pour optimiser le réseau ;
- lorsque l’équipement est un véhicule ou un terminal embarqué dans un véhicule, pour les autres véhicules connectés au réseau, les métriques pouvant être utilisées à des fins informatives ;
- lorsque l’entité est un véhicule ou un terminal embarqué dans un véhicule, pour un acteur du transport qui peut utiliser les métriques pour information et prévention.
- pour le gestionnaire du réseau, car les métriques peuvent être utilisées pour optimiser le réseau ;
- lorsque l’équipement est un véhicule ou un terminal embarqué dans un véhicule, pour les autres véhicules connectés au réseau, les métriques pouvant être utilisées à des fins informatives ;
- lorsque l’entité est un véhicule ou un terminal embarqué dans un véhicule, pour un acteur du transport qui peut utiliser les métriques pour information et prévention.
Toutefois, il n’est pas souhaitable qu’un équipement partage ses trajets et ses métriques exactes, car ces données sont privées et potentiellement confidentielles.
Il est connu pour surmonter ce problème de générer des données synthétiques à partir des données de mobilité collectées. A cet effet, les données de mobilité sont centralisées dans un serveur central, qui est apte à générer des données synthétiques, qui peuvent ensuite être exploitées par d’autres acteurs, les données synthétiques ne comprenant pas de données privées confidentielles.
Toutefois, une telle solution requiert de chaque équipement qu’il transmette les données réelles de mobilité, données qui sont confidentielles, au serveur central, ce qui pose des problèmes de sécurité. En effet, un attaquant peut intercepter ces données confidentielles, et les corrompre (les modifier) ou les utiliser à mauvais escient.
Qui plus est la transmission de données réelles de mobilité par chaque équipement vers le serveur centralisé, puis l’envoi de données synthétiques vers d’autres acteurs du réseau, occasionnent un trafic important, par conséquent coûteux et qui peut impliquer une congestion du réseau.
L'invention offre une solution ne présentant pas les inconvénients de l'état de la technique.
A cet effet, selon un aspect fonctionnel, l'invention a pour objet un procédé de génération de données synthétiques à partir de données de mobilité, le procédé comprenant les étapes suivantes, mises en œuvre dans un équipement apte à communiquer avec un serveur d’un réseau cellulaire :
- obtention de données de mobilité ;
- détermination de paramètres locaux optimisés d’un module de génération de données synthétiques à partir des données de mobilité obtenues ;
- transmission des paramètres locaux optimisés au serveur ;
- réception de paramètres globaux optimisés du serveur;
- mise à jour du module sur la base des paramètres globaux optimisés reçus ;
- génération de données synthétiques par le module mis à jour.
- obtention de données de mobilité ;
- détermination de paramètres locaux optimisés d’un module de génération de données synthétiques à partir des données de mobilité obtenues ;
- transmission des paramètres locaux optimisés au serveur ;
- réception de paramètres globaux optimisés du serveur;
- mise à jour du module sur la base des paramètres globaux optimisés reçus ;
- génération de données synthétiques par le module mis à jour.
Ainsi, le module de génération de données synthétiques est mis à jour à partir de paramètres globaux optimisés, reçus d’un serveur apte à recevoir des paramètres locaux optimisés de plusieurs équipements accédant à un réseau de télécommunications. Un apprentissage fédéré des paramètres du module de génération de données synthétiques est ainsi mis en œuvre. L’apprentissage fédéré permet à tous les équipements y participant de disposer des mêmes paramètres globaux optimisés, et ce quelles que soient leurs ressources de calcul : il permet ainsi d’une part que les équipements participant à l’apprentissage fédéré disposent de paramètres globaux optimisés, mais également, d’autre part, il permet que les données synthétiques de mobilité générées localement le soient à partir d’un même modèle génératif implémenté par les modules de génération de données synthétiques respectifs des équipements. Les données synthétiques de mobilité peuvent ainsi être accumulées et comparées, car elles sont issues du même modèle génératif, même lorsqu’elles sont issues de plusieurs équipements, ce qui permet d’exploiter de grandes quantités de données synthétiques. En outre, l’apprentissage fédéré accélère la convergence des modèles génératifs de données synthétiques de mobilité implémentés localement dans les équipements, comparativement à un apprentissage local du modèle génératif par chacun des équipements.
Selon des modes de réalisation, le procédé peut comprendre en outre la transmission des données synthétiques générées à un autre équipement accédant au réseau cellulaire, et/ou au serveur, et/ou à un autre serveur du réseau cellulaire.
Ainsi, les données synthétiques générées peuvent être exploitées par d’autres entités, sans que ces entités n’accèdent à des données confidentielles de l’utilisateur de l’équipement, puisque seules des données synthétiques sont transmises.
En complément, le procédé peut comprendre en outre une évaluation d’une performance du module de génération de données synthétiques mis à jour, à partir des données synthétiques générées et des données de mobilité, et les données synthétiques générées sont transmises à l’autre équipement accédant au réseau cellulaire, et/ou au serveur, et/ou à l’autre serveur du réseau cellulaire, uniquement si la performance évaluée est supérieure à un seuil de performance.
Ainsi, il est assuré une performance élevée lors de la génération des données synthétiques. Seules des données synthétiques de qualité élevée, c’est-à-dire générées par un module de génération de données synthétiques performant (dont l’évaluation de la performance est supérieure au seuil de performance), sont ainsi partagées avec d’autres entités.
Selon des modes de réalisation de l’invention, les étapes de détermination de paramètres locaux optimisés, de transmission des paramètres locaux optimisés, de réception des paramètres globaux optimisés et de mise à jour du module de génération de données synthétiques constituent un cycle d’apprentissage, et, à l’issue d’un cycle d’apprentissage courant, un cycle d’apprentissage suivant est mis en œuvre, des nouveaux paramètres locaux optimisés étant déterminés à partir du module de génération de données synthétiques mis à jour lors du cycle d’apprentissage courant.
Il est ainsi rendu possible d’itérer les cycles d’apprentissage de l’apprentissage fédéré, ce qui permet une amélioration continue des paramètres globaux optimisés, et ce qui facilite une convergence du modèle de génération de données synthétiques de chaque équipement.
Selon des modes de réalisation, le module de génération de données synthétiques peut implémenter un réseau antagoniste génératif comprenant un module générateur et un module discriminateur, et les paramètres locaux optimisés peuvent être déterminés par apprentissage non supervisé en fonction d’au moins une partie des données de mobilité utilisées comme données de mobilité d’entraînement.
Un réseau antagoniste génératif présente les avantages d’une simplicité d’implémentation ainsi que d’une non-réversibilité des données synthétiques générées : la confidentialité associée aux données de mobilité est ainsi renforcée pour l’utilisateur de l’équipement.
En complément, les paramètres locaux optimisés peuvent comprendre des premiers paramètres locaux optimisés du module générateur et/ou des deuxièmes paramètres locaux optimisés du module discriminateur.
Ainsi, l’apprentissage fédéré permet d’améliorer les performances d’un modèle génératif mis en œuvre localement par l’équipement.
En complément, le module générateur et/ou le module discriminateur peut être un réseau de neurones artificiels.
Il est ainsi rendu possible de générer des données synthétiques à partir de données de mobilité complexes, par exemple comprenant plusieurs types de données descriptives de l’environnement de l’équipement.
Selon des modes de réalisation, les données de mobilité peuvent comprendre au moins une première série temporelle de données de positions de l’équipement et de données descriptives de l’environnement de l’équipement, et les données synthétiques peuvent comprendre au moins une deuxième série temporelle de données de positions synthétiques et de données synthétiques descriptives de l’environnement de l’équipement, les données de positions synthétiques de la deuxième série temporelle étant différentes des données de position de la première série temporelle.
Ainsi, les données synthétiques ne correspondent pas à des trajectoires réelles de l’équipement, ce qui permet d’améliorer la confidentialité des données synthétiques comparativement aux données de mobilité obtenues.
En complément, les données descriptives de l’environnement peuvent comprendre l’une ou plusieurs des données suivantes :
- des données représentatives d’une qualité de service du réseau de télécommunications à une position donnée ;
- des données représentatives d’un trafic entre l’équipement et le réseau de télécommunications pour une position donnée ;
- des données descriptives d’un lieu situé à une position donnée ; et/ou
- des données descriptives de conditions météorologiques à une position donnée.
- des données représentatives d’une qualité de service du réseau de télécommunications à une position donnée ;
- des données représentatives d’un trafic entre l’équipement et le réseau de télécommunications pour une position donnée ;
- des données descriptives d’un lieu situé à une position donnée ; et/ou
- des données descriptives de conditions météorologiques à une position donnée.
Ainsi, les données synthétiques peuvent être obtenues à partir de données de mobilité enrichies par des données descriptives de l’environnement. L’invention peut ainsi être utilisée pour la génération de données synthétiques utilisées dans des applications variées. La liste de données descriptives mentionnée ci-dessus n’est pas exhaustive : d’autres données descriptives de l’environnement peuvent être intégrées, selon l’invention, dans les données de mobilité.
Selon des modes de réalisation, le procédé peut comprendre une collecte de données brutes de mobilité, les données de mobilité peuvent être obtenues à partir des données brutes de mobilité par :
- détermination des données manquantes à partir des données brutes de mobilité et ajout des données manquantes aux données brutes de mobilité pour obtenir les données de mobilité ; et/ou
- normalisation des données brutes de mobilité pour obtenir les données de mobilité.
- détermination des données manquantes à partir des données brutes de mobilité et ajout des données manquantes aux données brutes de mobilité pour obtenir les données de mobilité ; et/ou
- normalisation des données brutes de mobilité pour obtenir les données de mobilité.
Ainsi, il est assuré que les données utilisées en entrée du module de génération des données synthétiques sont complètes et/ou normalisées, ce qui améliore les données synthétiques générées.
Selon un aspect matériel, l’invention concerne un équipement comprenant une interface réseau apte à communiquer avec un serveur d’un réseau cellulaire et un processeur configuré pour :
- obtenir des données de mobilité ;
- déterminer de paramètres locaux optimisés d’un module de génération de données synthétiques à partir des données de mobilité obtenues ;
- transmettre des paramètres locaux optimisés au serveur par l’interface réseau ;
- recevoir des paramètres globaux optimisés du serveur via l’interface réseau;
- mettre à jour le module sur la base des paramètres globaux optimisés reçus ;
- générer des données synthétiques par le module mis à jour.
- obtenir des données de mobilité ;
- déterminer de paramètres locaux optimisés d’un module de génération de données synthétiques à partir des données de mobilité obtenues ;
- transmettre des paramètres locaux optimisés au serveur par l’interface réseau ;
- recevoir des paramètres globaux optimisés du serveur via l’interface réseau;
- mettre à jour le module sur la base des paramètres globaux optimisés reçus ;
- générer des données synthétiques par le module mis à jour.
Selon des modes de réalisation, l’équipement peut comprendre en outre au moins un capteur ou peut exécuter au moins une application, apte à obtenir au moins une partie des données de mobilité.
Selon un autre aspect matériel, l'invention concerne également un programme d'ordinateur apte à être mis en œuvre sur l’équipement défini, le programme comprenant des instructions de code qui, lorsque le programme est exécuté par un processeur, réalise les étapes du procédé défini.
De tels programmes peuvent utiliser n’importe quel langage de programmation. Ils peuvent être téléchargés depuis un réseau de communication et/ou enregistrés sur un support lisible par ordinateur.
Selon un autre aspect matériel, l’invention a trait à un support d’enregistrement de données sur lequel a été mémorisée au moins une série d’instructions de code de programme pour l’exécution du procédé défini ci-dessus.
Selon un autre aspect matériel, l’invention concerne également système comprenant un serveur et une pluralité d’équipements définis ci-dessus, aptes à communiquer dans un réseau cellulaire.
L'invention sera mieux comprise à la lecture de la description qui suit, donnée à titre d'exemple et faite en référence aux dessins annexés sur lesquels :
- La
illustre un exemple d’un réseau de télécommunications selon des modes de réalisation de l’invention ; - La
illustre les étapes d’un procédé de génération de données synthétiques de mobilité, selon des modes de réalisation de l’invention ; - La
illustre un module de génération de données synthétiques de mobilité selon des modes de réalisation de l’invention ; - La
illustre un réseau de neurones artificiels formant un module générateur d’un réseau adverse génératif pour la génération de données synthétiques de mobilité, selon des modes de réalisation de l’invention.
La illustre un exemple d’environnement de mise en œuvre de l’invention selon des modes de réalisation.
Un réseau de télécommunications 100 selon l’invention comprend au moins un premier serveur 110 et au moins une première station de base 101 associée au premier serveur.
Le réseau de télécommunications 100 peut être un réseau mobile de type cellulaire, comprenant une pluralité de stations de base, dont la première station de base 101 représentée sur la , chaque station de base étant apte à couvrir une zone de couverture radio respective, appelée zone radio dans ce qui suit, c’est-à-dire à communiquer de manière bidirectionnelle avec des équipements situés dans la zone radio qu’elle couvre. Sur la , la première station de base 101 couvre une première zone radio 102 dans laquelle se trouvent un premier équipement 111.1 et un deuxième équipement 111.2.
Par exemple, le réseau de télécommunications 100 peut être un réseau de type 3G, 4G, 5G ou tout autre réseau cellulaire, notamment de génération ultérieure.
Chaque station de base du réseau de télécommunications est associée à au moins une cellule radio couverte dans la zone radio de la station de base. Par exemple, la première station de base 101 peut être associée à au moins une cellule radio, voire à plusieurs cellules radio (une cellule 2G, une cellule 3G et une cellule 4G par exemple).
Dans ce qui suit, il est considéré, à titre illustratif uniquement, que la station de base 101 n’est associée qu’à une seule cellule radio.
Le premier équipement 111.1 et le deuxième équipement 111.2 sont des équipements mobiles dans la zone radio 102 : il peut s’agir d’un équipement portatif, tel qu’un Smartphone, embarqué dans un véhicule, ou du véhicule lui-même, ou de tout autre équipement apte à accéder à un réseau de télécommunications et à être déplacé. Seuls deux équipements sont représentés sur la , afin de simplifier la compréhension de l’invention : toutefois, un ensemble plus vaste d’équipements, pouvant comprendre plusieurs dizaines ou centaines d’équipements, peuvent accéder simultanément au premier serveur 110 via la première station de base 101.
A un instant donné, un premier ensemble d’équipements comprend les équipements mobiles localisés dans la zone radio 102, aptes à accéder au premier serveur 110 et implémentant localement un modèle génératif de données synthétiques de mobilité dans un module de génération de données synthétiques de mobilité, décrit dans ce qui suit. Le premier ensemble d’équipements varie ainsi avec le temps : un équipement peut sortir de la première zone radio 102 pour entrer dans une autre zone radio associée à une autre station de base du réseau de télécommunications 100, et/ou un nouvel équipement peut entrer dans la première zone radio 102.
Le premier équipement 111.1 comprend :
- des ressources de calcul, pouvant comprendre un processeur 113.1, le processeur 113.1 comprenant un module de génération de données synthétiques de mobilité apte à implémenter un modèle génératif de données synthétiques de mobilité, comme décrit dans ce qui suit ;
- des ressources de calcul, pouvant comprendre un processeur 113.1, le processeur 113.1 comprenant un module de génération de données synthétiques de mobilité apte à implémenter un modèle génératif de données synthétiques de mobilité, comme décrit dans ce qui suit ;
- des ressources de stockage 112.1 telle qu’une mémoire de type « Random Access Memory », RAM, ou une mémoire de type « Read Only Memory », ROM, ou tout autre type de mémoire (Flash, EEPROM, etc.). En variante, la mémoire 112.1 comprend plusieurs mémoires des types précités. La mémoire 112.1 comprend au moins une mémoire non-volatile dans laquelle sont stockées, de manière temporaire ou permanente, des données de mobilité, brutes ou pré-traitées, pouvant comprendre des données de position issues d’un module de localisation 116.1, optionnellement enrichies de données descriptives de l’environnement issues d’un ensemble 114.1 d’au moins un capteur du premier équipement 111.1, et/ou d’une application exécutée sur le premier équipement 111.1 ;
- l’ensemble 114.1 comprend au moins un capteur apte à obtenir des données brutes descriptives de l’environnement du véhicule, aussi appelées « métriques » dans ce qui suit. On entend par « donnée brute » une donnée captée directement par un capteur depuis l’environnement de l’équipement 111.1 et à laquelle le pré-traitement décrit en référence à la n’a pas été appliqué. Selon l’invention, en complément ou en variante des données collectées par l’ensemble 114.1, les données brutes descriptives de l’invention peuvent être collectées par une application, ou plusieurs applications, installées et exécutées sur le premier équipement 111.1. A noter que l’acquisition des données brutes descriptives de l’environnement du véhicule est optionnelle selon l’invention : le premier équipement 111.1 peut ne pas comprendre l’ensemble 114.1, qui est donc également optionnel ;
- une interface réseau 115.1 apte à échanger de manière bidirectionnelle avec la station de base 101 ;
- un module de localisation 116.1 apte à déterminer une donnée de position qui est une localisation de l’équipement 111.1 à un instant donné, la localisation pouvant comprendre un ensemble de coordonnées localisant le premier équipement 111.1 dans la zone radio 102. Le module de localisation 116.1 peut par exemple être un module de géolocalisation par satellite.
- l’ensemble 114.1 comprend au moins un capteur apte à obtenir des données brutes descriptives de l’environnement du véhicule, aussi appelées « métriques » dans ce qui suit. On entend par « donnée brute » une donnée captée directement par un capteur depuis l’environnement de l’équipement 111.1 et à laquelle le pré-traitement décrit en référence à la
- une interface réseau 115.1 apte à échanger de manière bidirectionnelle avec la station de base 101 ;
- un module de localisation 116.1 apte à déterminer une donnée de position qui est une localisation de l’équipement 111.1 à un instant donné, la localisation pouvant comprendre un ensemble de coordonnées localisant le premier équipement 111.1 dans la zone radio 102. Le module de localisation 116.1 peut par exemple être un module de géolocalisation par satellite.
Ainsi, le premier équipement 111.1 est apte à acquérir des données de mobilités brutes comprenant une première série temporelle de données de positions associées respectivement à des données descriptives de l’environnement du premier équipement 111.1.
Comme décrit dans ce qui suit, le module de génération de données synthétiques compris dans les ressources de calcul 113.1, peut implémenter un modèle génératif, par exemple issu d’un apprentissage machine, les paramètres du modèle génératif étant modifiés par entraînement en fonction de données de mobilité d’entraînement qui sont une partie ou l’ensemble des données de mobilité, brutes ou pré-traitées.
Le deuxième équipement 111.2 comprend également des ressources de calcul comprenant un processeur 113.2 qui comprend un module de génération de données synthétiques, des ressources de stockage 112.2, un ensemble 114.2 optionnel d’au moins un capteur, une interface réseau 115.2 et un module de localisation 116.2. Les ressources du deuxième équipement 111.2 peuvent différer des ressources du premier équipement 111.1 : la mémoire 112.1 peut avoir une capacité de stockage distincte de la capacité de stockage de la mémoire 112.2, les ressources de calcul 113.1 peuvent être plus puissantes, ou moins puissantes, que les ressources de calcul 113.2.
Selon l’invention, le premier serveur 110 est une unité centrale qui joue un rôle d’orchestrateur dans un apprentissage fédéré pour paramétrer les modèles de génération de données synthétiques du premier ensemble d’équipements, comprenant le premier équipement 111.1 et le deuxième équipement 111.2. Dans l’exemple considéré ici, le serveur 110 est associé à la première cellule radio desservie par la première station de base 101 dans la première zone radio 102. Dans une variante non décrite, le serveur 110 peut être associé à plusieurs premières cellules radio desservies par la première station de base 101 dans la première zone radio 102. Dans une autre variante non décrite, le serveur 110 peut être associé à plusieurs cellules radio desservies par plusieurs stations de base du réseau de télécommunications 100 dans plusieurs zones radio.
Un seul serveur étant représenté sur la , pour simplifier l’exposé de l’invention, le premier serveur 110 est appelé serveur 110 dans ce qui suit.
La présente les étapes d’un procédé de génération de données synthétiques de mobilité selon des modes de réalisation de l’invention.
A une étape 200, le premier équipement 111.1 initialise des paramètres du module de génération de données synthétiques. Aucune restriction n’est attachée aux paramètres initiaux du module de génération de données synthétiques, les paramètres initiaux pouvant être stockés avant la mise en fonctionnement du premier équipement 111.1, lors de l’installation du module de génération de données synthétiques, ou étant reçus depuis le serveur 110 via l’interface réseau 115.1.
A une étape 201, le premier équipement 111.1 obtient des données brutes de mobilité, les données brutes de mobilité comprenant des séries temporelles sous le format suivant , dans lequel :
- t est un instant de collecte des données brutes de mobilité ;
- (x,y) sont les données de positions indiquant la position géographique du premier équipement 111.1, à l’instant t ;
- [ ] est un ensemble de données descriptives de l’environnement à l’instant t, aussi appelées métriques, et qui sont obtenues par l’ensemble 114.1 d’au moins un capteur et/ou par une ou plusieurs applications exécutées sur le premier équipement 111.1. L’ensemble comprend n métriques, avec n entier supérieur ou égal à 1.
- t est un instant de collecte des données brutes de mobilité ;
- (x,y) sont les données de positions indiquant la position géographique du premier équipement 111.1, à l’instant t ;
- [
A noter que selon l’invention, les données descriptives de l’environnement permettant d’enrichir les données brutes de mobilité, sont optionnelles. Ainsi, selon certains modes de réalisation, les données brutes de mobilité ne comprennent pas de données descriptives de l’environnement et prennent ainsi la forme d’une série temporelle de données de position [t,(x,y)].
Dans ce qui suit, il est considéré, à titre illustratif, que les données brutes de mobilité comprennent en outre des données descriptives de l’environnement, ou métriques.
Les métriques peuvent comprendre n’importe laquelle des données suivantes, ou n’importe quelle combinaison obtenues à partir des données suivantes :
- des données représentatives d’une qualité de service du réseau de télécommunications pour la position (x,y) à l’instant t, pouvant comprendre un rapport entre un niveau de signal et un niveau de bruit, aussi appelé SINR pour « Signal to Interference + Noise Ratio » en anglais, une valeur moyenne d’une puissance reçue de signal de référence, aussi appelée RSRP, pour « Reference Signal Receive Power » en anglais, et/ou une technologie parmi les technologies 3G, 4G et 5G ;
- des données représentatives d’un trafic entre l’équipement et le réseau de télécommunications pour la position (x,y) à l’instant t;
- des données descriptives d’un lieu situé à la position (x,y) à laquelle le premier équipement 111.1 est localisé à l’instant t; et/ou
- des données descriptives de conditions météorologiques pour la position (x,y) à l’instant t.
- des données représentatives d’une qualité de service du réseau de télécommunications pour la position (x,y) à l’instant t, pouvant comprendre un rapport entre un niveau de signal et un niveau de bruit, aussi appelé SINR pour « Signal to Interference + Noise Ratio » en anglais, une valeur moyenne d’une puissance reçue de signal de référence, aussi appelée RSRP, pour « Reference Signal Receive Power » en anglais, et/ou une technologie parmi les technologies 3G, 4G et 5G ;
- des données représentatives d’un trafic entre l’équipement et le réseau de télécommunications pour la position (x,y) à l’instant t;
- des données descriptives d’un lieu situé à la position (x,y) à laquelle le premier équipement 111.1 est localisé à l’instant t; et/ou
- des données descriptives de conditions météorologiques pour la position (x,y) à l’instant t.
Les données listées ci-dessus sont des exemples non-exhaustifs de données qui peuvent être intégrées dans les données de mobilité en tant que métriques.
L’étape 201 peut notamment être mise en œuvre en continu, au fur et à mesure du déplacement du premier équipement 111.1 dans la première zone radio 102, et/ou dans d’autres zones radio non représentées sur les figures. Le premier équipement 111.1 peut ainsi collecter des données brutes de mobilité pendant une durée supérieure à la durée de passage dans la première zone radio 102, par exemple sur une période de l’ordre d’une journée, d’une semaine ou d’un mois.
A une étape 202 optionnelle, le premier équipement 111.1 peut traiter les données brutes de mobilité pour obtenir des données de mobilité. Un tel traitement peut être considéré comme un pré-traitement permettant d’améliorer les données brutes de mobilité avant la mise en œuvre des étapes suivantes, permettant un apprentissage fédéré des paramètres du module de génération de données synthétiques.
L’étape de traitement 202 peut comprendre l’une ou l’autre des sous-étapes suivantes :
- une première sous-étape de détermination de données manquantes dans les données brutes de mobilité. La détermination de données manquantes peut être mise en œuvre par interpolation linéaire, ou par un lissage qui consiste à transformer les données brutes discrètes en fonctions, les fonctions étant utilisées ensuite pour déterminer les valeurs manquantes. Dans le cas où la quantité de données brutes de mobilité est importante, par exemple supérieure à un premier seuil, et que la part des données manquantes est faible, par exemple inférieure à un deuxième seuil, les données manquantes peuvent être ignorées et la première sous-étape n’est pas mise en œuvre. Les données manquantes peuvent être déterminées à la fois pour les données de position (x,y) mais également pour l’ensemble des métriques [ ], lorsque les données de mobilité brutes comprennent de telles métriques ; et/ou
- une première sous-étape de détermination de données manquantes dans les données brutes de mobilité. La détermination de données manquantes peut être mise en œuvre par interpolation linéaire, ou par un lissage qui consiste à transformer les données brutes discrètes en fonctions, les fonctions étant utilisées ensuite pour déterminer les valeurs manquantes. Dans le cas où la quantité de données brutes de mobilité est importante, par exemple supérieure à un premier seuil, et que la part des données manquantes est faible, par exemple inférieure à un deuxième seuil, les données manquantes peuvent être ignorées et la première sous-étape n’est pas mise en œuvre. Les données manquantes peuvent être déterminées à la fois pour les données de position (x,y) mais également pour l’ensemble des métriques [
- une deuxième sous-étape de normalisation des données brutes de mobilité. La normalisation consiste à ramener des données de natures et d’amplitudes différentes, à des intervalles identiques ou proches. Par exemple, les données de positions et chaque métrique sont ramenées à un même intervalle compris entre 0 et 1. Une telle normalisation permet par la suite l’amélioration de l’apprentissage machine mis en œuvre localement pour déterminer des paramètres locaux optimisés du module de génération de données synthétiques de mobilité. En effet, elle permet d’éviter des biais d’apprentissage liés aux amplitudes, le modèle génératif entraîné pouvant donner plus de poids aux données dont l’amplitude est la plus importante. Aucune restriction n’est attachée à la technique de normalisation mise en œuvre par le premier équipement 111.1, qui peut être par exemple basée sur la fonction MinMaxScaler() ou RobustScaler(), ou qui peut être basée sur une technique plus complexe telle que la normalisation des modes, appelée « Mode Normalisation » en anglais.
Ainsi, l’étape 202 peut permettre d’obtenir des données de mobilité qui sont complètes et normalisées à partir des données brutes de mobilité.
En variante, lorsque l’étape 202 n’est pas appliquée, les données brutes de mobilité sont les données de mobilité mentionnées dans la suite de la description.
A une étape 203, le premier équipement 111.1 détermine des paramètres locaux optimisés du module de génération de données synthétiques, à partir des données de mobilité obtenues aux étapes précédentes. Le module de génération de données synthétiques peut en effet implémenter un modèle génératif de données synthétiques qui peut être entraîné par apprentissage machine, en fonction des données de mobilité obtenues aux étapes précédentes. Au début de l’étape 203, le module de génération de données synthétiques est mis à jour à partir des paramètres initiaux : l’entraînement par apprentissage machine à partir des données de mobilité obtenues permet une modification des paramètres initiaux pour obtenir les paramètres locaux optimisés.
On entend par « donnée synthétique de mobilité », une série temporelle du même format que les données de mobilité acquises aux étapes précédentes, mais distinctes des données de mobilité acquises. Les données de mobilité acquises sont des données réelles, qui comportent ainsi des données personnelles confidentielles de l’utilisateur du premier équipement 111.1, telles que ses trajets notamment (les positions successives occupées sur une période donnée). Au contraire, les données synthétiques de mobilité comprennent une succession de données de positions synthétiques dont au moins une partie n’a pas été occupée par l’utilisateur du premier équipement 111.1, en association, de manière optionnelle, avec des métriques correspondant respectivement aux données de positions synthétiques. Les données synthétiques de mobilité ne permettent ainsi pas de connaître les trajets exacts effectués par l’utilisateur du premier équipement 111.1. Les données synthétiques de mobilité peuvent notamment comprendre une série temporelle de données de positions qui ne sont pas consécutives, et qui forment ainsi un nuage de points dans la zone radio 102, et non pas des trajectoires continues comme les données de positions des données réelles de mobilité.
La présente invention permet un entraînement par apprentissage fédéré d’un modèle génératif de données synthétiques. Une fois entraîné, le modèle génératif de données synthétiques peut générer des données synthétiques de mobilité, qui illustrent les évolutions des métriques dans le temps et dans l’espace, sans toutefois contenir d’informations personnelles confidentielles de l’utilisateur du premier équipement 111.1.
Aucune restriction n’est attachée au type de modèle génératif de données synthétiques implémenté par le module de génération de données synthétiques. Le modèle génératif de données synthétiques peut par exemple être :
- un réseau génératif antagoniste, aussi appelé GAN, pour « Generative Adversarial Network » en anglais ;
- un auto-encodeur, ou VAE, pour « Variational Auto-Encoder » en anglais ;
- un modèle génératif basé sur le flux, aussi appelé modèle « Flow Based » ; ou
- un modèle de diffusion.
- un réseau génératif antagoniste, aussi appelé GAN, pour « Generative Adversarial Network » en anglais ;
- un auto-encodeur, ou VAE, pour « Variational Auto-Encoder » en anglais ;
- un modèle génératif basé sur le flux, aussi appelé modèle « Flow Based » ; ou
- un modèle de diffusion.
Selon des modes de réalisation préférentiels, le modèle génératif de données synthétiques de mobilité est un GAN. En effet, un GAN présente l’avantage d’être plus aisé à implémenter qu’un auto-encodeur, qui nécessite une grande complexité pour l’obtention de résultats probants.
Dans la suite de la description, il est considéré, à titre illustratif uniquement, que le modèle génératif de données synthétiques de mobilité est un GAN. Toutefois, l’invention peut être basée sur tout type de modèle génératif.
La présente la structure d’un modèle génératif 300 de type GAN, selon des modes de réalisation de l’invention.
Comme indiqué précédemment, le GAN 300 peut être implémenté par le module de génération de données synthétiques compris dans les ressources de calcul 113.1 du premier équipement 111.1. Selon l’invention, les équipements du premier ensemble d’équipements participant à l’apprentissage fédéré, comprennent chacun leur propre modèle génératif de données synthétiques, donc leur propre GAN 300, implémenté par leurs ressources de calcul respectives.
Conformément à la structure d’un GAN, le GAN 300 comprend un module générateur 301 entraîné pour générer des données synthétiques de mobilité 311 notées X’, à partir de données bruit 310, notées Z. On entend par « données bruit » n’importe quelles données du même format que les données réelles de mobilité, mais générées de manière aléatoire ou semi-aléatoire en fonction de lois statistiques telles que la loi normale, et ne correspondant à aucune donnée réelle. Les données bruit 310 ne sont donc aucunement corrélées à des données réelles de mobilité 312, notées X, utilisées comme données d’entraînement, pour l’apprentissage non supervisé des paramètres du GAN. Les données réelles de mobilité 312 utilisées comme données d’entraînement peuvent être tout ou partie des données réelles de mobilité issues de l’étape 202 précédente.
Le GAN 300 comprend en outre un module discriminateur 302, et un module de fonction de perte 303. Le module discriminateur 302 est apte à recevoir en entrée les données synthétiques de mobilité 311 ainsi que les données réelles de mobilité d’entraînement 312. Le module discriminateur 302 est configuré pour classer les données reçues 311 et 312, en données réelles ou en données synthétiques.
Selon les principes d’un GAN, le module générateur 301 est entraîné de manière à minimiser la capacité du module discriminateur 302 à classer correctement les données réelles et synthétiques de mobilité reçues en entrée du module discriminateur 302. A l’issue d’une ou de plusieurs classifications opérées par le module discriminateur 302, le module de fonction de perte 303 évalue la performance du GAN 300, et modifie les paramètres du GAN 300 en fonction de la performance ainsi évaluée. Le processus d’entraînement pour l’apprentissage des paramètres locaux optimisés lors de l’étape 203 est ainsi itératif. Après avoir entraîné le GAN 300 avec les données réelles de mobilité d’entraînement 312, des paramètres locaux optimisés sont ainsi obtenus, suite aux itérations successives.
Selon des modes de réalisation de l’invention, les paramètres du GAN 300 sont définis par des paramètres du module générateur 301. Dans ce cas, le module discriminateur 302 peut être défini à l’avance et ses paramètres ne sont pas entraînés. En variante, les paramètres du GAN 300 comprennent à la fois des paramètres définissant le module générateur 301 mais également des paramètres définissant le module discriminateur 302. Le module discriminateur 302 et le module générateur 301 sont dans ce cas entraînés lors de l’apprentissage non supervisé sur la base des données réelles de mobilité d’entraînement 312.
Le module générateur 301 et/ou le module discriminateur 302 peut implémenter un réseau de neurones artificiels. Dans ce qui suit, il est considéré que le module générateur 301 implémente un premier réseau de neurones artificiels et le module discriminateur 302 implémente un deuxième réseau de neurones artificiels.
Le GAN 300 est entraîné pour obtenir les paramètres locaux optimisés lors de l’étape 203 par la résolution d’un problème de théorie des jeux, défini de la manière suivante :
avec
où représente la distribution des données réelles de mobilité 312, représente la distribution des données synthétiques de mobilité 311 générées par le module générateur 301, et D(x) représente la classification faite par le module discriminateur 302. V(D,G) est ainsi évalué par le module de fonction de perte 303.
L’objectif du module générateur 301 est d’apprendre à tromper le module discriminateur 302, c’est-à-dire à produire des données synthétiques de mobilité X’ telles que p(X’)=p(G(z)) n’est pas différenciable de p(X).
Le module discriminateur 302 classe les données reçues en entrée en deux catégories : réelles ou synthétiques/fausses. Les données réelles sont classées dans une classe 1 et les données fausses sont classées dans une classe 0.
Le module générateur 301 est ainsi entraîné pour générer des données synthétiques qui paraissent réelles, du point de vue du module discriminateur 302.
Chacun des premier et deuxième réseaux de neurones artificiels peuvent être des réseaux de neurones multicouches, comprenant un ou plusieurs neurones par couche, qui sont connectés aux neurones des couches suivantes.
La présente la structure d’un premier réseau de neurones artificiels formant un module générateur 301 d’un GAN 300 apte à générer des données synthétiques de mobilité, selon des modes de réalisation de l’invention.
Le premier réseau de neurones artificiels comprend une première couche 400 comprenant trois neurones 401, 402 et 403, une deuxième couche 410 comprenant deux neurones 411 et 412, ainsi qu’une troisième couche 420 comprenant un unique neurone 421.
Une telle architecture est donnée à titre illustratif, et aucune restriction n’est attachée au nombre de couches ni au nombre de neurones par couche, du premier réseau de neurones formant le module générateur 301.
Les paramètres définissant le module générateur 301 sont les poids W= [w11
1;w12
1;w21
1;w22
1;w31
1;w32
1;w11
2;w12
2] et les biais B=[b1
1;b2
1;b1
2], dans lequel :
- w11 1 est le poids attribué à la sortie du nœud 401 dans le nœud 411 ;
- w12 1 est le poids attribué à la sortie du nœud 401 dans le nœud 412 ;
- w21 1 est le poids attribué à la sortie du nœud 402 dans le nœud 411 ;
- w22 1 est le poids attribué à la sortie du nœud 402 dans le nœud 412 ;
- w31 1 est le poids attribué à la sortie du nœud 403 dans le nœud 411 ;
- w32 1 est le poids attribué à la sortie du nœud 403 dans le nœud 412 ;
- w11 2 est le poids attribué à la sortie du nœud 411 dans le nœud 421 ;
- w12 2 est le poids attribué à la sortie du nœud 412 dans le nœud 421 ;
- b1 1 est le biais ajouté au nœud 411 ;
- b2 1 est le biais ajouté au nœud 412 ;
- b1 2 est le biais ajouté au nœud 421.
- w11 1 est le poids attribué à la sortie du nœud 401 dans le nœud 411 ;
- w12 1 est le poids attribué à la sortie du nœud 401 dans le nœud 412 ;
- w21 1 est le poids attribué à la sortie du nœud 402 dans le nœud 411 ;
- w22 1 est le poids attribué à la sortie du nœud 402 dans le nœud 412 ;
- w31 1 est le poids attribué à la sortie du nœud 403 dans le nœud 411 ;
- w32 1 est le poids attribué à la sortie du nœud 403 dans le nœud 412 ;
- w11 2 est le poids attribué à la sortie du nœud 411 dans le nœud 421 ;
- w12 2 est le poids attribué à la sortie du nœud 412 dans le nœud 421 ;
- b1 1 est le biais ajouté au nœud 411 ;
- b2 1 est le biais ajouté au nœud 412 ;
- b1 2 est le biais ajouté au nœud 421.
Les biais sont représentés par les flèches en pointillés sur la . Il convient de noter que les paramètres peuvent ne pas comprendre les biais, qui sont optionnels, et peuvent ne comprendre que les poids respectifs des nœuds du réseau de neurones artificiels.
Ainsi, l’entrée Z est propagée de la première couche 400 à la deuxième couche 410 : soit zi, pour i variant de 1 à 3 les sorties respectives des neurones 401 à 403 de la première couche 400. Alors, la sortie y1 du neurone 411 est égale à , sigma désignant une fonction d’activation, telle qu’une fonction ReLU, softmax, ou toute autre fonction d’activation.
De même, la sortie y2 du neurone 412 est égale à .
La sortie X’ est alors égale à .
Ainsi, le modèle génératif de données synthétiques de mobilité est initialisé avec des paramètres Win et Bin, et, lors de l’entraînement de l’étape 203, le premier équipement 111.1 détermine des paramètres locaux optimisés Wopt et Bopt. Les performances du modèle génératif de données synthétiques configurés avec Wopt et Bopt sont meilleures que dans le paramétrage initial. A cet effet, l’entraînement peut être basé sur la méthode de descente de gradient, appliquée par le module de fonction de perte 303.
Selon des modes de réalisation, le module discriminateur 302 est un deuxième réseau de neurones artificiels, pouvant comprendre une couche d’entrée apte à recevoir en entrée les données synthétiques de mobilité 311 ou les données réelles de mobilité d’entraînement 312, une couche de sortie apte à déterminer en sortie une classe 0 ou 1, et pouvant comprendre ou non une ou plusieurs couches intermédiaires entre la couche d’entrée et la couche de sortie. A nouveau, les paramètres définissant le module discriminateur sont un vecteur de poids W et un vecteur de biais B optionnel, dont le nombre de composantes dépend du nombre de couches et du nombre de neurones par couche. Ainsi, les paramètres du GAN 300 peuvent comprendre un vecteur de poids WG du module générateur 301, un vecteur de biais BG du module générateur 301, un vecteur de poids WD du module discriminateur 302 et un vecteur de biais BD du module discriminateur 302. Dans ce cas, lors de l’étape 203, le premier équipement 111.1 détermine les paramètres locaux optimisés WG,Lopt, WD,Lopt, BG,Lopt, BD,Lopt, le GAN 300 étant initialisé au début de l’étape 203 avec des paramètres initiaux WG,in, WD,in, BG,in, BD,in.
A noter que, comme précisé précédemment, le modèle génératif peut être différent d’un GAN 300, et peut être par exemple un auto-encodeur, un modèle de diffusion ou un modèle génératif basé sur le flux. Selon chacune de ces alternatives, le modèle génératif peut également comprendre un ou plusieurs réseaux de neurones artificiels, définis par des paramètres qui sont optimisés pour l’obtention de paramètres locaux optimisés.
En se référant à nouveau à la , l’étape 203 d’obtention des paramètres locaux optimisés, par entraînement du GAN 300, notamment sur la base des données réelles de mobilité d’entraînement, a été décrite.
Suite à l’étape 203, le premier équipement 111.1 transmet les paramètres locaux optimisés au serveur 110 à une étape 204, via l’interface réseau 115.1 du premier équipement 111.1.
A une étape 210, le serveur 110 reçoit les paramètres locaux optimisés transmis par le premier équipement 111.1. A une étape 211 ayant lieu avant ou après l’étape 210, le serveur 110 reçoit les paramètres locaux optimisés par le deuxième équipement 111.2. On comprend ainsi que le deuxième équipement 111.2 met en œuvre des étapes identiques aux étapes 200 à 204 décrites en référence au premier équipement 111.1. Toutefois, les ressources du deuxième équipement 111.2 et les données réelles de mobilité obtenues par le deuxième équipement 111.2 étant distinctes de celles du premier équipement 111.1, les paramètres locaux optimisés déterminés par le deuxième équipement 111.2 et reçus à l’étape 211 par le serveur 110, peuvent être différents des paramètres locaux optimisés déterminés par le premier équipement 111.1 et reçus à l’étape 210 par le serveur 110.
De manière plus générale, le serveur 110 reçoit les paramètres locaux optimisés d’une partie ou de la totalité des équipements du premier ensemble qui participent à l’apprentissage fédéré. Par exemple, le serveur 110 peut sélectionner au préalable une partie des équipements du premier ensemble pour qu’ils déterminent localement les paramètres locaux optimisés selon les étapes 200 à 204, les autres équipements du premier ensemble étant exemptés de la mise en œuvre de ces étapes. Une telle sélection peut par exemple être basée sur la quantité de données réelles de mobilité d’entraînement dont dispose chaque équipement du premier ensemble, et/ou des ressources de calcul dont dispose chaque équipement du premier ensemble.
Lorsque les paramètres locaux optimisés ont été reçus depuis la partie ou la totalité des équipements du premier ensemble, le serveur 110 met en œuvre l’étape 212. Dans l’exemple considéré ici, avec uniquement deux équipements dans le premier ensemble, le serveur 110 met en œuvre l’étape 212 suite à la réception de paramètres locaux optimisés depuis le premier équipement 111.1 et depuis le deuxième équipement 111.2.
A l’étape 212, le serveur 110 agrège les paramètres locaux optimisés reçus depuis la partie ou la totalité des équipements du premier ensemble pour obtenir des paramètres globaux optimisés. Aucune restriction n’est attachée à la fonction appliquée aux paramètres locaux optimisés reçus pour obtenir les paramètres globaux optimisés. Dans l’exemple où le module de génération de données synthétiques de mobilité est basé sur le GAN 300 considéré ci-dessus, les paramètres globaux optimisés peuvent être des vecteurs WG,Gopt, WD,Gopt, BG,Gopt, BD,Gopt.
La détermination des paramètres globaux optimisés peut être basée sur une moyenne de chacun des paramètres locaux optimisés reçus. Par exemple pour le paramètre w11
1 décrit précédemment, en considérant que le paramètre w11
1i a été reçu de chaque équipement d’indice i, i variant entre 1 et un entier p correspondant au nombre d’équipements ayant remonté les paramètres locaux optimisés (2 dans l’exemple décrit précédemment), le paramètre global optimisé w11,Gopt
1 est égal à .
En variante de l’utilisation de la moyenne décrite ci-dessus, la détermination des paramètres globaux optimisés peut être basée sur d’autres techniques d’agrégation des paramètres locaux optimisés, par exemple sur un algorithme FedMA, pour « Federated Matching Average » en anglais, ou sur un algorithme RFA, pour « Robust Federated Aggregation » en anglais.
Après obtention des paramètres globaux optimisés, le serveur 110 transmet, à une étape 213, les paramètres globaux optimisés au premier équipement 111.1, ainsi qu’à tout autre équipement du premier ensemble (donc également au deuxième équipement 111.2 dans l’exemple de la ) participant à l’apprentissage fédéré.
A une étape 220, le premier équipement 111.1 reçoit les paramètres globaux optimisés depuis le serveur 110, via l’interface réseau 115.1.
A une étape 221, le premier équipement 111.1 met à jour le module de génération de données synthétiques 300 sur la base des paramètres globaux optimisés reçus. Dans l’exemple du GAN 300, le module générateur 301 et le module discriminateur 302 peuvent ainsi être mis à jour sur la base des vecteurs WG,Gopt, WD,Gopt, BG,Gopt, BD,Gopt formant les paramètres globaux optimisés.
Suite à l’étape 221, le premier équipement 111.1 peut être sélectionné par le serveur 110 pour participer à un nouveau cycle d’apprentissage de l’apprentissage fédéré :
- sur la base de nouvelles données brutes de mobilité acquises lors de l’étape 201 ; et/ou
- sur la base des données brutes de mobilité acquises précédemment, en entraînant localement, lors de l’étape 203, le modèle de génération de données synthétiques de mobilité dont l’initialisation est cette fois-ci la mise à jour issue de l’étape 221, afin d’obtenir de nouveaux paramètres locaux optimisés. Les nouveaux paramètres locaux optimisés sont transmis lors de l’étape 204 au serveur 110, et, suite à leur agrégation avec d’autres nouveaux paramètres locaux optimisés d’autres équipements du premier ensemble, de nouveaux paramètres globaux optimisés sont obtenus à l’étape 220. Les étapes 221 à 223 sont répétées sur la base de ces nouveaux paramètres globaux optimisés.
- sur la base des données brutes de mobilité acquises précédemment, en entraînant localement, lors de l’étape 203, le modèle de génération de données synthétiques de mobilité dont l’initialisation est cette fois-ci la mise à jour issue de l’étape 221, afin d’obtenir de nouveaux paramètres locaux optimisés. Les nouveaux paramètres locaux optimisés sont transmis lors de l’étape 204 au serveur 110, et, suite à leur agrégation avec d’autres nouveaux paramètres locaux optimisés d’autres équipements du premier ensemble, de nouveaux paramètres globaux optimisés sont obtenus à l’étape 220. Les étapes 221 à 223 sont répétées sur la base de ces nouveaux paramètres globaux optimisés.
Si le premier équipement 111.1 n’est pas sélectionné pour le nouveau cycle d’apprentissage fédéré (par exemple parce que le serveur 110 a sélectionné d’autres équipements pour le nouveau cycle d’apprentissage fédéré), il peut tout de même recevoir de nouveaux paramètres globaux optimisés lors d’une nouvelle étape 220, et peut ainsi mettre à jour le module de génération de données synthétiques lors d’une nouvelle étape 221.
L’apprentissage fédéré peut ainsi comprendre plusieurs cycles d’apprentissage qui sont mis en œuvre par itération des étapes 203, 204, 220 et 221. Aucune restriction n’est attachée au nombre de cycles d’apprentissage, l’apprentissage fédéré étant terminé lorsqu’un critère d’arrêt est atteint, le critère d’arrêt pouvant être :
- un nombre prédéfini de cycles d’apprentissage ; et/ou
- lorsqu’une valeur de la fonction de perte implémentée par le module de fonction de perte 303 est inférieure à un seuil prédéfini.
- un nombre prédéfini de cycles d’apprentissage ; et/ou
- lorsqu’une valeur de la fonction de perte implémentée par le module de fonction de perte 303 est inférieure à un seuil prédéfini.
A une étape 222 à l’issue de l’apprentissage fédéré (donc du dernier cycle d’apprentissage mis en oeuvre), le premier équipement 111.1 génère des données synthétiques de mobilité par le module de génération de données synthétiques mis à jour lors de l’étape 221 (du dernier cycle d’apprentissage), et à partir d’une partie ou de l’ensemble des données brutes de mobilité collectées à l’étape 201, et optionnellement pré-traitées lors de l’étape 202.
A une étape 223, le premier équipement 111.1 évalue une performance du module de génération de données synthétiques 301 mis à jour lors de l’étape 221, à partir des données synthétiques générées lors de l’étape 222 et à partir d’une partie ou de l’ensemble des données brutes de mobilité collectées à l’étape 201, et optionnellement pré-traitées lors de l’étape 202.
La performance du module de génération de données synthétiques 301 est évaluée par la fonction de perte implémentée par le module de fonction de perte 303 décrit précédemment. La performance peut ainsi être évaluée par la fonction V(D,G) décrite précédemment.
Si la performance évaluée est inférieure à un seuil de performance donné, le premier équipement 111.1 peut ne pas transmettre les données synthétiques de mobilité générées, ce qui est indiqué par une étape 230 d’absence de transmission sur la . Dans ce cas, le modèle génératif de données synthétiques peut être amélioré lors d’un prochain apprentissage fédéré, comprenant à nouveau un ou plusieurs cycles d’apprentissage, initié par exemple lors du passage du premier équipement dans une autre zone radio du réseau cellulaire ou à l’expiration d’une période donnée.
Si la performance évaluée à l’étape 223 est supérieure au seuil de performance donné, alors le premier équipement 111.1 peut transmettre, à une étape 224, les données synthétiques de mobilité générées lors de l’étape 222, à un autre équipement accédant au réseau de télécommunications, par exemple au deuxième équipement 111.2, et/ou au serveur 110, et/ou à un autre serveur du réseau de télécommunications. Les données synthétiques de mobilité peuvent ainsi être exploitées par ces entités, sans divulguer d’informations confidentielles de l’utilisateur du premier équipement 111.1. La transmission à l’étape 224 peut être immédiatement consécutive à une comparaison positive de la performance évaluée avec le seuil de performance lors de l’étape 223, ou peut être en outre conditionnée par l’une ou plusieurs des conditions suivantes, données à titre illustratif et listées de manière non exhaustive :
- la transmission de l’étape 224 est conditionnée par la réception d’une demande de données synthétiques de la part de l’autre équipement accédant au serveur, du serveur 110 et/ou de l’autre serveur du réseau 100 ;
- la transmission de l’étape 224 est mise en œuvre de manière périodique, avec une transmission à l’issue de chaque période définie par une fréquence prédéterminée. Dans ce cas, la transmission de l’étape 224 est mise en œuvre à l’expiration d’une période courante.
- la transmission de l’étape 224 est conditionnée par la réception d’une demande de données synthétiques de la part de l’autre équipement accédant au serveur, du serveur 110 et/ou de l’autre serveur du réseau 100 ;
- la transmission de l’étape 224 est mise en œuvre de manière périodique, avec une transmission à l’issue de chaque période définie par une fréquence prédéterminée. Dans ce cas, la transmission de l’étape 224 est mise en œuvre à l’expiration d’une période courante.
A noter que les autres équipements du premier ensemble mettent en œuvre les mêmes étapes 220 à 224 de manière locale, suite à la transmission des paramètres globaux optimisés par le serveur 110 lors de l’étape 213.
Ainsi, à une étape 225, le premier équipement 111.1 peut recevoir des données synthétiques de mobilité depuis un autre équipement, par exemple depuis le deuxième équipement 111.2, qui a mis en œuvre localement les mêmes étapes 220 à 224 et qui a donc également participé à l’apprentissage fédéré.
Comme indiqué précédemment, un nouvel apprentissage fédéré peut être initié lors du passage du premier équipement dans une zone radio différente de la zone radio 102, ou à l’expiration d’un période donnée, auquel cas les étapes décrites précédemment sont réitérées pour le nouvel apprentissage fédéré.
L’invention permet ainsi la mise en œuvre d’un apprentissage fédéré pour le paramétrage d’un module de génération de données synthétiques de mobilité. Selon une telle approche, l’apprentissage est distribué entre les différents équipements y participant. Les équipements collaborent ainsi pour construire un modèle génératif global, la collaboration n’impliquant que le transfert, vers le serveur 110 commun à plusieurs équipements, de paramètres d’un modèle local, les paramètres étant optimisés localement par chaque équipement lors de l’étape 203.
L’apprentissage fédéré permet à tous les équipements y participant de disposer des mêmes paramètres globaux optimisés, et ce quelles que soient leurs ressources de calcul : il permet ainsi d’une part aux équipements du premier ensemble participant à l’apprentissage fédéré d’utiliser des paramètres optimisés globalement, mais également, d’autre part, il permet que les données synthétiques de mobilité générées localement le soient à partir d’un même modèle génératif. Les données synthétiques de mobilité peuvent ainsi être accumulées et comparées, même lorsqu’elles sont issues de plusieurs équipements, ce qui permet d’exploiter de grandes quantités de données synthétiques de mobilité.
En outre, l’apprentissage fédéré accélère la convergence des modèles génératifs de données synthétiques de mobilité implémentés localement dans les équipements, comparativement à un apprentissage uniquement local du modèle génératif par chacun des équipements.
Ainsi, les données synthétiques générées peuvent être exploitées par d’autres entités, sans que ces entités n’accèdent à des données confidentielles de l’utilisateur de l’équipement générant les données synthétiques, puisque seules des données synthétiques sont transmises.
Des exemples d’exploitation des données synthétiques de mobilité selon l’invention sont décrits ci-après, à titre illustratif.
Selon un premier exemple, les données synthétiques de mobilité générées peuvent être exploitées pour l’amélioration et l’information sur les conditions du réseau de télécommunications 100. Les équipements du premier ensemble sont des véhicules ou des téléphones embarqués dans des véhicules, et chaque équipement comprend une application apte à mesurer, de manière périodique, la qualité de service du réseau de télécommunications, pour chaque position occupée par l’équipement, la qualité de service étant intégrée dans les données brutes de mobilité en tant que métrique.
Des données synthétiques de mobilité sont ensuite générées selon l’invention, et peuvent être transmises à un serveur en charge de la gestion du réseau 100, à des fins d’amélioration de la qualité de service dans le réseau 100, et/ou à d’autres équipements qui peuvent alors adapter leurs itinéraires respectifs en fonction de la qualité de réseau indiquée dans les données synthétiques de mobilité.
Selon un deuxième exemple, les données synthétiques de mobilité générées sont exploitées pour l’amélioration du trafic routier. Dans ce deuxième exemple, la qualité de service du réseau du premier exemple est remplacée par des données représentatives d’une qualité de trafic (indiquant un état fluide du trafic, un état congestionné, des travaux), pour chaque position occupée par un équipement. Les données représentatives de la qualité de trafic sont ainsi intégrées en tant que métriques dans les données brutes de mobilité. Puis, des données synthétiques de mobilité sont générées selon l’invention et peuvent être exploitées par un serveur donné pour fournir des informations sur le trafic à certaines positions et/ou pour la planification de trafic.
Selon un troisième exemple, les données synthétiques de mobilité sont exploitées à des fins touristiques. Les équipements intègrent une application apte à fournir des indicateurs de qualité touristiques d’un itinéraire. Par exemple, au cours d’un trajet, un équipement peut collecter des métriques à des positions données du trajet, telles que le climat, la propreté, le calme, les commerces, etc. Des données synthétiques de mobilité sont ensuite générées selon l’invention, et peuvent être transmises à d’autres équipements intégrant la même application, pour les guider vers des itinéraires ayant les meilleurs indicateurs touristiques.
Selon un quatrième exemple, les données synthétiques de mobilité sont exploitées à des fins environnementales. Les équipements du premier ensemble peuvent disposer d’une application mesurant l’impact environnemental associé au trajet en cours, l’impact environnemental pouvant être les émissions de carbone générées, intégrées dans les données brutes de mobilité en tant que métriques. Les données synthétiques de mobilité sont ensuite générées selon l’invention, puis transmises à d’autres équipements embarqués dans des véhicules pour sensibiliser à prendre les itinéraires les plus respectueux de l’environnement.
Claims (15)
- Procédé de génération de données synthétiques à partir de données de mobilité, le procédé comprenant les étapes suivantes, mises en œuvre dans un équipement (111.1 ; 111.2) apte à communiquer avec un serveur (110) d’un réseau cellulaire (100) :
- obtention (201 ; 202) de données de mobilité ;
- détermination (203) de paramètres locaux optimisés d’un module de génération de données synthétiques (300) à partir des données de mobilité obtenues ;
- transmission (204) des paramètres locaux optimisés au serveur ;
- réception (220) de paramètres globaux optimisés du serveur;
- mise à jour (221) dudit module sur la base des paramètres globaux optimisés reçus ;
- génération (222) de données synthétiques par ledit module mis à jour. - Procédé selon la revendication 1, comprenant en outre la transmission (224) des données synthétiques générées à un autre équipement (111.2) accédant au réseau cellulaire, et/ou au serveur (110), et/ou à un autre serveur du réseau cellulaire.
- Procédé selon la revendication 2, comprenant en outre une évaluation (223) d’une performance du module de génération de données synthétiques mis à jour, à partir des données synthétiques générées et des données de mobilité, et dans lequel les données synthétiques générées sont transmises (224) à l’autre équipement (111.2) accédant au réseau cellulaire (100), et/ou au serveur (110), et/ou à l’autre serveur du réseau cellulaire, uniquement si la performance évaluée est supérieure à un seuil de performance.
- Procédé selon l’une des revendications précédentes, dans lequel les étapes de détermination (203) de paramètres locaux optimisés, de transmission (204) des paramètres locaux optimisés, de réception (220) des paramètres globaux optimisés et de mise à jour (221) du module de génération de données synthétiques constituent un cycle d’apprentissage, et dans lequel, à l’issue d’un cycle d’apprentissage courant, un cycle d’apprentissage suivant est mis en œuvre, des nouveaux paramètres locaux optimisés étant déterminés à partir du module de génération de données synthétiques mis à jour lors du cycle d’apprentissage courant.
- Procédé selon l’une des revendications 1 à 4, dans lequel le module de génération de données synthétiques (300) implémente un réseau antagoniste génératif comprenant un module générateur (301) et un module discriminateur (302), et dans lequel les paramètres locaux optimisés sont déterminés par apprentissage non supervisé en fonction d’au moins une partie des données de mobilité utilisées comme données de mobilité d’entraînement (312).
- Procédé selon la revendication 5, dans lequel les paramètres locaux optimisés comprennent des premiers paramètres locaux optimisés du module générateur (301) et/ou des deuxièmes paramètres locaux optimisés du module discriminateur (302).
- Procédé selon la revendication 6, dans lequel le module générateur (301) et/ou le module discriminateur (302) est un réseau de neurones artificiels.
- Procédé selon l’une des revendications précédentes, dans lequel les données de mobilité comprennent au moins une première série temporelle de données de positions de l’équipement et de données descriptives de l’environnement de l’équipement (111.1 ; 111.2), et dans lequel les données synthétiques comprennent au moins une deuxième série temporelle de données de positions synthétiques et de données synthétiques descriptives de l’environnement de l’équipement, les données de positions synthétiques de la deuxième série temporelle étant différentes des données de positions de la première série temporelle.
- Procédé selon la revendication 8, dans lequel les données descriptives de l’environnement comprennent l’une ou plusieurs des données suivantes :
- des données représentatives d’une qualité de service du réseau de télécommunications à une position donnée ;
- des données représentatives d’un trafic entre l’équipement et le réseau cellulaire pour une position donnée ;
- des données descriptives d’un lieu situé à une position donnée ; et/ou
- des données descriptives de conditions météorologiques à une position donnée. - Procédé selon l’une des revendications précédentes, comprenant une collecte (201) de données brutes de mobilité, dans lequel les données de mobilité sont obtenues à partir des données brutes de mobilité par :
- détermination (202) des données manquantes à partir des données brutes de mobilité et ajout des données manquantes aux données brutes de mobilité pour obtenir les données de mobilité ; et/ou
- normalisation (202) des données brutes de mobilité pour obtenir les données de mobilité. - Equipement (111.1 ; 111.2) comprenant une interface réseau (115.1 ; 115.2) apte à communiquer avec un serveur (110) d’un réseau cellulaire (100) et un processeur (113.1 ; 113.2) configuré pour :
- obtenir des données de mobilité ;
- déterminer de paramètres locaux optimisés d’un module de génération de données synthétiques à partir des données de mobilité obtenues ;
- transmettre des paramètres locaux optimisés au serveur par l’interface réseau ;
- recevoir des paramètres globaux optimisés du serveur via l’interface réseau;
- mettre à jour ledit module sur la base des paramètres globaux optimisés reçus ;
- générer des données synthétiques par ledit module mis à jour. - Equipement selon la revendication 11, comprenant en outre au moins un capteur (114.1 ; 114.2) ou exécutant au moins une application, apte à obtenir au moins une partie des données de mobilité.
- Programme d'ordinateur apte à être mis en œuvre dans un équipement (111.1 ; 111.2) tel que défini dans la revendication 11 ou 12, le programme comprenant des instructions de code qui, lorsqu’il est exécuté par un processeur (113.1 ; 113.2), réalise les étapes du procédé défini dans l’une des revendications 1 à 10.
- Support d’enregistrement de données sur lequel a été mémorisée au moins une série d’instructions de code de programme pour l’exécution du procédé selon l’une des revendications 1 à 10.
- Système comprenant un serveur (110) et une pluralité d’équipements (111.1 ; 111.2) selon la revendication 11 ou 12, aptes à communiquer dans un réseau cellulaire (100).
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR2401524A FR3159490A1 (fr) | 2024-02-16 | 2024-02-16 | Apprentissage fédéré pour la génération de données synthétiques de mobilité |
| FRFR2401524 | 2024-02-16 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2025172472A1 true WO2025172472A1 (fr) | 2025-08-21 |
Family
ID=91617307
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/EP2025/053908 Pending WO2025172472A1 (fr) | 2024-02-16 | 2025-02-13 | Apprentissage fédéré pour la génération de données synthétiques de mobilité |
Country Status (2)
| Country | Link |
|---|---|
| FR (1) | FR3159490A1 (fr) |
| WO (1) | WO2025172472A1 (fr) |
-
2024
- 2024-02-16 FR FR2401524A patent/FR3159490A1/fr active Pending
-
2025
- 2025-02-13 WO PCT/EP2025/053908 patent/WO2025172472A1/fr active Pending
Non-Patent Citations (7)
| Title |
|---|
| ATTAR: "Adaptive Model Aggregation for Decentralized Federated Learning in Vehicular Networks", 20 December 2023 (2023-12-20), XP093208548, Retrieved from the Internet <URL:-> * |
| HARDY CORENTIN ET AL: "Gossiping GANs Position paper", PROCEEDINGS OF THE SECOND WORKSHOP ON DISTRIBUTED INFRASTRUCTURES FOR DEEP LEARNING, IEEE PRESSPUB767, PISCATAWAY, NJ, USA, 10 December 2018 (2018-12-10), pages 25 - 28, XP059209017, ISBN: 978-1-7281-1436-1, DOI: 10.1145/3286490.3286563 * |
| HENKE NILS ET AL: "CondTraj-GAN: Conditional Sequential GAN for Generating Synthetic Vehicle Trajectories", 28 May 2023, ADVANCES IN KNOWLEDGE DISCOVERY AND DATA MINING; [LECTURE NOTES IN COMPUTER SCIENCE; LECT.NOTES COMPUTER], SPRINGER NATURE SWITZERLAND, CHAM, PAGE(S) 79 - 91, ISBN: 978-3-031-33376-7, ISSN: 0302-9743, XP047660116 * |
| MOVAHEDIAN MAHTAB ET AL: "Adaptive Model Aggregation for Decentralized Federated Learning in Vehicular Networks", 2023 19TH INTERNATIONAL CONFERENCE ON NETWORK AND SERVICE MANAGEMENT (CNSM), IFIP, 30 October 2023 (2023-10-30), pages 1 - 9, XP034478222, DOI: 10.23919/CNSM59352.2023.10327827 * |
| RASOULI MOHAMMAD ET AL: "FedGAN: Federated Generative Adversarial Networks for Distributed Data", 12 June 2020 (2020-06-12), XP055834634, Retrieved from the Internet <URL:https://arxiv.org/pdf/2006.07228.pdf> [retrieved on 20210824] * |
| TOMIYAMA EISUKE ET AL: "WAFL-GAN: Wireless Ad Hoc Federated Learning for Distributed Generative Adversarial Networks", 2023 15TH INTERNATIONAL CONFERENCE ON KNOWLEDGE AND SMART TECHNOLOGY (KST), IEEE, 21 February 2023 (2023-02-21), pages 1 - 6, XP034325016, DOI: 10.1109/KST57286.2023.10086811 * |
| X: "Federated learning - wikipedia", 15 February 2024 (2024-02-15), XP093208233, Retrieved from the Internet <URL:-> * |
Also Published As
| Publication number | Publication date |
|---|---|
| FR3159490A1 (fr) | 2025-08-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110097066B (zh) | 一种用户分类方法、装置及电子设备 | |
| EP3066565B1 (fr) | Procédé et programme d'ordinateur pour l'exécution déportée de tâches informatiques d'un équipement sans fil | |
| EP3825919A1 (fr) | Méthode d'association d'équipements d'utilisateurs dans un réseau cellulaire au moyen d'un apprentissage par renforcement multi-agent | |
| KR20210066754A (ko) | 연합 학습을 활용한 사용자 특성 분석을 위한 딥 러닝 모델 생성 방법 | |
| US20220232272A1 (en) | Crowdsourcing platform for on-demand media content creation and sharing | |
| EP4396732A1 (fr) | Procédé et système de configuration de réseaux de neurones d'un ensemble de noeuds d'un réseau de communication | |
| Biswas et al. | A Kalman filter based low complexity throughput prediction algorithm for 5G cellular networks | |
| EP3652699B1 (fr) | Fiabilité de cartographies de réseaux | |
| WO2019170384A1 (fr) | Réseau de neurones convolutionnel pour l'estimation d'un indicateur de production d'énergie solaire | |
| WO2023046887A1 (fr) | Titre : procédé de prédiction de la qualité de service d'un réseau de communication, produit programme d'ordinateur et dispositif électronique de prédiction associés | |
| WO2025172472A1 (fr) | Apprentissage fédéré pour la génération de données synthétiques de mobilité | |
| WO2025172473A1 (fr) | Apprentissage fédéré décentralisé pour la génération de données synthétiques de mobilité | |
| EP1664833A1 (fr) | Procede pour detecter la presence ou l'absence d'un terminal mobile sur un chemin | |
| WO2012085432A1 (fr) | Procede et dispositif de communication de donnees numeriques | |
| FR3143160A1 (fr) | Procédé de prévision d’une séquence d’images par intelligence artificielle et son architecture de réseau de neurones | |
| Drainakis et al. | Distributed Predictive QoS in Automotive Environments under Concept Drift | |
| Pimpinella et al. | Towards long-term coverage and video users satisfaction prediction in cellular networks | |
| EP3854136B1 (fr) | Procédé de réattribution d'un serveur périphérique de traitement de données | |
| FR3045162A1 (fr) | Systeme d'analyse spatio-temporelle des flux d'objets mobiles | |
| WO2025045518A1 (fr) | Sélection de clients d'un réseau de télécommunications pour la mise en œuvre d'un apprentissage fédéré | |
| FR3088113A1 (fr) | Procede de prediction du prochain trajet d’une personne | |
| Zhang et al. | Revenue Optimization in Video Caching Networks with Privacy-Preserving Demand Predictions | |
| WO2020128246A1 (fr) | Procédé de détermination d'un chemin de transmission de données, et dispositif correspondant | |
| Kumar et al. | Analyzing the Benefits of Ad-hoc Deep Learning Algorithms in 5G Network Traffic Prediction | |
| Reddy et al. | Bayesian K-means clustering based quality of experience aware multimedia video streaming |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 25705241 Country of ref document: EP Kind code of ref document: A1 |