ES3023268T3 - Method for controlling rail traffic of a plurality of railway vehicles, computing unit and computer program - Google Patents
Method for controlling rail traffic of a plurality of railway vehicles, computing unit and computer program Download PDFInfo
- Publication number
- ES3023268T3 ES3023268T3 ES21170890T ES21170890T ES3023268T3 ES 3023268 T3 ES3023268 T3 ES 3023268T3 ES 21170890 T ES21170890 T ES 21170890T ES 21170890 T ES21170890 T ES 21170890T ES 3023268 T3 ES3023268 T3 ES 3023268T3
- Authority
- ES
- Spain
- Prior art keywords
- kpi
- action selection
- control
- execution
- railway
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L27/00—Central railway traffic control systems; Trackside control; Communication systems specially adapted therefor
- B61L27/10—Operations, e.g. scheduling or time tables
- B61L27/14—Following schedules
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L27/00—Central railway traffic control systems; Trackside control; Communication systems specially adapted therefor
- B61L27/10—Operations, e.g. scheduling or time tables
- B61L27/12—Preparing schedules
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L27/00—Central railway traffic control systems; Trackside control; Communication systems specially adapted therefor
- B61L27/10—Operations, e.g. scheduling or time tables
- B61L27/16—Trackside optimisation of vehicle or train operation
Landscapes
- Engineering & Computer Science (AREA)
- Mechanical Engineering (AREA)
- Train Traffic Observation, Control, And Security (AREA)
Abstract
La invención se refiere a un método (100) para controlar el tráfico ferroviario de una pluralidad de vehículos ferroviarios (215), que comprende: - recibir (101) datos de estado del tráfico ferroviario; - recibir (103) un objetivo de control (KPI1, KPI2, KPIN) para controlar el tráfico ferroviario de la pluralidad de vehículos ferroviarios (215); - seleccionar (105) al menos una regla de selección de acción (Π1, Π2, ΠN) de una pluralidad de reglas de selección de acción (Π1, Π2, ΠN) en función del objetivo de control (KPI1, KPI2, KPIN), donde las reglas de selección de acción (Π1, Π2, ΠN) están configuradas para determinar acciones de control del tráfico ferroviario en función de los datos de estado del tráfico ferroviario, donde al ejecutar las acciones de control por los vehículos ferroviarios (215), el tráfico ferroviario se lleva a un estado optimizado con respecto a un objetivo de control (KPI1, KPI2, KPIN). se pueden transferir; - ejecutar (107) la al menos una regla de selección de acción seleccionada (Π1, Π2, ΠN) sobre los datos de estado recibidos y determinar acciones de control; y - proporcionar (109) las acciones de control para controlar la pluralidad de vehículos ferroviarios (215). (Traducción automática con Google Translate, sin valor legal)The invention relates to a method (100) for controlling railway traffic of a plurality of railway vehicles (215), comprising: - receiving (101) railway traffic status data; - receiving (103) a control objective (KPI1, KPI2, KPIN) for controlling railway traffic of the plurality of railway vehicles (215); - selecting (105) at least one action selection rule (Π1, Π2, ΠN) from a plurality of action selection rules (Π1, Π2, ΠN) based on the control objective (KPI1, KPI2, KPIN), where the action selection rules (Π1, Π2, ΠN) are configured to determine rail traffic control actions based on the rail traffic status data, where by executing the control actions by the railway vehicles (215), the railway traffic is brought to an optimized state with respect to a control objective (KPI1, KPI2, KPIN). can be transferred; - executing (107) the at least one selected action selection rule (Π1, Π2, ΠN) on the received status data and determining control actions; and - providing (109) the control actions for controlling the plurality of railway vehicles (215). (Automatic translation with Google Translate, no legal value)
Description
DESCRIPCIÓNDESCRIPTION
Procedimiento para controlar un tráfico ferroviario de una pluralidad de vehículos ferroviarios, unidad informática y programa informático Procedure for controlling railway traffic of a plurality of railway vehicles, computer unit and computer program
La presente invención hace referencia a un procedimiento para controlar un tráfico ferroviario de una pluralidad de vehículos ferroviarios. The present invention relates to a method for controlling railway traffic of a plurality of railway vehicles.
Un control de un tráfico ferroviario de una pluralidad de vehículos ferroviarios, como por ejemplo en una red de metros o tranvías, puede estar optimizado en cuanto a distintos objetivos de control, por ejemplo, en cuanto a un consumo de energía ventajoso o a tiempos de retardo lo más reducido posibles. Para ello, pueden generarse horarios optimizados de modo correspondiente, según los cuales puede controlarse el tráfico ferroviario y en particular la pluralidad de vehículos ferroviarios. Esos horarios optimizados habitualmente se determinan o calculan fuera de línea, es decir, no cuando el transporte ferroviario está en funcionamiento. Sin embargo, si durante la operación del tráfico ferroviario se presentan situaciones en las que se debe diferir del horario predefinido y optimizado, se presenta el problema de cómo alcanzar un control lo más óptimo posible del tráfico ferroviario en el estado en línea, es decir, durante el funcionamiento. Rail traffic control involving a plurality of rail vehicles, such as in a metro or tram network, can be optimized with regard to various control objectives, for example, in terms of advantageous energy consumption or the shortest possible delay times. To this end, optimized timetables can be generated accordingly, according to which rail traffic, and in particular the plurality of rail vehicles, can be controlled. These optimized timetables are typically determined or calculated offline, i.e., not while rail transport is in operation. However, if situations arise during rail traffic operation in which the predefined and optimized timetable must be deviated from, the problem arises of how to achieve the most optimal rail traffic control possible while online, i.e., during operation.
Por la solicitud WO 2020/043397 A1 se conoce una optimización de energía para operar una flota de vehículos ferroviarios. Además, en la solicitud US 6,459,964 B1 se describe un procedimiento para perfeccionar un horario de trenes, y en la solicitud EP 2619 067 B1 se describe un procedimiento para el control automático de una pluralidad de vehículos guiados. Energy optimization for operating a fleet of rail vehicles is known from application WO 2020/043397 A1. Furthermore, application US 6,459,964 B1 describes a method for improving a train timetable, and application EP 2619 067 B1 describes a method for automatically controlling a plurality of guided vehicles.
El objeto de la presente invención consiste en proporcionar un procedimiento mejorado para controlar un tráfico ferroviario de una pluralidad de vehículos ferroviarios. The object of the present invention is to provide an improved method for controlling railway traffic of a plurality of railway vehicles.
Dicho objeto se soluciona mediante un procedimiento para controlar un tráfico ferroviario de una pluralidad de vehículos ferroviarios según la reivindicación 1 independiente. En las reivindicaciones dependientes se indican configuraciones ventajosas. This object is achieved by a method for controlling rail traffic of a plurality of rail vehicles according to independent claim 1. Advantageous configurations are indicated in the dependent claims.
Según un aspecto de la invención se proporciona un procedimiento para controlar un tráfico ferroviario de una pluralidad de vehículos ferroviarios, donde el procedimiento comprende: According to one aspect of the invention there is provided a method for controlling rail traffic of a plurality of rail vehicles, the method comprising:
- recepción de datos de estado de la pluralidad de vehículos ferroviarios del tráfico ferroviario, donde los datos de estado describen estados de control de la pluralidad de vehículos ferroviarios y comprenden al menos datos de posición de los vehículos ferroviarios dentro de una red de tráfico ferroviario; - receiving status data from the plurality of railway vehicles of railway traffic, where the status data describes control states of the plurality of railway vehicles and comprises at least position data of the railway vehicles within a railway traffic network;
- recepción de un objetivo de control para controlar el tráfico ferroviario de la pluralidad de vehículos ferroviarios; - receiving a control target for controlling railway traffic of a plurality of railway vehicles;
- selección de al menos una regla de selección de acción de una pluralidad de reglas de selección de acción en base al objetivo de control, donde las reglas de selección de acción están configuradas para, en base a datos de estado del tráfico ferroviario, determinar acciones de control del tráfico ferroviario, donde mediante la ejecución de las acciones de control por los vehículos ferroviarios, el tráfico ferroviario puede pasarse a un estado optimizado con respecto a un objetivo de control, donde cada regla de selección de acción está configurada para la optimización con respecto a un objetivo de control individual, y donde al menos una regla de selección de acción seleccionada está configurada para una optimización con respecto al objetivo de control recibido; - selecting at least one action selection rule from a plurality of action selection rules based on the control objective, where the action selection rules are configured to, based on rail traffic state data, determine rail traffic control actions, where by executing the control actions by the rail vehicles, the rail traffic can be brought into a state optimized with respect to a control objective, where each action selection rule is configured for optimization with respect to an individual control objective, and where at least one selected action selection rule is configured for optimization with respect to the received control objective;
- ejecución de al menos una regla de selección de acción seleccionada en cuanto a los datos de estado recibidos y determinación de acciones de control; y - execution of at least one action selection rule based on the received status data and determination of control actions; and
- puesta a disposición de las acciones de control para controlar la pluralidad de vehículos ferroviarios. - provision of control actions to monitor the plurality of railway vehicles.
Gracias a esto puede alcanzarse la ventaja técnica de que puede proporcionarse un procedimiento mejorado para controlar un tráfico ferroviario de una pluralidad de vehículos ferroviarios, en el que durante la operación del tráfico ferroviario y el desplazamiento de los vehículos ferroviarios dentro de una red de tráfico ferroviario, puede efectuarse una modificación de un objetivo de control, según el cual puede controlarse u optimizarse el tráfico ferroviario. Para ello se dispone de una pluralidad de reglas de selección de acción diferentes, mediante las cuales, en base a datos de estado del tráfico ferroviario, pueden determinarse acciones de control que, al ser ejecutadas por la pluralidad de vehículos ferroviarios del tráfico ferroviario, posibilitan una optimización del tráfico ferroviario con respecto a un objetivo de control predeterminado. Al recibirse un objetivo de control que debe modificarse de modo correspondiente, de este modo, puede seleccionarse una regla de selección de acción que está optimizada o configurada para el respectivo objetivo de control, para determinar acciones de control correspondientes que están configuradas para, al ser ejecutadas por los respectivos vehículos ferroviarios, alcanzar el objetivo de control correspondiente. Gracias a esto puede lograrse que, durante la operación del tráfico ferroviario, pueda efectuarse de forma deseada una modificación del objetivo de control, y fácilmente, mediante la ejecución de las respectivas reglas de selección de acción, puedan determinarse acciones de control para optimizar el tráfico ferroviario con respecto al objetivo de control seleccionado. Con ello se suprime una adaptación compleja del control del tráfico ferroviario. This provides the technical advantage that an improved method for controlling rail traffic of a plurality of rail vehicles can be provided, in which a control objective can be modified during the operation of rail traffic and the movement of rail vehicles within a rail traffic network, according to which the rail traffic can be controlled or optimized. For this purpose, a plurality of different action selection rules are available, by means of which, based on rail traffic status data, control actions can be determined which, when executed by the plurality of rail vehicles in the rail traffic, enable optimization of rail traffic with respect to a predetermined control objective. Upon receipt of a control objective to be modified accordingly, an action selection rule can be selected that is optimized or configured for the respective control objective to determine corresponding control actions which, when executed by the respective rail vehicles, are designed to achieve the respective control objective. This makes it possible to modify the control objective as desired during rail traffic operation, and easily determine control actions to optimize rail traffic with respect to the selected control objective by executing the appropriate action selection rules. This eliminates the need for complex adaptation of rail traffic control.
Una regla de selección de acción, en el sentido de la solicitud, es una política (policy) conocida en el ámbito del aprendizaje de refuerzo (reinforcement learning), que está configurada para, en cualquier estado del tráfico ferroviario, determinar acciones de control correspondientes que sean adecuadas para pasar el tráfico ferroviario a un estado optimizado con respecto a un objetivo de control predeterminado. An action selection rule, in the sense of the request, is a policy known in the field of reinforcement learning, which is configured to, in any state of rail traffic, determine corresponding control actions that are suitable for bringing rail traffic into an optimized state with respect to a predetermined control objective.
Un objetivo de control, en el sentido de la solicitud, es una especificación objetivo, según la que debe optimizarse o mejorarse el tráfico ferroviario de la pluralidad de vehículos ferroviarios. Un objetivo de control o un criterio de optimización correspondiente del tráfico ferroviario, por ejemplo, puede comprender un consumo de energía, un retardo total de los vehículos ferroviarios, o factores similares, relevantes para la operación de una pluralidad de vehículos ferroviarios. A control objective, within the meaning of the application, is a target specification according to which rail traffic for a plurality of rail vehicles is to be optimized or improved. A control objective or corresponding optimization criterion for rail traffic, for example, may comprise energy consumption, total delay of the rail vehicles, or similar factors relevant to the operation of a plurality of rail vehicles.
Un tráfico ferroviario, en el sentido de la solicitud, es una totalidad de una pluralidad de vehículos ferroviarios dentro de una red de tráfico ferroviario, y está caracterizado por estados, aquellos estados de control de los vehículos ferroviarios individuales que comprenden al menos datos de posición de los vehículos ferroviarios dentro de la red de tráfico ferroviario, así como datos de tiempo, por ejemplo tiempos de retardo de la pluralidad de vehículos ferroviarios relativamente con respecto a un horario predeterminado, consumos de energía u otros parámetros de control de la totalidad de la pluralidad de vehículos ferroviarios. Una variación del tráfico ferroviario en el curso del control de los vehículos ferroviarios dentro de la red de tráfico ferroviario se describe mediante variaciones de estado del tráfico ferroviario, en las que los estados de control de la pluralidad de vehículos ferroviarios, como también los parámetros de control, como consumo de energía o retardo total, experimentan una variación de tiempo. A railway traffic, within the meaning of the application, is a totality of a plurality of railway vehicles within a railway traffic network, and is characterized by states, those control states of the individual railway vehicles comprising at least position data of the railway vehicles within the railway traffic network, as well as time data, for example delay times of the plurality of railway vehicles relative to a predetermined time, energy consumption or other control parameters of the totality of the plurality of railway vehicles. A change in railway traffic during the control of the railway vehicles within the railway traffic network is described by state changes in railway traffic, in which the control states of the plurality of railway vehicles, as well as control parameters, such as energy consumption or total delay, undergo a time change.
Las acciones de control, en el sentido de la solicitud, son acciones o criterios de control según los que debe controlarse la pluralidad de vehículos ferroviarios. Las acciones de control, en el sentido de la solicitud, junto con órdenes de control explícitas para los vehículos ferroviarios individuales, comprenden datos de tiempo que por ejemplo describen tiempos de llegada, tiempos de partida o tiempos de detención de los vehículos ferroviarios individuales en paradas dentro de la red de tráfico ferroviario. De este modo, los vehículos ferroviarios deben controlarse de manera que cumplan o respeten los datos de tiempo correspondientes de las especificaciones. Control actions, within the meaning of the application, are control actions or criteria according to which the plurality of railway vehicles are to be controlled. Control actions, within the meaning of the application, together with explicit control orders for individual railway vehicles, comprise time data that, for example, describe arrival times, departure times, or stopping times of individual railway vehicles at stops within the railway traffic network. Thus, the railway vehicles are to be controlled in such a way that they comply with or adhere to the corresponding time data of the specifications.
Una optimización del tráfico ferroviario con respecto a un objetivo de control seleccionado o predeterminado, en el sentido de la solicitud, comprende una mejora de un estado real del vehículo ferroviario, con respecto al respectivo objetivo de control. Una optimización del tráfico ferroviario, de este modo, en el sentido de la solicitud no debe conducir forzosamente a un estado óptimo del tráfico ferroviario con respecto al respectivo objetivo de control, sino que solamente puede estar limitado por una mejora con respecto al objetivo de control y en comparación con estados del tráfico ferroviario, precedentes en el tiempo. An optimization of rail traffic with respect to a selected or predetermined control objective, within the meaning of the application, comprises an improvement of the actual condition of the rail vehicle with respect to the respective control objective. An optimization of rail traffic, therefore, within the meaning of the application, does not necessarily have to lead to an optimal state of rail traffic with respect to the respective control objective, but can only be limited by an improvement relative to the control objective and in comparison to previous rail traffic conditions.
El procedimiento según la invención para controlar un tráfico ferroviario, de este modo, puede ejecutarse durante la operación del tráfico ferroviario, el efectuarse el desplazamiento de los vehículos ferroviarios individuales dentro de la red de tráfico ferroviario. La optimización del tráfico ferroviario puede efectuarse aquí con respecto a un horario predeterminado, según el que debe controlarse la pluralidad de los vehículos ferroviarios dentro de la red de tráfico ferroviario. The method according to the invention for controlling rail traffic can thus be carried out during rail traffic operations, as individual rail vehicles move within the rail traffic network. Rail traffic optimization can be carried out in this case with respect to a predetermined schedule, according to which the plurality of rail vehicles within the rail traffic network are to be controlled.
Según una forma de ejecución, el objetivo de control recibido es un objetivo de control combinado y comprende una pluralidad de objetivos de control, donde los objetivos de control con ponderaciones individuales se incluyen en el objetivo de control combinado; que comprende: In one embodiment, the received control objective is a combined control objective and comprises a plurality of control objectives, where the control objectives with individual weights are included in the combined control objective; comprising:
- selección de una pluralidad de reglas de selección de acción, donde cada regla de selección de acción respectivamente está configurada para una optimización con respecto a uno de la pluralidad de objetivos de control del objetivo de control combinado; y - selecting a plurality of action selection rules, where each action selection rule is respectively configured for optimization with respect to one of the plurality of control objectives of the combined control objective; and
- ejecución de la pluralidad de las reglas de selección de acción seleccionadas, según una relación de ejecución, donde la relación de ejecución, para cada regla de selección seleccionada, determina una porción de tiempo en una duración de ejecución total de la pluralidad de reglas de selección de acción seleccionadas, y donde una ejecución de la pluralidad de reglas de selección de acción, según la relación de ejecución, cumple con el objetivo de control combinado. - executing the plurality of selected action selection rules according to an execution relationship, where the execution relationship, for each selected selection rule, determines a time portion in a total execution duration of the plurality of selected action selection rules, and where an execution of the plurality of action selection rules, according to the execution relationship, meets the combined control objective.
Gracias a ello puede alcanzarse la ventaja técnica de que puede conseguirse otra mejora del control del tráfico ferroviario, al posibilitarse una consideración de objetivos de control combinados y una optimización correspondiente del tráfico ferroviario con respecto a objetivos de control de esa clase. Un objetivo de control combinado comprende en este caso una pluralidad de objetivos de control predeterminados que respectivamente con una ponderación correspondiente se incluyen en el objetivo de control combinado. Con ello se posibilita un control del tráfico ferroviario con respecto a una pluralidad de objetivos de control. This provides the technical advantage that a further improvement in rail traffic control can be achieved by enabling combined control objectives and corresponding optimization of rail traffic with respect to control objectives of that type. A combined control objective comprises a plurality of predetermined control objectives, which are each weighted accordingly in the combined control objective. This enables rail traffic control with respect to a plurality of control objectives.
Un objetivo de control combinado, en el sentido de la solicitud, está dado por una pluralidad de al menos dos objetivos de control predeterminados que, con una ponderación correspondiente, se incluyen en el objetivo de control combinado. Un tráfico ferroviario, con ello, puede controlarse simultáneamente con respecto a los objetivos de control consumo de energía y reducción del retardo, por ejemplo en una relación de 60 a 40. Para ello, se selecciona una pluralidad de reglas de selección de acción correspondientes que respectivamente están optimizadas en cuanto a objetivos de control predeterminados individuales del objetivo de control combinado, y se ejecuta según una relación de ejecución. En este caso, la relación de ejecución está configurada de manera que la ejecución de las reglas de selección de acción seleccionadas, según la relación de ejecución, conducen al cumplimiento del objetivo de control combinado. A combined control objective, within the meaning of the application, is defined by a plurality of at least two predetermined control objectives, which are included in the combined control objective with a corresponding weighting. Rail traffic can thus be controlled simultaneously with respect to the control objectives of energy consumption and delay reduction, for example in a ratio of 60 to 40. To this end, a plurality of corresponding action selection rules, each optimized with respect to individual predetermined control objectives, are selected from the combined control objective and executed according to an execution ratio. In this case, the execution ratio is configured such that the execution of the selected action selection rules, according to the execution ratio, leads to the fulfillment of the combined control objective.
Una ejecución de una pluralidad de reglas de selección de acción, según una relación de ejecución, en el sentido de la solicitud, corresponde a una ejecución de las acciones de control respectivamente determinadas mediante las reglas de selección de acción individuales, según la respectiva relación de ejecución. Una relación de ejecución, aquí en el sentido de la solicitud, para cada regla de selección de acción que debe considerarse de modo correspondiente, describe una porción de tiempo de la respectiva ejecución de la regla de selección de acción dentro de un periodo de ejecución predeterminado. La ejecución de las acciones de control individuales de las distintas reglas de selección de acción, según la relación de ejecución, en el sentido de la solicitud significa que, según la respectiva relación de ejecución, el tráfico ferroviario se controla según las respectivas reglas de selección de acción. An execution of a plurality of action selection rules, according to an execution relationship, in the sense of the request, corresponds to an execution of the control actions respectively determined by the individual action selection rules, according to the respective execution relationship. An execution relationship, here in the sense of the request, for each action selection rule to be considered accordingly, describes a time portion of the respective execution of the action selection rule within a predetermined execution period. The execution of the individual control actions of the individual action selection rules, according to the execution relationship, in the sense of the request means that, according to the respective execution relationship, rail traffic is controlled according to the respective action selection rules.
Según la forma de ejecución, mediante la relación de ejecución, para cada regla de selección de acción está determinada una duración de ejecución y/o una secuencia en el tiempo de la pluralidad de reglas de selección de acción. Depending on the execution method, the execution relationship determines an execution duration and/or a sequence in time of the plurality of action selection rules for each action selection rule.
Gracias a esto puede alcanzarse la ventaja técnica de que es posible una relación de ejecución precisa y que puede determinarse con facilidad, en la que para cada regla de selección de acción se determina una duración de ejecución dentro del respectivo periodo de ejecución y/o para la pluralidad de reglas de selección de acción involucradas se determina un orden de ejecución. This allows for the technical advantage that a precise and easily determinable execution relationship is possible, in which an execution duration is determined for each action selection rule within the respective execution period and/or an execution order is determined for the plurality of action selection rules involved.
Según una forma de ejecución, mediante la relación de ejecución, para cada regla de selección de acción seleccionada, está determinada una probabilidad de ejecución, según la cual la regla de selección de acción debe ser ejecutada en un periodo de ejecución. According to one form of execution, by means of the execution relation, for each selected action selection rule, an execution probability is determined, according to which the action selection rule must be executed within an execution period.
Gracias a esto puede alcanzarse la ventaja técnica de que puede proporcionarse un relación de ejecución precisa y que puede determinarse con facilidad. Para ello, para cada regla de selección de acción involucrada se determina una probabilidad de ejecución de una ejecución de la respectiva regla de selección de acción dentro de un periodo de ejecución correspondiente. La probabilidad de ejecución describe en este caso la probabilidad de que el tráfico ferroviario se controle según las acciones de control determinadas mediante la respectiva regla de selección de acción, durante un periodo predeterminado. This provides the technical advantage of providing a precise and easily determined execution ratio. To this end, a probability of execution of the respective action selection rule within a corresponding execution period is determined for each action selection rule involved. The execution probability describes the probability that rail traffic will be controlled according to the control actions determined by the respective action selection rule within a predetermined period.
Según una forma de ejecución, las reglas de selección de acción seleccionadas se ejecutan cíclicamente, donde el tráfico ferroviario se controla cíclicamente según las acciones de control determinadas mediante las reglas de selección de acción. According to one embodiment, the selected action selection rules are executed cyclically, whereby rail traffic is controlled cyclically according to the control actions determined by the action selection rules.
Gracias a esto puede alcanzarse la ventaja técnica de que se posibilita un control preciso del tráfico ferroviario. This provides the technical advantage of enabling precise control of rail traffic.
Según una forma de ejecución, la selección y/o la ejecución de las reglas de selección de acción se ejecuta mediante una función de división de tiempo, donde la función de división de tiempo está entrenada mediante aprendizaje automático, para determinar relaciones de ejecución correspondientes para objetivos de control combinados. In one embodiment, the selection and/or execution of the action selection rules is performed using a time-slicing function, where the time-slicing function is trained using machine learning to determine corresponding execution relationships for combined control objectives.
Gracias a esto puede alcanzarse la ventaja técnica de que es posible una selección precisa de las respectivas acciones de control que pueden ejecutarse y una determinación precisa de las respectivas relaciones de ejecución. Mediante la función de división de tiempo que, mediante técnicas del aprendizaje automático, está entrenada para determinar relaciones de ejecución correspondientes para objetivos de control combinados deseados, puede alcanzarse de modo preciso y fiable un control de alta complejidad de un tráfico ferroviario que comprende una pluralidad de vehículos ferroviarios y una optimización de la misma con respecto a objetivos de control combinados. La utilización de las técnicas del aprendizaje automático posibilita en este caso una determinación más precisa de las relaciones de ejecución correspondientes y, asociado a ello, un control más efectivo y más eficiente, del tráfico ferroviario. This allows for the technical advantage of enabling precise selection of the respective control actions that can be executed and precise determination of the respective execution ratios. Using the time-division function, which is trained using machine learning techniques to determine corresponding execution ratios for desired combined control objectives, highly complex control of rail traffic comprising a plurality of rail vehicles and optimization thereof with respect to combined control objectives can be achieved precisely and reliably. The use of machine learning techniques in this case enables more precise determination of the corresponding execution ratios and, consequently, more effective and efficient control of rail traffic.
Según la invención, las reglas de selección de acción están entrenadas mediante aprendizaje de refuerzo. Según una forma de ejecución, la función de división de tiempo está entrenada mediante aprendizaje de refuerzo. According to the invention, the action selection rules are trained using reinforcement learning. In one embodiment, the time-slicing function is trained using reinforcement learning.
Gracias a esto puede alcanzarse la ventaja técnica de que puede proporcionarse un entrenamiento preciso y eficiente de la función de división de tiempo, así como de las reglas de selección de acción. This provides the technical advantage of providing accurate and efficient training of the time-slicing function as well as action selection rules.
Según una forma de ejecución, el entrenamiento de las reglas de selección de acción y/o de la función de división de tiempo se ejecuta en base a datos de simulación, donde los datos de simulación se basan en una simulación de un tráfico ferroviario de una pluralidad de vehículos ferroviarios. In one embodiment, the training of the action selection rules and/or the time-slicing function is performed based on simulation data, where the simulation data is based on a simulation of rail traffic of a plurality of rail vehicles.
Gracias a esto puede alcanzarse la ventaja técnica de que se posibilita un entrenamiento efectivo y eficiente de las reglas de selección de acción, así como de la función de división de tiempo. Además, puede prescindirse de una generación de datos de entrenamiento correspondiente mediante marchas efectivamente realizadas de la pluralidad de vehículos ferroviarios. This provides the technical advantage of enabling effective and efficient training of action selection rules and the time-slicing function. Furthermore, generating training data based on actual journeys of the multiple rail vehicles can be eliminated.
Según la invención, el entrenamiento de las reglas de selección de acción comprende una maximización de funciones de recompensa y las funciones de recompensa definen objetivos de control y/u objetivos de control combinados. According to the invention, the training of the action selection rules comprises a maximization of reward functions and the reward functions define control objectives and/or combined control objectives.
Según una forma de ejecución, el entrenamiento de la función de división de tiempo comprende una maximización de funciones de recompensa, donde las funciones de recompensa definen objetivos de control y/u objetivos de control combinados. In one embodiment, training the time-slicing function comprises maximizing reward functions, where the reward functions define control objectives and/or combined control objectives.
Gracias a esto puede alcanzarse la ventaja técnica de que puede posibilitarse un entrenamiento efectivo y eficiente de las reglas de selección de acción, así como de la función de división de tiempo. This provides the technical advantage that effective and efficient training of action selection rules and the time-slicing function can be achieved.
Según una forma de ejecución, las reglas de selección de acción y las funciones de división de tiempo se entrenan simultáneamente. Gracias a esto puede alcanzarse la ventaja técnica de que se posibilita un control mejorado del tráfico ferroviario. Mediante el entrenamiento simultáneo de la función de división de tiempo y de la pluralidad de reglas de selección de acción con respecto a objetivos de control combinados, puede lograrse que las acciones de control individuales de las distintas reglas de selección de acción puedan adaptarse a la interacción con las respectivamente otras reglas de selección de control. Mediante la adaptación puede alcanzarse un mejor rendimiento de las reglas de selección de acción que lo que sería posible en el caso de un entrenamiento individual de las reglas de selección de acción individuales en cuanto a objetivos de control individuales y solamente una combinación de las reglas de selección de acción entrenadas de forma individual, mediante la función de división de tiempo, para cumplir con un objetivo de control combinado. Según una forma de ejecución, las reglas de selección de acción y/o la función de división de tiempo está diseñada como red neuronal. In one embodiment, the action selection rules and the time-slicing functions are trained simultaneously. This allows for the technical advantage of enabling improved rail traffic control. By simultaneously training the time-slicing function and the plurality of action selection rules with respect to combined control objectives, the individual control actions of the individual action selection rules can be adapted to their interaction with the other control selection rules. Through adaptation, the action selection rules can achieve better performance than would be possible with individual training of the individual action selection rules with respect to individual control objectives, and only a combination of the individually trained action selection rules, using the time-slicing function, to achieve a combined control objective. In one embodiment, the action selection rules and/or the time-slicing function are designed as neural networks.
Gracias a esto puede alcanzarse la ventaja técnica de que puede proporcionarse una configuración eficaz y robusta de las reglas de selección de acción o de las funciones de división de tiempo. This provides the technical advantage that efficient and robust configuration of action selection rules or time-slicing functions can be provided.
Según una forma de ejecución, los objetivos de control comprenden: la minimización de un consumo de energía de la pluralidad de vehículos ferroviarios y/o la minimización de consumos de energía de vehículos ferroviarios individuales, y/o la minimización de un retardo total de la pluralidad de vehículos ferroviarios y/o la minimización de un retardo máximo de vehículos ferroviarios individuales, y/o la minimización de una suma de desviación cuadrada o absoluta de los retardos con respecto a un valor de retardo medio o mediano de la pluralidad de vehículos ferroviarios. According to one embodiment, the control objectives comprise: minimizing an energy consumption of the plurality of railway vehicles and/or minimizing energy consumption of individual railway vehicles, and/or minimizing a total delay of the plurality of railway vehicles and/or minimizing a maximum delay of individual railway vehicles, and/or minimizing a sum of squared or absolute deviation of the delays with respect to a mean or median delay value of the plurality of railway vehicles.
Gracias a esto puede alcanzarse la ventaja técnica de que se posibilita un control preciso del tráfico ferroviario, en el que el tráfico ferroviario puede optimizarse con respecto a objetivos de control relevantes. This provides the technical advantage of enabling precise rail traffic control, which allows rail traffic to be optimized with respect to relevant control objectives.
Según una forma de ejecución, las acciones de control comprenden tiempos de llegada y/o tiempos de partida y/o tiempos de detención de la pluralidad de vehículos ferroviarios en paradas dentro de la red de tráfico ferroviario. According to one embodiment, the control actions comprise arrival times and/or departure times and/or stopping times of the plurality of railway vehicles at stops within the railway traffic network.
Gracias a esto puede alcanzarse la ventaja técnica de que se posibilita un control eficiente del tráfico ferroviario, considerando objetivos de control combinados. Mediante la consideración de tiempos de partidas y/o tiempos de llegada y/o tiempos de detención de los vehículos ferroviarios en paradas dentro de la red de tráfico ferroviario en las respectivas acciones de control, puede alcanzarse un control preciso del tráfico ferroviario. Los tiempos de llegada y/o tiempos de partida y/o tiempos de parada correspondientes en este caso pueden relacionarse con un horario optimizado predeterminado. Un control de los vehículos individuales del tráfico ferroviario en este caso puede configurarse de manera que los respectivos vehículos ferroviarios observen los tiempos de partida y/o tiempos de llegada y/o tiempos de detención definidos en las acciones de control. This allows for the technical advantage of enabling efficient rail traffic control by considering combined control objectives. By considering departure times and/or arrival times and/or stopping times of rail vehicles at stops within the rail traffic network in the respective control actions, precise rail traffic control can be achieved. The corresponding arrival times and/or departure times and/or stopping times in this case can be linked to a predetermined optimized timetable. In this case, individual rail traffic vehicle control can be configured so that the respective rail vehicles observe the departure times and/or arrival times and/or stopping times defined in the control actions.
De acuerdo con un segundo aspecto se proporciona una unidad informática, donde la unidad informática está diseñada para ejecutar el procedimiento para controlar un tráfico ferroviario de una pluralidad de vehículos ferroviarios según una de las formas de ejecución precedentes. According to a second aspect, a computing unit is provided, the computing unit being designed to execute the method for controlling a railway traffic of a plurality of railway vehicles according to one of the preceding embodiments.
Según un tercer aspecto de la invención se proporciona un producto de programa informático que comprende comandos que, al ser ejecutado el programa mediante una unidad de procesamiento de datos, disponen al mismo a ejecutar el procedimiento para controlar un tráfico ferroviario de una pluralidad de vehículos ferroviarios, según una de las formas de ejecución precedentes. According to a third aspect of the invention, there is provided a computer program product comprising commands which, when the program is executed by a data processing unit, arrange the program to execute the method for controlling rail traffic of a plurality of rail vehicles, according to one of the preceding embodiments.
Las características y ventajas de esta invención, descritas anteriormente, así como el modo de alcanzar las mismas, se aclaran y se vuelven más compresibles mediante las explicaciones de las siguientes representaciones, muy simplificadas, de ejemplos de ejecución preferentes. Respectivamente, muestran: The features and advantages of this invention, described above, as well as the manner of achieving them, are clarified and made more understandable by the explanation of the following highly simplified representations of preferred embodiments. They show respectively:
Figura 1 una representación esquemática de un sistema para controlar un tráfico ferroviario, según una forma de ejecución. Figure 1 a schematic representation of a system for controlling railway traffic, according to one embodiment.
Figura 2 un diagrama de flujo de un procedimiento para controlar un tráfico ferroviario, según una forma de ejecución; Figure 2 a flowchart of a procedure for controlling railway traffic, according to one embodiment;
Figura 3 un diagrama de una optimización de un tráfico ferroviario con respecto a dos objetivos de control; Figure 3 a diagram of a railway traffic optimization with respect to two control objectives;
Figura 4 una representación esquemática de una ejecución de dos reglas de selección de acción según una relación de ejecución; Figure 4 a schematic representation of an execution of two action selection rules according to an execution relationship;
Figura 5 una representación esquemática de una arquitectura para una función de división de tiempo, según una forma de ejecución; Figure 5 a schematic representation of an architecture for a time division function, according to one embodiment;
Figura 6 otra representación esquemática de una arquitectura para una función de división de tiempo, según otra forma de ejecución; Figure 6 another schematic representation of an architecture for a time division function, according to another form of implementation;
Figura 7 un diagrama de un hipervolumen de un estado de optimización de un tráfico ferroviario; y Figura 8 una representación esquemática de un producto de programa informático. Figure 7 shows a hypervolume diagram of a railway traffic optimization state; and Figure 8 shows a schematic representation of a software product.
La Figura 1 muestra una representación esquemática de un sistema 200 para optimizar un tráfico ferroviario, según una forma de ejecución. Figure 1 shows a schematic representation of a system 200 for optimizing railway traffic, according to one embodiment.
Un sistema 200 para optimizar un tráfico ferroviario, según la forma de ejecución mostrada, comprende una pluralidad de módulos que pueden ejecutarse en una unidad informática 201. El sistema 200, además, puede estar dividido en un subsistema fuera de línea 202 y un subsistema en línea 204, donde el subsistema fuera de línea 202 se ejecuta fuera de línea, es decir, independientemente de un funcionamiento de los vehículos ferroviarios 215, mientras que el subsistema en línea 204 se ejecuta durante el funcionamiento de los vehículos ferroviarios 215. A system 200 for optimizing railway traffic, according to the embodiment shown, comprises a plurality of modules that can be executed on a computer unit 201. The system 200 can furthermore be divided into an offline subsystem 202 and an online subsystem 204, where the offline subsystem 202 is executed offline, i.e. independently of an operation of the railway vehicles 215, while the online subsystem 204 is executed during the operation of the railway vehicles 215.
El componente central del subsistema fuera de línea 202 es un módulo de optimización de horario 211. El módulo de optimización de horario 211 se utiliza para crear un horario optimizado para un tráfico ferroviario de una pluralidad de vehículos ferroviarios de una red de tráfico ferroviario. El módulo de optimización de horario 211, mediante una primera interfaz, puede transmitir el horario optimizado, creado en subsistema fuera de línea 202, al subsistema en línea 204, para que se pueda ejecutar el horario para controlar el tráfico ferroviario. The central component of the offline subsystem 202 is a schedule optimization module 211. The schedule optimization module 211 is used to create an optimized schedule for rail traffic of a plurality of rail vehicles in a rail traffic network. The schedule optimization module 211, via a first interface, can transmit the optimized schedule created in the offline subsystem 202 to the online subsystem 204, so that the schedule can be executed to control the rail traffic.
En la operación efectiva del tráfico ferroviario, el horario, ahora denominado horario en línea, es gestionado por un módulo de gestión de horario 205. Para ello, datos de posición de vehículos ferroviarios individuales del tráfico ferroviario, mediante un módulo automático de seguimiento de vehículos ferroviarios 207, por medio de una segunda interfaz S2, puede transmitirse al módulo de gestión de horario 205, para que el mismo pueda realizar una comparación entre movimientos objetivo del horario y movimientos reales efectivamente realizados por los vehículos ferroviarios del tráfico ferroviario. In the actual operation of railway traffic, the timetable, now referred to as the online timetable, is managed by a timetable management module 205. For this purpose, position data of individual railway vehicles in the railway traffic can be transmitted to the timetable management module 205 via an automatic railway vehicle tracking module 207, via a second interface S2, so that it can perform a comparison between target movements in the timetable and actual movements actually performed by the railway vehicles in the railway traffic.
El módulo de gestión de horario 205, mediante una tercera interfaz S3, puede transmitir órdenes para la selección de recorridos ferroviarios que pueden transitarse de modo correspondiente, a un módulo automático de selección de vía 209. Con ello, pueden reservarse a tiempo rutas ferroviarias correspondientes para garantizar una operación de los vehículos ferroviarios con retardos mínimos. The timetable management module 205 can transmit commands for selecting railway routes that can be used accordingly via a third interface S3 to an automatic track selection module 209. This enables appropriate railway routes to be reserved in good time to ensure that railway vehicles operate with minimal delays.
El módulo de gestión de horario 205 presenta además una interfaz bidireccional S2, S4 con un módulo automático de regulación del vehículo ferroviario 203. En el caso de que el horario en línea deba modificarse, debido a un nuevo horario objetivo del módulo de optimización de horario 211 o a modificaciones de un guardagujas, el módulo automático de regulación de vehículos ferroviarios 203 puede ser informado de modo correspondiente para provocar una modificación del horario en línea. Para ello, el módulo automático de regulación de vehículos ferroviarios 203, además, necesita datos de posición reales de los vehículos ferroviarios, para determinar retardos reales de los vehículos ferroviarios y, en el caso de desviaciones mayores, poder iniciar regulaciones adecuadas. The timetable management module 205 further has a bidirectional interface S2, S4 with an automatic rail vehicle control module 203. If the online timetable is to be changed due to a new target time of the timetable optimization module 211 or due to changes in a switchman, the automatic rail vehicle control module 203 can be informed accordingly in order to trigger a change in the online timetable. For this purpose, the automatic rail vehicle control module 203 additionally requires actual position data of the rail vehicles in order to determine actual rail vehicle delays and, in the case of larger deviations, to be able to initiate appropriate controls.
Esas regulaciones pueden comprender acciones de control que deben ser ejecutadas por los vehículos ferroviarios, con aquellos tiempos de partida y/o tiempos de llegada y tiempos de detención de los vehículos ferroviarios en paradas de los recorridos ferroviarios de la red de tráfico ferroviario, que son deseados o que deben ser alcanzados u observados por los vehículos ferroviarios para evitar el retardo y para modificar el horario. Las regulaciones correspondientes y/o acciones de control pueden transmitirse al módulo de gestión de horario 205 mediante una quinta interfaz S5. These regulations may include control actions to be executed by railway vehicles, such as departure times and/or arrival times and stopping times of railway vehicles at stops on railway routes in the railway traffic network, which are desired or which must be achieved or observed by railway vehicles in order to avoid delays and to modify the timetable. The corresponding regulations and/or control actions may be transmitted to the timetable management module 205 via a fifth S5 interface.
Por último, para la adaptación del horario, las regulaciones y acciones de control correspondientes y los tiempos de llegada/tiempos de partida/tiempos de detención optimizados correspondientes, desde el módulo automático de gestión de vehículos ferroviarios 205, mediante una sexta interfaz S6, se transmiten a módulos automáticos de control de vehículos ferroviarios 213 de los vehículos ferroviarios 315 individuales del tráfico ferroviario, para que los mismos puedan ejecutar esa modificación deseada o acciones de control para alcanzar u observar los tiempos de llegada/tiempos de partida/tiempos de detención optimizados. Finally, for timetable adaptation, the corresponding regulations and control actions and the corresponding optimized arrival times/departure times/stop times are transmitted from the automatic rail vehicle management module 205 via a sixth interface S6 to automatic rail vehicle control modules 213 of the individual rail vehicles 315 of the rail traffic, so that they can execute the desired modification or control actions to achieve or observe the optimized arrival times/departure times/stop times.
En el caso de vehículos ferroviarios que circulan de forma automática, el módulo automático de control de vehículos ferroviarios 213 puede determinar trayectorias de marcha del vehículo ferroviario 203, optimizadas en cuanto a la energía, que encajan mejor en el horario en línea real. En el caso de la marcha manual, se informa al conductor del vehículo, pero el mismo es libre de implementar las regulaciones. In the case of railway vehicles operating automatically, the automatic railway vehicle control module 213 can determine energy-optimized travel paths for the railway vehicle 203 that best fit the actual line schedule. In the case of manual operation, the vehicle driver is informed, but is free to implement the regulations.
En la forma de ejecución mostrada, el módulo automático de regulación de vehículos ferroviarios 203, en base a los datos de estado de un tráfico ferroviario que debe optimizarse, de una pluralidad de vehículos ferroviarios, está configurado para ejecutar el procedimiento según la invención para controlar un tráfico ferroviario de una pluralidad de vehículos ferroviarios 215. In the embodiment shown, the automatic rail vehicle control module 203 is configured, based on status data of a rail traffic to be optimized, of a plurality of rail vehicles, to execute the method according to the invention for controlling a rail traffic of a plurality of rail vehicles 215.
La Figura 2 muestra un diagrama de flujo de un procedimiento 100 para controlar un tráfico ferroviario, según una forma de ejecución. Figure 2 shows a flowchart of a procedure 100 for controlling railway traffic, according to one embodiment.
El procedimiento 100 según la invención para controlar un tráfico ferroviario de una pluralidad de vehículos ferroviarios 215 puede realizarse mediante un sistema 200 según la forma de ejecución en la Figura 1 y en particular mediante un módulo de regulación automático del vehículo ferroviario 203. The method 100 according to the invention for controlling a railway traffic of a plurality of railway vehicles 215 can be carried out by a system 200 according to the embodiment in Figure 1 and in particular by an automatic railway vehicle regulation module 203.
Para controlar un tráfico ferroviario, según el procedimiento 100 según la invención, en primer lugar, en una etapa del procedimiento 101, se reciben datos de estado del tráfico ferroviario de la pluralidad de vehículos ferroviarios 215. Los datos de estado describen en este caso estados del tráfico ferroviarios y comprenden al menos datos de posición de la pluralidad de vehículos ferroviarios, según los cuales es posible un posicionamiento de los vehículos ferroviarios dentro de la red de tráfico ferroviario. Los datos de estado, además, pueden comprender criterios de control del tráfico ferroviario, por ejemplo consumos de energía del tráfico ferroviario o de los vehículos ferroviarios individuales, o retardos de los vehículos ferroviarios, tanto como totalidad, como también individualmente, y otros criterios relevantes para controlar un tráfico ferroviario. In order to control rail traffic according to the inventive method 100, first, in a method step 101, rail traffic status data are received from the plurality of rail vehicles 215. The status data describe rail traffic statuses and comprise at least position data of the plurality of rail vehicles, according to which positioning of the rail vehicles within the rail traffic network is possible. The status data may further comprise rail traffic control criteria, for example, energy consumption of the rail traffic or of individual rail vehicles, or delays of the rail vehicles, both as a whole and individually, and other criteria relevant to controlling rail traffic.
El procedimiento puede ejecutarse durante una operación del tráfico ferroviario, en la que los vehículos ferroviarios circulan dentro de una red ferroviaria en correspondencia con un horario. Los datos de estado describen aquí estados del tráfico ferroviario y describen al menos las posiciones dentro de la red ferroviaria en la que se encuentran vehículos en un instante determinado. Los datos de estado además pueden comprender datos de tiempo, por ejemplo datos de retardo de los vehículos ferroviarios individuales con respecto a un horario optimizado. The method can be executed during a rail traffic operation, in which rail vehicles travel within a rail network according to a schedule. The status data here describes rail traffic states and describes at least the positions within the rail network where vehicles are located at a given time. The status data can also comprise time data, for example, data on the delay of individual rail vehicles relative to an optimized schedule.
En otra etapa del procedimiento 103 se recibe un objetivo de control KPI<1>, KPI<2>, KPIn. El objetivo de control puede estar dado por ejemplo mediante un consumo de energía de la totalidad de los vehículos ferroviarios o un retardo total de la totalidad de los vehículos ferroviarios, mediante retardos individuales de los vehículos ferroviarios individuales. In a further step of the procedure 103, a control objective KPI<1>, KPI<2>, KPIn is received. The control objective can be given, for example, by an energy consumption of all railway vehicles or a total delay of all railway vehicles, by individual delays of individual railway vehicles.
El objetivo de control KPI<1>, KPI<2>, KPI<n>puede recibirse durante la operación del tráfico ferroviario y, con ello, durante la circulación de los vehículos ferroviarios dentro de la red ferroviaria. Esto posibilita una variación del objetivo de control KPI<1>, KPI<2>, KPIn durante el funcionamiento en línea del tráfico ferroviario. El objetivo de control indica aquí un criterio según el cual puede efectuarse el control del tráfico ferroviario. Por ejemplo, el tráfico ferroviario puede controlarse de manera que un consumo de energía total de los vehículos ferroviarios sea mínimo. De manera alternativa, el tráfico ferroviario puede controlarse para evitar o reducir a un mínimo retardos de los vehículos ferroviarios con respecto al horario. The control objective KPI<1>, KPI<2>, KPI<n> can be obtained during rail traffic operation and thus during the movement of rail vehicles within the rail network. This enables the control objective KPI<1>, KPI<2>, KPIn to be varied during online rail traffic operation. The control objective here indicates a criterion according to which rail traffic control can be carried out. For example, rail traffic can be controlled so that the total energy consumption of rail vehicles is minimal. Alternatively, rail traffic can be controlled to prevent or minimize delays of rail vehicles with respect to the schedule.
En una etapa del procedimiento 105, a continuación, al menos una regla de selección de acción ni, n<2>, nN se selecciona de una pluralidad de reglas de selección de acción m, n<2>, nN almacenadas previamente. Las reglas de selección de acción m, n<2>, nN están configuradas para, en base a datos de estado del tráfico ferroviario, determinar acciones de control que, en el caso ejecuciones mediante los vehículos ferroviarios del tráfico ferroviario, conducen a una optimización del tráfico ferroviario con respecto a un objetivo de control KPI<1>, KPI<2>, KPI<n>predeterminado. Las reglas de selección de acción m, n<2>, nN individuales están optimizadas con respecto a un objetivo de control KPI<1>, KPI<2>, KPI<n>individual. Por ejemplo, una regla de selección de acción rn, n<2>, nN está optimizada en cuanto a una optimización con respecto a un consumo de energía total del tráfico ferroviario, mientras que otra regla de selección de acción está optimizada con respecto a una minimización de un retardo total de los vehículos ferroviarios del tráfico ferroviario. Una optimización de una regla de selección de acción m, n<2>, nN con respecto a un objetivo de control KPI<1>, KPI<2>, KPI<n>puede entenderse de manera que la respectiva regla de selección de acción m, n<2>, nN está configurada para determinar acciones de control correspondientes que, en el caso de la ejecución mediante los vehículos ferroviarios, conducen a una optimización del tráfico ferroviario con respecto al respectivo objetivo de control KPI<1>, KPI<2>, KPIn. Por consiguiente, en la etapa del procedimiento 105, de la pluralidad de reglas de selección de acción m, n<2>, nN almacenadas previamente, se selecciona la regla de selección de acción rn, n<2>, nN que está optimizada con respecto al objetivo de control KPI<1>, KPI<2>, KPIn recibido. In a method step 105, at least one action selection rule ni, n<2>, nN is then selected from a plurality of previously stored action selection rules m, n<2>, nN. The action selection rules m, n<2>, nN are configured to determine control actions based on rail traffic status data, which, in the case of executions by rail traffic vehicles, lead to an optimization of rail traffic with respect to a predetermined control objective KPI<1>, KPI<2>, KPI<n>. The individual action selection rules m, n<2>, nN are optimized with respect to an individual control objective KPI<1>, KPI<2>, KPI<n>. For example, an action selection rule rn, n<2>, nN is optimized with respect to an optimization with respect to a total energy consumption of rail traffic, while another action selection rule is optimized with respect to a minimization of a total delay of the rail vehicles of the rail traffic. An optimization of an action selection rule m, n<2>, nN with respect to a control objective KPI<1>, KPI<2>, KPI<n> can be understood such that the respective action selection rule m, n<2>, nN is configured to determine corresponding control actions that, in the case of execution by the rail vehicles, lead to an optimization of the rail traffic with respect to the respective control objective KPI<1>, KPI<2>, KPIn. Accordingly, in method step 105, from the plurality of previously stored action selection rules m, n<2>, nN, the action selection rule rn, n<2>, nN that is optimized with respect to the received control objective KPI<1>, KPI<2>, KPIn is selected.
Las acciones de control determinadas mediante las reglas de selección de acción m, n<2>, nN en base a los datos de estado del tráfico ferroviario, junto con órdenes de control efectivas para los vehículos ferroviarios, o de forma alternativa a las mismas, pueden comprender especificaciones de tiempo en forma de tiempos de llegada, de partida y/o de detención de los vehículos ferroviarios en paradas de la red ferroviaria. Una regla de selección de acción m, n<2>, nN optimizada por ejemplo en cuanto a un consumo de energía de la pluralidad de vehículos ferroviarios, de este modo, está configurada para, en base a los datos de estado del tráfico ferroviario, en los que están descritas al menos las posiciones de los vehículos ferroviarios en un instante determinado, determinar tiempos de llegada, de partida y/o de detención de los vehículos ferroviarios para paradas que deben controlarse en el futuro, en donde los tiempos de llegada, de partida y/o de detención están configurados de manera que al controlarse los vehículos ferroviarios se logra que los vehículos ferroviarios cumplan con los tiempos de llegada, de partida y/o de detención, reduciéndose a un mínimo el consumo de energía de los vehículos. The control actions determined by the action selection rules m, n<2>, nN on the basis of railway traffic status data, together with, or alternatively to, actual control orders for the railway vehicles, may comprise time specifications in the form of arrival, departure and/or stopping times of the railway vehicles at stops on the railway network. An action selection rule m, n<2>, nN optimized for example with respect to an energy consumption of the plurality of railway vehicles is thus configured to, based on railway traffic status data, in which at least the positions of the railway vehicles at a given time are described, determine arrival, departure and/or stopping times of the railway vehicles for stops that are to be controlled in the future, where the arrival, departure and/or stopping times are configured such that when controlling the railway vehicles, it is achieved that the railway vehicles comply with the arrival, departure and/or stopping times, reducing the energy consumption of the vehicles to a minimum.
Los tiempos de llegada, de partida y/o de detención determinados de modo correspondiente pueden variar aquí para distintos objetivos de control. Por ejemplo, para reducir un consumo de energía puede ser ventajoso que un vehículo se detenga más tiempo en una parada, para sincronizar la puesta en marcha del vehículo con la aceleración y/o el frenado de otros vehículos ferroviarios. En cambio, para reducir un retardo de los vehículos ferroviarios pueden no requerirse tiempos de detención más prolongados, ya que debido a eso se generarían muchos más retardos. Además, los tiempos de llegada, de partida y/o detención determinados de modo correspondiente dependen de los datos de estado del tráfico ferroviario y en particular de los posicionamientos de los vehículos individuales. The correspondingly determined arrival, departure, and/or stopping times may vary here for different control objectives. For example, to reduce energy consumption, it may be advantageous for a vehicle to stay longer at a stop in order to synchronize the vehicle's start with the acceleration and/or braking of other rail vehicles. In contrast, to reduce a delay for rail vehicles, longer stopping times may not be required, as this would result in significantly greater delays. Furthermore, the correspondingly determined arrival, departure, and/or stopping times depend on rail traffic data and, in particular, on the positions of the individual vehicles.
En una etapa del procedimiento 107, se ejecuta al menos una regla de selección de acción rn, n<2>, nN seleccionada en cuanto a los datos de estado recibidos del tráfico ferroviario y se determinan acciones de control correspondientes. Las acciones de control determinadas, por ejemplo los tiempos de llegada, de partida y/o de detención correspondientes, en este caso están configuradas de manera que al controlarse de modo correspondiente los vehículos ferroviarios el tráfico ferroviario puede pasarse a un estado que está optimizado con respecto al respectivo objetivo de control o que al menos está mejorado en comparación con estados anteriores en el tiempo. Por ejemplo, en un estado generado de ese modo, puede estar reducido un retardo con respecto a un horario predeterminado o puede estar reducido un consumo de energía. In a method step 107, at least one action selection rule rn, n<2>, nN selected with respect to the received rail traffic status data is executed, and corresponding control actions are determined. The determined control actions, for example, the corresponding arrival, departure, and/or stopping times, are configured in this case such that by controlling the rail vehicles accordingly, the rail traffic can be brought to a state that is optimized with respect to the respective control objective or at least improved compared to previous states in time. For example, in a state generated in this way, a delay relative to a predetermined schedule can be reduced or an energy consumption can be reduced.
En una etapa del procedimiento 109, las acciones de control según la forma de ejecución relativa a la Figura 1 se proporcionan a los distintos módulos del sistema 200, de manera que se posibilita un control del tráfico ferroviario. El control en este caso comprende el hecho de que los vehículos ferroviarios se controlen de manera que los vehículos ferroviarios observen los tiempos de llegada, de partida y/o de detención determinados en la etapa del procedimiento. Los tiempos de llegada, de partida y/o de detención correspondientes, en este caso, junto con una parada directamente situada adelante para un respectivo vehículo en una vía de la red de transporte, pueden considerar una pluralidad de paradas que son alcanzadas por el vehículo ferroviario en la vía en un periodo de tiempo predeterminado en el caso de un control correspondiente. Con ello, las acciones de control correspondientes, para un vehículo ferroviario, pueden comprender un conjunto de tiempos de llegada, de partida y/o de detención para una pluralidad de paradas. In a method step 109, control actions according to the embodiment shown in FIG. 1 are provided to the individual modules of the system 200, thereby enabling rail traffic control. Control in this case comprises controlling the railway vehicles such that the railway vehicles observe the arrival, departure, and/or stopping times determined in the method step. The corresponding arrival, departure, and/or stopping times, in this case, in addition to a stop directly ahead of a respective vehicle on a track of the transport network, may include a plurality of stops that are reached by the railway vehicle on the track within a predetermined time period in the case of a corresponding control. The corresponding control actions for a railway vehicle may thus comprise a set of arrival, departure, and/or stopping times for a plurality of stops.
Según una forma de ejecución, en la etapa del procedimiento 103 se recibe un objetivo de control KPI combinado. El objetivo de control KPI combinado comprende una pluralidad de los objetivos de control KPI<1>, KPI<2>, KPI<n>predeterminados, que respectivamente se incluyen con ponderaciones W<1>, W<2>, W<n>individuales en el objetivo de control KPI combinado. Un objetivo de control KPI combinado, con ello, puede comprender por ejemplo una optimización simultánea con respecto a un consumo de energía, y con respecto a una minimización de un retardo total del tráfico ferroviario, donde la optimización con respecto al consumo de energía y la optimización con respecto al retardo total pueden incluirse en cualquier relación, por ejemplo de 60 a 40, en el objetivo de control KPI combinado. Con ello, un control puede tener lugar de manera que por ejemplo se alcancen en un 60% una reducción del consumo de energía y en un 40% una reducción de un retardo. Los objetivos de control descritos y las relaciones y porcentajes indicados son solamente ilustrativos y no representan ninguna limitación de la invención. According to one embodiment, a combined KPI control objective is received in method step 103. The combined KPI control objective comprises a plurality of the predetermined control objectives KPI<1>, KPI<2>, KPI<n>, which are respectively included with individual weights W<1>, W<2>, W<n> in the combined KPI control objective. A combined KPI control objective can thus comprise, for example, simultaneous optimization with respect to energy consumption and with respect to minimization of a total delay of rail traffic, where the optimization with respect to energy consumption and the optimization with respect to total delay can be included in the combined KPI control objective in any ratio, for example from 60 to 40. In this way, control can be carried out such that, for example, a 60% reduction in energy consumption and a 40% reduction in delay are achieved. The control objectives described and the ratios and percentages indicated are illustrative only and do not represent any limitation of the invention.
En la etapa del procedimiento 105, a continuación, se selecciona una pluralidad de reglas de selección de acción n , n<2>, nN de las reglas de selección de acción ni, n<2>, nN previamente almacenadas. Las reglas de selección de acción n , n<2>, nN seleccionadas en este caso están optimizadas en cuanto a objetivos de control KPI<1>, KPI<2>, KPIn correspondientes del objetivo de control KPI combinado. In method step 105, a plurality of action selection rules n, n<2>, nN are then selected from the previously stored action selection rules ni, n<2>, nN. The action selection rules n, n<2>, nN selected in this case are optimized with respect to corresponding control objectives KPI<1>, KPI<2>, KPIn of the combined control objective KPI.
En la etapa del procedimiento 107, a continuación, se ejecutan las reglas de selección de acción n , n<2>, nN de la pluralidad seleccionada, según una relación de ejecución. La relación de ejecución, en este caso, para cada una de las reglas de selección de acción n , n<2>, nN seleccionadas, describe una porción de tiempo en una duración de ejecución total de la pluralidad de reglas de selección de acción n , n<2>, nN ejecutadas y permite cumplir con el objetivo de control KPI combinado mediante la ejecución de las reglas de selección de acción rn, n<2>, nN seleccionadas, según la relación de ejecución correspondiente. Para controlar el tráfico ferroviario, los vehículos ferroviarios, según las acciones de control determinadas mediante las reglas de selección de acción rn, n<2>, nN seleccionadas, se controlan en la respectiva relación de ejecución. En este caso, la relación de ejecución puede corresponder a la ponderación de los objetivos de control KPI<1>, KPI<2>, KPIn individuales del objetivo de control KPI combinado, de modo que el tráfico ferroviario, según el ejemplo antes descrito, se controla por ejemplo en un 60 % de un periodo de control, según una optimización con respecto a un consumo de energía y en un 40 % del periodo de ejecución según una optimización con respecto a un retardo total. El control de los vehículos ferroviarios, de este modo, tiene lugar según las acciones de control determinadas mediante las reglas de selección de acción rn, n<2>, m La relación de ejecución, sin embargo, también puede diferir de la respectiva ponderación W<1>, W<2>, W<n>de los objetivos de control KPI<1>, KPI<2>, KPIn individuales del objetivo de control KPI combinado. In method step 107, the action selection rules n, n<2>, nN of the selected plurality are then executed according to an execution relationship. The execution relationship, in this case for each of the selected action selection rules n, n<2>, nN, describes a time portion in a total execution duration of the plurality of executed action selection rules n, n<2>, nN and makes it possible to meet the combined KPI control objective by executing the selected action selection rules rn, n<2>, nN according to the corresponding execution relationship. In order to control rail traffic, railway vehicles are controlled in the respective execution relationship according to the control actions determined by the selected action selection rules rn, n<2>, nN. In this case, the execution ratio may correspond to the weighting of the individual control objectives KPI<1>, KPI<2>, KPIn of the combined control objective KPI, so that, according to the example described above, rail traffic is controlled, for example, in 60% of a control period based on an optimization with respect to energy consumption and in 40% of the execution period based on an optimization with respect to total delay. The control of the railway vehicles thus takes place according to the control actions determined by the action selection rules rn, n<2>, m. The execution ratio, however, may also differ from the respective weighting W<1>, W<2>, W<n> of the individual control objectives KPI<1>, KPI<2>, KPIn of the combined control objective KPI.
La relación de ejecución, en este caso, según una forma de ejecución, puede describir una duración de ejecución t<1>, t2, tN para cada una de las reglas de selección de acción n , n<2>, nN individuales y/o puede determinar una secuencia en el tiempo de la pluralidad de reglas de selección de acción n , n<2>, m Con ello, de acuerdo con el ejemplo antes descrito, el tráfico ferroviario puede optimizarse por una duración de ejecución t<1>, t2 determinada de modo correspondiente con respecto al consumo de energía y puede optimizarse por una duración t<1>, t2 correspondiente con respecto a un retardo total. Las duraciones de ejecución t<1>, t2, en este caso, pueden dividirse en ventanas de tiempo correspondientes, de manera que, por ejemplo, de forma alternada, el tráfico ferroviario puede optimizarse con respecto a un objetivo de control y a continuación con respecto al otro. The execution relationship, in this case, according to one embodiment, may describe an execution duration t<1>, t2, tN for each of the individual action selection rules n, n<2>, nN and/or may determine a temporal sequence of the plurality of action selection rules n, n<2>, m. Thus, in accordance with the example described above, rail traffic may be optimized with respect to energy consumption by a correspondingly determined execution duration t<1>, t2 and optimized with respect to a total delay by a corresponding duration t<1>, t2. The execution durations t<1>, t2 may in this case be divided into corresponding time windows, so that, for example, rail traffic may be optimized alternately with respect to one control objective and then with respect to the other.
El control del tráfico ferroviario según la relación de ejecución y la duración de ejecución t<1>, t<2>, tN determinada de modo correspondiente, para las distintas reglas de selección de acción n , n<2>, m , significa aquí que los vehículos ferroviarios se controlan por una duración de ejecución, de manera que se alcanzan u observan esos tiempos de llegada, de partida y/o de detención, que son adecuados para alcanzar un primer objetivo de control, y se controlan por otra duración de ejecución para alcanzar u observar otros tiempos de llegada, de partida y/o de detención, que están configurados para alcanzar otro objetivo de control del objetivo de control combinado. Rail traffic control according to the execution ratio and the correspondingly determined execution duration t<1>, t<2>, tN for the individual action selection rules n, n<2>, m means here that the railway vehicles are controlled for one execution duration such that those arrival, departure and/or stopping times are reached or observed, which are suitable for achieving a first control objective, and are controlled for another execution duration in order to reach or observe other arrival, departure and/or stopping times, which are configured to achieve a further control objective of the combined control objective.
Según otra forma de ejecución, la relación de ejecución, para cada regla de selección de acción ni, n<2>, nN seleccionada, puede determinar una probabilidad de ejecución P, según la cual la regla de selección de acción rn, n<2>, nN debe ejecutarse en un periodo de ejecución. Según la relación de ejecución, con ello, se determina de forma estocástica con qué probabilidad P debe ejecutarse cada regla de selección de acción ni, n<2>, nN en un periodo de ejecución correspondiente. Esto significa que el tráfico ferroviario, según la probabilidad de ejecución P correspondiente, puede optimizarse durante un periodo de ejecución con respecto al consumo de energía o al retardo total. Un tiempo de ejecución, por ejemplo, puede estar dado por un tiempo de ciclo en el caso de un control cíclico del tráfico ferroviario, de manera que para cada tiempo de ciclo, de un ciclo que debe ejecutarse del control del tráfico ferroviario, según las probabilidades de ejecución P correspondientes, el tráfico ferroviario puede optimizarse con respecto a los respectivos objetivos de control KPIi, KPI<2>, KPI<n>. According to another execution method, the execution ratio, for each selected action selection rule ni, n<2>, nN, can determine an execution probability P, according to which the action selection rule rn, n<2>, nN must be executed in an execution period. Depending on the execution ratio, the probability with which each action selection rule ni, n<2>, nN must be executed in a corresponding execution period is stochastically determined. This means that rail traffic, depending on the corresponding execution probability P, can be optimized during an execution period with respect to energy consumption or total delay. An execution time, for example, can be given by a cycle time in the case of cyclic rail traffic control, such that for each cycle time of a cycle to be executed of rail traffic control, according to the corresponding execution probabilities P, rail traffic can be optimized with respect to the respective control objectives KPIi, KPI<2>, KPI<n>.
La selección en la etapa del procedimiento 105 y/o la ejecución en la etapa del procedimiento 107 de la pluralidad de reglas de selección de acción ni, n<2>, nN, puede ejecutarse mediante una función de división de tiempo 300. La función de división de tiempo 300, en este caso, mediante técnicas del aprendizaje automático, puede determinar relaciones de ejecución correspondientes considerando objetivos de control KPI combinados. La función de división de tiempo 300, por ejemplo, puede estar entrenada mediante aprendizaje de refuerzo. En particular, la función de división de tiempo 300 puede estar diseñada mediante una red neuronal 303 entrenada de modo correspondiente. The selection in method step 105 and/or the execution in method step 107 of the plurality of action selection rules ni, n<2>, nN may be executed by a time-slicing function 300. The time-slicing function 300, in this case by machine learning techniques, may determine corresponding execution ratios taking into account combined KPI control objectives. The time-slicing function 300, for example, may be trained by reinforcement learning. In particular, the time-slicing function 300 may be designed by a correspondingly trained neural network 303.
De manera correspondiente, las reglas de selección de acción rn, n<2>, nN están entrenadas mediante aprendizaje de refuerzo en cuanto a una optimización con respecto a los respectivos objetivos de control KPIi, KPI<2>, KPIn. Las reglas de selección de acción rn, n<2>, nN igualmente pueden estar diseñadas como redes neuronales entrenadas de modo correspondiente. Correspondingly, the action selection rules rn, n<2>, nN are trained using reinforcement learning to optimize the respective control objectives KPIi, KPI<2>, KPIn. The action selection rules rn, n<2>, nN can also be designed as correspondingly trained neural networks.
El entrenamiento de la función de división de tiempo 300, así como de las reglas de selección de acción rn, n<2>, nN, en este caso pueden ejecutarse en base a datos de simulación de una simulación de un tráfico ferroviario. Los datos de simulación, en este caso, pueden proporcionarse mediante una simulación correspondiente, por ejemplo mediante el programa de simulación Falko. The training of the time-division function 300, as well as the action selection rules rn, n<2>, nN, can in this case be performed using simulation data from a railway traffic simulation. The simulation data, in this case, can be provided by a corresponding simulation, for example by the Falko simulation program.
El entrenamiento de las reglas de selección de acción rn, n<2>, nN comprende una maximización de una función de recompensa y/o el entrenamiento de la función de división de tiempo 300 puede comprender en este caso una maximización de una función de recompensa que, de modo correspondiente, comprende los respectivos objetivos de control KPIi, KPI<2>, KPI<n>u objetivos de control KPI combinados. The training of the action selection rules rn, n<2>, nN comprises a maximization of a reward function and/or the training of the time-slicing function 300 may in this case comprise a maximization of a reward function which, correspondingly, comprises the respective control objectives KPIi, KPI<2>, KPI<n> or combined KPI control objectives.
El entrenamiento de las reglas de selección de acción rn, n<2>, nN puede realizarse aquí individualmente, de modo que cada regla de selección de acción rn, n<2>, nN se entrena para un objetivo de control KPIi, KPI<2>, KPIn individual. En base a las reglas de selección de acción rn, n<2>, nN entrenadas previamente, a continuación, la función de división de tiempo 300 puede entrenarse para distintos objetivos de control KPI combinados, que respectivamente, considerando diferentes ponderaciones Wi, W<2>, W<n>, comprenden los objetivos de control KPIi, KPI<2>, KPIn de las reglas de selección de acción rn, n<2>, nN individuales, en cuanto a la determinación de relaciones de ejecución correspondientes. The training of the action selection rules rn, n<2>, nN can be carried out individually here, such that each action selection rule rn, n<2>, nN is trained for an individual control objective KPIi, KPI<2>, KPIn. Based on the pre-trained action selection rules rn, n<2>, nN, the time-slicing function 300 can then be trained for various combined control objectives KPI, which, taking into account different weights Wi, W<2>, W<n>, comprise the control objectives KPIi, KPI<2>, KPIn of the individual action selection rules rn, n<2>, nN, in terms of determining corresponding execution relationships.
De manera alternativa, puede efectuarse un entrenamiento simultáneo de las reglas de selección de acción ni, n<2>, nN y de la función de división de tiempo 300. En un entrenamiento simultáneo de las reglas de selección de acción rn, n<2>, nN y de la función de división de tiempo 300, de este modo, las reglas de selección de acción rn, n<2>, nN previamente entrenadas y optimizadas en cuanto a los objetivos de control KPIi, KPI<2>, KPIn individuales, pueden entrenarse para cumplir con el objetivo de control KPI combinado, mientras que la función de división de tiempo 300 se entrena para determinar una relación de ejecución correspondiente. Alternatively, a simultaneous training of the action selection rules ni, n<2>, nN and the time-slicing function 300 may be performed. In a simultaneous training of the action selection rules rn, n<2>, nN and the time-slicing function 300, thus, the action selection rules rn, n<2>, nN pre-trained and optimized with respect to the individual control objectives KPIi, KPI<2>, KPIn may be trained to meet the combined control objective KPI, while the time-slicing function 300 is trained to determine a corresponding execution ratio.
El procedimiento según la invención puede aplicarse en una pluralidad de objetivos de control KPIi, KPI<2>, KPIn deseados y objetivos de control KPI combinados correspondientes, y puede aplicarse en cuanto a un número deseado correspondiente de reglas de selección de acción rn, n<2>, nN entrenadas de modo correspondiente. The method according to the invention can be applied to a plurality of desired control objectives KPIi, KPI<2>, KPIn and corresponding combined control objectives KPI, and can be applied with respect to a corresponding desired number of action selection rules rn, n<2>, nN trained accordingly.
La Figura 3 muestra un diagrama de una optimización de un tráfico ferroviario con respecto a dos objetivos de control (KPIi, KPI<2>, KPIn). Figure 3 shows a diagram of a railway traffic optimization with respect to two control objectives (KPIi, KPI<2>, KPIn).
La Figura 3 muestra un diagrama de un Frente de Pareto de un tráfico ferroviario que se controla u optimiza con respecto a dos objetivos de control KPIi, KPI<2>. El diagrama en la Figura 3 muestra en este caso una optimización porcentual Oí con respecto al primer objetivo de control KPIi y una optimización porcentual O<2>con respecto al segundo objetivo de control KPI<2>. Se muestran varios estados optimizados Opt, Opt1, Opt2. Los puntos representados del Frente de Pareto muestran aquí optimizaciones del tráfico ferroviario con respecto a los dos objetivos de optimización KP1<1>, KPI<2>para ponderaciones W<2>diferentes del segundo objetivo de control KPI<2>. El punto Opt1 muestra aquí un estado optimizado del tráfico ferroviario para una ponderación W<2>igual a 0 del segundo objetivo de control KPI<2>, de modo que el tráfico ferroviario, en el estado de optimización Opt1 mostrado, está optimizado en 100 % con respecto al primer objetivo de control KPI<1>. El estado optimizado Opt2, en cambio, muestra una optimización del tráfico ferroviario para una ponderación W<2>igual a 100 del segundo objetivo de control KPI<2>, de modo que en ese estado optimizado el tráfico ferroviario está optimizado exclusivamente en una optimización con respecto al segundo objetivo de control KPI<2>. Los otros estados optimizados muestran distintas relaciones de los dos objetivos de control KPI<1>, KPI<2>que, según las respectivas ponderaciones W<1>, W<2>, están reunidos en un objetivo de control KPI combinado. Figure 3 shows a Pareto front diagram of rail traffic that is controlled or optimized with respect to two control objectives KPIi, KPI<2>. The diagram in Figure 3 shows in this case a percentage optimization Oi with respect to the first control objective KPIi and a percentage optimization O<2> with respect to the second control objective KPI<2>. Several optimized states Opt, Opt1, Opt2 are shown. The plotted points of the Pareto front show optimizations of rail traffic with respect to the two optimization objectives KP1<1>, KPI<2> for different weights W<2> of the second control objective KPI<2>. Point Opt1 shows here an optimized state of rail traffic for a weight W<2> equal to 0 of the second control objective KPI<2>, such that rail traffic, in the shown optimization state Opt1, is 100 % optimized with respect to the first control objective KPI<1>. The optimized state Opt2, on the other hand, shows an optimization of rail traffic for a weighting W<2> of 100 of the second control objective KPI<2>, so that in this optimized state, rail traffic is optimized exclusively with respect to the second control objective KPI<2>. The other optimized states show different relationships of the two control objectives KPI<1>, KPI<2>, which, depending on the respective weights W<1>, W<2>, are combined into a combined control objective KPI.
En el diagrama mostrado está representada una optimización del tráfico ferroviario con respecto a un estado de referencia Ref, de modo que las optimizaciones porcentuales O<1>, O<2>están representadas como mejoras del tráfico ferroviario con respecto a los primeros y segundos objetivos de control KPI<1>, KPI<2>con respecto al estado de referencia Ref. The diagram shown represents an optimization of railway traffic with respect to a reference state Ref, such that the percentage optimizations O<1>, O<2> are represented as improvements of railway traffic with respect to the first and second control objectives KPI<1>, KPI<2> with respect to the reference state Ref.
Los valores numéricos mostrados son solamente ilustrativos y no representan una optimización real de un tráfico ferroviario. El proceso de optimización representado del tráfico ferroviario por ejemplo puede describir una situación en la que mediante el funcionamiento de los vehículos ferroviarios el tráfico ferroviario ha diferido de un horario optimizado predeterminado y, con ello, mediante la ejecución del procedimiento según la invención y mediante la optimización correspondiente del tráfico ferroviario con respecto a los respectivos objetivos de control KPI<1>, KPI<2>, KPI<n>, debe conseguirse una mejora o reconducción del tráfico ferroviario al horario optimizado predeterminado, considerando los respectivos objetivos de control. The numerical values shown are for illustrative purposes only and do not represent an actual optimization of rail traffic. The illustrated rail traffic optimization process can, for example, describe a situation in which, due to the operation of rail vehicles, rail traffic has deviated from a predetermined optimized timetable, and thus, by performing the method according to the invention and by correspondingly optimizing rail traffic with respect to the respective control objectives KPI<1>, KPI<2>, KPI<n>, an improvement in or redirection of rail traffic to the predetermined optimized timetable is to be achieved, taking into account the respective control objectives.
La Figura 4 muestra una representación esquemática de una ejecución de dos reglas de selección de acción (rn, n<2>) según una relación de ejecución. Figure 4 shows a schematic representation of an execution of two action selection rules (rn, n<2>) according to an execution relationship.
La Figura 4 muestra una curva en el tiempo de una ejecución de dos reglas de selección de acción ni, n<2>durante un periodo de ejecución que, en la forma de ejecución mostrada, está dado mediante un tiempo de ciclo tc. En la forma de ejecución mostrada, la primera regla de selección de acción rn respectivamente se ejecuta para una primera duración de ejecución t<1>, mientras que la segunda regla de selección de acción n<2>, a continuación, se ejecuta para una segunda duración de ejecución t<2>. En la forma de ejecución mostrada, el periodo de ejecución del tiempo de ciclo tc se ejecuta respectivamente en intervalos de tiempo ts individuales. Las reglas de selección de acción m, n respectivamente se ejecutan en los intervalos de tiempo ts y, con ello, según las respectivas acciones de control, provocan pasajes del tráfico ferroviario a distintos estados St, St+<1>, ..., St+<9>. La representación en la Figura 4 muestra un ejemplo de una relación de ejecución en la que a cada regla de selección de acción m, n<2>está asociada una duración de ejecución t<1>, t<2>correspondiente. De forma alternativa a lo mencionado, a las primeras y segundas reglas de selección de acción m, n<2>pueden asociarse probabilidades de ejecución P correspondientes, de modo que las reglas de selección de acción m, n<2>se ejecuten en los intervalos de tiempo ts individuales, según las probabilidades de ejecución P respectivamente asociadas. Figure 4 shows a time curve of an execution of two action selection rules ni, n<2> over an execution period which, in the execution form shown, is given by a cycle time tc. In the execution form shown, the first action selection rule rn is executed for a first execution duration t<1>, while the second action selection rule n<2> is then executed for a second execution duration t<2>. In the execution form shown, the execution period of cycle time tc is executed in individual time intervals ts. The action selection rules m, n are executed in time intervals ts and thus, depending on the respective control actions, cause the rail traffic to transition to different states St, St+<1>, ..., St+<9>. The representation in Figure 4 shows an example of an execution relationship in which each action selection rule m, n<2> is associated with a corresponding execution duration t<1>, t<2>. Alternatively, corresponding execution probabilities P can be associated with the first and second action selection rules m, n<2>, such that the action selection rules m, n<2> are executed in the individual time intervals ts according to the respectively associated execution probabilities P.
La Figura 5 muestra una representación esquemática de una arquitectura para una función de división de tiempo 300, según una forma de ejecución. Figure 5 shows a schematic representation of an architecture for a time division function 300, according to one embodiment.
La Figura 5 muestra una arquitectura de una función de división de tiempo 300 para la ejecución y el control de un tráfico ferroviario. En la función de ejecución mostrada, la función de división de tiempo 300 se aplica para controlar el tráfico ferroviario en cuanto a un objetivo de control KPI combinado que comprende objetivos de control KPI<1>, KPI<2>, KPI<n>provistos de las ponderaciones W<1>, W<2>, W<n>correspondientes. La función de división de tiempo 300 en este caso está configurada para generar una relación de ejecución según la forma de ejecución mostrada en la Figura 4, que para cada regla de selección de acción m, n<2>, nN determina una duración de ejecución correspondiente. Figure 5 shows an architecture of a time-slicing function 300 for the execution and control of rail traffic. In the execution function shown, the time-slicing function 300 is applied to control rail traffic with respect to a combined control objective KPI comprising control objectives KPI<1>, KPI<2>, KPI<n> provided with corresponding weights W<1>, W<2>, W<n>. The time-slicing function 300 in this case is configured to generate an execution relation according to the execution manner shown in Figure 4, which for each action selection rule m, n<2>, nN determines a corresponding execution duration.
En la forma de ejecución mostrada, la función de división de tiempo 300 comprende un módulo de división de tiempo 301 y un módulo de selección 302. El módulo de división de tiempo 301 está configurado para determinar relaciones de ejecución correspondientes para objetivos de control KPI combinados. Además, el módulo de selección 302 está configurado para, en base a las relaciones de ejecución determinadas, seleccionar las respectivas reglas de selección de acción rn, n<2>, m En la forma de ejecución mostrada, el módulo de división de tiempo 301 está diseñado como red neuronal 303. El módulo de selección 302, en la forma de ejecución mostrada, comprende además una función Argmax que está configurada para seleccionar las respectivas reglas de selección de acción m, n<2>, m In the shown embodiment, the time-slicing function 300 comprises a time-slicing module 301 and a selection module 302. The time-slicing module 301 is configured to determine corresponding execution relationships for combined KPI control objectives. Furthermore, the selection module 302 is configured to, based on the determined execution relationships, select respective action selection rules rn, n<2>, m. In the shown embodiment, the time-slicing module 301 is designed as a neural network 303. The selection module 302, in the shown embodiment, further comprises an Argmax function that is configured to select respective action selection rules m, n<2>, m.
Junto con los objetivos de control KPIi, KPI<2>, KPIn provistos de las ponderaciones Wi, W<2>, Wn, un operador de modulación mod, como función de activación, se incluye en la red neuronal 303 del módulo de división de tiempo 301. El operador de modulación mod posibilita en este caso una consideración de la división del tiempo de ciclo tc como periodo de ejecución en los intervalos de tiempo ts representados en la Figura 4. A diferencia de la forma de ejecución mostrada, el operador de modulación mod, como función de activación, también puede estar dispuesto en capas más profundas de la red neuronal. En conjunto, las estructuras de las redes neuronales, mostradas en las Figuras 5, 6, solamente son ilustrativas y no describen estructuras de redes neuronales que puedan realizarse de manera efectiva. In addition to the control objectives KPIi, KPI<2>, KPIn provided with the weights Wi, W<2>, Wn, a modulation operator mod is included as an activation function in the neural network 303 of the time-slicing module 301. The modulation operator mod enables the division of the cycle time tc as an execution period into the time intervals ts shown in Figure 4. In contrast to the execution method shown, the modulation operator mod can also be arranged as an activation function in deeper layers of the neural network. Overall, the neural network structures shown in Figures 5, 6 are merely illustrative and do not describe neural network structures that can be effectively implemented.
En la arquitectura mostrada, la función de división de tiempo 300 está entrenada para determinar una relación de ejecución correspondiente para objetivos de control KPI combinados del modo deseado, según la cual deben ejecutarse las reglas de selección de acción ni, n<2>, nN optimizadas en cuanto a los objetivos de control KPIi, KPI<2>, KPI<n>individuales. In the architecture shown, the time-slicing function 300 is trained to determine a corresponding execution ratio for desired combined KPI control objectives, according to which the action selection rules ni, n<2>, nN optimized with respect to the individual KPIi, KPI<2>, KPI<n> control objectives should be executed.
Para ejecutar la función de división de tiempo 300 y las reglas de selección de acción ni, n<2>, nN para controlar el tráfico ferroviario según el procedimiento 100 según la invención, durante la operación del tráfico ferroviario y durante la operación de la pluralidad de vehículos ferroviarios, se reciben datos de estado de los vehículos ferroviarios. En este caso, por ejemplo, los datos de estado pueden indicar que un estado real del tráfico ferroviario difiere de un horario predeterminado. In order to execute the time division function 300 and the action selection rules ni, n<2>, nN for controlling rail traffic according to the method 100 according to the invention, status data of the rail vehicles are received during the operation of the rail traffic and during the operation of the plurality of rail vehicles. In this case, for example, the status data may indicate that an actual status of the rail traffic differs from a predetermined timetable.
Con ello, un control del tráfico ferroviario puede prever llevar el tráfico ferroviario nuevamente a una coincidencia con el horario optimizado y, de modo correspondiente, reducir los retardos. Dicho control puede preverse con respecto a distintos objetivos de control KPIi, KPI<2>, KPIn. Por ejemplo, puede preverse el control del tráfico ferroviario con el mayor ahorro de energía posible. Alternativamente, puede preverse una reducción lo más rápida posible de los retardos. Rail traffic control can thus be designed to bring rail traffic back into line with the optimized timetable and, accordingly, reduce delays. This control can be planned with respect to various control objectives: KPIi, KPI<2>, and KPIn. For example, rail traffic control can be planned to be as energy-efficient as possible. Alternatively, delay reduction can be planned as quickly as possible.
En la forma de ejecución mostrada, se prevé el control del tráfico ferroviario considerando un objetivo de control KPI combinado que comprende una pluralidad de objetivos de control KPIi, KPI<2>, KPI<n>en una ponderación determinada. Por ejemplo, el control del tráfico ferroviario puede preverse de manera que el restablecimiento del horario óptimo tenga lugar considerando un consumo de energía minimizado y considerando un tiempo lo más reducido posible, hasta una nueva coincidencia con el horario optimizado. In the embodiment shown, rail traffic control is provided taking into account a combined control objective KPI comprising a plurality of control objectives KPIi, KPI<2>, KPI<n> in a given weighting. For example, rail traffic control can be provided such that the restoration of the optimal timetable takes place taking into account minimized energy consumption and the shortest possible time until the optimized timetable is again aligned.
Para controlar el tráfico ferroviario, por consiguiente, se recibe un objetivo de control KPI combinado correspondiente que comprende los respectivos objetivos de control KPIi, KPI<2>, KPI<n>previstos con ponderaciones correspondientes, donde las ponderaciones Wi, W2, W<n>, para cada KPIi, KPI<2>, KPI<n>, describen una prioridad dentro del control del tráfico ferroviario. For rail traffic control, therefore, a corresponding combined KPI control objective is received, comprising the respective planned control objectives KPIi, KPI<2>, KPI<n> with corresponding weights, where the weights Wi, W2, W<n>, for each KPIi, KPI<2>, KPI<n>, describe a priority within rail traffic control.
Para el control, la función de división de tiempo 300 se aplica en cuanto al objetivo de control KPI combinado recibido, y se determina una relación de ejecución correspondiente. La relación de ejecución indica aquí una relación según la cual deben ejecutarse las reglas de selección de acción m, n<2>, nN correspondientes a los respectivos objetivos de control KPIi, KPI<2>, KPI<n>y optimizadas en cuanto a los mismos, y según la cual el tráfico ferroviario debe controlarse con respecto a las respectivas acciones de control de las reglas de selección de acción m, n<2>, nN. For control, the time division function 300 is applied with respect to the received combined control objective KPI, and a corresponding execution relationship is determined. The execution relationship indicates a relationship according to which the action selection rules m, n<2>, nN corresponding to the respective control objectives KPIi, KPI<2>, KPI<n> and optimized with respect thereto are to be executed, and according to which the rail traffic is to be controlled with respect to the respective control actions of the action selection rules m, n<2>, nN.
Según la relación de ejecución determinada, mediante el módulo de selección 302 se seleccionan las reglas de selección de acción m, n<2>, nN correspondientes, y las reglas de selección de acción m, n<2>, nN seleccionadas se aplican en cuanto a los datos de estado del tráfico ferroviario recibidos. La aplicación de las reglas de selección de acción m, n<2>, nN en cuanto a los datos de datos de estado, del modo antes descrito, comprende la determinación de acciones de control correspondiente y eventualmente de tiempos de llegada, de partida y de detención correspondientes que están optimizados en cuanto a los respectivos objetivos de control. Cada regla de selección de acción m, n<2>, nN y las acciones de control que pueden determinarse de modo correspondiente mediante las mismas, están optimizadas en cuanto a uno de los objetivos de control. According to the determined execution relationship, the corresponding action selection rules m, n<2>, nN are selected by means of the selection module 302, and the selected action selection rules m, n<2>, nN are applied with respect to the received rail traffic status data. The application of the action selection rules m, n<2>, nN with respect to the status data, in the manner described above, comprises the determination of corresponding control actions and, if applicable, corresponding arrival, departure and stopping times that are optimized with respect to the respective control objectives. Each action selection rule m, n<2>, nN and the control actions that can be determined correspondingly by means thereof are optimized with respect to one of the control objectives.
Mediante una ejecución de una regla de selección de acción m, n<2>, nN en cuanto a los datos de estado del tráfico ferroviario, la regla de selección de acción m, n<2>, nN es capaz de determinar acciones de control que están configuradas para, al ser ejecutada por los vehículos ferroviarios, pasar el tráfico ferroviario desde un estado real a un estado que está optimizado con respecto al respectivo objetivo de control o que al menos está mejorado en comparación con el estado precedente en el tiempo. By executing an m, n<2>, nN action selection rule on the railway traffic state data, the m, n<2>, nN action selection rule is able to determine control actions that are designed to, when executed by the railway vehicles, transition the railway traffic from an actual state into a state that is optimized with respect to the respective control objective or that is at least improved compared to the preceding state in time.
En la forma de ejecución mostrada, la relación de ejecución describe una relación en el tiempo que a cada regla de selección de acción m, n<2>, nN involucrada asocia una duración de ejecución que indica el intervalo de tiempo durante el cual debe ejecutarse la respectiva regla de selección de acción m, n<2>, nN. La relación en el tiempo, en este caso, está configurada de manera que se alcanza el respectivo objetivo de control KPI combinado. In the execution form shown, the execution relationship describes a time relationship that associates an execution duration to each action selection rule m, n<2>, nN involved, indicating the time interval during which the respective action selection rule m, n<2>, nN is to be executed. The time relationship in this case is configured such that the respective combined KPI control objective is achieved.
El control del tráfico ferroviario puede ejecutarse cíclicamente, de modo que según ciclos de control predeterminados se reciben datos de estado y objetivos de control, la función de división de tiempo 300 se aplica en cuanto a los objetivos de control, se determinan relaciones de ejecución correspondientes, las reglas de selección de acción m, n<2>, nN correspondientes se ejecutan según las respectivas relaciones de ejecución en cuanto a los datos de estado recibidos, se determinan acciones de control correspondientes y los vehículos ferroviarios se controlan según las acciones de control y, con ello, el tráfico ferroviario se pasa a un estado optimizado o al menos mejorado con respecto al respectivo objetivo de control. The rail traffic control can be executed cyclically, such that according to predetermined control cycles, status data and control objectives are received, the time division function 300 is applied with respect to the control objectives, corresponding execution relationships are determined, the corresponding action selection rules m, n<2>, nN are executed according to the respective execution relationships with respect to the received status data, corresponding control actions are determined and the railway vehicles are controlled according to the control actions and, thereby, the railway traffic is brought to an optimized or at least improved state with respect to the respective control objective.
La representación mostrada de la función de división de tiempo 300 es solamente ilustrativa. La red neuronal 301 representada no representa una red neuronal que debe realizarse de manera efectiva. The depiction of the time-division function 300 shown is for illustrative purposes only. The depicted neural network 301 does not represent a neural network that should actually be implemented.
La Figura 6 muestra otra representación esquemática de una arquitectura de entrenamiento para una función de división de tiempo 300, según otra forma de ejecución. Figure 6 shows another schematic representation of a training architecture for a 300-time slice function, according to another implementation form.
La Figura 6 muestra otra forma de ejecución de una arquitectura para una función de división de tiempo 300. En la forma de ejecución mostrada, la función de división de tiempo 300 está entrenada para determinar una relación de ejecución que, para cada regla de selección de acción ni, n<2>, nN, determine probabilidades de ejecución P correspondientes. A diferencia de la forma de ejecución en la Figura 5, el módulo de selección 300 comprende una función Softmax 305 que está configurada para, en base a las probabilidades de ejecución P determinadas mediante el módulo de división de tiempo 301, seleccionar las reglas de selección de acción ni, n<2>, nN correspondientes. Figure 6 shows another embodiment of an architecture for a time-slicing function 300. In the embodiment shown, the time-slicing function 300 is trained to determine an execution relation that, for each action selection rule ni, n<2>, nN, determines corresponding execution probabilities P. Unlike the embodiment in Figure 5, the selection module 300 comprises a Softmax function 305 that is configured to, based on the execution probabilities P determined by the time-slicing module 301, select corresponding action selection rules ni, n<2>, nN.
La ejecución de la arquitectura tiene lugar de forma análoga a la ejecución de la arquitectura en la Figura 6. En lugar de la duración de ejecución allí descrita, en la arquitectura representada en la Figura 7, sin embargo, las distintas reglas de selección de acción se ejecutan por intervalos de tiempo predeterminados según las probabilidades de ejecución P determinadas mediante la función de división de tiempo 300. The execution of the architecture takes place analogously to the execution of the architecture in Figure 6. Instead of the execution duration described there, in the architecture represented in Figure 7, however, the individual action selection rules are executed at predetermined time intervals according to the execution probabilities P determined by means of the time division function 300.
La Figura 7 muestra un diagrama de un hipervolumen HV de un estado de optimización de un tráfico ferroviario. Figure 7 shows a hypervolume HV diagram of an optimization state of a railway traffic.
La Figura 7 muestra una representación gráfica de un hipervolumen HV para distintos estados optimizados de un tráfico ferroviario que debe optimizarse con respecto a dos objetivos de control KPIi, KPI<2>. En este caso, el hipervolumen puede utilizarse como variable objetiva para determinar la calidad de un proceso de entrenamiento o la calidad de las capacidades de optimización de las reglas de selección de acción m, n<2>, nN individuales, o de la función de división de tiempo 300. Figure 7 shows a graphical representation of a hypervolume HV for different optimized states of a rail traffic that needs to be optimized with respect to two control objectives KPIi, KPI<2>. In this case, the hypervolume can be used as an objective variable to determine the quality of a training process or the quality of the optimization capabilities of individual action selection rules m, n<2>, nN, or of the time slice function 300.
La Figura 8 muestra una representación esquemática de un producto de programa informático 40 que comprende comandos que, al ser ejecutado el programa mediante una unidad informática, disponen al mismo a ejecutar el procedimiento 100 según una de las formas de ejecución antes mencionadas. Figure 8 shows a schematic representation of a computer program product 40 comprising commands which, when the program is executed by a computing unit, arrange the program to execute the method 100 according to one of the aforementioned execution forms.
El producto de programa informático 400, en la forma de ejecución mostrada, está almacenado en un medio de almacenamiento 401. En este caso, el medio de almacenamiento 401 puede ser cualquier medio de almacenamiento conocido por el estado de la técnica. The computer program product 400, in the embodiment shown, is stored on a storage medium 401. In this case, the storage medium 401 may be any storage medium known to the prior art.
Si bien la invención fue ilustrada y descrita en detalle mediante el ejemplo de ejecución preferente, la invención no está limitada por los ejemplos descritos, y el experto puede deducir de éstos otras variaciones, sin abandonar el alcance de protección de la invención. Although the invention has been illustrated and described in detail by means of the preferred embodiment, the invention is not limited by the examples described, and the expert can deduce from them other variations, without abandoning the scope of protection of the invention.
Claims (15)
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP21170890.4A EP4082869B1 (en) | 2021-04-28 | 2021-04-28 | Method for controlling rail traffic of a plurality of railway vehicles, computing unit and computer program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES3023268T3 true ES3023268T3 (en) | 2025-05-30 |
Family
ID=75728682
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES21170890T Active ES3023268T3 (en) | 2021-04-28 | 2021-04-28 | Method for controlling rail traffic of a plurality of railway vehicles, computing unit and computer program |
Country Status (2)
| Country | Link |
|---|---|
| EP (1) | EP4082869B1 (en) |
| ES (1) | ES3023268T3 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE102023107969A1 (en) * | 2023-03-29 | 2024-10-02 | Bayerische Motoren Werke Aktiengesellschaft | CONTROL DEVICE AND METHOD FOR STATIC EXECUTION PLANNING AND EXECUTION OF NEURAL NETWORKS |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6459964B1 (en) * | 1994-09-01 | 2002-10-01 | G.E. Harris Railway Electronics, L.L.C. | Train schedule repairer |
| DE102010041078A1 (en) * | 2010-09-20 | 2012-03-22 | Siemens Aktiengesellschaft | Method for automatically controlling a plurality of track-bound vehicles |
| EP3814194B1 (en) * | 2018-08-31 | 2024-09-04 | Siemens Mobility GmbH | Energy optimisation during operation of a rail vehicle fleet |
| EP4035969B1 (en) * | 2021-01-29 | 2024-11-13 | Siemens Mobility GmbH | Controller, railway vehicle and method for training a controller for a railway vehicle |
| EP4082868A1 (en) * | 2021-04-27 | 2022-11-02 | Siemens Mobility GmbH | Method for optimizing rail traffic of a rail traffic network |
-
2021
- 2021-04-28 ES ES21170890T patent/ES3023268T3/en active Active
- 2021-04-28 EP EP21170890.4A patent/EP4082869B1/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| EP4082869B1 (en) | 2025-01-15 |
| EP4082869C0 (en) | 2025-01-15 |
| EP4082869A1 (en) | 2022-11-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10800416B2 (en) | Vehicle control system | |
| US12030517B2 (en) | Method and system for determining a driving maneuver | |
| US20240371264A1 (en) | Traffic control at an intersection | |
| CN112249033B (en) | Automatic driving system and method for vehicle | |
| KR102528317B1 (en) | Controllers, systems and methods for vehicle control | |
| Li et al. | Game theoretic modeling of vehicle interactions at unsignalized intersections and application to autonomous vehicle control | |
| US20190035269A1 (en) | Method for traffic control entity for controlling vehicle traffic | |
| JP7409810B2 (en) | Cooperative operation coordination method | |
| US20190144023A1 (en) | Route Resource Controlling Method, Intelligent Vehicle On-Board Controller and Object Controller | |
| US20200272159A1 (en) | Method and vehicle control system for intelligent vehicle control about a roundabout | |
| ES3023268T3 (en) | Method for controlling rail traffic of a plurality of railway vehicles, computing unit and computer program | |
| CN112088117B (en) | Method, control system and motor vehicle for operating a motor vehicle | |
| CA3153593A1 (en) | Method and apparatus for operation of railway systems | |
| Naumann et al. | Provably safe and smooth lane changes in mixed traffic | |
| Müller et al. | Time optimal scheduling of automated vehicle arrivals at urban intersections | |
| CN109034639B (en) | Scheduling control method | |
| Zheng et al. | Deep reinforcement learning for autonomous vehicles collaboration at unsignalized intersections | |
| Montanaro et al. | Cloud-assisted distributed control system architecture for platooning | |
| Molinari et al. | Traffic automation in urban road networks using consensus-based auction algorithms for road intersections | |
| Kala et al. | Heuristic based evolution for the coordination of autonomous vehicles in the absence of speed lanes | |
| US20250162628A1 (en) | Train control method, storage medium, on-board controller, and train | |
| Yuan et al. | Deep reinforcement learning based green wave speed guidance for human-driven connected vehicles at signalized intersections | |
| Schöner | “How Good Is Good Enough?” In Autonomous Driving | |
| Talaat et al. | Smart navigation system for emergency vehicles (SNSEV): utilizing fog and cloud computing technology for real-time traffic management | |
| Mao et al. | UCLF: An uncertainty-aware cooperative lane-changing framework for connected autonomous vehicles in mixed traffic |