WO2015079079A1

WO2015079079A1 - Método para el modelado del nivel de glucemia mediante programación genética

Info

Publication number: WO2015079079A1
Application number: PCT/ES2014/000190
Authority: WO
Inventors: José Ignacio HIDALGO PÉREZ; Antonio Oscar GARNICA ALCAZAR; Juan LANCHARES DÁVILA; Jose Luis RISCO MARTÍN; Jose Manuel COLMENAR VERDUGO; Alfredo CUESTA INFANTE; Estjer MÁQUEDA VILLAIZÁN; Marta BOTELLA SERRANO; José Antonio RUBIO GARCÍA
Original assignee: Universidad Complutense de Madrid
Current assignee: Universidad Complutense de Madrid
Priority date: 2013-11-27
Filing date: 2014-11-05
Publication date: 2015-06-04
Anticipated expiration: 2016-05-27
Also published as: ES2540159B1; ES2540159A1

Abstract

La invención consiste en un método que, aplicando algoritmos evolutivos sobre soluciones aleatorias y datos tomados de un paciente con glucemia, permite establecer un modelado del nivel de glucemia para obtener un modelado del nivel de glucosa en instantes futuros a los momentos de obtención de los datos del paciente. Los datos del paciente son al menos los niveles de glucosa, ingesta e insulina rápida y lenta para un intervalo de tiempo. El algoritmo evolutivo consiste básicamente en aplicar programación genética en su variante de gramáticas evolutivas o evolución gramatical. Es decir, aplicar gramáticas personalizadas en formato BNF, procesos de mapeo personalizados y evaluaciones de error concretas a las soluciones aleatorias o a modelos generados con anterioridad para obtener una expresión que describa y prediga los niveles de glucosa de un paciente. De entre todos los pacientes, el método de la presente invención está especialmente indicado para sujetos con Diabetes Mellitus.

Description

MÉTODO PARA EL MODELADO DEL NIVEL DE GLUCEMIA MEDIANTE PROGRAMACIÓN GENÉTICA

OBJETO DE LA INVENCIÓN

La presente invención propone aplicar la programación genética para encontrar un modelo personalizado que describa y prediga los niveles de glucosa de un paciente. De esta forma, la presente invención describe un método que, a partir de los datos históricos de un paciente que consisten en valores previos de glucosa, carbohidratos tomados e insulinas inyectadas, obtiene una expresión que puede usarse para predecir valores de glucosa en un futuro próximo.

El campo de aplicación de la presente invención es la estimación de la glucosa de un paciente a partir de los datos medidos. Debido a la naturaleza de la invención, la estimación de la glucosa de la presente invención permite a dispositivos que operen según el método de la presente invención, predecir los niveles de glucosa de un paciente. De entre todos los pacientes, el método de la presente invención está especialmente indicado para sujetos con Diabetes Mellitus.

ANTECEDENTES DE LA INVENCIÓN

La Diabetes Mellitus es una enfermedad causada por un defecto en la secreción o en la acción de la insulina, que es esencial para el control de los niveles de glucosa en sangre. En ambos casos el resultado es que las células no asimilan el azúcar y como consecuencia, se produce una subida en los niveles de glucosa en sangre o hiperglucemia. Existen distintos tipos de diabetes dependiendo de su naturaleza. Según la ADA (American Diabetes Association) podemos distinguir cuatro tipos de DM:

• Diabetes Tipo 1 (T1DM): Las células no producen insulina debido a un proceso autoinmune. Actualmente esto hace necesario que la persona se inyecte insulina exógena, ya sea mediante inyecciones puntuales o que utilice una bomba de insulina. Diabetes Tipo 2 (T2DM): El es resultado de una resistencia a la insulina, donde las células no consiguen utilizar la insulina correctamente. En ocasiones se combina con una ausencia, ya sea parcial o total de insulina.

Diabetes Gestacional: Aparece en los periodos de gestación en una de cada diez mujeres embarazada. El embarazo es un cambio en el metabolismo, ya que el feto utiliza la energía de la madre para obtener alimento, oxígeno y otros recursos. Esto hace que se produzca un descenso en la secreción de insulina por parte de la madre.

Otros tipos: como por ejemplo problemas en las células , defectos genéticos que afectan a la acción de la insulina, provocados por medicamentos, síndromes genéticos, etc.r

En la mayoría de los casos, los pacientes con una evolución larga de la enfermedad requieren la inyección de insulina exógena en varias dosis, o mediante una bomba de insulina. Es importante mantener un buen control glucémico para prevenir tanto las complicaciones agudas de la diabetes (cetoacidosis diabética e hipoglucemia, definida como un valor de glucosa en sangre inferior a 70mg=dl), como todas las complicaciones multi-crónicas asociadas a los pacientes diabéticos (nefropatía, retino patía, microangiopatía y macroangiopatía).

En los últimos años se ha demostrado que un control estricto del Nivel de glucemia en pacientes críticos mejora su evolución y reduce los costes médicos. El control de los niveles de glucosa es una tarea difícil y que requiere un esfuerzo por ambas partes, pacientes y sus familias. Para mantener buenos niveles de glucosa en sangre el paciente debe tener alguna capacidad de predicción para saber que nivel de glucosa tendría si toma cierta cantidad de comida o si se inyecta cierta cantidad de insulina de un determinado tipo. De hecho el objetivo final es evitar no sólo periodos de hiperglucemia (niveles de glucosa > 180 mg=dl) sino también episodios de Hipoglucemia severa (niveles de glucosa < 40mg=dl) que pueden llevar al paciente a la muerte. Uno de los aspectos que hace difícil el control de glucosa en sangre es la ausencia de un modelo general de respuesta tanto a la insulina como a los diversos factores mencionados anteriormente, debido principalmente a las particularidades de cada paciente. Los modelos presentes en el estado de la técnica aplican técnicas de modelado clásico que resultan en el uso de ecuaciones lineales, perfiles definidos o modelos con un conjunto limitado de entradas.

Otro tipo de técnicas conocidas del estado de la técnica y que nunca han sido utilizadas para realizar modelos de estimación de la glucosa son las técnicas evolutivas. Las técnicas evolutivas como la programación genética -(PG) -tienen ciertas características que las hacen especialmente útiles para abordar problemas de optimización y modelado complejo. En primer lugar son "simples" conceptualmente hablando y también lo es su aplicación. Sin embargo tienen una base teórica bien definida y ampliamente estudiada. La programación genética ha demostrado su aplicabilidad a multitud de problemas reales y es intrínsecamente paralelizables por trabajar con un conjunto de soluciones. Es más, los algoritmos evolutivos tienen un gran potencial para incorporar conocimiento acerca del dominio en el que trabajan y para incorporar otros mecanismos de búsqueda no necesariamente evolutivos.

Una de las aplicaciones más conocidas de la programación genética es la regresión simbólica y la aplicación de una de las variantes de la PG, las gramáticas evolutivas o en inglés Grammatical Evolution (GE) nos permite obtener soluciones para incorporar términos no-lineales. La gramática evolutiva GE es una técnica de computación evolutiva establecida en 1998 por el grupo de Conor Ryan en la Universidad de Limerick (Irlanda). La programación genética trata de encontrar programas ejecutables o funciones que respondan a unos datos de referencia. La principal ventaja es que la gramática evolutiva GE aplica operadores genéticos a una cadena completa lo que simplifica la aplicación de la búsqueda en diferentes lenguajes de programación. Además no tiene problemas de memoria, al contrario que la programación genética básica, donde la representación en árbol puede llevar al conocido problema de bloating (un crecimiento excesivo de las estructuras de datos del computador en la memoria).

Por todo ello, nosotros proponemos aplicar PG para encontrar un modelo personalizado que describa y prediga los niveles de glucosa de un paciente. Nuestro método tomará los datos históricos de un paciente que consisten en valores previos de glucosa carbohidratos tomados e insulinas inyectadas y a partir de ellos obtendrá una expresión que puede usarse para predecir valores de glucosa en un futuro próximo. Mediante los modelos del estado de la técnica no es posible conocer una estimación de la glucosa en sangre en pacientes ni de forma genérica ni personalizada al paciente. Ello implica que actualmente no es posible aplicar tratamientos adecuados a los pacientes con diabetes. Aunque existen muchos trabajos que usan modelos de control, hasta la fecha el problema del modelado no se ha abordado con técnicas de computación evolutiva. Esta solución no se ha abordado hasta la fecha debido a su complejidad mediante el uso de técnicas clásicas.

DESCRIPCIÓN DE LA INVENCIÓN

La presente invención propone una técnica nueva que implica obtener el modelo del paciente particularizado utilizando programación genética "GP" (del inglés "Genetic Programming"). La programación genética "GP" elimina las barreras relacionadas con la construcción del modelo, tales como la linealidad o la limitación en los parámetros de entrada. Mediante la aplicación de la programación genética "GP" en la forma divulgada por la presente invención, es posible encontrar un modelo personalizado que describa y prediga los niveles de glucosa de un paciente. El método de la presente invención toma los datos históricos de un paciente que consisten en valores previos de glucosa carbohidratos tomados e insulinas inyectadas y, a partir de ellos, obtiene una expresión que puede usarse para predecir valores de glucosa en un futuro próximo.

Un primer aspecto de la invención es un método para el modelado del nivel de glucemia que permite predecir la glucosa de un individuo. El método comprende los siguientes pasos: i) obtener de un individuo unos datos que comprendan, para un tiempo k, al menos: o unos niveles de glucosa GL;

o unos niveles de ingesta CH;

o unos niveles de insulina inyectada de efecto rápido IS e insulina inyectada de efecto lento IL;

ii) aplicar un Algoritmo Evolutivo a un conjunto de soluciones y a los datos anteriormente obtenidos;

iii) calcular una función GL de predicción de la glucosa para un tiempo posterior (k+1) al tiempo k, tal que:

GL(k + 1) = f(GL, CH, IS, IL).

El paso ii) adicionalmente comprende llevar a cabo los siguientes sub-pasos:

a) generar el conjunto de soluciones con N-soluciones aleatorias donde cada solución está formada por una cadena de caracteres (cromosoma);

b) calcular N-expresiones GL_k para k=l ,.. . ,N obtenidas mediante la decodifícación del conjunto de las N-soluciones aleatorias aplicando una gramática BNF y una función de mapeo;

c) calcular el error Ek que conlleva: calcular ek como la diferencia entre los datos obtenidos del paciente y las N-expresiones GL_k; y, aplicar una función de fítness a cada uno de los errores anteriormente calculados ei<; de tal forma que se obtiene para cada expresión GL_k, un error asociado Ek;

d) seleccionar N-1 soluciones resultado de: tomar las N-soluciones y apartar la solución de menor error Ek de las N-soluciones; enfrentar las N-1 soluciones tomadas de dos en dos, seleccionando la solución de menor error E ;

e) cruzar las N-1 soluciones anteriores mediante un algoritmo de probabilidad de cruce;

f) mutar un carácter de las N-1 soluciones anteriores mediante un algoritmo de probabilidad de mutación;

g) añadir la solución de menor error Ek apartada en el paso d) a las N-1 soluciones anteriores;

h) repetir los pasos c) a g) hasta cumplir una condición de parada predefinida. El algoritmo de probabilidad de cruce comprende:

i) tomar las N-l soluciones de dos en dos;

ii) establecer una probabilidad de cruce entre 0 y 1 ;

iii) generar un número aleatorio entre 0 y 1 ;

iv) si el número aleatorio generado es mayor que la probabilidad de cruce, no hay cruce;

v) si el número aleatorio generado es menor o igual que la probabilidad de cruce, se cruza parte de una solución con parte de la otra solución de tal forma que se mantiene la longitud de la cadena de caracteres.

Por otro lado, el algoritmo de probabilidad de mutación comprende:

i) tomar las N-l soluciones de una en una;

ii) establecer una probabilidad de mutación entre 0 y 1 ;

iii) generar un número aleatorio entre 0 y 1 ;

iv) si el número aleatorio generado es mayor que la probabilidad de mutación, no hay mutación;

v) si el número aleatorio generado es menor o igual que la probabilidad de mutación, se muta uno o más carácteres de la cadena de caracteres de tal forma que se mantiene la longitud de la cadena de caracteres.

Adicionalmente, la condición de parada predefinida es al menos una de las siguientes condiciones:

• máximo número de iteraciones;

· convergencia: no mejora en un número "p" de iteraciones;

• estar cerca de un óptimo teórico.

Por otro lado, la función de fitness es una de las siguientes funciones (ver tabla 2):

• mínimos cuadrados Fi (Least Squares);

· error medio F₂ (Average Error);

• error máximo F₃ (Máximum Error); • error cuadrático medio F₄ (RSME);

• desviación absoluta media F₅ (MAD).

Tabla 2.- Funciones de Fitness.

La predicción de la glucosa anteriormente calculada se obtenía a partir de cuatro datos de entrada tomado del paciente. No obstante, el número de datos de entrada puede ser variable hasta un total de veinticinco variables de entrada. Así, la solución GL(k + 1) de partida se ampliaría hasta tener una expresión como la siguiente:

GL(k + 1) =f(P,E,k,SI,IG,PG,CI,M,IC,IP,DI,OC, TI,FV, VI,PC, TE,FA,G(-),C(-), IS(-),

IL(-),F(-),E(-),Z) donde el operador^■ representa cualquier instante actual o anterior en el tiempo y donde / es una función que se calcula mediante una gramática BNF que comprende la siguiente forma:

I (<f><OP><f>)

I <PREOP>(<f>)

I <v>

I <z>

<OP> ::= + /

<PREOP> ::= SIN

COS

EXP

TAN

LOG

ABS

LN

TANH COSH SENH

DERIVAD A CON RESPECTO AL TIEMPO

DERIVAD A CUADRADO CON RESPECTO AL TIEMPO

DERIVAD A TERCERA CON RESPECTO AL TIEMPO

<A>

#{k}

<SI>

<IG>

<PG>

<CI>

<M>

<IC>

<IP>

<DI>

<OC>

<TI>

<FV>

|<TE>

|<FA>

|#{G[k-<J>]}

|#{C[k-<J>]}

|#{IS[k-<J>]}

|#{IL[k-<J>]}

|#{F[k-<J>]}

|#{E[k-<J>]}

|#<Z>

<P> ::= "el peso del individuo en kg.";

<E> ::= "edad del individuo en años";

<SI> ::= "unidades de glucemia que baja 1 unidad de insulina en mg/dl";

<IG> ::= "índice glucémico de la ingesta" (el de la glucosa es 1, y puede ser mayor o menor;)

<M> ::=0

<IC> ::= 5

<IP>::=0

<DI> ::=2

<OC> ::=3

<TI> ::= 12

<FV> ::=0.2

<VI>::=0.8

<PC> ::= 0.6

|-<D>.<D>

<J> ::=0

|1

12 13

I "instantes de tiempo" (por ejemplo: 96→ 24 horas a intervalos de 15 minutos = 96 instantes de tiempo. En el caso de usar otro horizonte de predicción u otro -periodo de muestreo habría que modificar esta regla)

<D> ::= 0

|1

12

|3

14

15

16

17

|8

19 donde los distintos parámetros de entrada son:

P: peso actual en kg;

A: edad actual en años;

k: instante actual;

FSI: sensibilidad a la insulina o mg/dl que baja la glucemia por unidad de insulina; IG: es el índice glucémico;

PG: unidades proteína/grasa: cantidad de alimento que aporta lOOKcal en forma de grasa y/o proteínas, se mide en unidades;

CI: ratio Hidratos de carbono / insulina;

M: menstruación-, Sí =1 ó no=0;

IC: insulina Circulante, unidades de insulina;

IP: intervalo entre comienzo de la infusión de insulina prandial y comienzo de la ingesta, en intervalos de 15 minutos;

DI: tiempo de duración de la última ingesta en intervalos de 15 minutos; OC: orden en que se consumen los alimentos; (número natural correspondiente a una fila en una tabla de posibles ordenaciones)

TI: tiempo desde la última ingesta en intervalos de 15 minutos;

FV: factor de variabilidad de absorción, valor entre 0 y 1 ;

VI: variabilidad de la insulina, valor entre 0 y 1 ;

PC: preparación de la comida (fritos, asados, condimentos...), valor entre 0 y 1 ;

FTSI: factor transitorio de sensibilidad a la insulina, vendrá determinado por el efecto de distintos tipos de enfermedades que tiene el paciente y por los fármacos que toma el paciente, que aumentan o disminuyen la glucosa, y el efecto de la insulina. Lo definimos como un valor que va de -1 a l ;

Z: es una constante;

en cuanto a históricos:

G(-) es el histórico de la glucemia (o parte de él);

C(-) es el histórico de carbohidratos;

IS(-) es la insulina de acción corta;

IL(-) es la insulina de acción larga;

F(-) es el ejercicio físico; y,

Ε(·) es el nivel de estrés. Respecto de la función de mapeo indicada anteriormente, ésta comprende la siguiente expresión:

Choicei = (CIV)MOD (# of choices )

donde Choice¡ es la elección seleccionada para el no-terminal i, CIV es el codón que estamos decodificando, MOD es la función módulo y (# of choices¡) es el número de opciones posibles para la regla en el terminal i.

Hasta aquí queda descrito el método de la presente invención cuando partimos de cero. Es decir, no existe un modelo anterior de la presente invención aplicado al paciente. En caso de existir un modelo anterior, método de la presente invención, entre los pasos i) y ii), opcionalmente comprendía evaluar si es o no correcta la función GL (=modelo) de predicción de la glucosa. En otro aspecto de la presente invención, la presente invención comprende un programa de ordenador para la ejecución de un método para el modelado del nivel de glucemia la predicción de la glucosa según una cualquiera de la realizaciones descritas anteriormente o en el apartado "descripción de una o varias formas de realización de la invención".

En otro aspecto de la presente invención, la presente invención comprende un medio de almacenamiento que contiene un programa de ordenador para la ejecución de un método para el modelado del nivel de glucemia la predicción de la glucosa según una cualquiera de la realizaciones descritas anteriormente o en el apartado "descripción de una o varias formas de realización de la invención".

El último aspecto de la presente invención está comprendido por un sistema computacional en el que se carga el programa de ordenador anteriormente descrito.

BREVE DESCRIPCIÓN DE LAS FIGURAS

Figura 1.- Representa un diagrama de flujo para calcular el modelo de predicción de la glucosa.

Figura 2.- Representa un diagrama de flujo para calcular el modelo de predicción de la glucosa en una implementación web.

Figura 3.- Es el ejemplo de gramática en BNF diseñada para regresión simbólica.

Figura 4.- Es un primer ejemplo de gramática BNF.

Figura 5.- Es un segundo ejemplo de gramática BNF.

Figura 6.- Es un tercer ejemplo de gramática BNF. Figura 7.- Es un cuarto ejemplo de gramática BNF. DESCRIPCIÓN DE UNA O VARIAS FORMAS DE REALIZACIÓN DE LA

INVENCIÓN

Seguidamente se realiza una descripción de una o varias formas de realización de la invención que, de forma no limitativa, ayudan a la mejor comprensión de la presente invención.

La figura 1 muestra un diagrama de flujo del método de acuerdo con la presente invención. Primeramente, se realiza una recogida de datos 1 durante un periodo de tiempo determinado k, por ejemplo siete días. Los datos recogidos son al menos los niveles de glucosa GL, los niveles de ingesta CH y los niveles de insulina de efecto rápido IS y de efecto lento -IL. Posteriormente, se evalúa 2 si el modelo (=función GL) es correcto (si ya existe previamente un modelo). En caso afirmativo, se continúa recogiendo datos. En caso contrario, se aplica un algoritmo evolutivo 3 consistente, básicamente, en personalizar una gramática en formato BNF 4 mediante la aplicación de una función de mapeo 5. Como resultado de la aplicación del algoritmo evolutivo 3, se obtiene un nuevo modelo caracterizado por la función 6:

G^~L{k + 1) = f(Gl, CH, IS, IL)

que depende de los datos recogidos que son al menos GL, CH, IS e IL. Los datos recogidos se pueden ampliar con una o varias variables de entrada hasta obtener un modelo caracterizado por una función con la siguiente expresión:

GL(k + 1) =f(P,E,k,SIIG,PG, CIM,IC,IP,DI OC, TIFV, VI,PC, TE,FA, G(-), C(-), IS(-),

IL(-),F(-),E(-),Z)

donde:

P: peso actual en kg;

A: edad actual en años;

k: instante actual;

FSI: sensibilidad a la insulina o mg/dl que baja la glucemia por unidad de insulina; IG: es el índice glucémico u;

PG: unidades proteína/grasa: cantidad de alimento que aporta l OOKcal en forma de grasa y/o proteínas, se mide en unidades;

CI: ratio Hidratos de carbono / insulina;

M: menstruación (días desde la última menstruación), Sí =1 ó no=0;

IC: insulina Circulante, unidades de insulina;

DI: tiempo de duración de la última ingesta en intervalos de 15 minutos;

OC: orden en que se consumen los alimentos; (número natural correspondiente a una fila en una tabla de posibles ordenaciones)

TI: tiempo desde la última ingesta en intervalos de 15 minutos;

FV: factor de variabilidad de absorción, valor entre 0 y 1 ;

VI: variabilidad de la insulina, valor entre 0 y 1 ;

PC: preparación de la comida (fritos, asados, condimentos..), valor entre 0 y 1 ;

FTSI: factor transitorio de sensibilidad a la insulina, vendrá determinado por el efecto de distintos tipos de enfermedades que tiene el paciente y por los fármacos que toma el paciente, que aumentan o disminuyen la glucosa, y el efecto de la insulina. Lo definimos como un valor que va de -1 a 1 ;

Z: es una constante;

en cuanto a históricos:

G(-) es el histórico de la glucemia (o parte de él);

C(-) es el histórico de carbohidratos;

IS(-) es la insulina de acción corta;

IL(-) es la insulina de acción larga;

F(-) es el ejercicio físico; y,

Ε(·) es el nivel de estrés.

La figura 2 muestra un diagrama de flujo donde el método de la presente invención se encuentra implementado dentro de un sistema computacional que comprende una base de datos 7 y una aplicación web 8, a través de la cual, un paciente 9 puede introducir 11 en la base de datos 7 los datos correspondientes a los niveles de glucosa medidos por un medidor continuo de glucosa 10. El sistema computacional adicionalmente comprende unos medios computacionales 15 tales como memorias, microprocesadores, unidades de entrada/salida. Los medios computacionales 15 están encargados de almacenar las gramáticas y procesar el algoritmo evolutivo para obtener el modelo o expresión matemática para GL(k+l) 6 con el que obtener la predicción de la glucosa 13. Los modelos computaciones 15 pueden ampliarse con medios computacionales opcionales 15' que servirían para predecir la glucosa 14 e indicar los bolos de insulina en un tiempo futuro (por ejemplo 2 horas) combinación la función GL(k+l ) con los datos "instantáneos" de glucosa, ingesta prevista, ejercicio físico e insulina pautada 12. A continuación se detalla cómo se aplica el algoritmo evolutivo para modelar el nivel de glucemia en individuos mediante Programación Genética, y especialmente en sujetos con Diabetes Mellitus.

1. Aproximación Evolutiva

El objetivo de la presente invención es encontrar una expresión que modele el nivel de glucosa de un paciente diabético. Esta expresión debe ser obtenida, al menos, a partir de datos previos de glucosa, carbohidratos e insulina almacenados en un sistema o base de datos. Por lo tanto, estamos ante un problema similar al problema de la regresión simbólica. La regresión simbólica trata de obtener expresiones matemáticas que reproduzcan un conjunto discreto de datos.

La Programación Genética (PG) ha demostrado ser efectiva en un alto número de problemas de regresión simbólica, aunque tiene algunas limitaciones, que a menudo vienen del modo de representación como por ejemplo el "bloating". Otro punto que hay que considerar es que en Programación Genética (PG), la evolución se produce en el fenotipo del individuo y no en su representación (genotipo). Durante los últimos años, variantes de la programación genética, las gramáticas evolutivas han aparecido para proponer diferentes aproximaciones a la evolución. La Gramática Evolutiva (GE) permite la generación de programas de computador en un lenguaje arbitrario. Esto se consigue mediante la utilización de gramáticas para especificar las reglas de obtención de programas. Específicamente, la presente invención utiliza gramáticas expresadas en la forma de BNF (Backus Naur form).

En contraste con los algoritmos genéticos, que trabajan con representación de soluciones, la Gramática Evolutiva GE trabaja (evoluciona) con un código genético que determina el proceso de producción de la solución. El proceso de traducción de código se determina por las Gramáticas representadas como BNF.

BNF es una notación técnica para expresar gramáticas libres de contexto. Una representación en BNF puede ser cualquier especificación de un lenguaje completo o un subconjunto de un lenguaje orientado al problema. Una especificación BNF es un conjunto de reglas de derivación, expresadas en la forma:

<símbolo> ::= <expresión>

Las reglas están compuestas de secuencias de terminales y no terminales. Los símbolos que aparecen a la izquierda son no-terminales, mientras que los terminales nunca aparecen al lado izquierdo. En este caso, se puede afirmar que <símbolo> es no-terminal y, aunque no es una especificación BNF completa, también se puede afirmar para la presente invención que <expresión> será un no-terminal ya que siempre aparecen entre el par o. Por tanto, en este caso, el no-terminal <símbolo> será remplazado por una expresión. La operación de remplazo se representa con "::=". El resto de la gramática debe indicar las diferentes posibilidades. Una gramática está representada por una 4-tupla {N, T, P, S}, siendo N el conjunto de no-terminales, T es el conjunto de terminales, P son las reglas de producción para la asignación de elementos de N a T, y S es un símbolo de comienzo que debería aparecer en N. Las opciones dentro de una regla de producción están separadas por el símbolo "|". La Figura 3 representa un ejemplo de gramática en BNF diseñado para regresión simbólica. El código que representa una expresión consistirá de elementos de un conjunto de terminales T. Estos han sido combinados con las reglas de la gramática como se explica más adelante.

Además las gramáticas pueden ser adaptadas para sesgar la búsqueda del proceso evolutivo porque hay un número finito de opciones de reglas de producción, la cual limita el espacio de búsqueda.

2. Proceso de Mapeo. Como se ha mencionado anteriormente, la presente invención aplica un algoritmo evolutivo para evolucionar genotipos, los cuales se representan como una cadena de valores enteros. Cada genotipo mapea el símbolo de comienzo a símbolos terminales leyendo los codones, los cuales, en este ejemplo de realización, tienen una longitud de 8 bits. El proceso es similar al explicado en la sección previa pero, en vez de hacer elecciones aleatorias, tomaremos las decisiones leyendo el genotipo. Cada codón es por tanto un valor entero del genotipo, el cual es procesado mediante la siguiente función de mapeo:

Choicei = (CIV)MOD (# of choices )

donde Choice¡ es la elección seleccionada para el no-terminal i, CIV es el codón que se está decodificando, MOD es la función módulo y (# of chotees,) es el número de opciones posibles para la regla en el terminal .

La función de mapeo toma el valor entero del cromosoma, calcula el módulo respecto al número de posibilidades de la regla y selecciona la opción de acuerdo con el resultado. Dado que la función módulo devuelve valores entre 0 y (# of choices,) - 1 , la primera opción corresponderá al primer valor, 0, la segunda a 1 , y así sucesivamente. Por tanto, si una regla tiene sólo una posibilidad, ésta siempre será seleccionada.

En el presente ejemplo de realización, el proceso de mapeado usa la gramática de la Figura 3, diseñada para resolver un problema de regresión simbólica y los problemas del modelo de la glucosa, a falta de particularizar el conjunto terminal, lo cual se describe en la siguiente sección. Un individuo se compone de una serie de genes (valores enteros). Cada gen puede tomar un valor entre 0 y 255 ya que los codones son de 8 bits. Supongamos por ejemplo el siguiente individuo de 7 genes:

12 - 55 - 23 - 47 - 38 - 254 - 2

El símbolo comienzo es S = { expr }, por tanto la expresión de la solución comenzará con este no-terminal:

Solución = <expr>

Para obtener el fenotipo aplicamos la función de mapeo al primer gen (CIV = 12) usando la regla del primer no-terminal de la expresión. En este punto sólo aparece un no-terminal, <expr>, el cual se corresponde con la regla I de la Figura 3. El número de opciones en esa regla es tres. Por tanto, la función mapeo aplicada es:

12 MOD 3 = 0

Por lo que se selecciona la primera opción, <expr> <op> <expr>, y se continúa con el proceso de mapeo. La opción seleccionada sustituye los no-terminales decodifícados. Como resultado la expresión es, en este punto,:

Solución = <expr> <op> <expr>

El proceso continuará con el siguiente gen, 55, el cual se emplea en decodifícar el primer no-terminal de la expresión en su estado de desarrollo actual. A continuación se aplica de nuevo el mapeo, ahora a la regla I:

55 MOD 3 = 1

La segunda opción, <pre_op> (<expr>), es entonces seleccionada. La expresión pasa a ser: Solución = <pre op> (<expr>) <op> <expr>

El siguiente gen, 23, pasa a ser descodifícado. En este punto del proceso, el primer no- terminal que aparece en la expresión es <pre_op>. Por tanto, se puede aplicar la función de mapeo a la regla III, la cual tiene tres posibilidades:

23 MOD 3 = 2

Al tomar el valor 2 se selecciona la tercera opción, el símbolo terminal Abs.

La expresión pasa a ser:

Solución = Abs(<expr>) <op> <expr> El siguiente gen, 47, descodifíca <expr> con la regla I:

47 MOD 3 = 2

Por lo que se selecciona la tercera opción, <var>. La expresión pasa a ser:

Solución = Abs(<var>) <op> <expr> El gen 38 descodifíca <var> con la regla IV:

38 MOD 2 = 0

Dicho valor selecciona la primera opción, el no-terminal X.

Solution = Abs(X) <op> <expr> El no-terminal <op> se descodifica con 254 y la regla II:

254 MOD 4 = 2 Este valor selecciona la tercera opción, el terminal * .

Solución = Abs(X) * <expr> El siguiente gen, 2, descodifica <expr> con la regla I:

2 MOD 3 = 2

Este valor selecciona la tercera opción, el no-terminal <var>.

Solución = Abs(X) * <var>

En este punto el proceso de transformación de genotipo a fenotipo ha agotado los codones. Es decir, se han utilizado todos los genes o codones pero no se ha llegado a una expresión con terminales en todos sus componentes.

La solución es reusar los codones comenzando por el primero otra vez. Esto representa una novedad respecto de los algoritmos evolutivos distintos de las Gramáticas Evolutivas, del estado de la técnica. De hecho es posible reutilizar los codones varias veces. Esta técnica se conoce como "wrapping" y simula el fenómeno de solapamiento de genes que se da en muchos organismos. Reusar codones no es un problema ya que en Gramática Evolutiva (GE), un codón siempre genera el mismo valor entero y, si se aplica a la misma regla, genera la misma solución. Sin embargo, si los usamos con reglas diferentes obtendremos diferentes partes de fenotipos. Así, las Gramáticas Evolutivas (GE) aseguran que un genotipo individual siempre produce el mismo fenotipo. Por tanto, el "wrapping" no supone un problema.

De esta manera, aplicando el "wrapping", el proceso vuelve atrás, al primer gen, 12, el cual se utiliza para decodificar <var> con la regla IV:

12 MOD 2 = 0 Este valor selecciona la primera opción, el no-terminal X, dando lugar a la expresión definitiva del fenotipo:

Solución = Abs(X) * X

En la siguiente sección se describen cuatro gramáticas correspondientes a cuatro ejemplos de realización para representar diferentes espacios de búsqueda para obtener expresiones que modelen los niveles de glucosa en sangre. 3. Descripción del modelo.

Para que un modelo sea completo, dicho modelo, para los niveles de glucosa, debería basarse en factores observables así como en otras características ocultas e intrínsecas al organismo del paciente. Los factores observables son aquellos datos que ha recogido el paciente manualmente o un dispositivo automático, mientras que los no observables deben ser inferidos. Por estos motivos, la presente invención propone un modelo que considera todos estos factores, aplicando Gramáticas Evolutivas (GE) para inferir una expresión que caracterice el comportamiento de la glucosa en pacientes diabéticos. 3.1. Datos disponibles y modelo general de la glucosa.

El nivel del glucosa en un instante dado depende de varios factores, algunos de ellos intrínsecos al funcionamiento del organismo. En el caso de un paciente de diabetes, los más relevantes son el nivel de glucosa que había hasta la última medida, los carbohidratos ingeridos y la insulina inyectada. Estos factores están incluidos en los conjuntos de datos de nuestros pacientes. Es importante destacar que estos datos son fáciles de recopilar para un paciente real. El valor de la glucosa se mide con analizadores de sangre, los carbohidratos se miden en unidades ingeridas a partir de las comidas diarias, y la cantidad de insulina así como el tipo, son datos que el paciente obviamente conoce. Para el primer ejemplo de realización, se han obtenido datos con un periodo de medición entre dos consecutivos de 15 minutos a lo largo de 24 horas. La Tabla 1 muestra el conjunto de datos obtenido para un paciente "XI". En cada fila de la tabla k se representa el tiempo, donde k = 1 son las 00:00AM, GL es el nivel de glucosa en dicho instante, CH las unidades de carbohidratos ingeridas, IS la insulina de efecto rápido inyectada e IL la de efecto lento.

Tabla 1.- Ejemplo de datos tomados para un paciente "XI " para los valores GL, CH, IS IL.

El modelo propuesto nos proporciona los valores estimados de la glucosa, representados por GL. En cada iteración, la glucosa estimada se obtiene usando los valores estimados anteriores, y los valores de los carbohidratos e insulina en dicho instante, formalmente:

GL( + 1) = f(GL;CH; IS; IL); l < k< N (ec. l) donde GL(k + 1 ) es el futuro valor estimado para la glucosa, un instante posterior al actual, y el resto de variables tiene la misma interpretación que la anteriormente descrita. De esta manera el motor de la Gramática Evolutiva (GE) debería ser capaz de decidir el aspecto de f. Para guiar la búsqueda necesitamos una gramática que limite el espacio de búsqueda y capture la dinámica de los niveles de glucosa en sangre. A continuación detallamos las gramáticas empleadas en la presente invención.

3.2. Gramáticas BNF para el modelado de los niveles de glucosa.

Siguiendo el modelo general mostrado en (ec.l), se han diseñado cuatro gramáticas donde la glucosa estimada depende únicamente de factores observables. La incorporación de conocimiento del problema en la gramática mejora el rendimiento de la exploración. Así, las gramáticas diseñadas siguen los consejos de los médicos en el equipo de investigación. Según sus indicaciones, el comportamiento esperado de la glucosa puede variar a lo largo del día, por lo que se han añadido las posibles influencias en forma de ventanas de tiempo. En definitiva, hay cuatro gramáticas que mezclan las diferentes observaciones.

Gramática 1

Es bien conocido que la ingesta de carbohidratos eleva la glucosa mientras que las inyecciones la disminuyen. Por este motivo en la primera gramática los carbohidratos siempre suman mientras que la insulina siempre resta. Además permite utilizar cualquier valor anterior de la glucosa, los carbohidratos o la insulina al construir la expresión.

Gl(k + 1) =f_gi(Gl (k-m))+fc(CH(k-m))-f_in(IS(k-m); IL(k-m)); 0< m< k; (gr.l) La forma concreta de f_gi, f_cn y fin se obtiene mediante GE con la Gramática 1 , mostrada en la Figura 4. Los tres términos <exprgluc>, <exprch> y <exprins> se corresponden con f_gi, fch y fin, respectivamente y son las expresiones que pueden usar prefijos (operandos) como aquellos de la regla IX, variables para cada uno de los términos o combinaciones de ellos a través de la regla VIII.

Gramática 2 Esta gramática es un caso particular de la anterior que limita el histórico de valores de glucosa, carbohidratos e insulina al instante actual k y el anterior k-1. El modelo resultante tiene la expresión general:

Gl(k + 1) =f_gi(Sl (k-m))+fc_h(CH(k-m))-fin(IS(k-m); IL(k-m)); 0 < m <1; (gr.2)

La Figura 5 muestra la gramática empleada. Simplemente hay que limitar a 00 y 01 los índices en las reglas III, V y VII.

Gramática 3

Para dotar de más libertad a la búsqueda, se dejan libres las operaciones conectivas, ampliándolas a las operaciones aritméticas básicas. La expresión general del modelo es (gr.3), donde f es la función que conecta las tres subexpresiones para la glucosa, carbohidratos e insulina.

Gl(k + 1) =f(f_gi(Gl(k - m));f_ch(CH(k - m));fi„(IS(k - m); IL(k - m))); 0< m< k; (gr.3) La gramática 3 es la encargada de definir este modelo, el cual presenta una ligera modificación en la regla I de la gramática 1. Se trata de cambiar las operaciones fijas + y - por el no-terminal <op> y a continuación se define en la regla VIII. La figura 6 muestra la gramática 3. Gramática 4

El modelo general es similar a la gramática 2 pero añade libertad a función / que relaciona las subexpresiones de la glucosa, los carbohidratos y la insulina.

GL(k + 1) = f(f_gi(GL (k - m));f_ch(CH(k - m));f_in(IS(k - m); IL(k . m))); 0< m <1; (gr. 4) Para ello la gramática 4 es similar a la gramática 2 pero dotando de libertad a las operaciones en la regla I. La gramática se muestra en la Figura 7.

3.3. Evaluación fitness o aptitud (error ek)

Si las gramáticas limitan el espacio de búsqueda de la Gramática Evolutiva GE, la misión de las funciones de "fitness" (también conocidas como aptitud) es guiar la evolución hacia una buena solución. Para calcular el "fitness", primero se obtiene la serie temporal de la glucosa completa, GL, a partir del fenotipo generado por el genotipo del individuo y la gramática empleada. En este paso la glucosa estimada en k se realimenta para estimar la glucosa en los siguientes k.

A continuación se mide el error ek, definido como la diferencia absoluta entre el valor real, en el conjunto de entrenamiento, y el valor estimado para cada k. e_k = \ GL(k) - GL(k) \, l≤ k≤N

Finalmente se emplean las cinco funciones de fitness diferentes, basadas en el error ek, recogidas en la Tabla 2. Las funciones de fitness contenidas en la Tabla 2 son: Fi (mínimos cuadrados), F₂ (error medio), F₃ (error máximo), F₄ (error cuadrático medio) y F₅ (desviación absoluta media).

Tabla 2.- Ejemplos de funciones de fitness.

Claims

REIVINDICACIONES

1.- Método para el modelado del nivel de glucemia mediante programación genética que comprende los siguientes pasos:

i) obtener de un individuo unos datos que comprendan, para un tiempo k, al menos:

o unos niveles de glucosa GL;

o unos niveles de ingesta CH;

G~L(k + 1) = f(GL, CH, IS, IL)

2 - Método según la reivindicación 1 , caracterizado por que el paso ii) adicionalmente comprende llevar a cabo los siguientes pasos:

b) calcular N-expresiones GL_k para k=l ,...,N obtenidas mediante la decodifícación del conjunto de las N-soluciones aleatorias aplicando una gramática BNF y una función de mapeo;

c) calcular el error Ek que conlleva: calcular ek como la diferencia entre los datos obtenidos del paciente y las N-expresiones GL_k; y, aplicar una función de fítness a cada uno de los errores anteriormente calculados ek; de tal forma que se obtiene para cada expresión GL_k, un error asociado Ek;

d) seleccionar N-1 soluciones resultado de: tomar las N-soluciones y apartar la solución de menor error Ek de las N-soluciones; enfrentar las N-1 soluciones tomadas de dos en dos, seleccionando la solución de menor error Ek;

e) cruzar las N-1 soluciones anteriores mediante un algoritmo de probabilidad de cruce; f) mutar un carácter de las N-l soluciones anteriores mediante un algoritmo de probabilidad de mutación;

g) añadir la solución de menor error Ek apartada en el paso d) a las N-l soluciones anteriores;

h) repetir los pasos c) a g) hasta cumplir una condición de parada predefinida.

3. - Método según la reivindicación 2, caracterizado por que el algoritmo de probabilidad de cruce comprende:

i) tomar las N-l soluciones de dos en dos;

ii) establecer una probabilidad de cruce entre 0 y 1 ;

iii) generar un número aleatorio entre 0 y 1 ;

4. - Método según la reivindicación 2, caracterizado por que el algoritmo de probabilidad de mutación comprende:

i) tomar las N- 1 soluciones de una en una;

ii) establecer una probabilidad de mutación entre 0 y 1 ;

iii) generar un número aleatorio entre 0 y 1 ;

v) si el número aleatorio generado es menor o igual que la probabilidad de mutación, se muta un carácter de la cadena de caracteres de tal forma que se mantiene la longitud de la cadena de caracteres.

5. - Método según la reivindicación 2, caracterizado por que la condición de parada predefinida es al menos una de las siguientes condiciones:

• máximo número de iteraciones; • convergencia: no mejora en un número "p" de iteraciones;

• estar cerca de un óptimo teórico.

6. - Método según la reivindicación 2, caracterizado por que la función de fitness es una de las siguientes funciones:

• mínimos cuadrados;

• error medio;

• error máximo;

• error cuadrático medio;

· desviación absoluta media.

7. - Método según la reivindicación 2, caracterizado por que la solución GL(k + 1) tiene la siguiente expresión:

GL(k + 1) =f(P,E,k,SI,IG,PG,CI,M,IC,IP,DI, OC, TI,FV, VI,PC E,FA,G(-),CO, IS(-),

IL(-),F(-),E(-),Z) donde el operador · representa cualquier instante actual o anterior en el tiempo y donde / es una función que se calcula mediante una gramática BNF que comprende la siguiente forma:

I (<f><OP><f>)

I <PREOP>(<f>)

I <v>

I <Z>

<OP> ::= +

I*

V

<PREOP> ::= SIN

|COS |EXP

|TAN

|LOG

|ABS

|LN

|TANH

|COSH

|SENH

|DERIVADA_CON_RESPECTO_AL_TIEMPO

|DERIVADA_CUADRADO_CON_RESPECTO_AL_TIEMPO (DERIVAD A TERCERA CON RESPECTO AL TIEMPO

|<A>

|#{k}

|<SI>

|<IG>

|<PG>

|<CI>

|<M>

|<IC>

|<IP>

|<DI>

|<OC>

|<TI>

|<FV>

|<VI>

|<PC>

|<TE>

|<FA>

|#{G[k-<J>]}

|#{C[k-<J>]} |#{IS[k-<J>]}

|#{IL[k-<J>]}

|#{F[k-<J>]}

|#{E[k-<J>]}

|#<Z>

<P> ::= "el peso del individuo en kg.";

<E> ::= "edad del individuo en años";

<SI> ::= "unidades de glucemia que baja 1 unidad de insulina en mg/dl";

<IG> ::= "índice glucémico de la ingesta" (el de la glucosa es 1 , y puede ser mayor o menor;)

<M> ::= 0

<IC> ::= 5

<IP> ::= 0

<DI> ::= 2

<OC> : := 3

<TI> ::= 12

<FV> ::= 0.2

<VI> ::= 0.8

<PC> ::= 0.6

|-<D>.<D>

<J> ::= 0

| 1

|2

13

I "instantes de tiempo" (por ejemplo: 96→ 24 horas a intervalos de 15 minutos = 96 instantes de tiempo. En el caso de usar otro horizonte de predicción u otro periodo de muestreo habría que modificar esta regla); <Z> ::= <D>.<D>

<D> ::= 0

| 1

12

|3

|4

|5

|6

17

|8

|9 donde los distintos parámetros de entrada son:

P: peso actual en kg;

A: edad actual en años;

k: instante actual;

CI: ratio Hidratos de carbono / insulina;

M: menstruación , Sí =1 ó no=0;

IC: insulina Circulante, unidades de insulina;

DI: tiempo de duración de la última ingesta en intervalos de 15 minutos;

TI: tiempo desde la última ingesta en intervalos de 15 minutos;

FV: factor de variabilidad de absorción, valor entre 0 y 1 ;

VI: variabilidad de la insulina, valor entre 0 y 1 ; PC: preparación de la comida (fritos, asados, condimentos..), valor entre 0 y 1 ;

FTSI: factor transitorio de sensibilidad a la insulina: valor de -1 a l ;

Z: es una constante;

en cuanto a históricos:

G(-) es el histórico de la glucemia (o parte de él);

C(-) es el histórico de carbohidratos;

IS(-) es la insulina de acción corta;

IL(-) es la insulina de acción larga;

F(-) es el ejercicio físico; y,

Ε(·) es el nivel de estrés.

8. - Método según la reivindicación 2, caracterizado por que la función de mapeo comprende la siguiente expresión:

Choicet = (CIV)MOD (# of choices^)

donde Choice¡ es la elección seleccionada para el no-terminal i, CIV es el codón que estamos decodificando, MOD es la función módulo y (# of choices,) es el número de opciones posibles para la regla en el terminal i.

9. - Método según la reivindicación 1 , caracterizado por que el método, entre los pasos i) y ii), opcionalmente comprende evaluar la función GL de predicción de la glucosa anteriormente calculada cuando existe un modelo de glucosa anteriormente calculado.

10. - Programa de ordenador caracterizado por que comprende la ejecución de un método definido de acuerdo con una cualquiera de las reivindicaciones 1 a 9.

1 1. - Medio de almacenamiento caracterizado por que comprende un programa de ordenador definido según la reivindicación 10.

12. - Sistema computacional caracterizado por que en dicho sistema computacional se carga el programa de ordenador definido en la reivindicación 10.