Herramientas

HTML

PDF

Metadatos de indexación

Cómo citar un elemento

Imprimir este artículo

Política de revisión

Envía por correo este artículo (Se requiere entrar)
Enviar un correo electrónico al autor/a (Se requiere entrar)

ARTÍCULO ORIGINAL

Estudio sobre modelos predictivos para la COVID-19 en Cuba

Study on predictive models for COVID-19 in Cuba

1 Universidad Carlos Rafael Rodríguez, Cienfuegos, Cienfuegos, Cuba
2 Poder Popular Provincial, Cienfuegos, Cienfuegos, Cuba


RESUMEN

Fundamento: ante la pandemia provocada por el nuevo coronavirus SARS-CoV-2, resulta importante la estimación del crecimiento de casos infestados y decesos de la población cubana.
Objetivo: obtener predicciones para el pico de casos confirmados y fallecidos en Cuba por la COVID- 19, haciendo uso de herramientas estadísticas e informáticas.
Métodos: el método de los mínimos cuadrados fue utilizado para la obtención de los parámetros utilizando modelos lineales (MCL) y no lineales (MCNL). Los modelos logísticos y exponenciales, como la curva de crecimiento logístico, utilizada para modelar el crecimiento poblacional (modelos de crecimiento de Gompertz), se aplicaron en el pronóstico del crecimiento de casos infectados y/o decesos respectivamente.
Resultados: existe una adecuación de los modelos presentados con respecto a los valores pronosticados y los reales lo cual permite una confiabilidad de los mismos para los pronósticos efectuados para Cuba.
Conclusiones: los modelos estadísticos de predicciones obtenidos dan resultados muy significativos para el estudio de la pandemia COVID-19 en Cuba.



Palabras clave: infecciones por coronavirus, predicción, Cuba

ABSTRACT

Foundation: on the pandemic caused by the new SARS-CoV-2 coronavirus, it is important to estimate the growth of infested cases and deaths of the Cuban population.
Objective: to obtain predictions for the peak of confirmed and deceased cases in Cuba by COVID-19, using statistical and computer tools.
Methods: the least squares method was used to obtain the parameters using linear (MCL) and nonlinear (MCNL) models. Logistic and exponential models, such as the logistic growth curve, used to model population growth (Gompertz growth models), were applied to the growth prediction of infected cases and / or deaths, respectively.
Results: there is an adequacy of the presented models with respect to the predicted and the real values which allow their reliability for the predictions made for Cuba.
Conclusions: statistical prediction models obtained give very significant results for the COVID-19 pandemic study in Cuba.



Keywords: coronavirus infections, forecasting, Cuba

INTRODUCCIÓN

Una situación muy difícil con la salud se presenta en el planeta actualmente. La Organización Mundial de la Salud declara el 11 de marzo del 2020 la pandemia de la COVID-19 y plantea una serie de medidas para evitar el contagio entre las personas; el aislamiento se plantea como condición esencial así como el mantenimiento de una conducta de autorresponsabilidad, instando a la imposición de medidas sanitarias por los gobiernos de cada país.

En principios del mes de marzo del 2020 en Cuba se presentan las primeras manifestaciones de la COVID-19,  y  la dirección de país plantea medidas de  cuarenta para enfrentarlo, algunas de ellas fueron: evitar concentraciones de personas, cerrar temporalmente las actividades en las universidades e implementar modalidades a distancias, que contribuyan a la formación de los profesionales,  utilizando modalidades no presenciales y que los profesores se dediquen al desarrollo de las medios de enseñanza, el  trabajo científico y las publicaciones.

Los científicos en el mundo comenzaron a trabajar en la modelación matemática de la epidemia provocada por el nuevo coronavirus SARS.CoV.2 causante de la COVID-19, utilizando diversas técnicas y modelos matemáticos. Han sido utilizadas diferentes vías para dicha modelación matemática:

  • Modelación clásica para las epidemias con modelos SIR basados en ecuaciones diferenciales ordinarias. Investigaciones en este sentido para la pandemia han sido:(1-3)
  • Modelación de la Covid-19 basadas en modelos estadísticos de series cronológicas.(4)
  •  Modelos predictivos a través del uso de internet.(5)
  • Modelos basados en inteligencia artificial y Machine Learning.(6-7)

Las modelaciones antes expuestas tienen presente una serie de parámetros que permiten la inclusión de varios factores con el fin de expresar, lo mejor posible, las realidades de las epidemias, sin embargo, presentan alto grado de complejidad y nivel de procesamiento para la obtención de estos parámetros.

Dentro de los modelos estadísticos se encuentran los de ajuste de crecimiento poblacional logísticos y exponenciales (modelos de crecimiento de Gompertz). En algunas publicaciones se encuentra la utilización con éxito de estos en la epidemia de la Covid-19. Algunas publicaciones lo han hecho,(8-10) y presentan una complejidad inferior a las modelaciones antes expuestas.

El objetivo fundamental del presente trabajo es obtener predicciones para el pico de casos confirmados y fallecidos en Cuba, haciendo uso de herramientas estadísticas e informáticas.

MÉTODOS

El método de los mínimos cuadrados fue utilizado para la obtención de los parámetros de los modelos utilizando modelos lineales (MCL) y no lineales (MCNL).

Los modelos logísticos, como la curva de crecimiento logístico(11) utilizada para modelar el crecimientos poblacional puede ser utilizada en el pronóstico del crecimiento de casos infectados y/o decesos respectivamente.

Un modelo básico logístico tiene la siguiente expresión (Ecuación 1):

Este modelo puede ser utilizado para el pronóstico de las epidemias teniendo presente que P(t)  representa los casos acumulados (casos confirmados o fallecimientos), t representa el tiempo trascurrido luego de haberse presentados los primeros casos y a y b son parámetros que pueden ser obtenidos (luego de realizar transformaciones matemáticas) aplicando el método de los MCL. Para la utilización de este modelo los datos deben ser llevados a la escala de [0; 1] dividiendo cada dato entre el mayor obtenido. En este modelo un valor importante lo representa el punto de inflexión debido a que muestra el cambio de comportamiento de la curva lo cual puede ser interpretado como el pico de la epidemia. Este punto de inflexión está dado por la expresión (Ecuación 2):

Una modelación que ofrece mayor versatilidad, está representada en la (Ecuación 3). En este caso no es necesaria la transformación de los datos a la escala de [0; 1], dado que el parámetro c representa el máximo de casos acumulados y el punto de inflexión es el mismo que el presentado anteriormente. Sin embargo, presenta un mayor nivel de complejidad para la obtención de los parámetros debido a que no es posible, mediante transformaciones matemáticas, obtener un modelo lineal con respecto a los parámetros por lo que se aplica el método de los MCNL para la obtención de los mismos.(11)

Modelos exponenciales, la curva de crecimiento exponencial de Gompertz(11) pertenecen a la familia de curvas sigmoideas, inicialmente cóncavas y tras pasar el punto de inflexión, convexas. Su nombre procede del matemático Benjamin Gompertz, el cual utiliza la curva para describir la ley de la naturaleza que rige la mortalidad humana. Existen diferentes tipos de curvas Gompertz en función de les parámetros que la componen, sin embargo, están caracterizadas por una doble exponencial como elemento característico común. (Ecuación 4)

En este modelo G(t) representa los casos acumulados (casos confirmados o fallecimientos), t representa el tiempo trascurrido luego de haberse presentados los primeros casos y a, b y c son parámetros que pueden ser obtenido aplicando el método de los MCNL. El punto de inflexión está dado por la expresión (Ecuación 5):

Los modelos anteriores presentan estabilidad debido a que utilizan los valores acumulados de los casos, sin embargo, su representación geométrica, en ocasiones, limita su comprensión. Un modelo, de fácil interpretación geométrica, que puede ser utilizado para la representación de los casos por cada día, es el modelo exponencial basado en los modelos normales (Ecuación 6):

En este modelo N(t) representa los casos obtenidos por días (casos confirmados o fallecimientos), t representa el tiempo trascurrido luego de haberse presentados los primeros casos y a, b y c son parámetros que pueden ser obtenidos (luego de realizar transformaciones matemáticas) aplicando el método de los MCL. En este modelo es de gran importancia el punto estacionario que muestra el cambio de comportamiento de la curva que pasa de un crecimiento a un decrecimiento. Este punto está dado por la expresión t=c.

Para la bondad del ajuste de los modelos se utiliza el coeficiente de determinación ajustado R2, adecuado para modelos no lineales con respecto a los parámetros.

En la presente investigación se pretende realizar pronósticos de las fechas para el pico de casos confirmados y casos fallecidos por la enfermedad COVID-19 respectivamente para Cuba, así como el total de casos confirmados y fallecidos pronosticados.

Los datos utilizados para la estimación de los modelos son tomados del sitio web www.cubadebate.cu con la información diaria y acumulada en Cuba. Estos datos se encuentran actualizados hasta la fecha de escrito este informe, 22 de abril de 2020.

Para la aplicación de la metodología es importante la selección del primer día de conteo de datos. Se comenzó a contabilizar el primer día de aparición de casos para los datos confirmados diarios y acumulados y el primer día de fallecimiento de una persona por esta enfermedad para los datos de decesos diarios y acumulados.

Para el procesamiento de la información se utilizaron los programas informáticos Maxima 5.41.0(12) y R 3.6.1(13). Para el procesamiento de los modelos que utilizaron el método de los MCL se empleó el programa simbólico Maxima y para el procesamiento de los modelos utilizando el método de MCNL se empleó el lenguaje de programación R, de procesamiento numérico.(14) En ambos casos se implementaron una serie de instrucciones que permiten el análisis, de forma rápida, de cualquier país afectado por la COVID-19 existente en la base de datos. Ambos ficheros de instrucciones (covid_19.mac para el caso de Maxima y covid_19.R para el caso de R) pueden ser descargados desde la dirección https://clasesvirtuales.ucf.edu.cu/course/view.php?id=1147. Para la utilización del método de los mínimos cuadrados se utilizó el paquete lsquare.mac en el programa Maxima y las instrucciones nls, SSlogis y SSgompertz del paquete stat de R.

RESULTADOS

Estimaciones para la información de casos confirmados en Cuba.

Cuba presentó sus primeros casos el 11 de marzo, pero se registraron a partir del día posterior (12 de marzo). Al momento de escrito este informe investigativo habían transcurrido 42 días desde el primer reporte. (Tabla 1).

El gráfico que se muestra en la figura 1 expone las representaciones geométricas de los casos confirmados por días y diez modelos exponenciales (ecuación 6). Cada modelo representa la estimación obtenida para cada uno de los días de avance de la enfermedad a partir de pasado 33 días de inicio de la misma (13 de abril) hasta pasado 42 días (22 de abril). Estos modelos presentan estabilidad a partir de pasado 35 días de inicio de la enfermedad (15 de abril), un pico estimado pasado entre 38 (18 de abril) y 39 (19 de abril) días y coeficientes de determinación que oscilan entre 0,87 y 0,88.

La figura 2 muestra la representación geométrica de los casos confirmados acumulados, llevados a la escala de [0,1] y diez modelos logísticos (ecuación 1). De igual forma estos modelos presentan estabilidad, un pico estimado pasado entre 24 (4 de abril) y 28 (8 de abril) días luego de confirmados los primeros casos en el país (12 de marzo) y R2 que oscilan entre 0,88 y 0,97.

La figura 3 muestra la representación geométrica de los casos confirmados acumulados y la del modelo logístico (ecuación 3). En este modelo se estima el pico pasado 34 días (14 de abril) luego de confirmados los primeros casos en el país (12 de marzo) y un R2 adecuado aproximadamente igual a 0,99865.

La figura 4 muestra la representación geométrica de los casos confirmados acumulados y la del modelo de crecimiento exponencial de Gompertz (ecuación 4). En este modelo se estima el pico pasado 39 días (19 de abril) luego de confirmados los primeros casos en el país (12 de marzo) y un R2 muy adecuado aproximadamente igual a 0,99936.

A continuación, se presenta una comparación de las estimaciones realizadas mediante los modelos. (Tabla 2).

Los modelos logístico y de Gompertz presentan mejor bondad de ajuste dado que sus R2 son muy adecuados. A través de estos modelos se estima un pico de casos contagiados pasado entre 34 días (14 de abril) y 39 días (19 de abril) (a la fecha de escrito este informe se estima ya pasado el pico), luego de confirmados los primeros casos en el país (12 de marzo). Se pronostican, además, un total de contagiados con la COVID-19 entre 1482 a 2678.

Estimaciones para la información de casos fallecidos en Cuba.

Cuba presentó su primer caso de deceso el 18 de marzo. Al momento de escrito este informe investigativo han transcurrido 36 días desde este fallecimiento.

El gráfico que se muestra en la figura 5 expone las representaciones geométricas de los casos fallecidos por días y tres modelos exponenciales (ecuación 6). Cada modelo representa la estimación obtenida para cada uno de los días de avance de la enfermedad a partir de pasado 40 días (20 de abril) hasta 42 días (22 de abril) desde que se presentaron los primeros casos confirmados en el país. Estos modelos presentan inestabilidad y coeficientes de determinación bajos (entre 0.23 y 0.24), por lo que se pone de manifiesto que son poco adecuados para utilizarlo como predictores.

La figura 6 muestra la representación geométrica de los casos fallecidos acumulados, llevados a la escala de [0,1] y diez modelos logísticos (ecuación 1). Estos modelos presentan una estabilidad media, un pico estimado pasado entre 26 (6 de abril) y 32 (12 de abril) días luego de confirmados los primeros casos en el país (12 de marzo) y R2 que oscilan entre 0,79 y 0,98.

La figura 7 muestra la representación geométrica de los casos fallecidos acumulados y la del modelo logístico (ecuación 3). En este modelo se estima el pico pasado 32 días (18 de abril) luego de haber fallecido el primer caso en el país (18 de marzo) y un R2 adecuado aproximadamente igual a 0,99656.

La figura 8 muestra la representación geométrica de los casos confirmados acumulados y la del modelo de crecimiento exponencial de Gompertz (ecuación 4). En este modelo se estima el pico pasado 49 días (5 de mayo) luego de haber fallecido el primer caso en el país (18 de marzo) y un R2 adecuado aproximadamente igual a 0,99582.

A continuación, se presenta una comparación de las estimaciones realizadas mediante los modelos (Tabla 3).

Los modelos logísticos y de Gompertz presentan mejor bondad de ajuste dado que sus R2 son adecuados. A través de estos modelos se estima un pico de casos fallecidos pasado entre 32 días (18 de abril) y 49 días (5 de abril) luego de que falleciera el primer caso en el país (18 de marzo). Se pronostican, además, un total de fallecidos por la COVID-19 entre 63 a 211.

DISCUSIÓN

En el presente artículo de investigación se expusieron predicciones para los picos de casos confirmados y decesos en Cuba respectivamente, asociados a la COVID-19, así como las afectaciones en cantidad total de personas contagiadas y fallecidas.

Han sido utilizados modelos logísticos y exponenciales (específicamente el modelo de crecimiento de Gompertz) para obtener estas estimaciones. Estos modelos han sido contrastados, con resultados satisfactorios, con los datos publicados, por las afectaciones de esta enfermedad.

Cuba comienza a ser afectada por la pandemia COVID-19 alrededor de 20 días después de haber sido afectados Italia y España, lo cual le dio un margen de preparación basado en las experiencias de países como China, Corea del Sur y los propios Italia y España.

Se han obtenido las conclusiones siguientes:

Los modelos estadísticos de predicciones obtenidos dan resultados muy significativos para el estudio de la pandemia COVID.19 en Cuba.

El pico estimado de contagiados se debe haber alcanzado (con respecto a la fecha en que se ha escrito este informe de investigación 22 de abril), en un estimado aproximadamente, entre el 14 y 19 de abril,  pronosticándose una cantidad total de contagios entre 1 482 y 2 678. Sin embargo, el pico de fallecidos se pronostica que debe alcanzarse entre el 18 de abril y 5 de mayo y se estima una cantidad total de deseos en un rango entre 63 y 211.

El sistema de salud cubano ha demostrado su solidez y efectividad diferente al que presentan otros países contagiados en el mundo y la certera política por parte del sistema de salud y el gobierno para tratar la posible epidemia es también distinta.

 

Conflicto de intereses:

Los autores de este artículo no presentan conflicto de intereses.

Contribuciones de los autores:

Juan Felipe Medina: análisis estadístico, escritura del artículo y cálculo de resultados.

Manuel E Cortés Cortés, Manuel Cortés Iglesias, Annia del Carmen Pérez, Marianelis Manzano Cabrera: análisis de documentos, escritura del artículo y revisión.

Financiación:

Universidad Carlos Rafael Rodríguez. Cienfuegos.

REFERENCIAS BIBLIOGRÁFICAS
1 Lin Q, Zhao S, Gao D, Lou Y, Yang S, Musa SS, et al. A conceptual model for the coronavirus disease 2019 (COVID-19) outbreak in Wuhan, China with individual reaction and governmental action. International Journal of Infectious Diseases. 2020;93:211-16
2 Cagigal MA, Becario FP. Modelado y análisis de la evolución de una epidemia vírica mediante filtros de Kalman: el caso del COVID-19 en España [Internet]. Sevilla: Universidad de Sevilla; 2020 [citado 4 Abr 2020]. Disponible en: https://www.us.es/actualidad-de-la-us/modelado-y-analisis-de-la-evolucion-de-una-epidemia-virica-mediante-filtros-de
3 Bacaër N. Un modelo matemático de la epidemia de coronavirus en Francia [Internet]. París: Institut de Recherche pour leD ́eveloppement; 2020 [citado 23 Abr 2020]. Disponible en: https://hal.archives-ouvertes.fr/hal-02509142v2/file/epidemie_es.pdf
4 Deb S, Majumdar M. A time series method to analyze incidence pattern and estimate reproduction number of COVID-19. Bengaluru: Indian Institute of Management; 2020
5 Wang CJ, Ng CY, Brook RH. Response to COVID-19 in Taiwan: big data analytics, new technology, and proactive testing. JAMA. 2020;323(14):1341-1342
6 Hu Z, Ge Q, Jin L, Xiong M. Artificial intelligence forecasting of COVID-19 in China [Internet]. Boston: Researchgate; 2020 [citado 23 Jul 2020]. Disponible en: https://www.researchgate.net/publication/339324015_Artificial_Intelligence_Forecasting_of_Covid-19_in_China
7 Zhou C, Su F, Pei T, Zhang A, Du Y, Luo B, et al. COVID-19: challenges to GIS with big data. Geography and Sustainability. 2020;1:77-87
8 Avendaño VH. Infección del COVID-19 en Colombia. Una comparación de modelos logísticos y exponenciales aplicados a la infección por el virus en Colombia [Internet]. Boston: Researchgate; 2020 [citado 23 Abr 2020]. Disponible en: https://www.researchgate.net/publication/340092755_Infeccion_del_Covid-19_en_Colombia_Una_comparacion_de_modelos_logisticos_y_exponenciales_aplicados_a_la_infeccion_por_el_virus_en_Colombia
9 Jia L, Li K, Jiang Y, Guo X. Prediction and analysis of Coronavirus Disease 2019 [Internet]. Ithaka: Cornell University; 2020 [citado 20 Abr 2020]. Disponible en: https://arxiv.org/ftp/arxiv/papers/2003/2003.05447.pdf
10 Villalobos-Arias M. Generalized logistics and optimization heuristics. Ithaka: Cornell University; 2020
11 Villalobos-Arias M. Estimation of population infected by Covid-19 using regression. Ithaka: Cornell University; 2020
12 Simón Mínguez F. (2016). Procesos de difusión Logístico y Gompertz. Métodos numéricos clásicos en la estimación paramétrica [Tesis de Maestría]. Granada: Universidad de Granada; 2016 [citado 23 Abr 2020]. Disponible en: https://masteres.ugr.es/moea/pages/curso201516/tfm1516/simon_minguez_tfm/!
13 DOE Macsyma. Maxima, a Computer Algebra System [Internet]. New York: Dice Holdings; 2013 [citado Abr 23]. Disponible en: http://maxima.sourceforge.net/es/index.html#top
14 GNU Project. The R Project for Statistical Computing [Internet]. Cambridge: GNU Project; 2018 [citado Abr 23]. Disponible en: https://www.r-project.org/

Enlaces refback

  • No hay ningún enlace refback.


Editada en la Universidad de las Ciencias Médicas de Cienfuegos. Directora: Dr.C Dunia María Chavez Amaro