Introducción
La promoción de la ciencia abierta y el acceso libre a la información científica tiene sus orígenes en la Declaración de Budapest (Budapest Open Access Initiative, BOAI, por sus siglas en inglés), emitida en 2002 como una iniciativa del Open Society Institute en Budapest, Hungría. Este documento, elaborado por expertos en las esferas científica, política y social, se basa en la premisa de que el conocimiento científico es un bien público y debe estar disponible de manera gratuita para el beneficio y progreso de todos.(1)
Dentro del movimiento global de acceso abierto se identifican dos vertientes interconectadas, pero con diferentes enfoques y mecanismos. Una vertiente se refiere al acceso de los datos públicos generados por los Gobiernos Nacionales y Agencias Internacionales (2,3,4,5). Esta vertiente, que podríamos denominar gubernamental, tiene sus antecedentes alrededor del 2009 y permite la transparencia en la gobernanza de las instituciones, con vistas a propiciar la rendición de cuentas de los servidores públicos y mejorar la calidad de los servicios que se prestan.(6,7)
La otra vertiente está fundamentalmente relacionada con el acceso abierto al conocimiento en las ciencias y las humanidades y, como ya se mencionó, tuvo sus inicios a nivel internacional con la Declaración de Budapest (2002) (1) y su posterior desarrollo con la Declaración de Bethesda (2003),(8) la Declaración de Berlín (2003)(9) y otras iniciativas importantes. En Cuba, esta vertiente fue explorada como parte de una tesis doctoral del 2010 dentro del sector de la salud, donde se analizan las particularidades del acceso abierto en el contexto cubano y su evolución dentro del sistema de salud.(10)
Según la BOAI, “acceso abierto” se refiere a la disponibilidad en línea, libre e irrestricta, de la literatura publicada en revistas científicas. Al cumplirse el 20 Aniversario de esta iniciativa, el concepto se amplió para incluir no solo la publicación y el hospedaje en acceso abierto de artículos científicos, sino también datos, metadatos, códigos/programas computacionales, y otros resultados digitales de las investigaciones, en infraestructuras abiertas con control comunitario.(1)
Se han definido dos vías complementarias para el logro del Acceso Abierto, una vía “dorada”, que promueve la publicación de los resultados investigativos en revistas científicas de acceso abierto, y otra vía “verde” que promueve el autoarchivo de la producción científica en repositorios institucionales.(1)
La vía “dorada” sufre del potencial conflicto ético acerca de “a quién le otorga” la revista científica el “acceso abierto”. Un número creciente de importantes revistas científicas internacionales son de “acceso abierto” en el sentido de que permiten el uso y reúso ilimitado de sus artículos, pero reclaman a los autores (o a sus instituciones y patrocinadores) un “pago por el procesamiento del artículo” (Article Processing Charge, APC, por sus siglas en inglés). Dentro de la vía “dorada”, las revistas que no reclaman a los autores un APC se les considera que pertenecen a la vía “diamante” del acceso abierto.(11)
La infraestructura de datos abiertos es esencial para respaldar decisiones informadas y avanzar en la investigación basada en evidencia. Contar con plataformas que pongan a disposición datos de acceso abierto, permite análisis robustos y facilita la colaboración.
Este artículo examina las políticas de acceso abierto en Cuba, así como el uso y potencial de plataformas de datos internacionales en Cuba. Describe el contenido de algunas plataformas de datos abiertas relevantes para la investigación en salud enfocándonos en el tipo de datos que ofrecen y su utilidad para los investigadores cubanos.
Desarrollo
Infraestructura y políticas de datos abiertos en Cuba
Independientemente del carácter complementario de las dos vías para el logro del Acceso Abierto, en nuestra opinión y la de otros autores,(12) en Cuba, la vía “dorada” ha avanzado más que la vía “verde”. Al momento de redactar este trabajo, en Cuba todas las revistas han adoptado el modelo “diamante” del acceso abierto.
Alrededor del 2016 se publicaron dos trabajos que analizan la situación en Cuba de los repositorios de la vía “verde”, concluyendo que el desarrollo era escaso.(12,13) En nuestra opinión, el desarrollo que ha alcanzado la vía “verde” sigue siendo insuficiente y está dado por dos razones fundamentales. Primero, existen limitaciones en los recursos materiales necesarios, como son facilidades de conectividad a internet y de infraestructura que permitan el almacenamiento y conservación de la información. Segundo, la falta de promoción y concienciación sobre los beneficios de los repositorios institucionales, agravado en algunos casos por reservas de los directivos de nuestras instituciones científicas.
Este escaso desarrollo se manifiesta no sólo en el reducido número de instituciones científico-académicas con repositorios, sino en la limitada interconexión, interoperabilidad, y promoción de los pocos repositorios existentes en el ámbito nacional.(12) Una excepción importante a esta situación general es el repositorio de Tesis Doctorales coordinado por la Comisión Nacional de Grados Científicos, que permite el acceso abierto a sus documentos usando distintas estrategias de búsqueda.(14) Le corresponde a la Editorial de Ciencias Médicas en el Sector Salud en Cuba definir la estrategia del acceso abierto para todos los actores en este sector, constituyendo los repositorios institucionales el primer eslabón y que no ha sido lo suficientemente explorado.(15)
Desde 2015, existen documentos político-legales en nuestro país que abordan la gestión de los datos y de la información, con el objetivo de avanzar hacia la informatización de la sociedad en un entorno seguro. (2) Sin embargo, dichos documentos carecen de las regulaciones necesarias para implementar tales estrategias de acceso abierto. Según un trabajo del 2020, las carencias persisten, lo que representa una desventaja para nuestro país en el contexto latinoamericano.(16)
En este mismo año, en nuestro país se alentó la adopción de un enfoque de apertura de datos públicos, mediante el cual fuera posible que se liberaran para su acceso todos los datos generados por las administraciones públicas, como parte de sus servicios habituales.(2) En nuestra opinión, este llamado sigue siendo completamente relevante en la actualidad.
No hemos encontrado evidencias anteriores al 2018 de la existencia de una Política Nacional para la difusión “en abierto” de los resultados de las investigaciones (incluyendo sus bases de datos) financiadas con fondos públicos.(12) Actualmente, Cuba se adhiere a los principios de las declaraciones internacionales que promueven el acceso abierto a los resultados científicos,(17) entre ellas, la BOAI(1) y la Declaración de Salvador de Bahía sobre el Acceso Abierto para los Países en Desarrollo,(18) de la cual es signataria.
Publicación de protocolos de investigación y publicación de bases de datos
Es importante notar que la mayoría de los artículos nacionales e internacionales, cuándo se refieren a la importancia y a la promoción del uso, de las “bases de datos” de acceso abierto, se refieren a bases de datos bibliográficas, es decir, bases de datos de artículos científicos publicados en revistas certificadas, indexados según temática, autor, año, etc., y que permiten descargar libremente los artículos de interés del usuario.(19,20)
En este trabajo, sin embargo, nos concentraremos en Plataformas de Bases de Datos (colección organizada y estandarizada de datos) de acceso abierto, que contienen un volumen grande de datos primarios (o mínimamente procesados), donde, a partir de metadatos pertinentes y detallados, los interesados pueden identificar y obtener/descargar libremente los datos específicos que sean de su interés para su posterior procesamiento y análisis.
El acceso abierto a este tipo de plataformas o bases de datos es mencionado en algunos trabajos de autores cubanos. Ejemplos son, el trabajo de Sánchez Tarrago del año 2010(10) y el trabajo de Babini y Rovelli (2020) que aborda este tema directamente, identificando los países que no han avanzado en el acceso abierto de este aspecto, entre los cuales se encuentra Cuba.(16)
A nivel internacional, se presentan y discuten Plataformas de Datos en Salud (Data Health Platforms) que, por definición, no pueden incluirse, al menos automáticamente, dentro del movimiento de acceso abierto. Los datos en estas Plataformas, con un gran potencial para la mejora de la salud, han sido históricamente generados y recolectados en instituciones que prestan servicios de atención a la salud, pero últimamente también por las mismas personas a partir del uso de dispositivos personales conectados a internet, el uso de redes sociales, etc.
El foco de atención en estas Plataformas se ha concentrado en la evolución del control y la gerencia de datos, desde las instituciones hasta las personas involucradas, evolución matizada por importantes batallas legales acerca del balance entre el derecho a la privacidad y el bien público.(21)
Fundamentos para publicar protocolos de investigación y bases de datos
Un protocolo de investigación es un documento en el que se detalla el diseño de un estudio, lo mismo observacional que experimental. La revisión por pares (peer review, en inglés) de este tipo de trabajos promueve las investigaciones rigurosas y de alta calidad, aumenta la visibilidad, la reproducibilidad, y el reconocimiento al trabajo científico.(22) Por otro lado, la publicación de estos protocolos puede facilitar la colaboración entre instituciones, y el logro de apoyos financieros relevantes. En Cuba existe el Registro Público de Ensayos Clínicos, donde se publica en acceso abierto un resumen de la información más relevante de los protocolos de este tipo de estudios.(23) Autores cubanos han colaborado en investigaciones que han publicado su protocolo de estudio.(24,25,26,27)
Existen reconocidas guías para el reporte de distintos tipos de estudios (ver repositorio EQUATOR).(23) Debe resaltarse que todas estas guías son igualmente relevantes para la preparación y publicación de los correspondientes protocolos. Hasta donde hemos podido revisar, no existen trabajos que evalúen el comportamiento en nuestro país de las publicaciones de protocolos de investigación, pero en opinión de los autores este tipo de publicaciones no han sido suficientemente explotadas.
En el contexto de una Ciencia Intensiva en Datos (Data Intensive Science), la publicación formal de datos (artículos de datos o data papers en inglés) y su disponibilidad en acceso abierto tienen especial importancia.(28,29) Este propósito conlleva características propias(29,30,31) y muestra una tendencia creciente a nivel internacional.(30,31,32,33) Aunque en nuestro país todavía es limitada, ya hay evidencias de algunos data paper indizados en la Web de la Ciencia. Uno de ellos es el publicado recientemente por Verdú y colaboradores (2023), donde se describe y se pone accesible, datos sobre redes de reclutamiento de plantas a nivel global. El trabajo compila 143 redes de reclutamiento de plantas en 23 países. Este data paper permite a los investigadores explorar hipótesis ecológicas y evolutivas relacionadas con el reclutamiento de plantas a nivel mundial.(34)
Una variante que gana fuerza a nivel internacional es la solicitud que están realizando un número creciente de revistas a los autores para que pongan a disposición de los lectores, en acceso abierto, las bases de datos usadas en las correspondientes publicaciones, con el claro propósito de propiciar la reproducibilidad de los resultados de las investigaciones.(35) Esta variante aún no está presente en las revistas cubanas.
Algunas plataformas de datos de acceso abierto
- IHME-GHDx
El IHME-GHDx (Institute of Health Metrics and Evaluation – Global Health Data exchange), es una plataforma de datos de acceso abierto del IHME disponible en https://ghdx.healthdata.org/. Esta plataforma constituye, posiblemente, el más exhaustivo catálogo/repositorio de encuestas, censos, estadísticas vitales, entre otros datos relacionados con la salud.
Previo registro en este sitio web, podrá ver que en la Página de Inicio (Home) aparecen varias pestañas de gran utilidad para familiarizarse con el uso de esta plataforma, y que recomendamos revisar como paso inicial. En particular, en la pestaña de Ayuda (Help) aparecen varias secciones con videos instructivos y otros materiales introductorios; lo mismo ocurre con las secciones dentro de la pestaña Acerca de GHDx (About the GHDx). (Ver Página de Inicio en Anexos, Figura 1).
Hay múltiples maneras de buscar/localizar información y datos en esta Plataforma:
- Por tipo de de datos
- Por país
- Por palabras clave
- Por organización/institución
- Por tipo de encuesta/estudio
Eventualmente, los usuarios de esta Plataforma podrán constatar que la pestaña IHME data es de especial utilidad, y en particular la sección GBD Results Tool. Esta sección permite seleccionar, de un muy amplio menú de opciones, los datos de interés del usuario.
En la Figura 2 del Anexo, se muestra captura de pantalla de esta Sección, en la que hemos dado clic en la Sub-sección About (señalada con una flecha en la Figura 1), lo que brinda detalles de cada una de las opciones en el menú a la izquierda de la pantalla.
Una manera fácil y directa de ilustrar su uso es mediante un ejemplo. Supongamos que queremos comparar Cuba y Uruguay con respecto a los principales factores de riesgo, en términos del número de muertes y de la carga total (DALYs) que ellos generan, para el año 2019.
Para lograr este objetivo, una de las posibles variantes se muestra en la Figura 3 del Anexo. Obsérvese que se han seleccionado estimaciones para factores de riesgo (en GBD Estimate), para los indicadores Fallecidos y DALYs (Measure), cifras absolutas y porcentajes (Metric), y para los tres factores de riesgo a Nivel 1 establecidos en los estudios de GBD, Riesgos Medio Ambientales/Ocupacionales (MA/Ocupacionales), Riesgos Conductuales, y Riesgos Metabólicos (Risk), con relación a todas las enfermedades (Cause), en Cuba y Uruguay (Location), para todas las edades (Age), ambos sexos combinados (Sex), y para el año 2019 (Year). Las opciones para sexo y año no salen en la captura de pantalla en esta Figura 3, pero conectados al sitio se puede desplazar hacia arriba el menú para visualizarlas.
Después de completada la selección, se da clic en Download, para descargar un fichero CSV con los datos de interés. La Plataforma le informa por email (al correo que se especificó al registrarse en el sitio) cuándo sus datos ya estén listos, para que los descargue a través de la liga ofrecida.
El fichero CSV descargado desde la Plataforma contiene los resultados solicitados para los indicadores Fallecidos y DALYs. En la Figura 4 del Anexo, presentamos la parte del fichero correspondiente a los Fallecidos. De estas cifras de obtienen los resultados en la Tabla 1 (Ver Anexo), que muestran que, en 2019, en Cuba y Uruguay, el impacto en términos de fallecidos de los Riesgos Metabólicos es similar (43,5 % y 44 % respectivamente); el impacto de los Riesgos MA/Ocupacionales es mayor en Cuba que en Uruguay (19,1 % y 14, 9 % respectivamente), mientras que lo contrario ocurre con los Riesgos Conductuales (37.5 % y 41,1 % respectivamente).
1. MICS-UNICEF
Desde mediados de los 90 y hasta la fecha (Julio 2024), 121 países han llevado a cabo una o más “Encuestas por Conglomerados de Indicadores Múltiples”, más conocidas internacionalmente por MICS (Multiple Indicator Cluster Surveys). En total han sido 365 encuestas, organizadas y patrocinadas por UNICEF cada 4-5 años, que han generado indicadores esenciales sobre el bienestar de los niños y las mujeres, ayudando a la conformación de políticas para el mejoramiento de sus vidas.
Cuba ha participado en 5 “rondas”: MICS2-2000, MICS3-2006, MICS4-2010, MICS5-2014 y MICS6-2019. Las correspondientes bases de datos están todas disponibles, excepto la primera (MICS2-2000), mediante la liga: https://mics.unicef.org/surveys. En esta misma liga también se pueden descargar muchas otras bases de datos de distintas “rondas” de los MICS realizadas en diversos países. La Figura 5 (ver Anexo) ilustra el uso de esta Plataforma de Datos para seleccionar y descargar las bases de datos de las MICS de Cuba.
2. Otras importantes Plataformas de Datos de Acceso Abierto:
i Climate Change Knowledge Portal (CCKP)
Esta Plataforma de Datos de Acceso Abierto, como se indica en su página de Inicio (ver Figura 6 en Anexos), proporciona muy valiosos datos globales y por países (incluyendo Cuba) sobre indicadores del Cambio Climático, entre otros indicadores relacionados. Acceda con el link: https://climateknowledgeportal.worldbank.org/
ii Our World In Data (OWID)
Esta Plataforma de Datos de Acceso Abierto, como se indica en su página de Inicio (ver Figura 7 en Anexos), proporciona datos globales y por países (incluyendo Cuba) sobre indicadores económicos, sociodemográficos, y de salud. Tuvo un papel central en recolectar, organizar y hacer accesible, datos relevantes sobre la pandemia de COVID-19 desde principios del 2020. Se puede acceder mediante el link: https://ourworldindata.org/
Cuba ha avanzado de manera importante en la proliferación y sostenibilidad de bases de datos bibliográficas nacionales certificadas, y en su inserción en varias (las más importantes) de las regionales/internacionales. La casi nula promoción del uso de plataformas de datos internacionales en nuestro país tiene cierta lógica: si no ponemos en repositorios de acceso abierto nuestras bases de datos, se esperaría que no promoviéramos su uso entre nuestros investigadores.
Es nuestra opinión y la de otros autores(36) que en algunas áreas del conocimiento es más accesible para los investigadores cubanos la información de otros países que la propia nacional. Esto se debe en gran medida a la mayor apertura de los datos que existe en otros países. Incluso, la información nacional a veces está disponible en fuentes externas y no lo está en las fuentes nacionales. Esta situación consideramos que mejoró sustancialmente durante la pandemia de COVID-19, en la que se hizo imperante la necesidad de compartir los datos locales/nacionales para así aprender unos de otros y evitar muertes innecesarias.
Al momento de redactarse este manuscrito (julio 2024), la Asamblea Nacional del Poder Popular en Cuba aprobaba la “Ley de la Transparencia y el Acceso a la Información Pública”(37) conducida por el CITMA, acontecimiento que propiciará un sostenido avance en el camino del acceso abierto al conocimiento en las ciencias y las humanidades, al cual nos referíamos previamente.
Al presentar el proyecto de ley a los parlamentarios reunidos en el Palacio de Convenciones, el Ministro de Ciencia, Tecnología y Medio Ambiente recordó las palabras de Raúl cuando afirmó en 2010 que “Es preciso poner sobre la mesa toda la información y los argumentos que fundamentan cada decisión y, de paso, suprimir el exceso de secretismo a que nos habituamos durante más de 50 años de cerco enemigo.”(38)
Comentarios finales
Es necesaria una mayor inversión y promoción en infraestructuras para el desarrollo de la vía “verde” en Cuba, lo que posibilitará que los datos de nuestras investigaciones se “depositarse” en repositorios de acceso abierto. Es conveniente promover la publicación de artículos científicos o data papers que presenten de manera estandarizada los metadatos de las correspondientes bases de datos. Incluso, eventualmente, debiéramos considerar la creación de una revista científica cubana de datos.
Es fundamental que los investigadores en Cuba conozcamos y aprovechemos mejor las plataformas de datos de acceso abierto, donde con frecuencia se pueden encontrar datos relevantes sobre nuestro país.
Agradecimientos
Los autores agradecen al Instituto Nacional de Higiene, Epidemiología y Microbiología de La Habana, Cuba, así como del Instituto de Medicina Tropical de Amberes por el apoyo en esta investigación.
Conflicto de intereses
Los autores declaran que no existe conflicto de intereses.
Contribuciones de los autores
Conceptualización: Mayelin Mirabal Sosa, Armando H. Seuc Jo, Yanet García Serrano
Visualización: Armando H Seuc Jo, Mayelin Mirabal Sosa, Yanet García Serrano, Karen Alfonso Sagué, Darily Losada Gandarilla, Carlos Moncada Menéndez.
Redacción del borrador original: Mayelin Mirabal Sosa, Armando H Seuc Jo, Yanet García Serrano, Karen Alfonso Sagué, Darily Losada Gandarilla, Carlos Moncada Menéndez.
Redacción, revisión y edición: Mayelin Mirabal Sosa, Armando H. Seuc Jo. investigación.
Financiación
Sin financiamiento externo.