Herramientas

HTML

PDF

Metadatos de indexación

Cómo citar un elemento

Imprimir este artículo

Política de revisión

Envía por correo este artículo (Se requiere entrar)
Enviar un correo electrónico al autor/a (Se requiere entrar)

CARTA AL DIRECTOR

El procesamiento estadístico con R en la investigación científica

Statistical processing with R in scientific research

1 Universidad de Cienfuegos, Cienfuegos, Cuba
2 Empresa de Telecomunicaciones de Cuba, Cienfuegos, Cuba


Señor Director:

Es indudable que la estadística ocupa un lugar importante dentro de la investigación científica. Mediante la estadística se evalúan cuantitativamente hipótesis de investigación, se desarrollan modelos predictivos, se estiman parámetros y se pueden analizar experimentos.

El uso de un programa de computación estadístico es importante tanto en la ciencia básica como en la aplicada, por sus posibilidades de automatización de los complejos cálculos estadísticos para el análisis de los datos. Las aplicaciones de procesamiento estadístico que se han establecido en la investigación científica cubana, han sido opciones comerciales (SPSS, Minitab, Statgraphic, MS Excel, entre otros), con precios bien altos en licencias. Sin embargo, ha surgido un conjunto de aplicaciones de software libre (R, PSPP, etc.) muy potentes para la difícil tarea del análisis de datos de la investigación.1

El caso específico de R (R Development Core Team) es un programa estadístico y un lenguaje de programación de uso libre, de distribución gratuita y código abierto, desarrollado a partir de un proyecto colaborativo voluntario de investigadores y estadísticos de diversos países y disciplinas. Es un programa basado en comandos, que permite acceder a todos los procedimientos y opciones a través de una sintaxis textual. Fue oficialmente presentado en 1997 bajo Licencia General Pública de la Fundación de Software Libre.2 (Figura 1).

R es un entorno de programación para el análisis estadístico y gráfico de datos, que cada vez se hace más popular entre los investigadores de todas las disciplinas, y cada día lo suman más universidades a sus planes de estudio. Tiene muchas ventajas y es oportuno y pertinente para los investigadores cubanos de cualquier área del saber.

Como software libre es aprobado por varios motivos: transmite valores socialmente positivos (libertad individual, conocimiento compartido, solidaridad y cooperación); nos aproxima al método científico, porque permite el examen y mejora del código desarrollado por otros usuarios y la reproducibilidad de los resultados obtenidos; pueden adquirirse de manera legal y gratuita copias del programa, sin necesidad de licencias personales o académicas.

Aparte de su faceta de software libre, R tiene algunas ventajas específicas: por ejemplo, su sintaxis básica es sencilla e intuitiva, lo que se traduce en un aprendizaje rápido y cómodo; además, tiene una enorme comunidad de usuarios, estructurada alrededor de la Comprehensive R Archive Network, CRAN, que desarrolla cada día nuevos paquetes que extienden sus funcionalidades y cubren casi todas las necesidades computacionales y estadísticas de un científico.

Junto a R, se han desarrollado varias interfaces y ambientes. Una de ellas es R-Commader, poderosa interface gráfica de usuario que permite acceder a múltiples análisis estadísticos, sin necesidad de conocer propiamente el lenguaje de programación. RKWard es otra de las más utilizadas, cuyo diseño de aplicación ofrece la posibilidad de utilizar las herramientas gráficas, así como ignorar muchas de ellas y usar el programa como entorno de desarrollo integrado.

Gracias a su sistema de extensiones RKWard amplía constantemente el número de funciones a las cuales se puede acceder sin necesidad de escribir el código directamente. Estos componentes permiten que se generen instrucciones en R para las operaciones estadísticas más usuales o las más complejas. De esta manera, incluso sin tener conocimientos profundos sobre el lenguaje, es posible realizar análisis de datos avanzados o gráficas elaboradas. Los resultados de las operaciones son formateados y presentados como HTML, haciendo posible exportar tablas y gráficos, por ejemplo, a suites ofimáticas.

En el año 2011 surge RStudio, ambiente de desarrollo integrado que permite una interacción rápida y amigable con R, además del desarrollo de código de forma interactiva. (Figura 2).

Paralelo al proyecto y patrocinado por la Fundación R, ha florecido la Revista R (R Journal), que desde el año 2009 divulga artículos de investigación científica en computación, estadística y otras áreas afines de interés de la comunidad. Anualmente se realizan conferencias y congresos relacionados con el desarrollo y aplicación de R en todas las áreas del conocimiento.

Como se ha comentado, miles son los contribuidores de código, extensiones y bibliotecas que amplían casi a diario el abanico de temas a tratar con este, posibilitando el crecimiento y madurez de este software, haciendo evidente además la fortaleza del software libre y el código abierto.3

Cada día se suman universidades y centros de investigación científica, incluyendo las ciencias médicas, que utilizan R en su día a día, demostrando sus capacidades y fiabilidad para el análisis estadístico y tratamiento de datos frente a soluciones privativas. Sería muy beneficioso para nuestra sociedad que se comiencen a introducir estas opciones en la práctica científica de los investigadores, para seguir labrando el camino hacia una investigación científica sostenible y soberana.

REFERENCIAS BIBLIOGRÁFICAS
1 Artime C, Blanco N. Paquetes estadísticos con licencia libre (I). Revista electrónica de metodología aplicada [revista en Internet]. 2013 [citado 6 Abr 2017];18(2):[aprox. 45p]. Disponible en: https://www.unioviedo.es/reunido/index.php/Rema/article/view/10307/9917
2 Salas C. ¿Por qué comprar un programa estadístico si existe R?. Ecol austral [revista en Internet]. 2008 [citado 6 Abr 2017];18(2):[aprox. 13p]. Disponible en: http://www.scielo.org.ar/scielo.php?script=sci_arttext&pid=S1667-782X2008000200007&lng=es
3 López E, Hidalgo R. Escalamiento Multidimensional No Métrico. Un ejemplo con R empleando el algoritmo SMACOF. Estudios sobre educación [revista en Internet]. 2016 [citado 6 Abr 2017];18:[aprox. 60p]. Disponible en: https://www.unav.edu/publicaciones/revistas/index.php/estudios-sobre-educacion/article/view/4650/4007

Enlaces refback

  • No hay ningún enlace refback.


Editada en la Universidad de las Ciencias Médicas de Cienfuegos. Directora: Dra.C Dunia María Chavez Amaro