Herramientas

HTML

PDF

Metadatos de indexación

Cómo citar un elemento

Imprimir este artículo

Política de revisión

Envía por correo este artículo (Se requiere entrar)
Enviar un correo electrónico al autor/a (Se requiere entrar)

ARTÍCULO ORIGINAL

Calidad del instrumento de evaluación final de la asignatura Célula, Tejidos y Sistema Tegumentario

Final assessment tool quality of the subject Cell, Tissues and Integumentary System

1 Universidad de Ciencias Médicas de Cienfuegos, Cuba


RESUMEN

Fundamento: cuando se emplea un instrumento evaluativo, este debe ajustarse a rigurosos estándares de calidad; los defectos en su elaboración tienen efectos negativos en el proceso de enseñanza aprendizaje.
Objetivo: evaluar la calidad del examen ordinario de la asignatura Célula, Tejidos y Sistema Tegumentario a través del nivel de dificultad y el poder de discriminación del instrumento.
Métodos: estudio observacional, descriptivo de corte transversal en el campo de la evaluación. El universo estuvo integrado por 369 exámenes que corresponden al total de estudiantes que se presentaron. Las variables de estudio fueron procedimiento y técnicas, frecuencia de errores, índice de dificultad y poder de discriminación. Para el procesamiento estadístico se realizó el cálculo de índices y por cientos.
Resultados: el examen estuvo constituido por siete preguntas, predominaron las de tipo ensayo (57,14 %) y dentro de estas las de respuesta corta con un total de tres que representa el 75 %. La pregunta uno tuvo mayor número de aciertos mientras que la pregunta cuatro tuvo el menor número de aciertos. De las preguntas, cinco (71,42 %) fueron altamente fácil, dos (28,57 %) medianamente fácil, una (14,28 %) con dificultad media. El examen se calificó de altamente fácil con un índice de 0,88. El 85,71 % de las preguntas presentaron una discriminación excelente al igual que el examen en general con un índice de 0,57.
Conclusiones: el examen mostró una calidad adecuada a partir de la coherencia que existió entre las preguntas, el nivel de dificultad y el poder de discriminación.



Palabras clave: evaluación educacional, estudios de evaluación como asunto, enseñanza, medicina

ABSTRACT

Background: when an assessment tool is used, it must conform to rigorous quality standards; defects in its preparation have negative effects on the teaching-learning process.
Objective: to evaluate the quality of the ordinary examination of the Cell Tissues and Integumentary System subject through the level of difficulty and the power of the instrument discrimination.
Methods: observational, descriptive cross-sectional study in the field of evaluation. The universe was made up of 369 exams that correspond to the total number of students who took part. The study variables were procedure and techniques, frequency of errors, index of difficulty and power of discrimination. For statistical processing, the calculation of indices and percentages was performed.
Results: the exam consisted of seven questions, essay-type predominated (57.14%) and within these short-answer questions with a total of three that represents 75%. Question one had the highest number of correct answers while question four had the least number of correct answers. Of the questions, five (71.42%) were highly easy, two (28.57%) moderately easy, one (14.28%) medium difficulty. The exam was rated as highly easy with an index of 0.88. 85.71% of the questions presented an excellent discrimination as well as the exam in general with an index of 0.57.
Conclusions: the exam showed an adequate quality based on the coherence that existed between the questions, the level of difficulty and the power of discrimination.



Keywords: educational measurement, evaluation studies as topic, learning, medicine

INTRODUCCIÓN

La educación de calidad en las ciencias médicas es primordial para la formación de profesionales responsables y competentes cuyo encargo social responde a los objetivos de la salud pública, con mejores indicadores de salud y calidad de vida de las poblaciones.(1)

En la educación superior cubana está reglamentado que la evaluación del aprendizaje es un proceso consustancial al desarrollo del proceso docente educativo; tiene como propósito comprobar el grado de cumplimiento de los objetivos formulados en los planes de estudio, mediante la valoración de los conocimientos y habilidades que los estudiantes van adquiriendo y desarrollando.(2)

La evaluación constituye una vía para la retroalimentación y la regulación, le permite al profesor indagar sobre el grado de aprendizaje y desarrollo en el proceso de formación, así como la capacidad para aplicar los contenidos en la solución de problemas de la profesión, le brinda información oportuna y confiable para descubrir aquellos elementos de la práctica, de tal manera que pueda reflexionar para mejorarlos y reorientarlos de forma permanente.(2,3,4)

Cuando se utilizan instrumentos de alto impacto, como los exámenes finales de las asignaturas, es necesario conocer los indicadores técnicos que definen la calidad del instrumento evaluativo que se emplea. La elaboración de comprobaciones debe ajustarse a rigurosos estándares de calidad; los defectos en su elaboración tienen efectos negativos en el currículo, el proceso docente y los estudiantes.(2,4,5)

Dentro de los indicadores de calidad de los exámenes escritos, que con mayor frecuencia se trabajan, están la validez, confiabilidad, dificultad y discriminación.(6,7) Los autores de esta investigación asumen los dos últimos indicadores de calidad para este estudio.

En Cuba, como en otros países, diversos estudios(4,5) reportan defectos en la elaboración de instrumentos evaluativos escritos, estos repercuten de manera perjudicial en las características psicométricas y en su validez.

La implementación del Plan E en la carrera de Medicina comienza a partir del curso 2019-2020 e incluye en su currículo, como una de sus disciplinas, las Bases Biológicas de la Medicina, dentro de ella la asignatura Célula, Tejidos y Sistema Tegumentario impartida en el primer semestre de primer año, la cual termina con un examen final escrito.(7,8)

Los autores consideran que al realizar un análisis de los indicadores de calidad aportarían información útil al colectivo de profesores sobre el grado de dificultad que presenta un examen o contenido evaluado, para trabajar en la superación de los problemas que puedan presentarse en ese sentido y con ello mejorar la calidad del proceso enseñanza-aprendizaje.

Con la realización de este trabajo pretendemos identificar las principales dificultades presentes en el proceso evaluativo de la asignatura y así trazar estrategias a través de las actividades metodológicas planificadas por el colectivo de profesores que permitan realizar acciones que garanticen elevar la calidad en la formación de los estudiantes, por tal motivo fue su objetivo evaluar la calidad del examen ordinario de la asignatura Célula, Tejidos y Sistema Tegumentario a través del nivel de dificultad y el poder de discriminación del instrumento.

MÉTODOS

Se realizó un estudio observacional, descriptivo de corte transversal en el marco de la educación médica (en el campo de la evaluación), para evaluar la calidad del examen ordinario de la Asignatura Célula, Tejidos y Sistema Tegumentario, a través del nivel de dificultad y el poder de discriminación del instrumento aplicado en el primer semestre del primer año de la Carrera de Medicina en la Facultad de Ciencias Médicas de Cienfuegos, curso 2020-2021.

El universo de estudio estuvo integrado por 369 exámenes que corresponden al total de estudiantes presentados al examen de Célula, Tejidos y Sistema Tegumentario en el curso 2020- 2021.

Se clasificaron las preguntas teniendo en cuenta procedimientos y técnicas empleados para su elaboración y se determinó la frecuencia de errores de cada una.

Las variables de estudio declaradas fueron el procedimiento (examen de siete preguntas de tipo ensayo y test objetivo) y técnicas (verdadero y falso, respuesta corta, respuesta larga y enlace o apareamiento), frecuencia de errores, índice de dificultad y poder de discriminación.

Nivel de dificultad: proporción de personas que responden correctamente dentro del total de examinados, es inversamente proporcional a la dificultad, cuanto mayor sea esta proporción menor será la dificultad. Bajo una perspectiva estadística se expresa como índice de dificultad (p) y, como cualquier índice, debe estar cercano a una proporción de 0,5-0,6.(6,9) Su cálculo se realizó por la fórmula de Backhoff.(9)

Se distribuyeron los valores de p en: altamente difícil menos de 0,32; medianamente difícil de 0,32-0,52; dificultad media de 0,53-0,73; medianamente fácil de 0,74-0,86 y altamente fácil más de 0,86 de acuerdo a los parámetros propuestos por Backhoff.(9)

Se interpretaron los resultados acordes con la curva de distribución de frecuencias donde se espera que, según las respuestas correctas dadas por los estudiantes, un 5 % considera fácil el examen, 20 % medianamente fácil, 50 % con dificultad media, 20 % medianamente difícil y 5 % difícil.(9)

Poder de discriminación: permite distinguir a los estudiantes de alto y bajo rendimiento, además aporta criterio de predicción sobre los resultados del estudiante, pues si el examen y una pregunta miden la misma habilidad o competencia, se puede esperar que quien tuviera una puntuación alta en todo el examen deberá tener altas probabilidades de contestar correctamente los temas evaluados en sus preguntas. Para identificarlo se utilizan dos indicadores: índice de discriminación y coeficiente de discriminación.(9) En esta investigación solo se trabajó con el índice de discriminación.

Índice de discriminación: permite distinguir los estudiantes de alto y bajo rendimiento, solo se valora 54 % (27 % más alto y 27 % más bajo) de los estudiantes evaluados, por tanto, se dividió el grupo de estudiantes en tres subgrupos, de acuerdo con calificación que obtuvieron en el examen, quedó así un tercio superior, un tercio medio y un tercio inferior.(9)

Cuanto más alto es el índice de discriminación (Di), la prueba diferenciará mejor a los estudiantes con altas y bajas calificaciones. Si todos los estudiantes con altas calificaciones contestan correctamente una pregunta y todos los estudiantes con bajas calificaciones contestan incorrectamente, entonces el Di= 1, (valor máximo de este indicador); si sucede lo contrario D= -1 (valor máximo negativo), si ambos grupos contestan por igual Di= 0 (valor mínimo de discriminación).

Un índice de discriminación negativo refleja error en la determinación de la clave o que es una pregunta muy difícil, lo cual impediría discriminar correctamente un grupo de estudiantes para valorar si dominan o no el contenido evaluado.

Cuando el índice es altamente positivo se considera una pregunta excelente, ajustada a la clave, pero si disminuye el índice refleja que la pregunta se podrá modificar, debido a que muy pocos estudiantes seleccionaron la respuesta correcta, o un gran número de estudiantes seleccionó otra respuesta como correcta, lo cual orienta a la revisión para valorar si esa otra respuesta predominante sería igualmente correcta, si hay problemas de redacción que hagan que el estudiante interprete diferente a la respuesta correcta, o si consta de preguntas con respuestas muy elementales que disminuyan el poder de discriminación que se persigue.(10)

Para el cálculo del indicador índice de discriminación (Di) se aplicó la fórmula:(8, 9,11)

Pasos seguidos para el cálculo de Di: se organizaron los resultados de los exámenes en orden decreciente, se calculó 27 % de los resultados más altos y de los más bajos, se calculó el número que representa 46 % restante, se aplicó la fórmula.

El Di se distribuyó según propuesta de Backhoff:(9) mayor de 0,39 calidad excelente (conservar), de 0,30 – 0,39 buena calidad (posibilidades de mejorar), de 0,20 – 0,29 calidad regular (necesidad de revisar), de 0,00 – 0,20 pobre calidad (descartar o revisar a profundidad) y < -0.01 pésima calidad (descartar definitivamente).

Los métodos estadísticos que se utilizaron para la identificación del índice de dificultad y el índice de discriminación fueron del software de hoja de cálculo Excel de Windows XP. Se realizó un análisis descriptivo de todas las variables del estudio. Se trabajó con números enteros, porciento e índices para la presentación de los resultados en tablas.

Esta investigación fue aprobada por el Comité de Ética y el Consejo Científico de la Universidad de Ciencias Médicas de Cienfuegos.

RESULTADOS

El examen ordinario estuvo compuesto por siete preguntas. Predominaron las preguntas de tipo ensayo (57,14 %) y dentro de estas las de respuesta corta (75 %). (Tabla 1).

Se comprobó que la pregunta uno tuvo mayor número de aciertos con un total de 349 para un 94, 58 %; la pregunta cuatro tuvo el mayor número de errores o menor número de aciertos con un total de 253 que representa el 68, 56 %. Resultaron aprobados en el examen 328 estudiantes que representa el 88,88 % y desaprobados 41 estudiantes para un 11,11 %. (Tabla 2).

Según los resultados obtenidos del examen, de acuerdo a su índice de dificultad, se observó que de las siete preguntas, cinco (71,42 %) fueron altamente fácil, dos (28,57 %) medianamente fácil, una (14,28 %) dificultad media. (Tabla 3).

El índice de discriminación osciló entre 0,69 y 0,85, así la mayoría de las preguntas presentaron excelente discriminación y solo una con pobre discriminación. (Tabla 4).

DISCUSIÓN

El examen ordinario estuvo compuesto por siete preguntas, predominaron las de tipo ensayo y dentro de estas las de respuesta corta. El hecho de limitar el espacio de respuesta favorece la facilidad de calificación, pero, al mismo tiempo, reduce la posibilidad del estudiante de la libre expresión. Permite apreciar la capacidad de síntesis, comparación, redacción y originalidad del estudiante.

Al revisar algunos artículos se pudieron encontrar autores como Carrazana et al.(6) que analizaron en sus investigaciones instrumentos evaluativos con formato mixto, resultados que evidencian la tendencia a la elaboración de exámenes en este formato en ciencias médicas. Zayas,(12) plantea que las preguntas más empleadas son las de test objetivo, pero, contrariamente, las preguntas de mayor preferencia por los estudiantes fueron las de ensayo.

Las autoras consideran que lo correcto sería utilizar exámenes de formato mixto, utilizando ambos tipos de preguntas y así se pueden aprovechar las ventajas de cada una y minimizar sus desventajas.

Cuando se hace el análisis de la frecuencia de errores se puede observar que la pregunta uno tuvo mayor número de aciertos que la pregunta cuatro, lo que coincide con los resultados obtenidos cuando se le calcula el índice de dificultad a cada una de las preguntas. En investigaciones revisadas se plantea que los resultados que se desean obtener para un examen, como promedio, deben oscilar en un rango de dificultad media a medianamente fácil;(6,9) sin embargo, este estudio no se comporta según lo planteado.

El promedio general de dificultad del examen analizado fue de 0,88, clasificándose de altamente fácil lo cual provocó que más de 80 % de los estudiantes lograran responder el examen satisfactoriamente. Según Carrazana,(6) el nivel medio de dificultad del examen debe oscilar entre 0,5 y 0,6; aunque Backhoff(9) extiende el límite superior de este rango hasta 0,73, criterio asumido por los autores de este trabajo.

El resultado de este estudio difiere de lo planteado por algunos autores, los cuales plantean que un examen que posea dificultad media es superior, en confiabilidad de resultados, a aquellos que tengan mucha dificultad o que resulten muy fáciles, debido a que aumenta el criterio para diferenciar los estudiantes que dominan un contenido de los que aún no lo hacen. Es decir, exámenes muy fáciles o muy difíciles dan poco margen de discriminación, debido a que los estudiantes son igualados, en un examen muy fácil la mayoría tiene altos resultados, en un examen muy difícil la mayoría tiene muy bajos resultados, estas preguntas no contribuyen a la fiabilidad.(6,9,13)

Los autores consideran que los resultados obtenidos en el examen se encuentran asociados al trabajo metodológico del colectivo de la asignatura con el uso de las guías autoformativas, las cuales se implementaron en la educación a distancia debido a la COVID-19, fortaleciendo así la autopreparación de los estudiantes que se enfrentaron a un proceso de enseñanza aprendizaje diferente a los cursos anteriores.

El índice de discriminación osciló entre 0,69 y 0,85; así, la mayoría de las preguntas presentaron excelente discriminación y solo una con pobre discriminación. Estas cifras muestran que el instrumento presenta buena eficacia para diferenciar los estudiantes que tienen buenos resultados de aquellos con resultados bajos, define sin dificultad aquellos estudiantes que tienen el conocimiento correcto de aquellos que no lo tienen, resultados diferentes se encontraron en otros estudios afines con este.(6,9,14)

La excelente discriminación general del instrumento concuerda con la frecuencia de errores del examen. Estos resultados coinciden con investigaciones realizadas por Blanco Pereira y colaboradores.(13)

La pregunta con índice discriminativo pobre (14,28 %) coincide en ser clasificada de dificultad media según su índice de dificultad, fue elaborada de tipo ensayo de respuesta larga, por lo que tenía mayor grado de complejidad, a pesar de esto podemos decir que aunque los estudiantes hayan obtenido baja calificación en esa pregunta, no determinó para que alcanzaran altas puntuaciones en el examen en general.

Es criterio de las autoras que en la pregunta de dificultad media que no discriminó adecuadamente, debe ser valorada la posibilidad de emplear otro tipo de procedimiento para su confección, descartar o revisar con profundidad para lograr la mejor comprensión por parte de los estudiantes, también se considera que ellos pueden ser entrenados durante las evaluaciones frecuentes en este tipo de preguntas, siempre con el objetivo de lograr buenos resultados en las preguntas del examen.

Se debe tener presente que al hacer la revisión de un examen se debe verificar: si las preguntas responden a los objetivos generales a evaluar, si otras respuestas predominantes serían igualmente correctas, si existen problemas de redacción que hagan que el estudiante interprete diferente a la respuesta correcta, o si constan preguntas con respuestas muy elementales o muy difíciles que disminuyan el poder de discriminación que se persigue.(6,9)

Podemos concluir que el examen de Célula, Tejidos y Sistema Tegumentario mostró una calidad adecuada a partir del análisis de la coherencia entre las preguntas, el nivel de dificultad y el poder de discriminación.

Sugerimos incorporar a estas investigaciones métodos cualitativos que permitan valorar la calidad de los instrumentos, así como continuar trabajando la línea de la evaluación del aprendizaje en las actividades metodológicas de los colectivos de asignaturas que integran la disciplina Bases Bilógicas de la Medicina y de esta forma profundizar en la elaboración del diseño de los instrumentos de evaluación, que ayudan en la eficiencia del proceso docente educativo.

 

Conflicto de intereses

Los autores declaran no tener conflicto de intereses.

Contribuciones de los autores

Conceptualización: Marlen Llanes Torres.

Curación de datos: Grey Alicia Crespo Lechuga.

Análisis formal: Zulema Tamara Mesa Montero .

Investigación: Marlen Llanes Torres,

Metodología: Laura Naranjo Hernández.

Administración del proyecto: Marlen Llanes Torres.

Supervisión: Galia Ivis Pérez Rumbaut, Marlen Llanes Torres.

Validación: Laura Naranjo Hernández, Marlen Llanes Torres.

Visualización: Marlen Llanes Torres, Laura Naranjo Hernández.

Redacción del borrador original: Marlen Llanes Torres.

Redacción, revisión y edición: Laura Naranjo Hernández, Marlen Llanes Torres.

Financiacion

Universidad de Ciencias Médicas de Cienfuegos. Cienfuegos, Cuba.

REFERENCIAS BIBLIOGRÁFICAS
1 Céspedes-Miranda E, Suárez-Castillo N, Carrión-Pérez E, Guerrero-Ramírez A, Espinosa-Martínez J. Características del ingreso y resultados académicos en estudiantes de primer año de Medicina. Edumecentro [revista en Internet]. 2021 [citado 6 Dic 2021];14:[aprox. 7p]. Disponible en: http://www.revedumecentro.sld.cu/index.php/edumc/article/view/1682
2 Martínez Pérez R. Criterios de calidad de los instrumentos evaluativos escritos. Medimay [revista en Internet]. 2020 [citado 20 Ene 2022];27(2):[aprox. 7p]. Disponible en: https://www.medigraphic.com/pdfs/revciemedhab/cmh-2020/cmh202o.pdf
3 Ministerio de Educación Superior. Resolución Ministerial No. 02. Reglamento de Trabajo Docente y Metodológico en la Educación Superior [Internet]. La Habana: Ministerio de Educación Superior; 2018 [citado 20 Ene 2021]. Disponible en: https://www.mes.gob.cu/es/resoluciones
4 Martínez Pérez R, Ríos Rodríguez M, Roque Marrero Y, Caballero Padrón KY. Evidencias de validez del examen final de la asignatura Metabolismo y Nutrición. Medimay [revista en Internet]. 2021 [citado 20 Ene 2022];28(1):[aprox. 6p]. Disponible en: https://www.medigraphic.com/pdfs/revciemedhab/cmh-2021/cmh211j.pdf
5 Rivera Jiménez J, Flores Hernández F, Alpuche Hernández A, Martínez González A. Evaluación de reactivos de opción múltiple en medicina. Evidencia de validez de un instrumento. Inv Ed Med [revista en Internet]. 2017 [citado 20 Ene 2021];6(21):[aprox. 8p]. Disponible en: http://dx.doi.org/10.1016/j.riem.2016.04.005
6 Carrazana Lee A, Salas Perea RS, Ruiz Salvador AK. Nivel de dificultad y poder de discriminación del examen diagnóstico de la asignatura Morfofisiología Humana I. Educ Med Super [revista en Internet]. 2011 [citado 4 Jun 2021];25(1):[aprox. 11p]. Disponible en: http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S086421412011000100010&lng=es
7 Resco Zequeira M, Sánchez Rodríguez I, González Verdecia Y. Calidad del instrumento de evaluación final de la asignatura célula tejidos y sistema tegumentario [Internet]. Granma: Universidad de Ciencias Médicas de Granma; 2021 [citado 23 Mar 2022]. Disponible en: https://cibamanz2021.sld.cu/index.php/cibamanz/cibamanz2021/paper/viewFile/379/286
8 Fernández Jiménez M, González Jardines M, Dovale Borjas A, Rodríguez Pérez I, Iglesias Ramírez B, González Aguilar V. Programa de Célula, Tejidos y Sistema Tegumentario. La Habana: Comisión Nacional de Carrera de Medicina; 2019
9 Backhoff E, Larrazolo N, Rosas M. Nivel de dificultad y poder de discriminación del Examen de Habilidades y conocimientos Básicos (EXHCOBA). Revista Electrónica de Investigación Educativa [revista en Internet]. 2000 [citado 4 Jun 2021];2(1):[aprox. 7p]. Disponible en: http://redie.uabc.mx/vol2no1/contenido-backhoff.html
10 Carrazana Lee A, Álvarez Bustamante G, Quesada Rodríguez M, Hidalgo Cerito Y. Dificultad y discriminación de exámenes ordinarios de la asignatura Célula, Tejidos y Sistema Tegumentario en Ciencias Básicas. Rev Haban Cienc Méd [revista en Internet]. 2018 [citado 1 Jul 2021];17(2):[aprox. 9p]. Disponible en: http://www.revhabanera.sld.cu/index.php/rhab/article/view/2149
11 Salas Perea RS, Salas Mainegra A. Modelo formativo del médico cubano. Bases teóricas y metodológicas. La Habana: Editorial Ciencias Médicas; 2017
12 Zayas González M. Estudio descriptivo de los instrumentos evaluativos en la asignatura Farmacología[Trabajo de terminación de Diplomado en Educación Médica Superior]. Villa Clara: Instituto Superior de Ciencia Médica Serafín Ruíz de Zarate Ruiz; 2002
13 Blanco Pereira ME, Martínez L, González Gil A, Jordán Padrón M. Calidad del examen final teórico de Morfofisiología Humana I en la Facultad de Ciencias Médicas de Matanzas. Cursos 2012-2013 y 2013-2014. Rev Med Electrón [revista en Internet]. 2015 [citado 20 Ene 2021];37(4):[aprox. 6p]. Disponible en: http://www.revmedicaelectronica.sld.cu/index.php/rme/article/view/1173/html_31
14 Martínez Pérez R, Ríos Rodríguez M, Roque Marrero Y, Caballero Padrón KY. Evidencias de validez del examen final de la asignatura Biología molecular. Carrera de Medicina. Medimay [revista en Internet]. 2018 [citado 20 Ene 2021];26(3):[aprox. 6p]. Disponible en: http://www.medimay.sld.cu/index.php/rcmh/issue/archive

Enlaces refback

  • No hay ningún enlace refback.


Editada en la Universidad de las Ciencias Médicas de Cienfuegos. Directora: Dra.C Dunia María Chavez Amaro