Establecimiento de estándares y puntos de corte en exámenes de alto impacto en profesiones de la salud

Laura Delgado Maldonado; Melchor Sánchez Mendiola

doi:10.22201/fm.20075057e.2026.57.25768

DOI: https://doi.org/10.22201/fm.20075057e.2026.57.25768

Laura Delgado Maldonado
Melchor Sánchez Mendiola https://orcid.org/0000-0002-9664-3208

Palabras clave: Establecimiento de estándares, puntos de corte, psicometría, certificación médica, exámenes sumativos de alto impacto, América Latina

Resumen

Introducción: Los exámenes sumativos estandarizados de alto impacto en las profesiones de la salud se utilizan para sustentar decisiones de certificación profesional. La definición de estándares y puntos de corte debe ser válida, transparente y defendible, equilibrando la seguridad del paciente, la equidad y la factibilidad.

Objetivo: Sintetizar marcos conceptuales, métodos y consideraciones prácticas para establecer estándares y definir puntos de corte en exámenes de alto impacto, incorporando psicometría, defendibilidad legal y análisis de consecuencias, con énfasis regional latinoamericano.

Método: Revisión narrativa de literatura internacional y regional, documentos técnicos y guías de organismos certificadores. Se comparan enfoques para pruebas de conocimiento (por ejemplo, exámenes de opción múltiple) y de competencias o destrezas (p. ej., simuladores), destacando requisitos, ventajas y limitaciones.

Resultados: Los métodos basados en jueces (Angoff modificado, Ebel) son útiles cuando el contenido está claramente alineado al currículo; Bookmark se apoya en la teoría de respuesta al ítem (TRI) para ordenar ítems y fijar umbrales; Hofstee acota rangos aceptables de aprobación; Beuk y esquemas híbridos ayudan a armonizar el estándar con la dificultad empírica. En evaluación del desempeño, predominan Grupo Limítrofe y Regresión del Limítrofe. Factores críticos: selección y capacitación de panelistas; uso de evidencia empírica (dificultad, discriminación, funcionamiento diferencial de ítems); equiparación entre versiones; estimación del error estándar de medición y bandas de confianza para decisiones de aprobación; documentación y transparencia; monitoreo de impacto y equidad por subgrupos. La defendibilidad legal mejora cuando el estándar se vincula a descriptores de competencia, se sustenta en un argumento de validez y se reporta precisión y consistencia de clasificación.

Conclusiones: No existe un método único superior. La elección debe alinearse con el propósito de la evaluación, formato, datos disponibles y recursos. Se recomiendan procesos híbridos, gobernanza clara, trazabilidad documental y evaluación continua de consecuencias para fortalecer la equidad y la confianza pública en los contextos de América Latina.

Descargas

La descarga de datos todavía no está disponible.

Biografía del autor/a

Laura Delgado Maldonado

Consultora independiente, exdirectora General de Medición y Tratamiento de Datos, Instituto Nacional para la Evaluación de la Educación (INEE), Cd. Mx., México.

Melchor Sánchez Mendiola

División de Estudios de Posgrado, Facultad de Medicina, Universidad Nacional Autónoma de México (UNAM), Cd. Mx., México.

Establecimiento de estándares y puntos de corte en exámenes de alto impacto en profesiones de la salud

Resumen

Descargas

Biografía del autor/a

Artículos más leídos del mismo autor/a