Establecimiento de estándares y puntos de corte en exámenes de alto impacto en profesiones de la salud
Resumen
Introducción: Los exámenes sumativos estandarizados de alto impacto en las profesiones de la salud se utilizan para sustentar decisiones de certificación profesional. La definición de estándares y puntos de corte debe ser válida, transparente y defendible, equilibrando la seguridad del paciente, la equidad y la factibilidad.
Objetivo: Sintetizar marcos conceptuales, métodos y consideraciones prácticas para establecer estándares y definir puntos de corte en exámenes de alto impacto, incorporando psicometría, defendibilidad legal y análisis de consecuencias, con énfasis regional latinoamericano.
Método: Revisión narrativa de literatura internacional y regional, documentos técnicos y guías de organismos certificadores. Se comparan enfoques para pruebas de conocimiento (por ejemplo, exámenes de opción múltiple) y de competencias o destrezas (p. ej., simuladores), destacando requisitos, ventajas y limitaciones.
Resultados: Los métodos basados en jueces (Angoff modificado, Ebel) son útiles cuando el contenido está claramente alineado al currículo; Bookmark se apoya en la teoría de respuesta al ítem (TRI) para ordenar ítems y fijar umbrales; Hofstee acota rangos aceptables de aprobación; Beuk y esquemas híbridos ayudan a armonizar el estándar con la dificultad empírica. En evaluación del desempeño, predominan Grupo Limítrofe y Regresión del Limítrofe. Factores críticos: selección y capacitación de panelistas; uso de evidencia empírica (dificultad, discriminación, funcionamiento diferencial de ítems); equiparación entre versiones; estimación del error estándar de medición y bandas de confianza para decisiones de aprobación; documentación y transparencia; monitoreo de impacto y equidad por subgrupos. La defendibilidad legal mejora cuando el estándar se vincula a descriptores de competencia, se sustenta en un argumento de validez y se reporta precisión y consistencia de clasificación.
Conclusiones: No existe un método único superior. La elección debe alinearse con el propósito de la evaluación, formato, datos disponibles y recursos. Se recomiendan procesos híbridos, gobernanza clara, trazabilidad documental y evaluación continua de consecuencias para fortalecer la equidad y la confianza pública en los contextos de América Latina.


