En toda evaluación educativa uno de los procesos que juega un papel fundamental es la medición ya que a través de ésta se pueden obtener puntuaciones válidas y fiables que van a permitir al evaluador (profesor) hacer inferencias apropiadas sobre los resultados de sus alumnos.

Si bien es cierto que la medición es una parte muy importante de todo proceso de evaluación, también es cierto que obtener puntuaciones válidas y fiables se convierte en una tarea bastante exigente y costosa. Por este motivo, gran parte del tiempo que se destina a un programa de evaluación es consumido por el diseño de los instrumentos de medida.

Para obtener una medición de calidad no es suficiente con tener buenas intenciones y definir con claridad unos objetivos de uso de dicha medida sino que se requiere un alto dominio teórico sobre el diseño y funcionamiento de los test. Es decir, se hace necesario comprender cómo se define una escala de medida, cuáles son las características que debe tener, cómo se debe interpretar, de qué forma se puede comprobar su validez y su fiabilidad, qué modelo teórico explica mejor su comportamiento, cómo se comunican sus características y resultados, qué consecuencias tendrá la evaluación en las personas y un largo etcétera.

Por lo tanto para llegar a construir una prueba (test, control, evaluación, examen…) apropiado es necesario seguir un proceso riguroso y estructurado en su diseño y construcción. En general dicho proceso se caracteriza por tener una claridad en los objetivos de la medida (para qué se va a medir) y posteriormente una definición de los atributos, habilidades o contenidos que se quieren evaluar (qué se va a medir). Posteriormente se define el cómo se va a medir, y es aquí donde es necesario diseñar el test y las preguntas de la forma más correcta posible. La construcción de preguntas es una parte importante del proceso de construcción de un instrumento pero se debe evitar a toda costa el error común de considerar que con la construcción de las preguntas se termina el proceso, por el contrario, sólo se ha comenzado a dar forma a un instrumento que va a permitir acceder a una medición correcta de los resultados de aprendizaje.

Una vez que se han definido las preguntas es necesario comprobar que existe una relación entre dichas preguntas con los atributos, habilidades y contenidos que pretendían medir y esta es la clave de la construcción de buenos exámenes. Para estudiar a profundidad esta relación es necesario aplicar la prueba a una muestra lo suficientemente amplia para analizar el potencial de calidad de las preguntas y su lugar en la definición de la escala de medida. Cuando se ha estudiado suficientemente la calidad de las preguntas se define la composición final del test y a partir de éste se podrá definir la escala de medida definitiva.

Por lo tanto el diseño y funcionamiento de un test aplicado a la medición de resultados de aprendizaje es un proceso que requiere mucha mucha dedicación, atención y trabajo.

Sonia Janeth Romero es Doctora en Psicología, Máster en Metodología de las ciencias del comportamiento y la salud y Especialista en Estadística. Su principal campo de investigación es la psicometría y el estudio de los modelos de diagnóstico cognitivo para la medición en Psicología y Educación.