Universidad Nacional Experimental del Táchira Vicerrectorado Académico Decanato de Docencia Departamento de Ingeniería Civil Seminario de Investigación
Validez y confiabilidad de los instrumentos de recolección de información Integrantes: • Carla Peñaloza • Reynamar Mejia • Andrea Aguirre • David Vivas • Marco Oliveros Julio de 2018
Medir
• Procesos que vinculan conceptos abstractos con procesos empíricos
Instrumento
• Recurso que se utiliza para registrar información o datos sobre las variables que se tienen
Validación
La validez es un concepto propio de la lógica. Por lo cual ésta es la mejor aproximación posible a la verdad que puede tener una proposición, una inferencia o conclusión
Se refiere al grado en que un instrumento realmente mide la variable que pretende medir y conduce a conclusiones validas
Por ejemplo, un instrumento para medir la inteligencia válida debe medir la inteligencia y no la memoria. La validez tiene tres grandes componentes: Validez de Contenido, Validez de Criterio y Validez de Constructo.
Se puede decir que con la validez se determina la revisión de la presentación del contenido, el contraste de los indicadores con los ítems (preguntas) que miden las variables correspondientes, por lo cual se estima que la validez de una prueba sea de tal manera concebida, elaborada y aplicada y que la misma mida lo que se propone medir.
Componentes de La Validez
Contenido
Criterio
Constructo
Representa al concepto medido
Contenido
Test de rendimiento
Se determina antes de la aplicación del instrumento
Mediante el juicio de expertos.
Test educativos
Test referidos al criterio
Índice de Validez de Contenido
Cálculo Descriptivo
• Ser capaz de justificar la decisión sobre la puntuación corte • Usar toda la puntuación de corte para todos los ítems de la escala, incluso si la escala es multidimensional • No poner una puntuación de corte tan alta que implique eliminar muchos ítems
• Lawshe (1975) propuso un índice de validez basado en la valoración de un grupo de expertos de cada uno de los ítems del test como innecesario, útil y esencial. 𝑛𝑒−𝑁/2 • IVC= 𝑁/2
Juicio de Expertos
Validación Validez de contenido
La validez de contenido se refiere al grado en que un instrumento test presenta una muestra adecuada de los contenidos a los que se refieren sin omisiones y si desequilibrios de contenido.
Esta se refiere al grado en que el test presenta una muestra, La validez de contenido se utiliza principalmente con tests de rendimiento, y especialmente con los tests educativos y tests referidos al criterio.
Por ejemplo, una prueba de operaciones aritméticas no tendrá validez de contenido si incluye sólo problemas de resta y excluye problemas de suma, multiplicación o división
Validación Validez de criterio
La validez de criterio evalúa si una prueba refleja un cierto conjunto de habilidades o no.
Para medir el criterio de validez, los investigadores deben compararlo con un estándar conocido o con el mismo. Donde comparar la prueba con una medida establecida recibe el nombre de validez concurrente, y probarla durante un periodo de tiempo se denomina validez predictiva.
Es importante destacar que una de las formas más sencillas de evaluar la validez relacionada con el criterio es compararla con un estándar conocido. Mientras mas alta la correlación, mejor será el instrumento
Validación Validez de constructo Se refiere si una escala o prueba mide el constructo correctamente. ¿Hasta donde el instrumento mide un rasgo determinado y con cuanta eficiencia lo hace?
El constructo es una “construcción psicológica teorica”
Siendo la validez de constructo la que define si una prueba o experimento está a la altura de sus pretensiones o no, es decir se refiere a si la definición operacional de una variable refleja realmente el significado teórico verdadero de un concepto.
Confiabilidad La confiabilidad es la propiedad según la cual un instrumento aplicado a los mismos fenómenos, bajo las mismas condiciones, arroja resultados congruentes.
La pregunta clave para determinar la confiabilidad de un instrumento de medición es: Si se miden fenómenos o eventos una y otra vez con el mismo instrumento de medición, ¿Se obtienen los mismos resultados u otros muy similares? Si la respuesta es afirmativa, se puede decir que el instrumento es confiable. ¿PERO QUE MIDE LA CONFIABILIDAD? Ésta es una medida de determinación de la estabilidad y la consistencia interna del instrumento. .
Un instrumento es estable si, al aplicarlo repetidas veces a los mismos fenómenos, bajo las mismas condiciones, arroja resultados consistentes (congruentes).
Ejemplo: Si se midiera en este momento la temperatura ambiental usando un termómetro y este indicara que hay 22°C, un minuto mas tarde 5° C, tres minutos después 40° C; dicho termómetro no sería confiable.
Relación entre confiabilidad y validez
OBJETIVIDAD En un instrumento de medición, la objetividad se refiere al grado en que éste es permeable a la influencia de los sesgos y tendencias del investigador o investigadores que lo istran, califican e interpretan (Mertens, 2005)
valido
objetivo
CONFIABLE
Factores que pueden afectar la confiabilidad y la validez Improvisación Distorsión del contexto Falta de empatía
Tendencias personales de los participantes Condiciones en las cuales se aplica el instrumento
Falta de estandarización Aspectos mecánicos
Calculo de la confiabilidad Existen diversos procedimientos para calcular la confiabilidad de un instrumento de medición. Todos utilizan procedimientos y fórmulas que producen coeficientes de fiabilidad.
Alfa de Cronbach El método de consistencia interna basado en el alfa de Cronbach permite estimar la fiabilidad de un instrumento a través de un conjunto de ítems que se espera que midan el mismo constructo.
>0,9 excelente >0,8 bueno >0,7 aceptable >0,6 cuestionable >0,5 pobre <0,5 inaceptable
Test-retest En este procedimiento un mismo instrumento es aplicado en dos o mas oportunidades a un mismo grupo de personas, después de cierto periodo de tiempo. Si la correlación entre los resultados de las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable. Persona
Test
Retest
1
16
10
2
14
14
3
12
8
4
11
12
5
10
10
6
8
8
7
8
7
8
6
5
9
4
4
10
1
2
Es importante que para la aplicación de esta prueba, se tome un lapso de tiempo lo suficientemente largo para que los sujetos se olviden de lo que contestaron y, por el otro, no tanto que se produzcan cambios importantes. Este tipo de medición se utiliza para investigaciones cuantitativas.
r=0,87
Formas paralelas En lo que respecta al método de formas paralelas, también llamado de formas alternativas, indica que se calcula a través de un coeficiente de correlación entre los resultados de dos pruebas supuestamente equivalentes.
Requiere que se utilicen dos pruebas o instrumentos paralelos, esto es, que midan lo mismo de forma diferente (por ejemplo, dos tests que con diferentes preguntas midan un determinado rasgo). Después se comparan los dos tests, calculando el coeficiente de Pearson.
La dificultad radica en conseguir que dos instrumentos sean realmente “paralelos”, dada la dificultad que supone realizar dos pruebas que midan exactamente lo mismo, pero con diferentes ítems.
Forma 1
Forma 2
Split-halves También conocido como método de las mitades partidas, se calcula por medio de un coeficiente de correlación entre las puntuaciones de las mitades de un instrumento (se correlacionan los resultados de una mitad del instrumento con los resultados de la otra mitad, aparentemente equivalente).
Corrección Spearman-Brown
El método requiere una sola aplicación de la medición. Específicamente, el conjunto total de ítems es dividido en dos mitades y las puntuaciones de ambas son comparadas. Si el instrumento es confiable, las puntuaciones de ambas mitades deben estar fuertemente correlacionadas
Coeficiente KR-20 La formula KR-20 tan solo es una variante de alfa especialmente orientada a ítems dicotómicamente valorados, una vez obtenidos p y q para cada ítem se procede a obtener la varianza de cada ítem como producto de p por q, donde también se requiere la varianza total y la sumatoria de la varianza de los ítems.
Características: • Permite calcular la confiabilidad con una sola aplicación del instrumento. • No requiere el diseño de pruebas paralelas. • Es aplicable solo en instrumentos con ítems dicotómicos, en los cuales solo existen respuestas correctas e incorrectas.