LOS TEST PSICOMÉTRICOS

2.1 Características


Son procesos estandarizados de recogida de información, son voluntarios, no enmascarados (sabemos la finalidad de la prueba) y estandarizados. Se basan en procedimientos estadísticos y el material esta tipificado (que todos lo utilizan de forma uniforme, en la aplicación, corrección e interpretación).

Los test psicométricos iniciaron dentro de la teoría de los rasgos, pero actualmente se apoyan en diferentes modelos, tienen en común que poseen una base empírica y todos intentan medir.



2.2 Componentes de los test

1. Manual técnico de descriptores del test

a Descripción del test (¿para qué sirve?, autor, año de publicación, cómo se comercializa).

b Desarrollo de las escalas (qué pasos siguió para elaborar los ítems, tareas, qué modificaciones se han dado, criterios seguidos paras las modificaciones)

c Proceso de adaptación española del test..

d Justificación estadística (tratamiento de los datos, fiabilidad, validez, estudios comparativos, grupos normativos especiales, estudios transculturales).

e Normas de interpretación (parámetros de cómo valorar cada una de las puntuaciones que se han obtenido).

f Otros (bibliografía).

g Tablas de los normativos (estudios de estandariazación).



WAIS:

a. Estimación de las capacidades intelectuales de una persona.

c. Adaptación de un test en otra lengua a la española (cómo se han superado los sesgos culturales p.e. en los subtest de información)

g. Datos estadísticos de las características de la muestra con la que se ha hecho la estadarización (p.e. edad, sexo, nivel educativo) en el WAIS p.e. hay datos de varias edades.



2.3 Manual de aplicación y corrección (cómo se administran cada una de las tareas):

a Ámbito de aplicación (lugar)

b Cualificación del examinador (condiciones psicológica en individuales, si tiene dificultad para comprender o algún problema sensorial).

c Procedimiento normalizado (reglas, instrucciones, etc.)

d Tiempo de aplicación (para cada subtest, tiempo mínimo esperado en el WAIS hora y media).

e Condiciones ambientales.

f Tablas y baremos de corrección y ajustes estadísticos (inicialmente aparecen diferenciados para cada subgrupo de edad)

g Obtención de puntuaciones típicas, escalares y CI/índices.



2. Cuadernillo/hoja de respuestas, pueden estar o no.



3. Materiales de administración para cada test.



4. Plantilla de corrección: manual o informatizada.

2.4 Presentación de un test

La forma de presentación de un test difiere según la finalidad de este, existen cuatro tipos:

a. Forma de presentación de los ítems (preguntas y respuestas).

- Verbales.

- Gráficos (p.e. visuales, test de Raven, test de dominó).

- Manipulativos

- Mixtos (WAIS).

b. Contenido del test. Cómo está estructurado, pueden ser:

- Homogéneo o de tarea única, siempre se realiza la misma tarea (MMPI).

- Ómnibus, tiene diferentes tareas con diferentes puntuaciones pero que llevan a una única puntuación global (p.e. WAIS).

- Batería de test, son múltiples tareas pero con diferentes puntuaciones (p.e. batería de aptitudes diferenciales de Thurstone, se saca un perfil con diferentes puntuaciones, que son independientes entre sí).

c. Tipo de respuesta, que se le pide al sujeto:

- Respuesta ya elaborada por el autor del test (p.e. exámenes tipo test, se selecciona la R/)

- Test de producción de respuesta, el sujeto produce su propia respuesta (p.e. examen de desarrollo).

d. Según la aplicación del test:

- Colectiva, se pueden aplicar también de forma individual.

- Individual, no se pueden aplicar de forma colectiva.



2.4 Etapas de elaboración de un test

1. Demarcación de la prueba:

¿Qué queremos hacer? (p.e. un test de calidad de vida del enfermo de cáncer, ya está hecho o no, cómo es, hacer un estudio de mercado).

Ubicar el instrumento, definir qué voy a medir, a qué problema va ser dirigido (p.e. calidad de vida, cáncer), qué deseo hacer con el, para qué sirve (p.e. clasificar, intervenir, saber el estado actual de su enfermedad). Buscar a nivel práctico y teórico.

2. Delimitación conceptual y operativa:

a. Fundamentar teóricamente el atributo a medir, buscar bibliografía (qué es calidad de vida).

b. Definir el objetivo, finalidad y uso del test (por qué y para qué se construye el instrumento)

c. Elegir a qué sujeto se destina el test (para quién se hace el instrumento (personas con cáncer del País Vasco). Con mayor precisión en la definición pensaremos mejor en ellas.

d. Establecer cómo se va a aplicar el instrumento, colectivo o individual, procedimiento y presentación.

e. Cómo se define de forma operativa ese atributo.



3. Elaboración del protocolo:

a. Formato del test: gráfico, verbal, manipulativo..., forma de presentación: cuadernillo, hoja de respuesta.

b. Ítems que va a tener el instrumento (verbales-creencias, gráficos-niños, manipulativos o mixtos). Se elaboran en base a la edad, contexto sociocultural, qué es lo que yo quiero valorar… ¿Cuántos ítems hacer?, a la hora de construir el test hacer un 25% más de ítems por los que se puedan desechar.

Tiempo disponible para la aplicación y tipo de tarea. Elaboración de ítems, ¿cómo ordenarlos? (p.e. de menor a mayor dificultad). Presentación del test (hoja de instrucciones, ejercicios prácticos como modelo, ficha de identificación o no, etc.).



Construcción de los ítems

 Ítems de construcción de respuesta libre o producción de respuesta:

a. Ítems de ensayo. El sujeto debe responder con sus propias palabras, no hay una única respuesta. Es la más completa. El sujeto desarrolla de forma abierta y libre una respuesta ante una pregunta que se plantea, desde una perspectiva personal y su propio lenguaje. Puede ser verbal, manipulativo o gráfico.

Ventajas: se recoge la creatividad/originalidad de la respuesta del sujeto, se permiten varias respuestas verdaderas y se puede valorar no solo lo que dice sino también cómo lo expone y lo construye (información adicional).

Desventajas: la subjetividad a la hora de construir y, fundamentalmente, a la hora de valorar estos ítems (diferentes evaluadores no llegan al mismo acuerdo, es diferente según el juez, evaluación sesgada, a no ser que evalué un solo juez).

Sobre los demás tiene la ventaja de tener la mejor manera de valorar la creatividad y originalidad del sujeto.

b. Ítems de respuesta restringida. En los que se le pide una respuesta breve, tiene menor libertad pero se puede ampliar el número de ítems (hacer más preguntas).

Ventajas: corrección rápida y se llega a un acuerdo entre jueces.

Desventajas: perdemos mucho la valoración de la creatividad del sujeto y sigue siendo subjetiva.

Son más globalistas.



 Ítems de respuesta estructurada o elección de respuesta:

Se pierde totalmente la posibilidad de valorar respuestas creativas (p.e. exámenes tipo test), se le dan las respuestas al sujeto y se le pide que elija una alternativa. La muestra es mucho mayor, se hacen más preguntas. Se responde a cada ítem por separado, son independientes entre sí y se suelen puntuar uno a uno.

Ventajas: permiten la comparación de grupo por presentar las mismas respuesta a cada sujeto. Más fáciles de cuantificar, mayor precisión, hay una clave de corrección clara y por ende, más acuerdo entre los jueces.

Desventaja: menor libertad a la hora de responder, no se valora la originalidad y creatividad. Perdemos cualidades, son muy atomistas (analiza una pequeña parte del comportamiento del sujeto). Existen diferentes tipos:



a. Ítems de respuesta alterna. Verdadero-falso, sí-no.

1. Asegurarse de que el ítem se puede clasificar inequívocamente de verdadero o falso.

2. Utilización de términos que no sean generales o universales, pues son erróneos (nunca, siempre, todas, ninguna...)

3. Evitar el empleo de términos ambiguos o indefinidos para asignar cantidad (p.e. hace ejercicio frecuentemente?, la interpretación de este puede variar de una persona a otra). Es necesario poner cantidad (3, 4 o más veces por semana).

4. Procurar no utilizar negaciones (enunciados negativos) y muchísimo menos la doble negación (pues esto afirma).

5. Limitar los enunciados de verdadero-falso a una sola idea (una idea para cada enunciado)

6. Que los enunciados tengan aproximadamente la misma extensión (p.e. generalmente, un enunciado verdadero es más extenso que uno falso).

Ventajas: se pueden construir muchos, recoger más muestras de conducta, son fáciles de corregir y rápidos.

Desventajas: difíciles de construir, pierde la capacidad de creatividad.



b. Ítems de elección de respuesta múltiple.

1. Poseen más de dos alternativas, generalmente de 3 a 5. Son más flexibles, representan mejor lo que quieren evaluar, hay más opciones para el sujeto.

2. Es necesario delimitar bien el enunciado de las alternativas de respuesta. El enunciado debe contener toda la pregunta (saber que estamos preguntando y poner las alternativas pertinentes). El enunciado puede ser amplio pero las alternativas de respuesta deben ser breves.

3. El enunciado debe ser claro y específico, claramente expuesto (cuál es nuestra pregunta) y que sea positivo, no utilizar la doble negación (pues esta evalúa lo peor de una persona no lo mejor).

4. Utilizar material novedoso para explorar la creatividad del sujeto.

5. Asegurarse de que haya solo una respuesta válida o que expresa mejor lo que se pregunta (p.e. en los test de personalidad, la respuesta que manifiesta mejor ese rasgo). Que haya una única respuesta óptima, evidente sobre las demás y asegurarse de que las otras también sean plausibles.

6. No proporcionar indicadores involuntarios para las respuesta (todas tienen que acercarse a lo que quieren medir).



Ventajas: suele ser más objetiva la corrección, existe un mayor acuerdo y se puede corregir mediante el uso del ordenador (p.e. en la selección de personal). Se corrige rápidamente y de forma objetiva se puede comparar y el número de ítems es amplio para tener una muestra representativa de la conducta del sujeto. Recogen mucha información en poco tiempo.



Desventajas: para redactarlos bien lleva mucho tiempo (su construcción), no permiten analizar la creatividad del sujeto. A veces es difícil determinar cuando una respuesta óptima es correcta sobre las demás. Su utilización depende del ámbito de trabajo, por ello puede ser mejor o peor en una determinada situación (p.e. para aplicaciones grupales son buenas pero en el ámbito clínico no, serían mejores las de ensayo).



¿Qué peso relativo tiene cada área de evaluación?

La característica a evaluar se puede plasmar en diferentes ámbitos, puedo elegir algunos o uno. Si cada ámbito va ser valorado igual habrá un mismo número de ítems para cada área (p.e. la asertividad en la familia, el trabajo, con los amigos), si le damos más relevancia = mayor número de ítems y obtener más muestras de conducta.

Temas: Introd. Psicometría 20% Test psicométricos 40% Teoría de los test 40%

Objetivos Conceptos 10% 2 4 4

Relación 30% 6 12 12

Aplicación 60% 12 24 24

Total: 100 20 40 40

Está es una tabla de doble entrada, que nos permite darle peso a cada área del test. Para ello no hay una regla fija, es relativo y depende de quien elabora el test. No hay que extrapolar los datos obtenidos en un área a otras (p.e. del laboral al familiar). Toma de decisiones subjetiva.

¿Cómo elegimos los ítems?

La elección de los ítems la hace el autor de los test, tomando en cuenta:

1. Que sean representativos del atributo que quiero medir, ¿cómo se manifiesta ese atributo?  observación directa, definir cuál es la manifestación, tomar datos de campo.

2. Hasta que punto necesito una precisión de los datos, cuanto más estructurado es un ítem más preciso es pero menos creativo. Qué quiero evaluar y qué precisión quiero; me interesan los datos cualitativos o cuantitativos, describir (cualidad, ensayo) o predecir (cantidad, respuesta alternativa).

3. Las personas, a quien voy a evaluar, considerar edad, nivel sociocultural, académico, contexto, ambiente. Variables del sujeto.

4. Forma de administración: individual o colectiva.

5. Tiempo disponible (las pruebas verbales son más rápidas de aplicar y corregir que una manipulativa o gráfica)

6. Dificultad que le quiero dar a la prueba (p.e. para un niño son más difíciles los ítems verbales que los gráficos).

7. Destrezas del propio autor del test (p.e. que sepa dibujar).



Longitud (cuántos ítems tendrá la prueba):

1. Ver la característica que quiero evaluar y lo amplia que es (p.e. una característica de personalidad es más amplia que el clima familiar, más concreto), y ver si tengo de esa característica tengo más áreas de evaluación, si es así necesitaré más ítems. Cada uno de los ítems es una muestra de conducta, cuántas más tengamos mejor podremos entender al sujeto pero sin perder el equilibrio (no preguntas en exceso).

2. Tipo de ítems elegidos (la prueba es más larga o corta según los ítems, las pruebas verbales tienen más ítems, los manipulativos son menos). Demarcar la longitud del test.

3. Finalidad del instrumento, según ella la longitud puede cambiar.

4. Forma de aplicación. Los test individuales suelen tener menor número de ítems, en los colectivos se pierden la relación de tú a tú y otra información, hay que tener más preguntas, son más amplios que los individuales (p.e. tiempo de reacción WAIS, dificultad de los ítems y cuánto tiempo necesita para pensar y responder).

5. Características del sujeto.

6. Tiempo de aplicación, si tenemos menos tiempo utilizamos test cortos. No hay normas fijas, depende de estos apartados y del autor.



¿Qué nivel de dificultad deben tener los ítems?

Tomar en cuenta el tipo de prueba, en las de personalidad tendrá que ser una dificultad media y media-alta, en los test de manipulativos y de inteligencia existirán diferentes niveles. Por ende, hay que valorar lo que mide la prueba y el tipo de sujetos a evaluar (tipo de ítems, presentación, áreas de contenido y características del sujeto marcarán la dificultad). Es importante que el nivel de lectura o lenguaje de los sujetos evaluados no sea un obstáculo para responder a las tareas, debe estar adecuado a su nivel de lenguaje. La única excepción sería si se trata de una prueba en que se evalué el rendimiento en el lenguaje, pero en ellas poco a poco se va aumentado el grado de dificultad para que el sujeto encuentre ítems que pueda resolver.





Construcción de las instrucciones del protocolo

Instrucciones del protocolo/cuestionario, existen dos niveles de instrucciones:

a. Instrucciones para el sujeto que va a realizar el test. Explicar la sujeto cuál es la tarea que va a realizar con un lenguaje claro, precio y sencillo. El protocolo debe proporcionar algún tipo de ejemplo con la tarea ya resuelta, explicarle al sujeto si hay límite de tiempo o no, si existe penalización por las respuestas incorrectas o no (p.e. en test de rendimientos sí).

b. Instrucciones para el evaluador (manual del test).

- Especificar si el evaluador necesita una preparación previa y de qué tipo.

- Circunstancias situacionales: situación ambiental, tiempo que requiere, material a utilizar...

- Ficha técnica del test, datos de fiabilidad y validez.

- Condiciones y claves de corrección, cómo se utiliza la plantilla si hay.

- Condiciones de interpretación del test.

- El autor debe decir a que marco teórico pertenece.

- Instrucciones de manejo y calidad científica del test.

Por último, deben estar las tablas de conversión de datos (baremos) para poder comparar al sujeto con otros, y otras referencias.



4. Primer estudio empírico

Saber si lo que hemos construido es válido o no, se realiza un análisis cuantitativo y cualitativo. Los pasos a seguir son los siguientes:

I. Identificar y seleccionar una muestra en la cual aplicar el test (debe representar la población a la que va dirigida el test).

II. Aplicar el test en las mejores condiciones posibles y corregirlo, obtenemos las puntuaciones que nos permitan un primer análisis estadístico descriptivo de los resultados

III. Análisis de cada uno de los ítems, saber cuáles no son importantes o están mal redactados. Se realiza el análisis en dos niveles:

a Cuantitativo. Analizar el contenido (representan lo que miden) y redacción de los ítems (lo buenos que son, si se entienden o no).

b Cualitativo. Analizar hasta que punto el ítem discriminan bien, nivel de dificultad que tiene, cómo es de consistente (si siempre mide igual), son homogéneos o heterogéneos, independencia de cada uno de los ítems, hasta que punto responden bien a la finalidad del test, interesa comparar el ítem consigo mismo y el exterior.

IV. Reestructuración de la prueba, modificar los ítems que están mal o quitarlos, dejar los que sirven, cambio en el orden o la presentación.



5. Segundo estudio empírico

Volver a aplicar el test, ampliar la muestra de sujetos, para baremar el test. Su objetivo es garantizar la bondad del instrumento desde el punto de vista psicométrico y científico. La muestra debe ser realmente representativa de la población para que sea punto de comparación para los sujetos futuros. Se deben tomar en cuenta todas las variables (edad, sexo, nivel académico o sociocultural...). No debe ser un muestreo aleatorio sino que se debe hacer una estratificación (p.e. mismo porcentaje de hombres y mujeres, en clase serían más chicas que chicos), se deben utilizar estrategias de muestreo.







6. Aplicación del test

Se analizan los ítems para validar nuevamente el instrumento, confrontar que está bien.





7. Estudio de la fiabilidad del test

Elegir el método más apropiado (estadísticos de correlación), nos dicen hasta que punto esos datos obtenidos nos dan una seguridad porque se mantiene en el tiempo (p.e. una balanza que siempre de el mismo peso para un objeto). Si hay estabilidad en la medida es una medida fiable pero no me asegura que es buena (p.e. si la balanza pesa 2kg. de más), puede conllevar error, por ello se necesita la validez.



8. Estudio de la validez del test

Existen diferentes modos dependiendo de la finalidad que tiene, saber hasta que punto es válido y útil



9. Capacidad de predicción del test (también estadísticos)



10. Tipificación

Elegir las normas a partir de las cuales hacer la tipificación y luego pasamos las puntuaciones directas a puntuaciones indirectas, lo hacemos a través de un baremo. En base a los datos de la muestra normativa.



11. Llevarlo a la imprenta, ponerle precio y distribuirlo



Definiciones:

Análisis de los ítems, ordenar y analizar los datos de la muestra o población.

Población estadística, conjunto de elementos que cumplen una serie de características o propiedades en común. Población finita, conocemos el número de sujetos y en la población infinita no lo sabemos.

Muestra, es la parte representativa de la población.

Estadística, es la ciencia.

Estadísticos son operaciones matemáticas que proporcionan descripciones de una muestra.

Parámetro, propiedad que le pertenece a la población.

Cualidad, atributo.

Modalidad, cómo se presenta la característica.

Medición, proceso de atribución de números a características o cualidades.

Escalas de medición, uso que se les da a los números.

Los atributos pueden ser: variables, pueden tomar diferentes números o valores y se puede mostrar en diferentes modalidades (cuantitativa: género, profesión y cualitativa: rasgos de personalidad, altura) y constantes.

Valor de la variable, dato cuantitativo de ese momento.

Las variables cuantitativas pueden ser: discretas, solo puede tomar un número finito de valores (p.e. número de hijos, ji cuadrada) y continuas, que al menos teóricamente puede tomar infinitos valores en un intervalo (p.e. talla, peso).

Estadística descriptiva, describen la muestra a partir de una o más características o variables. Intenta describir y analizar a una muestra en base a características o variables.

Estadística inferencial, a partir de una muestra representativa no sesgada, tener un conocimiento de la representatividad de la población. Hacemos inferencias de que eso le pertenece a una población. En la estadística inferencial adquieren mucha importancia las puntuaciones:

- Puntuaciones directas o brutas, aquellas que se obtienen a partir de la medida de una característica manifiesta (p.e. el Raven 84, pero no da mucha información psicológica, para saberlo es necesario comparar esa información: la puntuación obtenida por el sujeto menos la media del grupo pero a veces esta medida queda corta).

- Puntuaciones indirectas o ponderadas, para que tengan un sentido es necesario transformar las puntuaciones para poder hacer comparaciones. Es importante comparar de la forma más exacta posible, lo más verídica (que me compare con mi grupo de referencia real). Por ejemplo, si se aplica un test de razonamiento abstracto para compararlo con el rendimiento de las notas de matemática, es necesario saber cómo es el grupo, cómo se distribuyen las puntuaciones (representación gráfica: diagrama de barras, histograma: polígono de frecuencias, pictograma, etc.).

Es necesario analizar los datos, ordenarlos a través de una tabla de frecuencias o gráfico, donde se resuma la realidad objetiva de los datos. Luego a partir de la representación gráfica se siguen operando los datos. En la estadística descriptiva veremos cómo son los chicos, cómo se comportan como grupo (estadísticos de posición: media-promedio de actuación del grupo, moda-valor que más se repite, mediana-punto que divide a al distribución en dos parte iguales, percentiles-50% a la izquierda y 50% a la derecha.



La desviación típica, variable del grupo con respecto a la media (si esta fuera de la desviación típica del grupo, el sujeto seria anormal estadísticamente), nos dice la posición del sujeto, si está cerca o no del grupo, si hay diferencia o no entre los miembros. Nos muestra cuánto se desvía cada sujeto con respecto a la media.

La varianza, nos dice si como grupo somos muy homogéneos o heterogéneos, variación total de grupo con respecto a otros grupos. Si la varianza es pequeña el grupo será más homogéneo (parecido) y si es grande, el grupo será más heterogéneo (más diferente).

Coeficiente de variación, comparar a un grupo con respecto a otros (CV = (S/X) x 100). Para poder inferir y predecir se necesitan los estadísticos de correlación (expresan la relación entre dos o más conjuntos de puntuaciones o variables). Cuando nos interesa saber la relación entre dos características se utiliza la estadística descriptiva.

En la correlación, dos o más variables que covarían juntas, nos basamos en las varianzas del grupo. También existen correlaciones múltiples. Los valores de la correlación directa van de +1 a -1 y los de la correlación inversa de 0 a +1. Son necesarias las medidas de relación en:



1. Cuando nos interesa saber la relación entre dos características o variables (describir).

2. Cuando estudiamos la relación entre dos variables para hacer una predicción a partir de los datos de otra.

3. Determinar hasta que punto un test o instrumento psicológico es útil como instrumento de medición (fiabilidad).

4. A partir de un instrumento o test pretendemos evaluar las características actuales de la persona para predecir otras que aun no se han dado (p.e. mejores notas, mejor profesional?)



Los estadísticos de correlación se utilizan en unas condiciones determinadas, por ejemplo, para variables continuas, lineales se utiliza la r de Pearson pero si las variables son nominales se utiliza la ji cuadrada (nombran) y para variables ordinales la r de Spearman (cuando se han ordenado).

A veces hay variables continuas que las hacemos discretas, variables dicotómicas (p.e. género), las que tienen dos categorías (altura, variable continua), la podemos dicotomizar artificialmente (pequeños, altos), ji cuadrada.

La mayor parte de la población está en un límite determinado, media + 3 desviaciones típicas, se hallan el 99.8% de los sujetos. El 95.4% en + 2 s y el 68.2% + 1 s.





Por ejemplo, aquí con una desviación típica (s) = 0.5, las notas estaría entre 4.5 y 7.5, un 9 seria anormal estadísticamente

Preguntas:

1. ¿Cuál es la tendencia de esas puntuaciones?, ¿cómo se representan gráficamente el conjunto de puntuaciones para saber cómo se comporta el grupo?

Para saber la tendencia de las puntuaciones podemos analizar en base a los estadísticos de posición (media, mediana, moda), en este caso utilizamos la moda porque es la que más se repite y se representa gráficamente un histograma (polígono de frecuencias).



2. A través de qué estadístico podemos saber el promedio de actuación del grupo.

La media



3. ¿Cómo podemos saber como de bueno es el grupo respecto a otro grupo del colegio?

Diferencia de medias, si es significativa (el grupo con mayor diferencia tendrá una mejor actuación).



4. ¿Cuál es el nivel típico de ejecución de grupo?

Moda (porque nos da el que más se repite).

5. Los chicos con muy iguales o no entre sí, ¿cómo es de amplia su variación?

Estadísticos de dispersión, porque nos dan la posición del individuo con respecto a su grupo (desviación típica), nos dice cómo de homogéneo es el grupo. La varianza nos daría la dispersión total del grupo y para saber cómo de amplia es esa dispersión (amplitud o recorrido de una distribución), le restamos al dato máximo el dato mínimo.



6. ¿Cuál es la dispersión de todo el grupo?

La dispersión grupal nos la da la varianza (mientras que la desviación típica nos dice cuánto se desvía el sujeto respecto al grupo, los percentiles solo nos dan una posición aproximada del sujeto-posición relativa). Cuanto más te alejas de la media hay mayor dispersión, más cerca de la media las puntuaciones entre sujetos están más cercanas, entre más lejos de la media más lejanas las puntuaciones entre los sujetos).



7. ¿Cuál es el lugar concreto de un sujeto con respecto a ese grupo?

Puntuación típica (z), nos da la posición exacta del sujeto (al tipificar las puntuaciones puedo comparar puntuaciones de diferentes variables).



8. Relación entre la capacidad de abstracción y el rendimiento en matemática, cuál es la relación, se dan juntas estas dos variables.

Si covarian juntos (la covarianza nos da la correlación).





Análisis de los ítems

Se puede hacer de forma cualitativa o cuantitativa. El análisis cuantitativo se puede realizar con una tabla de doble entrada, en la parte superior se coloca cada ítem con sus alternativas de respuesta y en las columnas se pone la actuación de cada alumno, que respuesta a dado. La siguiente tabla es un ejemplo de matriz de datos:





Sujeto 1 2 3

a b c a b c a b c

1 X X X

2 X X X

3 X X X



También se utiliza en test manipulativos (donde haya una respuesta), es más difícil en ítems de ensayo. Estas tablas se utilizan para cuantificar el test y ver cómo se comportan los ítems, se le pide que ordene a los sujetos, de la mayor a la menor puntuación en el test. Se tomar el 25% con las puntuaciones más altas y el 25% de puntuaciones más bajas (se trabaja con el 50% más representativo de la población, con los datos más representativos. Índices de facilidad-dificultad:

a. Índice de facilidad, para saber si es fácil el test o cada uno de los ítems, se calcula: cuántos aciertos ha tenido el ítem partido por el número total de sujetos a los que se aplico el test por 100. Por ejemplo, si el test se ha aplicado a 180 sujetos y se han obtenido 100 aciertos en un determinado de ítem la operación seria 100 entre 180, por 100.

b. Índice de dificultad. Se hace el mismo procedimiento pero en lugar de utilizar los aciertos se utilizan los fallos: fallos entre el número de sujetos, por 100.

Hay que ver en las personas con mayores puntuaciones los ítems que se han hecho mal, si son muchos el nivel de dificultad es grande, pueden estar mal redactados. Viendo los aciertos y errores que tienen el 25% de los mejores y el 25% de los peores.

c. Índice de discriminación de cada ítem, se puede hacer de dos maneras:

- Cogiendo los aciertos del grupo superior menos los aciertos del grupo inferior, partido n

ID = aciertos del grupo superior – aciertos del grupo inferior

n

Si el ítem se discrimina bien sale positivo (hay más aciertos en el grupo superior), si sale negativo significa que el grupo inferior salió mejor.



- Si se tienen en cuenta los aciertos, esto nos dice que porcentaje de sujetos del grupo superior han acertado:

Aciertos del grupo superior________________

Número de aciertos del grupo inferior + aciertos del grupo inferior

También hay otros indicadores para saber si es bueno o malo un ítem.

0 comentarios: