Pedagogía y Virtualidad/Psicometría
miércoles, 10 de agosto de 2011
sábado, 4 de septiembre de 2010
Test de apercepcion infantil cat
Prueba De ApercepcióN TemáTica Para NiñOs
PRUEBAS PSICOLÓGICAS
jueves, 12 de agosto de 2010
Psicometría (II Bimestre)
Psicometría (I Bimestre)
ESCALA MIXTA LIKERT-THURSTONE
Manuel Guil Bozal
(Universidad Pablo de Olavide)
Introducción
Se presenta con este artículo un proyecto para construir escalas para medir las actitudes de una determinada población hacia un determinado objeto utilizando una metodología mixta Likert y Thurstone.
RESUMEN
Una de las limitaciones, que tradicional- mente se ha venido apuntando sobre la escala de Likert, es que el peso relativo en el conjunto de la escala representa cada ítem sea considerado exactamente el mismo, cuando esto no tiene por qué ser así, y de hecho no lo es normalmente. La escala de Thurstone asigna un valor relativo diferente a cada ítem,
pero su validación es efectuada por un grupo de jueces y no por la misma población destinataria de la misma. La innovación metodológica que se propone con esta comunicación se fundamenta en una ponderación de los valores ofrecidos por los diferentes ítems según el
peso relativo que le sea estimado a los mismos por un grupo de jueces y al mismo tiempo ser validados por la población objeto de la misma. En otras palabras sería un método para construir escalas de actitud social basada en una combinación de las técnicas de Likert y Thurstone.
Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006
La principal crítica que las escalas de Likert han recibido a lo largo de su dilatada historia es que el peso relativo de cada ítem, en el conjunto de la escala, se considera exactamente el mismo, cuando esto no tiene por qué ser así, y de hecho no lo es normalmente.
La escala de Thurstone, por su parte, asigna un valor relativo diferente a cada ítem, pero adolece de otros defectos: su validación es efectuada por un grupo de jueces y no por la misma población destinataria de la misma, con lo cual su validez queda también bastante mermada.
La innovación metodológica que se propone con este artículo se fundamenta en una ponderación de los valores ofrecidos por los diferentes ítems según el peso relativo que le sea estimado a los mismos por un grupo de jueces y al mismo tiempo ser validados por la población objeto de la misma. En otras palabras sería un método para construir escalas de actitud social basada en una combinación de las técnicas de Likert y Thurstone.
Las escalas Likert son las más empleadas, de hecho, en la actualidad porque su elaboración es más sencilla que las de Thurstone y ofrecen unos resultados análogos a los de ésta. Por este motivo, para el desarrollo teórico del instrumento que ahora se propone, se tomará como base el procedimiento de elaboración de una escala Likert
1 Conceptos previos
1.1 Concepto de «actitud»
Las actitudes han sido definidas como aquellas formas de pensar, de setir o de comportarse hacia a una idea, un objeto, persona o grupo de semejantes. (McConell, 1978, p.91).
Encontramos en esta definición tres elementos:
1. Un elemento cognitivo.
2. Un elemento afectivo
3. Un elemento de comportamental
El elemento cognitivo sería aquello que se piensa acerca del objeto de la actitud.
Desde un punto de vista cognitivo puede pensarse que algo está bien o está mal, independientemente de lo que luego se haga, porque puede suceder que afectivamente
se sienta movido en otra dirección.
El elemento afectivo haría referencia a aquello que se siente, que gusta o disgusta.
Así pues, puede sentirse que algo gusta o disgusta, sin que necesariamente se
actúe en la dirección que apunte ese sentimiento, porque racionalmente se consi-
dere que no es conveniente.
Por último, cuando se habla de un elemento de comportamiento o reactivo en las
actitudes, se quiere significar que no basta que algo parezca bien o mal, o guste o
· 83 ·
disguste, sino que esto lleve, de una manera u otra, a actuar en consecuencia.
Así, es posible que una persona, desde un punto de vista cognitivo, puramente
cerebral, puede considerar, por ejemplo, que las corridas de toros son algo censu-
rable y sin embrago, afectivamente, sienta atracción, le guste, y como consecuen-
cia en esta persona se establezca una determinada actitud, a favor, en contra, o ni
en contra ni a favor.
Por otro lado, también se echa de ver en la definición, que el objeto de esta actitud
puede ser una idea, un objeto o personas. Objetos de estudio de actitudes son,
pues, entidades de las más diversas.
1.2 Concepto de «escala»
Otro de los términos que se emplea es el de «escala». Una escala sería un instru-
mento de medición (Maynt, R; Holm, K; Hübner, P. 1983, p. 63) en el cual se puede
hacer una disposición de cosas distintas pero con un aspecto común(Sierra Bravo,
R. 1992). De esta manera una escala de actitud sería la disposición de diferentes
actitudes de mayor a menor intensidad, a favor o en contra.
Existen diversos tipos de escala, que pueden clasificarse básicamente en tres
(Morales Vallejo, 2000, p. 43):
1. diferenciales (Thurstone),
2. summativas (Likert),
3. acumulativas (Guttman)
Estos tres tipos de escala tienen en común que en ellas se presenta al encuestado
una serie de ítems formulados como ‘preguntas, y según responda de una manera
u otra, se le asigna a éste una puntuación en la actitud medida que lo coloca en una
escala continua, de uno a cinco normalmente, o de otro rango de valores.
Las escalas diferenciales (Thurstone, 1929), se caracterizan por que en ellas tan
solo hay dos respuestas posibles a los distintos ítems que se presentan: «de acuer-
do» o «desacuerdo». Previamente, ha habido un grupo de expertos que ha dado
una puntuación a cada uno de los ítems del cuestionario, según consideren que
ese ítem expresa con mayor o menos intensidad la actitud que se pretende medir.
Así, cada ítem parte con una puntuación previa. El sujeto encuestado recibirá una
puntuación determinada en función de la puntuación que posean los ítems con los
que se ha mostrado de acuerdo.
Las escalas summativas son debidas a Likert (1932), que fue el primero en introdu-
cirlas para medir actitudes, tomándolas de técnicas de medida de la personalidad
(Morales Vallejo, 2000, p.46). En este método se supone que todos los ítems mi-
den con la misma intensidad la actitud que se desea medir y es el encuestado el
que le da una puntuación, normalmente de uno a cinco, en función de su posición
frente a la afirmación sugerida por el ítem. La actitud final que se asigna al encuestado
será la media de la puntuación que éste da a cada uno de los ítems del cuestionario.
Las escalas acumulativas, tiene su origen en el modelo de Guttman (1950). Según
Artículos · Manuel Guil Bozal
Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006
· 84 ·
este modelo, también llamado escalograma, los ítems tienen una determinada difi-
cultad y el estar de acuerdo con uno, implica el estar de acuerdo con todos los
precedentes. Suelen tener muy pocos ítems y se utiliza para medir actitudes muy
concretas.
Aparte de estos tres tipos de escala, cabria mencionar otros instrumentos de me-
dida, pero que no pueden recibir en sentido estricto el nombre de escalas, puesto
que no sitúan al sujeto encuestado en un continuo. Según Morales Vallejo (ibid. p.
48) son «instrumentos de elección forzada, en el que los ítems son bloques de
estímulos entre los que el sujeto debe escoger el más apropiado. Estos instrumen-
tos no suelen recibir el nombre de escala». Entre estos se situarían el diferencial
semántico de Osgood (Osgood et al. 1957), y la técnica Q sort de Stephenson
(1953)
2 Construcción de una escala tipo Likert
Esta herramienta, cuyo nombre se debe al primer investigador social que la desa-
rrolló, allá por los años 1930, consiste en un cuestionario compuesto por una serie
de ítems que tratan de reflejar los diferentes aspectos de un objeto (de esta actitud)
hacia los que cabe tener una posición diferente.
2.1 Dimensiones del objeto de la actitud
El estudio del objeto de la actitud para su definición, permitirá comprobar que esta
realidad consta generalmente de una serie de componentes o dimensiones. Es
decir, no es una cosa homogénea.
Frente a las distintas dimensiones de las que consta el objeto de actitud que se
estudia, caben, a su vez, distintas posiciones por parte del mismo encuestado. Así,
por ejemplo, en el caso de un estudio de actitudes hacia las corridas de toros, es
posible tener una actitud positiva hacia la estética de una corrida, pero se puede ser
contrario al sufrimiento del animal. Por lo tanto es importante identificar estas di-
mensiones, o componentes, del objeto de la actitud a medir.
Para la identificación de las dimensiones del objeto de esta actitud, puede recurrirse
a tres vías complementarias:
1. Trabajos anteriores
2. Nosotros mismos
3. Expertos
· 85 ·
Así pues, y siguiendo con el ejemplo taurino, unas dimensiones hacia las corridas
de toros, podrían ser las de la tabla 2.1:
Se debe añadir un ítem general. Un ítem de este tipo darán cuenta de una actitud
general hacia el objeto a medir, y los ítems referidos a cada una de las dimensiones
particulares, informarán de la actitud hacia ese aspecto de la actitud general. La
finalidad de añadir este ítem es comprobar la diferencia entre los valores encontra-
dos al indagar sobre cada una de las dimensiones con el encontrado al hacer una
pregunta directa del tipo «¿Cual es sus actitud general hacia...? Generalmente
estos valores van a diferir, por razones de deseabilidad social de la respuesta. La
puntuación obtenida con la escala, es por tanto más ajustada a la realidad que la
que se obtienen con un ítem directo.
2.2 Redacción de los ítems
El siguiente paso consiste en, una vez perfiladas las distintas dimensiones de la
actitud tras una discusión en grupo, hacer una lista de ítems (que algunos autores,
como Mayntz, llaman statemens) en los cuales se reflejen estas actitudes que se
quieren conocer. Esta es posiblemente la etapa más laboriosa y más delicada en la
construcción de una escala de actitudes.
Para la obtención de los ítems pueden utilizarse las mismas fuentes que utilizamos
para determinar las dimensiones de la actitud, es decir, 1) publicaciones anterio-
res, 2) nuestro propio trabajo y 3) el recurso a expertos.
2.2.1Los ítems empleados
En la construcción de una escala de actitudes tipo Likert hay dos fases en la
construcción del cuestionario. En la primera fase se pasa un cuestionario que consta
de muchos más ítems y es la base para construir el cuestionario definitivo que
resulta así validado y que constituye la escala propiamente dicha.
En cuanto al número de ítems del cuestionario en la fase de validación, la única
regla que pueda darse es la de que cuanto mayor sea el número de estos ítems
mayor será la fiabilidad del instrumento final, puesto que mayor será la posibilidad
de seleccionar los mejores ítems en el cuestionario definitivo.
Artículos · Manuel Guil Bozal
Tabla 2.1. Dimensiones de lo taurino
1. El torero. (Como persona con virtudes, etc.)
2. El toro. (Como animal con derechos)
3. Lo lúdico-estético
4. Lo económico
5. Lo simbólico. (De identidad cultural y étnica)
Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006
· 86 ·
Mayntz, Holm y Hüber (1983) estiman que 100 es un número razonable de ítems
para el cuestionario en la fase de validación. Por su parte, Nunnally (1978, p.605)
sugiere como número adecuado para la fase previa unos 40 y unos 20 para el
definitivo. En publicaciones como la de Borich y Madden (1977), en la que se des-
criben numerosos instrumentos, no puede precisarse una práctica común en cuan-
to al número de ítems iniciales.
Sobre el número de ítems del cuestionario definitivo, un estudio de Bidnick (1975)
que analiza cuestionarios de escalas publicados, desde 1964 a 1973, encuentra
que el 62 por 100 no supera los 10 ítems. La recomendación de Morales Vallejo
(2000, p.68) es que el número de ítems del cuestionario definitivo debe oscilar entre
20 y 25 ítems.
A igualdad de fiabilidad es recomendable el menor número posible de ítems para
evitar lo que Sharp y Frankel (1983) denominan respondent burden o nivel de moles-
tia que experimenta el encuestado.
2.2.3 Variables independientes
En el cuestionario hay que añadir una serie de variables que llamamos independien-
tes porque, en principio, se va a medir la actitud en dependencia de ciertas varia-
bles consideradas variable independientes.
Estas variables independientes pueden ser: la edad, el género, el nivel de estudios,
la religiosidad, etc., y con ellas se trata de fijar un perfil básico del encuestado con
idea de, posteriormente, compararlo con la variable dependiente.
2.2.4 Primera etapa en la elaboración del cuestionario
Como queda dicho, para realizar una escala de Likert se sigue un procedimiento
que pasa por dos etapas, en la primera se formulan unos cien ítems aproximada-
mente.
En la segunda fase de la elaboración del cuestionario, que puede llamarse de vali-
dación, queda ya el cuestionario definitivo.
2.2.5 Validación del cuestionario
El proceso de validación de un cuestionario consiste en pasar este cuestionario a
una pequeña muestra de manera que pueda saberse que ítems son verdaderamen-
te los que van a marcar diferencias entre unos y otros sujetos en cuanto a la actitud
que quiere medirse.
Hay dos procedimientos para saber cuales son los ítems más discriminantes. El
primer procedimiento está basado en el cálculo de la t de Student, consiste en
tomar a los dos grupos de sujetos de la muestra con puntuación media total más
extrema para, a continuación, calcular la t de cada uno de los ítems. Los valores
más altos de t son los que van a decir que ítems son los más discriminante, que
serán los que constituyan la escala definitiva.
· 87 ·
El segundo procedimiento consiste en calcular la correlación ítem-total. Este pro-
cedimiento se fundamenta en el cómputo de la correlación que guarda la puntua-
ción que recibe cada ítem particular, de los que componen el cuestionario, con la
puntuación media total de todos los demás ítems del cuestionario, excluido el ítem
con el que se calcula la correlación.
Ambos procedimientos dan resultados prácticamente iguales (Morales Vallejo, 2000,
p.72), sobre todo si se utiliza un gran número de ítems para hacer la selección de
los mejores.
2 Escalas Likert versus escalas Thustone
En una escala tipo Likert encontramos el esquema de la figura 2.1
La puntuación del sujeto encuestado será la suma de las puntuaciones obtenidas
en cada ítem.
En una escala tipo Thurstone el esquema que se encontraría sería el de la figura 2.2:
Artículos · Manuel Guil Bozal
Ítem TD AD ¿? AA TA
1 1 2 3 4 5
2 1 2 3 4 5
3 1 2 3 4 5
…. … … … … …
19 1 2 3 4 5
20 1 2 3 4 5
VARIABLES INDEPENDIENTES Y DE CONTROL
Figura 2.1. Esquema de una escala tipo Likert
Ítem D A Puntuación
1 0 1 P1
2 0 1 P2
3 0 1 P3
… 0 1 ...
19 0 1 P29
20 0 1 P30
VARIABLES INDEPENDIENTES Y DE CONTROL
Figura 2.2. Esquema de una escala tipo Thurstone
Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006
· 88 ·
Es decir, cada ítem recibe una puntuación previa, de modo que al responder al
cuestionario el sujeto solo dice si está de acuerdo o no con cada una de las afirma-
ciones que aparecen en los ítems, de modo que la puntuación de cada sujeto será
la suma de las puntuaciones de los ítems con los que el sujeto está de acuerdo.
Si ahora se reflexiona acerca de las ventajas e inconvenientes de una escala u otra,
se pueden fijar tres características diferenciales (figura 2.3):
Figura 2.3. Diferencias entre las escalas de Likert y Thurstone
2.1 La selección de los ítems
Según la técnica de Likert, la selección de los ítems se hace administrando el
cuestionario a la población que se está estudiando, y es la respuesta así obtenida
la que determina que ítems son útiles y que ítems son redundantes.
Según la técnica de Thurstone los ítems que se emplean son seleccionados por un
grupo de expertos. De modo que se corre el riesgo de que la actitud medida sea, en
cierto modo, la actitud de los expertos, y no sólo la de la población que se está
estudiando. La ventaja de esta escala frente a la de Likert está en el hecho de que
a sus ítems se les asigna diferentes intensidades, mientras que en Likert siempre
es la misma intensdad.
2.2 Las respuestas posibles
En una escala tipo Likert las posibles respuestas que se ofrecen al encuestado son
más de dos: suelen ser cinco, aunque en algunos casos es otro número, pero
siempre más de dos. En la escala tipo Thurstone, por contra, solo hay dos respues-
tas posibles: estar de acuerdo o no estar de acuerdo con la afirmación propuesta.
En este aspecto, tal como lo refleja la tabla 2.3, las escalas tipo Likert son preferi-
bles a las tipo Thurstone.
3.3 Peso de cada ítem
Respecto al peso relativo de cada ítem, la escala tipo Likert ha sido criticadas por
cuento se supone que en ellas el peso relativo de cada ítem es el mismo, cuando
ésto en realidad no siempre es así. Por ejemplo, en un ítem para medir las actitu-
des hacia lo taurino que se formulara diciendo Me alegro cuando me entero que un
toro ha corneado a un torero, una respuesta a la misma con la opción «Totalmente
de Acuerdo», reflejaría, en el sujeto que respondiera así, una actitud hacia lo taurino
muy contraria. Sin embargo responder de idéntico modo a un ítem, como por
ejemplo, No me parece bien que los niños pequeños vean corridas de toros, aun-
CARACTERÍSTICA VENTAJA LIKERT THURSTONE
SELECCIÓN DE LOS ITEMS LIKERT POBLACION EXPERTOS
RESPUESTAS POSIBLES LIKERT MÁS DE 2 SÓLO 2
PESO DE CADA ÍTEM THURSTONE EL MISMO DIFERENTE
· 89 ·
que implica también una actitud negativa, ésta no tiene que ser, necesariamente,
tan negativa como la anterior. Pero según la metodología de Likert, ambos ítems
estarían midiendo una actitud idéntica.
Si se observa ahora la escala de Thurstone, se ve que aquí cada respuesta tiene un
peso relativo deferente, cada ítem tiene un peso diferente. Así, si un mismo entre-
vistado respondiera como que está de acuerdo a las dos afirmaciones, la puntua-
ción que recibiría por ello sería la suma de las puntuaciones de los dos ítems. Si al
ítem Sería capaz de pagar mi sueldo de un mes por ver una buena corrida de toros,
le damos una puntuación previa de 5, y al ítem Si me regalaran la entrada iría a una
corrida de toros 1. El sujeto que respondiera afirmativamente a ambas sería puntuado
con 6 (=1+5). Sin embargo en una escala de Likert hubiera sido puntuado con 10
(=5+5).
Así, en un ejemplo hipotético, podrían considerase las respuestas de cinco sujetos
con diferentes actitudes hacia lo taurino, concretamente: Muy favorables, algo favo-
rables, ni favorables ni desfavorables, algo desfavorables y muy desfavorables; y
dos ítems que midan esta actitud con diferente peso.
Ítem 1: Sería capaz de pagar mi sueldo de un mes por ver una buena corrida
de toros.
Ítem 2: Por lo que a mi respecta, pueden televisarse corridas de toros.
Ambas afirmaciones, reflejan una actitud positiva hacia las corridas de toros, pero,
sin duda, no con la misma intensidad.
¿Cómo medirían estos dos ítems las actitudes taurinas de cinco supuestos suje-
tos, cuyas actitudes reales fueran respectivamente 1, 2, 3, 4 y 5 (es decir Muy
Desfavorables, Algo Desfavorables, ni Favorables ni Desfavorables, Algo Favorables
y Muy Favorables)?3. Método propuesto
Artículos · Manuel Guil Bozal
LIKERT THURSTONE
Item 1 Item 2 Item 1 Item 2
Sujeto 1 1 1 0 0
Sujeto 2 1 3 0 0
Sujeto 3 1 5 0 1
Sujeto 4 1 5 0 1
Sujeto 5 2 5 0 1
Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006
· 90 ·
3 Método propuesto
La idea que se propone se concreta en combinar las ventajas de ambos métodos.
Es decir, se asignaría un coeficiente a cada ítem de modo que la puntuación obte-
nida por cada sujeto fuera la de la respuesta dada multiplicada por un determinado
coeficiente. Este coeficiente indicaría el peso relativo de este ítem en el conjunto de
la escala (tabla 3)
Tabla 3. Modelo de escala mixta
La puntuación, por tanto, de cada ítem, sería la obtenida por cada sujeto, pero
multiplicada por un coeficiente que habría de variar entre 0 y 10.
4 Comprobación de resultados
Los resultados obtenidos mediante este método habría que contrastarlos con los
obtenidos mediante otros procedimientos para ver si las diferencias son significati-
vas. Concretamente habría que hacer los siguientes cálculos:
Correlación Likert-Thurstone
Correlación Likert-Mixta
Correlación Thurstone-Mixta
Para ello se utilizará un cuestionario como el de la tabla 4, y se pedirá al mismo
sujeto que respondiera, respecto al mismo ítem de 1 a 5 y nuevamente, de 0 a 1.
De este modo tendríamos toda la información suficiente para medir la actitud por
los tres procedimientos (Likert, Thurstone y Likert-Thurstone).
Coef. Ítem TD AD ¿? AA TA
C1 1 1 2 3 4 5
C2 2 1 2 3 4 5
C3 3 1 2 3 4 5
… …. … … … … …
C19 19 1 2 3 4 5
C20 20 1 2 3 4 5
· 91 ·
La correlación entra las escalas de Likert y Thurstone ha sido comprobada en
multitud de ocasiones y se sabe que es bastante alta. Sería, pues, interesante
conocer la correlación que guardaría esta nueva escala con una escala Likert y una
escala Thurstone. Este trabajo se ha realizado, como parte de un proyecto, en el
seno del grupo de investigación HUM346, adscrito al Departamento de Sociología
de la Universidad de Sevilla. Así se pasó un cuestionario con una escala Likert, una
escala Thurstone y una escala Mixta a 30 estudiantes de la Universidad y los
resultados fueron los de la tabla 5 y 6.
En la tabla 5 se han dispuesto los valores de las variables manejadas. Puede apre-
ciarse como la respuesta media a un ítem general del tipo ¿cual considera que es
su actitud general hacia...? en este caso la tauromaquia, en una escala de 1 a 5, en
la que 1 sería una actitud muy desfavorable y 5 una actitud muy favorable, fue de
2,18. Este valor es sensiblemente inferior al 2,46 que se obtuvo mediante la aplica-
ción de la escala Likert (mediaL1). Por otro lado, en aplicación de una escala
Thurstone, se encontró que en una escala de 0 a 1, en la que 0 significa una actitud
desfavorable y 1 una actitud favorable, la población encuestada presentaba una
puntuación media de 0,198 (media TH). Con la escala mixta construida, la puntua-
ción encontrada (de nuevo en una escala de 1 a 5, donde 1 es muy desfavorable y
5 muy favorable) fue de 1,31.
Artículos · Manuel Guil Bozal
Coef. Ítem TD AD ¿? AA TA D A
C1 1 1 2 3 4 5 0 1
C2 2 1 2 3 4 5 0 1
C3 3 1 2 3 4 5 0 1
… …. … … … … … … …
C19 19 1 2 3 4 5 0 1
C20 20 1 2 3 4 5 0 1
VARIABLES INDEPENDIENTES Y DE CONTROL
Tabla 4. Procedimiento para contrastar resultados
Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006
· 92 ·
Si ahora se examinan las correlaciones entre estas escalas, se encuentran los
resultados de la tabla 6, donde puede apreciarse que las correlaciones son todas
muy elevadas. Especialmente elevada (0,999) es la correlación existente entre la
escala de Likert y la escala Mixta, mayor que la existente entre la de Likert y la de
Thurstone (0,856) y mayor que la correlación existente entre la escala Mixta y la de
Thurstone (0,852). Todos estos valores son extremadamente altos y significan que
la correlación entre cualquiera de estos tres tipos de escala es muy elevado, la
diferencia que pude haber entre ellos es inferior a la diferencia por error técnico en la
aplicación de la escalas. En este sentido, se administró a la misma población la
escala Likert, pero con el orden de los ítem alterado y se obtuvo una puntuación
media de 2,5283 (tabla 5, mediaL2), y al calcularse su correlación con mediaL1 se
obtuvo un valor de 0,888, inferior al encontrado entre mediaL1 y mediaM
N Mínimo Máximo Media Desv. típ.
mediaL1 30 1,000 4,550 2,46583 ,956207
mediaL2 30 1,000 4,700 2,52833 ,972349
mediaTHD 30 ,000 1,000 ,37250 ,277096
mediaTH 30 ,000 ,534 ,19639 ,147452
mediaM 30 ,53 2,45 1,3137 ,52009
¿Cual considera
que es su actitud ? 28 1 5 2,18 1,278
N válido (según lista) 28
Tabla 5. Estadísticos descriptivos
· 93 ·
** La correlación es significativa al nivel 0,01 (bilateral).
Cómo última conclusión y resumen de todo la precedente, puede decirse que la
escala mixta realizada correlaciona con ambos tipos de escala (Likert y Thurstone),
pero mucho más con la de Likert.
Artículos · Manuel Guil Bozal
mediaL
1
mediaL
2
mediaT
HD
media
TH
media
M
¿Cual
considera
que es su
actitud
general?
Media L1
Correlación de Pearson
N
Media L2
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
Sig. (bilateral)
Correlación de Pearson
Sig. (bilateral)
N
Correlación de Pearson
Sig. (bilateral)
N
MediaTHD
Media TH
Media M
¿Cual
considera
que es su
actitud
general?
Sig. (bilateral)
N
Correlación de Pearson
1 ,888(**) ,856(**),856(**) ,999(**) ,435
,000 ,000 ,000 ,000 ,464
30 30 30 30 30 5
,888(**) 1 ,939(**),939(**) ,886(**) ,343
,000 ,000 ,000 ,000 ,572
30 30 30 30 30 5
,856(**),939(**) 1 ,999(**) ,852(**) ,684
,000 ,000 ,000 ,000 ,203
30 30 30 30 30 5
,856(**),939(**) ,999(**) 1 ,852(**) ,673
,000 ,000 ,000 ,000 ,213
30 30 30 30 30 5
,999(**),886(**) ,852(**),852(**) 1 ,397
,000 ,000 ,000 ,000 ,508
30 30 30 30 30 5
,435 ,343 ,684 ,673 ,397 1
,464 ,572 ,203 ,213 ,508
5 5 5 5 5 5
Tabla 6. Correlaciones
Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006
· 94 ·
Bibliografía
BARWISE, Jon, (1992)-; PERRY, John. Situaciones y actitudes. Madrid Visor.
BIDNICK, M. L. (1975), The Methodology of Measurement: An Analysis of Selected Scaling
Techniques and Their Applications in Sociology, Ann Arbor, Michigan: Xerox University
Microfilms.
BOLÍVAR BOTÍA, Antonio (1995), La evaluación de valores y actitudes. Madrid: Anaya.
BORICH, G.D. and MADDEN, S. K. (1977), Evaluating Classroom Instruction, A Sourcebook
of Instruments, Reading, Mass.: Addison-Wesley.
BRIONES, Guillermo (2001), Métodos y técnicas de investigación para las ciencias so-
ciales. México: Trillas.
CAMBRIA, Rosario (1974), Los toros: tema polémico en el ensayo español del siglo XX.
Madrid: Gredos.
CASTAÑO (1992), Carlos. Análisis y evaluación de las actitudes de los profesores hacia
los medios de enseñanza. Sevilla Universidad de Sevilla, Facultad de Filosofía y
Ciencias de la Educación.
CLARIN, Rèmy; BRION, Philipe. Manual de Muestreo. Madrid. 2001. Editorial La Muralla.
DIXON, P. N.; BOBO, M. & STEVICK, R. A. (1984) “Responses Differences and Preferences
for All-Categories-Defined” Educational and Psychological Measurement, 44, 61-66
DOMÈNECH I MASSONS, Josep Ma. Bioestadística: métodos estadísticos para investi-
gadores. Barcelona Herder, 1982
EDWARDS, A. L. (1957b). The Social Desirability Variable in Personality Assessment,
New York: Holt, Rinehart and Winston.
ELZO , Francisco Javier (1986), Juventud vasca 1986: informe sociológico sobre com-
portamientos, actitudes y valores de la juventud vasca actual. Departamento de Cul-
tura y Turismo, Dirección de Juventud y Acción Comunitaria, Gobierno Vasco. Vitoria
Gobierno Vasco, Servicio Central de Publicaciones.
Estudio sobre actitudes y hábitos de lectura de prensa diaria en Sevilla capital. (1977)
Prensa Española, S.A.
FERRY, Gilles [et al.] (1976), Nuevas actitudes en la relación pedagógica: la no-directividad,
sus proposiciones, sus aciertos y sus desviaciones. Buenos Aires. Librería del Cole-
gio.
FRISBIE, D. A. & BRANDEMBURG, D. C (1979) «Equivalence of Questionnaire items with
Varying Response Formats» Journal of Educational Measurements, 16, 43-48.
GARCÍA FERRANDO, Manuel. (2001) Socioestadística. Madrid: Alianza.
HENERSON, Mariene E; MORRIS, Lynn & FIZT-GIBBON, Carol Taylor (1988) How measure
Attitudes, London: Sage
JOHNSON, W.L. and DIXON, P. N. (1984), “Response alternatives in Likert Scaling”,
Educational and Psychological Measurement, 44, 567.
KANDYSKY, W. (1995), De lo espiritual en el arte. Barcelona. Labor. 4ª edición.
KING Y ZIEGLER, (1975), Research Projects in Social Psychology, Monterey: Brooks-
Cole.
KLOCKARS, Alan J. and YAMAGISHI, Midori.(1988),”The Influence of Labels and Position
in Rating Scales. “Journal of Educational Measurement. 25, 2.
· 95 ·
LABRADA RUBIO, María Antonia (1982), Comportamientos y actitudes estéticas de la
población madrileña actual: (Metodología y aplicación sectorial.) Madrid Universidad
Complutense de Madrid, Departamento de Historia del Arte.
LAMM, T.C.M, and KLOCKARS, A. J. (1982). «Anchor Point Effects on the Equivalence of
Questionnaire Items» Journal of Educational Measurements, 19, 317-322.
MARTÍNEZ ARIAS, M. Rosario (1995), Psicometría: teoría de los tests psicológicos y
educativos, Madrid Síntesis.
MAYNTZ, R; HOLM, K; HÜBER, P. (1983), Introducción a los métodos de la sociología
empírica. Alianza Universidad. Madrid.
MORALES, Pedro (2000), Medición de actitudes en psicología y educación: construcción
de escalas y problemas metodológicos. Madrid: Universidad Pontificia Comillas.
NUNNALLY, J. C. (1987), Teoría psicométrica. México: Trillas.
NUNNALLY, JUM C. & BERSTEIN, IRA H. (1994), Psychometric Theory, 3ª ed., New York:
McGraw-Hill.
OZAMIZ, José Agustín (1985), Actitudes hacia las enfermedades mentales en el País
Vasco. Oñati. Instituto Vasco de Administración Pública.
PITT-RIVERS, Julián (1984), El sacrificio del toro. Revista de Occidente. Mayo.
REICH, Ben. (1980), Valores, actitudes y cambio de conducta. México. Compañía Edito-
rial Continental.
RODRÍGUEZ LEGIDO, Clementina (1985), Los andaluces, protagonistas de su salud:
opiniones sobre la atención médica. Sevilla. Consejería de Salud y Consumo, Depar-
tamento de Ordenación Profesional, Información y Estudios Sanitarios.
ROTTER (1972), «Attitudinal Point of Agreement and Disagreement» Journal of Social
Psychology, 86.
SCHWARTZ, S. A. (1978), “A Comprehensive System for Item Analysis in Psychological
Scale Construction”, Journal of Educational Measurement, 15, 117-123.
SHARP, L. M. FRANKEL, J. (1983), “Respondent Burden: A Test of Some Common
Assumptions”, Public Opinion Quarterly, 47.
SHUBERT, Adrian (2002), A las mesis, experiencia estética. Madrid: Tecnos.
Artículos · Manuel Guil Bozal
Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006cinco de la tarde. Una historia social del toreo. Turner
Publicaciones. Real maestranza de Caballería de Ronda.
SPECTOR, Paul E. (1992). Summating Ratings Scale Construction: An Introduction,
Newbury Park & London: Sage.
STEVENS, S. S. (1946), “On the Theory of Scales of Measurement”, Science, 103, 677-
680
SUMMERS, Gene F. (1978), Medición de actitudes. México Trillas.
UNIVERSIDAD DE SEVILLA (2001), Anuario estadístico. Sevilla: Universidad, Servicio de
Publicaciones.
URKOLA ELEIZEGI, Mikel (1985), Problemas de actitudes psicosociales de Guipúzcoa.
Director José Luis Pinillos. Madrid: Universidad Complutense de Madrid.
WILSON, G. D. & PATTERSON, J. R. (1968), «A New measure of Conservatism» British
Journal of Social and Clinical Psychology, 7.
TATARKIEWICZ, W. (1976), Historia de seis ideas. Arte, belleza, forma, creatividad, mi-
· 96 ·
MEDICION - REQUISITOS- PROCEDIMIENTO PARA CONSTRUIR UN INSTRUMENTO DE MEDICION
Resumen Cap. 8 del libro Introducción a la Investigación Pedagógica de Ary, Jacobs y Razavieh y cap 9. del libro Metodología de la investigación de Hernández S. y otros.
¿QUE IMPLICA LA ETAPA DE RECOLECCION DE DATOS?
¿QUÉ SIGNIFICA MEDIR?
De acuerdo a definiciones clásicas como la de Stevens (1951), significa “asignar números o valores a objetos y eventos de acuerdo a reglas”. Sin embargo, como lo señala Carmines y Zeller (1979), esta definición es más apropiada para las ciencias físicas que para las ciencias sociales, las cuales trabajan con una serie de conceptos más abstractos que no pueden verse directamente o tratarse como productos o resultados.
¿QUÉ REQUISITOS DEBE CUBRIR UN INTRUMENTO DE MEDICION?
Toda medición o instrumento de recolección de datos debe reunir dos requisitos esenciales; confiabilidad y validez.
LA CONFIABILIDAD de un instrumento de medición se refiere al grado de precisión o exactitud de la medida, en el sentido de que si aplicamos repetidamente el instrumento al mismo sujeto u objeto produce iguales resultados. Es el caso de un balanza o de un termómetro, los cuales serán confiables si al pesarnos o medirnos la temperatura en dos ocasiones seguidas, obtenemos los mismos datos.
LA VALIDEZ se refiere al grado en que un instrumento mide la variable que pretende medir. Por ejemplo, un test de inteligencia no será válido, si lo que mide es realmente memoria y no inteligencia. Ciertas variables como el sexo, la nacionalidad, son muy fáciles de observar o de preguntar y obtener una respuesta válida. Pero cuando se trata de diversas variables que se trabajan en ciencias sociales como motivaciones, actitudes, sentimientos, emociones, etc, la validez de un instrumento que pretenda medirlas se torna más compleja, y por lo tanto, cabe preguntarse si ¿realmente el instrumento estará midiendo lo que pretende medir?
« Evidencia relacionada con el contenido LA VALIDEZ DE CONTENIDO se refiere al grado en que un instrumento refleja un dominio específico de contenido de lo que se mide. Por ejemplo, una prueba de operaciones aritméticas no tendrá validez de contenido si explora suma y división y excluye problemas de resta y multiplicación. Un instrumento de medición debe contener representados a todos los items del dominio de contenido de las variables a medir.
« Evidencia relacionada con el constructo. LA VALIDEZ DE CONSTRUCTO es probablemente la más importante, sobretodo desde la perspectiva científica, ya que se refiere al grado en que una medición aportada por un instrumento relaciona consistentemente con otras mediciones que han surgido de hipótesis y construcción de teorías antecedentes.
VALIDEZ TOTAL = Validez de contenido + validez de criterio + validez de constructo
b) El no estar validados en el contexto donde se aplican. Traducir un instrumento, aún cuando adaptemos los términos a nuestro lenguaje no es ni remotamente validarlo. Es simplemente un primer paso ya que validar un instrumento implica realizar una investigación extensa y compleja. Los grupos, las personas cambian y tienen valores diferentes de acuerdo a la cultura. Por lo tanto, se deben aplicar instrumentos ya validados en el contexto.
c) El instrumento e inadecuado o no es empático. Hay instrumentos que tienen un lenguaje muy elevado para el entrevistado o no toma en cuenta diferencias de sexo, edad nivel ocupacional y educativo; todo esto puede resultar en errores de validez y confiabilidad del instrumento de medición
d) El cuarto factor lo constituyen las condiciones en que se aplica el instrumento. El ruido, presionar para que una persona conteste un instrumento largo en un período de tiempo corto, el hambre o falta de motivación para responder influirá negativamente en la validez y confiabilidad de la medida.
e) El quinto factor se refiere a los aspectos mecánicos. Que el instrumento tenga instrucciones precisas, que se lea bien (si se trata de un cuestionario escrito), que no le falten páginas, que haya un espacio adecuado para contestar.
« Medidas paralelas o formas equivalentes de medir. En este procedimiento no se aplica el mismo instrumento de medición sino dos o más versiones equivalentes de éste. Las versiones deben ser similares en contenido, instrucciones, duración, etc. Por ej. cuando un profesor administra 2 o más modalidades de examen en su grupo de alumnos. El instrumento es confiable si la correlación entre los resultados de las dos o más pruebas administradas es significativamente positiva.
PROCEDIMIENTO PARA CONSTRUIR UN INSTRUMENTO DE MEDICION
1. El primer paso consiste en listar las variables que se pretenden medir u observar. Recordemos que las variables son propiedades de los objetos o de los sujetos que adquieren distintos valores y que son razón de nuestro estudio o fenómeno a investigar.
2. Revisar su definición conceptual y comprender su significado. Por ejemplo, comprender qué es “integración escolar” y qué dimensiones o grandes aspectos envuelve.
La definición conceptual se refiere a la descripción de la esencia o de las características propias, reconocidas por consenso de un fenómeno u objeto, a la cual se le llama cotidianamente “definición real”; se reconoce la importancia de una conceptualización teórica, dada por autores reconocidos.
Cuando el investigador dispone de varias opciones debe utilizar el procedimiento que le reporte mayor información sobre la esencia del objeto o fenómeno de estudio.
4. En caso de no encontrar un instrumento desarrollado adecuado, válido y confiable y se quiera construir o desarrollar uno propio, debe pensarse en cada variable, sus categorías, los indicadores más precisos y los items para cada uno de ellos. Un ejemplo de ello podría ser el siguiente:
Variable | Definición operacional | Categorías | Indicadores | Items |
Integración escolar | Grado de aceptación de la comunidad escolar regular para aprender y convivir con niños especiales | Por parte de los Directivos | Interés y voluntad por aceptar niños especiales en su Institución | 1. ¿Desde hace cuanto tiempo se realiza integración escolar en este Centro? 2. ¿De qién fue la iniciativa? 3. ¿Cuáles fueron las estrategias para llevar adelante este proceso? |
| | Por parte de los Docentes | Sensibilización y preparación para trabajar con niños especiales dentro de un aula regular | 1. ¿Cómo es su perfil de formación para trabajar con estos niños? 2. ¿Qué adiestramiento ha recibido? 3. ¿Cómo planifica y evalúa las actividades con estos niños? 4. ¿Qué estrategias de integración practica? |
| | Por parte de los Padres | Información y opinión sobre el proceso de integrar niños especiales en aulas regulares | 1. ¿En qué medida ha sido informado sobre el proceso de integración escolar que adelanta la escuela? 2. ¿Cuáles son a su juicio los aspectos favorables de la integración? 3. ¿Cuáles son los obstáculos o dificultades de este proceso? |
En este caso, debemos asegurarnos de tener un número suficiente de items para medir todas las variables en todas sus dimensiones.
Variable | Definición operacional | Categorías | Indicadores | Items |
Nivel de participación de los alumnos de Unimet | Compromisos adquiridos por el alumno para realizar diferentes tareas y funciones propias de la Unimet. | Académicas | Rendimiento Delegado de curso Ayudantías Preparadurías | 1.¿Cuál es tu índice académico acumulado? 2. ¿Eres actualmente o has sido delegado de curso 3.¿Has realizado alguna ayudantía? Describe....... 4.¿Has realizado alguna preparaduría? Cátedra............... Tiempo......... |
| | No académicas | Deportes Cultura Gremiales Capital Social | 5.¿Participas o has participado en algún equipo o selección de portiva en Unimet? ¿Cual.....? 6.¿Participas o has participado en alguna agrupación cultural dentro de Unimet? ¿Cuál?....... 7.¿Has participado en alguna de estas agrupaciones: -Aisec ___ -Centro de estudiantes____ -Aje (jóvenes empresarios)____ 8.¿Participas o has participado en alguna agrupación de proyecto social y comunitarios? ¿Cuál?_____ |
5. Indicar el nivel de medición de cada ítem y por ende, el de las variables. Recordemos que existen cuatro (4) niveles de medición ampliamente conocidos
· El nivel de medición ordinal, indica que hay varias categorías, pero además estas mantienen un orden jerárquico, de mayor a menor. Por ejemplo el Grado o Nivel de Instrucción de las personas, el cargo que una persona ocupa dentro de una empresa o Institución, etc. En los dos niveles mencionados no se pueden utilizar las operaciones matemáticas básicas, porque sería absurdo y no tiene sentido, darle numeración en escala a las respuestas.
· El nivel de medición por intervalo, implica crear escalas de medición donde las distancias entre las diferentes categorías de respuestas son iguales. El cero o punto de partida, es arbitrario, es decir no es real, como el caso de la temperatura, donde el cero no significa que no haya temperatura. Algunas escalas de observación y de medición de opinión de actitudes suelen tratarse como si fueran mediciones de intervalo. Aquí se permite utilizar las operaciones matemáticas básicas y algunas estadísticas. Ej. las escalas de evaluación que los estudiantes llenan sobre sus profesores. ¿Cómo considera el sistema de evaluación de la materia? 1 --- 2 --- 3 --- 4 --- 5 (1 = deficiente, 5 = excelente)
· El nivel de medición de razón, además de tener todas las características del nivel de intervalo (distancias iguales entre las categorías de respuesta y aplicación de operaciones matemáticas básicas), implica que parte de un cero real y absoluto donde no existe la propiedad a medir. Por ej. ¿Cuántos hijos tiene usted?
O --- 1 --- 2 --- 3 --- 4 --- 5 --- 6 --- 7 --- 8 --- 9 --- 10 ó más
6. Indicar cómo se han de codificar los datos . La codificación es necesaria para analizar cuantitativamente los datos (aplicar análisis estadísticos). La mayoría de las veces se usan números o cantidades, aunque también se pueden utilizar letras o símbolos.
7. Aplicar una prueba piloto del instrumento de medición. Es decir, aplicar el instrumento a personas con características semejantes a las de la muestra o población objetivo de nuestra investigación
En esta prueba se analiza si las instrucciones se comprenden y si los items funcionan adecuadamente. Los resultados se utilizan para calcular la confiabilidad y de ser posible, la validez del instrumento de medición. La prueba piloto se realiza con una pequeña muestra; los investigadores aconsejan un 10% de personas semejantes a las que integrarán la muestra definitiva.