miércoles, 10 de agosto de 2011

sábado, 4 de septiembre de 2010

Rorschach

Check out this SlideShare Presentation:

Test de apercepcion infantil cat

Check out this SlideShare Presentation:

Prueba De ApercepcióN TemáTica Para NiñOs

Check out this SlideShare Presentation:

PRUEBAS PSICOLÓGICAS

Check out this SlideShare Presentation:

jueves, 12 de agosto de 2010

Psicometría (II Bimestre)

Check out this SlideShare Presentation:

Psicometría (I Bimestre)

Check out this SlideShare Presentation:

ESCALA MIXTA LIKERT-THURSTONE


Manuel Guil Bozal

(Universidad Pablo de Olavide)

Introducción

Se presenta con este artículo un proyecto para construir escalas para medir las actitudes de una determinada población hacia un determinado objeto utilizando una metodología mixta Likert y Thurstone.

RESUMEN

Una de las limitaciones, que tradicional- mente se ha venido apuntando sobre la escala de Likert, es que el peso relativo en el conjunto de la escala representa cada ítem sea considerado exactamente el mismo, cuando esto no tiene por qué ser así, y de hecho no lo es normalmente. La escala de Thurstone asigna un valor relativo diferente a cada ítem,

pero su validación es efectuada por un grupo de jueces y no por la misma población destinataria de la misma. La innovación metodológica que se propone con esta comunicación se fundamenta en una ponderación de los valores ofrecidos por los diferentes ítems según el

peso relativo que le sea estimado a los mismos por un grupo de jueces y al mismo tiempo ser validados por la población objeto de la misma. En otras palabras sería un método para construir escalas de actitud social basada en una combinación de las técnicas de Likert y Thurstone.

Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006


La principal crítica que las escalas de Likert han recibido a lo largo de su dilatada historia es que el peso relativo de cada ítem, en el conjunto de la escala, se considera exactamente el mismo, cuando esto no tiene por qué ser así, y de hecho no lo es normalmente.

La escala de Thurstone, por su parte, asigna un valor relativo diferente a cada ítem, pero adolece de otros defectos: su validación es efectuada por un grupo de jueces y no por la misma población destinataria de la misma, con lo cual su validez queda también bastante mermada.

La innovación metodológica que se propone con este artículo se fundamenta en una ponderación de los valores ofrecidos por los diferentes ítems según el peso relativo que le sea estimado a los mismos por un grupo de jueces y al mismo tiempo ser validados por la población objeto de la misma. En otras palabras sería un método para construir escalas de actitud social basada en una combinación de las técnicas de Likert y Thurstone.

Las escalas Likert son las más empleadas, de hecho, en la actualidad porque su elaboración es más sencilla que las de Thurstone y ofrecen unos resultados análogos a los de ésta. Por este motivo, para el desarrollo teórico del instrumento que ahora se propone, se tomará como base el procedimiento de elaboración de una escala Likert

1 Conceptos previos

1.1 Concepto de «actitud»

Las actitudes han sido definidas como aquellas formas de pensar, de setir o de comportarse hacia a una idea, un objeto, persona o grupo de semejantes. (McConell, 1978, p.91).

Encontramos en esta definición tres elementos:

1. Un elemento cognitivo.

2. Un elemento afectivo

3. Un elemento de comportamental

El elemento cognitivo sería aquello que se piensa acerca del objeto de la actitud.

Desde un punto de vista cognitivo puede pensarse que algo está bien o está mal, independientemente de lo que luego se haga, porque puede suceder que afectivamente

se sienta movido en otra dirección.

El elemento afectivo haría referencia a aquello que se siente, que gusta o disgusta.

Así pues, puede sentirse que algo gusta o disgusta, sin que necesariamente se

actúe en la dirección que apunte ese sentimiento, porque racionalmente se consi-

dere que no es conveniente.

Por último, cuando se habla de un elemento de comportamiento o reactivo en las

actitudes, se quiere significar que no basta que algo parezca bien o mal, o guste o

· 83 ·

disguste, sino que esto lleve, de una manera u otra, a actuar en consecuencia.

Así, es posible que una persona, desde un punto de vista cognitivo, puramente

cerebral, puede considerar, por ejemplo, que las corridas de toros son algo censu-

rable y sin embrago, afectivamente, sienta atracción, le guste, y como consecuen-

cia en esta persona se establezca una determinada actitud, a favor, en contra, o ni

en contra ni a favor.

Por otro lado, también se echa de ver en la definición, que el objeto de esta actitud

puede ser una idea, un objeto o personas. Objetos de estudio de actitudes son,

pues, entidades de las más diversas.

1.2 Concepto de «escala»

Otro de los términos que se emplea es el de «escala». Una escala sería un instru-

mento de medición (Maynt, R; Holm, K; Hübner, P. 1983, p. 63) en el cual se puede

hacer una disposición de cosas distintas pero con un aspecto común(Sierra Bravo,

R. 1992). De esta manera una escala de actitud sería la disposición de diferentes

actitudes de mayor a menor intensidad, a favor o en contra.

Existen diversos tipos de escala, que pueden clasificarse básicamente en tres

(Morales Vallejo, 2000, p. 43):

1. diferenciales (Thurstone),

2. summativas (Likert),

3. acumulativas (Guttman)

Estos tres tipos de escala tienen en común que en ellas se presenta al encuestado

una serie de ítems formulados como ‘preguntas, y según responda de una manera

u otra, se le asigna a éste una puntuación en la actitud medida que lo coloca en una

escala continua, de uno a cinco normalmente, o de otro rango de valores.

Las escalas diferenciales (Thurstone, 1929), se caracterizan por que en ellas tan

solo hay dos respuestas posibles a los distintos ítems que se presentan: «de acuer-

do» o «desacuerdo». Previamente, ha habido un grupo de expertos que ha dado

una puntuación a cada uno de los ítems del cuestionario, según consideren que

ese ítem expresa con mayor o menos intensidad la actitud que se pretende medir.

Así, cada ítem parte con una puntuación previa. El sujeto encuestado recibirá una

puntuación determinada en función de la puntuación que posean los ítems con los

que se ha mostrado de acuerdo.

Las escalas summativas son debidas a Likert (1932), que fue el primero en introdu-

cirlas para medir actitudes, tomándolas de técnicas de medida de la personalidad

(Morales Vallejo, 2000, p.46). En este método se supone que todos los ítems mi-

den con la misma intensidad la actitud que se desea medir y es el encuestado el

que le da una puntuación, normalmente de uno a cinco, en función de su posición

frente a la afirmación sugerida por el ítem. La actitud final que se asigna al encuestado

será la media de la puntuación que éste da a cada uno de los ítems del cuestionario.

Las escalas acumulativas, tiene su origen en el modelo de Guttman (1950). Según

Artículos · Manuel Guil Bozal

Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006

· 84 ·

este modelo, también llamado escalograma, los ítems tienen una determinada difi-

cultad y el estar de acuerdo con uno, implica el estar de acuerdo con todos los

precedentes. Suelen tener muy pocos ítems y se utiliza para medir actitudes muy

concretas.

Aparte de estos tres tipos de escala, cabria mencionar otros instrumentos de me-

dida, pero que no pueden recibir en sentido estricto el nombre de escalas, puesto

que no sitúan al sujeto encuestado en un continuo. Según Morales Vallejo (ibid. p.

48) son «instrumentos de elección forzada, en el que los ítems son bloques de

estímulos entre los que el sujeto debe escoger el más apropiado. Estos instrumen-

tos no suelen recibir el nombre de escala». Entre estos se situarían el diferencial

semántico de Osgood (Osgood et al. 1957), y la técnica Q sort de Stephenson

(1953)

2 Construcción de una escala tipo Likert

Esta herramienta, cuyo nombre se debe al primer investigador social que la desa-

rrolló, allá por los años 1930, consiste en un cuestionario compuesto por una serie

de ítems que tratan de reflejar los diferentes aspectos de un objeto (de esta actitud)

hacia los que cabe tener una posición diferente.

2.1 Dimensiones del objeto de la actitud

El estudio del objeto de la actitud para su definición, permitirá comprobar que esta

realidad consta generalmente de una serie de componentes o dimensiones. Es

decir, no es una cosa homogénea.

Frente a las distintas dimensiones de las que consta el objeto de actitud que se

estudia, caben, a su vez, distintas posiciones por parte del mismo encuestado. Así,

por ejemplo, en el caso de un estudio de actitudes hacia las corridas de toros, es

posible tener una actitud positiva hacia la estética de una corrida, pero se puede ser

contrario al sufrimiento del animal. Por lo tanto es importante identificar estas di-

mensiones, o componentes, del objeto de la actitud a medir.

Para la identificación de las dimensiones del objeto de esta actitud, puede recurrirse

a tres vías complementarias:

1. Trabajos anteriores

2. Nosotros mismos

3. Expertos

· 85 ·

Así pues, y siguiendo con el ejemplo taurino, unas dimensiones hacia las corridas

de toros, podrían ser las de la tabla 2.1:

Se debe añadir un ítem general. Un ítem de este tipo darán cuenta de una actitud

general hacia el objeto a medir, y los ítems referidos a cada una de las dimensiones

particulares, informarán de la actitud hacia ese aspecto de la actitud general. La

finalidad de añadir este ítem es comprobar la diferencia entre los valores encontra-

dos al indagar sobre cada una de las dimensiones con el encontrado al hacer una

pregunta directa del tipo «¿Cual es sus actitud general hacia...? Generalmente

estos valores van a diferir, por razones de deseabilidad social de la respuesta. La

puntuación obtenida con la escala, es por tanto más ajustada a la realidad que la

que se obtienen con un ítem directo.

2.2 Redacción de los ítems

El siguiente paso consiste en, una vez perfiladas las distintas dimensiones de la

actitud tras una discusión en grupo, hacer una lista de ítems (que algunos autores,

como Mayntz, llaman statemens) en los cuales se reflejen estas actitudes que se

quieren conocer. Esta es posiblemente la etapa más laboriosa y más delicada en la

construcción de una escala de actitudes.

Para la obtención de los ítems pueden utilizarse las mismas fuentes que utilizamos

para determinar las dimensiones de la actitud, es decir, 1) publicaciones anterio-

res, 2) nuestro propio trabajo y 3) el recurso a expertos.

2.2.1Los ítems empleados

En la construcción de una escala de actitudes tipo Likert hay dos fases en la

construcción del cuestionario. En la primera fase se pasa un cuestionario que consta

de muchos más ítems y es la base para construir el cuestionario definitivo que

resulta así validado y que constituye la escala propiamente dicha.

En cuanto al número de ítems del cuestionario en la fase de validación, la única

regla que pueda darse es la de que cuanto mayor sea el número de estos ítems

mayor será la fiabilidad del instrumento final, puesto que mayor será la posibilidad

de seleccionar los mejores ítems en el cuestionario definitivo.

Artículos · Manuel Guil Bozal

Tabla 2.1. Dimensiones de lo taurino

1. El torero. (Como persona con virtudes, etc.)

2. El toro. (Como animal con derechos)

3. Lo lúdico-estético

4. Lo económico

5. Lo simbólico. (De identidad cultural y étnica)

Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006

· 86 ·

Mayntz, Holm y Hüber (1983) estiman que 100 es un número razonable de ítems

para el cuestionario en la fase de validación. Por su parte, Nunnally (1978, p.605)

sugiere como número adecuado para la fase previa unos 40 y unos 20 para el

definitivo. En publicaciones como la de Borich y Madden (1977), en la que se des-

criben numerosos instrumentos, no puede precisarse una práctica común en cuan-

to al número de ítems iniciales.

Sobre el número de ítems del cuestionario definitivo, un estudio de Bidnick (1975)

que analiza cuestionarios de escalas publicados, desde 1964 a 1973, encuentra

que el 62 por 100 no supera los 10 ítems. La recomendación de Morales Vallejo

(2000, p.68) es que el número de ítems del cuestionario definitivo debe oscilar entre

20 y 25 ítems.

A igualdad de fiabilidad es recomendable el menor número posible de ítems para

evitar lo que Sharp y Frankel (1983) denominan respondent burden o nivel de moles-

tia que experimenta el encuestado.

2.2.3 Variables independientes

En el cuestionario hay que añadir una serie de variables que llamamos independien-

tes porque, en principio, se va a medir la actitud en dependencia de ciertas varia-

bles consideradas variable independientes.

Estas variables independientes pueden ser: la edad, el género, el nivel de estudios,

la religiosidad, etc., y con ellas se trata de fijar un perfil básico del encuestado con

idea de, posteriormente, compararlo con la variable dependiente.

2.2.4 Primera etapa en la elaboración del cuestionario

Como queda dicho, para realizar una escala de Likert se sigue un procedimiento

que pasa por dos etapas, en la primera se formulan unos cien ítems aproximada-

mente.

En la segunda fase de la elaboración del cuestionario, que puede llamarse de vali-

dación, queda ya el cuestionario definitivo.

2.2.5 Validación del cuestionario

El proceso de validación de un cuestionario consiste en pasar este cuestionario a

una pequeña muestra de manera que pueda saberse que ítems son verdaderamen-

te los que van a marcar diferencias entre unos y otros sujetos en cuanto a la actitud

que quiere medirse.

Hay dos procedimientos para saber cuales son los ítems más discriminantes. El

primer procedimiento está basado en el cálculo de la t de Student, consiste en

tomar a los dos grupos de sujetos de la muestra con puntuación media total más

extrema para, a continuación, calcular la t de cada uno de los ítems. Los valores

más altos de t son los que van a decir que ítems son los más discriminante, que

serán los que constituyan la escala definitiva.

· 87 ·

El segundo procedimiento consiste en calcular la correlación ítem-total. Este pro-

cedimiento se fundamenta en el cómputo de la correlación que guarda la puntua-

ción que recibe cada ítem particular, de los que componen el cuestionario, con la

puntuación media total de todos los demás ítems del cuestionario, excluido el ítem

con el que se calcula la correlación.

Ambos procedimientos dan resultados prácticamente iguales (Morales Vallejo, 2000,

p.72), sobre todo si se utiliza un gran número de ítems para hacer la selección de

los mejores.

2 Escalas Likert versus escalas Thustone

En una escala tipo Likert encontramos el esquema de la figura 2.1

La puntuación del sujeto encuestado será la suma de las puntuaciones obtenidas

en cada ítem.

En una escala tipo Thurstone el esquema que se encontraría sería el de la figura 2.2:

Artículos · Manuel Guil Bozal

Ítem TD AD ¿? AA TA

1 1 2 3 4 5

2 1 2 3 4 5

3 1 2 3 4 5

…. … … … … …

19 1 2 3 4 5

20 1 2 3 4 5

VARIABLES INDEPENDIENTES Y DE CONTROL

Figura 2.1. Esquema de una escala tipo Likert

Ítem D A Puntuación

1 0 1 P1

2 0 1 P2

3 0 1 P3

… 0 1 ...

19 0 1 P29

20 0 1 P30

VARIABLES INDEPENDIENTES Y DE CONTROL

Figura 2.2. Esquema de una escala tipo Thurstone

Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006

· 88 ·

Es decir, cada ítem recibe una puntuación previa, de modo que al responder al

cuestionario el sujeto solo dice si está de acuerdo o no con cada una de las afirma-

ciones que aparecen en los ítems, de modo que la puntuación de cada sujeto será

la suma de las puntuaciones de los ítems con los que el sujeto está de acuerdo.

Si ahora se reflexiona acerca de las ventajas e inconvenientes de una escala u otra,

se pueden fijar tres características diferenciales (figura 2.3):

Figura 2.3. Diferencias entre las escalas de Likert y Thurstone

2.1 La selección de los ítems

Según la técnica de Likert, la selección de los ítems se hace administrando el

cuestionario a la población que se está estudiando, y es la respuesta así obtenida

la que determina que ítems son útiles y que ítems son redundantes.

Según la técnica de Thurstone los ítems que se emplean son seleccionados por un

grupo de expertos. De modo que se corre el riesgo de que la actitud medida sea, en

cierto modo, la actitud de los expertos, y no sólo la de la población que se está

estudiando. La ventaja de esta escala frente a la de Likert está en el hecho de que

a sus ítems se les asigna diferentes intensidades, mientras que en Likert siempre

es la misma intensdad.

2.2 Las respuestas posibles

En una escala tipo Likert las posibles respuestas que se ofrecen al encuestado son

más de dos: suelen ser cinco, aunque en algunos casos es otro número, pero

siempre más de dos. En la escala tipo Thurstone, por contra, solo hay dos respues-

tas posibles: estar de acuerdo o no estar de acuerdo con la afirmación propuesta.

En este aspecto, tal como lo refleja la tabla 2.3, las escalas tipo Likert son preferi-

bles a las tipo Thurstone.

3.3 Peso de cada ítem

Respecto al peso relativo de cada ítem, la escala tipo Likert ha sido criticadas por

cuento se supone que en ellas el peso relativo de cada ítem es el mismo, cuando

ésto en realidad no siempre es así. Por ejemplo, en un ítem para medir las actitu-

des hacia lo taurino que se formulara diciendo Me alegro cuando me entero que un

toro ha corneado a un torero, una respuesta a la misma con la opción «Totalmente

de Acuerdo», reflejaría, en el sujeto que respondiera así, una actitud hacia lo taurino

muy contraria. Sin embargo responder de idéntico modo a un ítem, como por

ejemplo, No me parece bien que los niños pequeños vean corridas de toros, aun-

CARACTERÍSTICA VENTAJA LIKERT THURSTONE

SELECCIÓN DE LOS ITEMS LIKERT POBLACION EXPERTOS

RESPUESTAS POSIBLES LIKERT MÁS DE 2 SÓLO 2

PESO DE CADA ÍTEM THURSTONE EL MISMO DIFERENTE

· 89 ·

que implica también una actitud negativa, ésta no tiene que ser, necesariamente,

tan negativa como la anterior. Pero según la metodología de Likert, ambos ítems

estarían midiendo una actitud idéntica.

Si se observa ahora la escala de Thurstone, se ve que aquí cada respuesta tiene un

peso relativo deferente, cada ítem tiene un peso diferente. Así, si un mismo entre-

vistado respondiera como que está de acuerdo a las dos afirmaciones, la puntua-

ción que recibiría por ello sería la suma de las puntuaciones de los dos ítems. Si al

ítem Sería capaz de pagar mi sueldo de un mes por ver una buena corrida de toros,

le damos una puntuación previa de 5, y al ítem Si me regalaran la entrada iría a una

corrida de toros 1. El sujeto que respondiera afirmativamente a ambas sería puntuado

con 6 (=1+5). Sin embargo en una escala de Likert hubiera sido puntuado con 10

(=5+5).

Así, en un ejemplo hipotético, podrían considerase las respuestas de cinco sujetos

con diferentes actitudes hacia lo taurino, concretamente: Muy favorables, algo favo-

rables, ni favorables ni desfavorables, algo desfavorables y muy desfavorables; y

dos ítems que midan esta actitud con diferente peso.

Ítem 1: Sería capaz de pagar mi sueldo de un mes por ver una buena corrida

de toros.

Ítem 2: Por lo que a mi respecta, pueden televisarse corridas de toros.

Ambas afirmaciones, reflejan una actitud positiva hacia las corridas de toros, pero,

sin duda, no con la misma intensidad.

¿Cómo medirían estos dos ítems las actitudes taurinas de cinco supuestos suje-

tos, cuyas actitudes reales fueran respectivamente 1, 2, 3, 4 y 5 (es decir Muy

Desfavorables, Algo Desfavorables, ni Favorables ni Desfavorables, Algo Favorables

y Muy Favorables)?3. Método propuesto

Artículos · Manuel Guil Bozal

LIKERT THURSTONE

Item 1 Item 2 Item 1 Item 2

Sujeto 1 1 1 0 0

Sujeto 2 1 3 0 0

Sujeto 3 1 5 0 1

Sujeto 4 1 5 0 1

Sujeto 5 2 5 0 1

Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006

· 90 ·

3 Método propuesto

La idea que se propone se concreta en combinar las ventajas de ambos métodos.

Es decir, se asignaría un coeficiente a cada ítem de modo que la puntuación obte-

nida por cada sujeto fuera la de la respuesta dada multiplicada por un determinado

coeficiente. Este coeficiente indicaría el peso relativo de este ítem en el conjunto de

la escala (tabla 3)

Tabla 3. Modelo de escala mixta

La puntuación, por tanto, de cada ítem, sería la obtenida por cada sujeto, pero

multiplicada por un coeficiente que habría de variar entre 0 y 10.

4 Comprobación de resultados

Los resultados obtenidos mediante este método habría que contrastarlos con los

obtenidos mediante otros procedimientos para ver si las diferencias son significati-

vas. Concretamente habría que hacer los siguientes cálculos:

Correlación Likert-Thurstone

Correlación Likert-Mixta

Correlación Thurstone-Mixta

Para ello se utilizará un cuestionario como el de la tabla 4, y se pedirá al mismo

sujeto que respondiera, respecto al mismo ítem de 1 a 5 y nuevamente, de 0 a 1.

De este modo tendríamos toda la información suficiente para medir la actitud por

los tres procedimientos (Likert, Thurstone y Likert-Thurstone).

Coef. Ítem TD AD ¿? AA TA

C1 1 1 2 3 4 5

C2 2 1 2 3 4 5

C3 3 1 2 3 4 5

… …. … … … … …

C19 19 1 2 3 4 5

C20 20 1 2 3 4 5

· 91 ·

La correlación entra las escalas de Likert y Thurstone ha sido comprobada en

multitud de ocasiones y se sabe que es bastante alta. Sería, pues, interesante

conocer la correlación que guardaría esta nueva escala con una escala Likert y una

escala Thurstone. Este trabajo se ha realizado, como parte de un proyecto, en el

seno del grupo de investigación HUM346, adscrito al Departamento de Sociología

de la Universidad de Sevilla. Así se pasó un cuestionario con una escala Likert, una

escala Thurstone y una escala Mixta a 30 estudiantes de la Universidad y los

resultados fueron los de la tabla 5 y 6.

En la tabla 5 se han dispuesto los valores de las variables manejadas. Puede apre-

ciarse como la respuesta media a un ítem general del tipo ¿cual considera que es

su actitud general hacia...? en este caso la tauromaquia, en una escala de 1 a 5, en

la que 1 sería una actitud muy desfavorable y 5 una actitud muy favorable, fue de

2,18. Este valor es sensiblemente inferior al 2,46 que se obtuvo mediante la aplica-

ción de la escala Likert (mediaL1). Por otro lado, en aplicación de una escala

Thurstone, se encontró que en una escala de 0 a 1, en la que 0 significa una actitud

desfavorable y 1 una actitud favorable, la población encuestada presentaba una

puntuación media de 0,198 (media TH). Con la escala mixta construida, la puntua-

ción encontrada (de nuevo en una escala de 1 a 5, donde 1 es muy desfavorable y

5 muy favorable) fue de 1,31.

Artículos · Manuel Guil Bozal

Coef. Ítem TD AD ¿? AA TA D A

C1 1 1 2 3 4 5 0 1

C2 2 1 2 3 4 5 0 1

C3 3 1 2 3 4 5 0 1

… …. … … … … … … …

C19 19 1 2 3 4 5 0 1

C20 20 1 2 3 4 5 0 1

VARIABLES INDEPENDIENTES Y DE CONTROL

Tabla 4. Procedimiento para contrastar resultados

Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006

· 92 ·

Si ahora se examinan las correlaciones entre estas escalas, se encuentran los

resultados de la tabla 6, donde puede apreciarse que las correlaciones son todas

muy elevadas. Especialmente elevada (0,999) es la correlación existente entre la

escala de Likert y la escala Mixta, mayor que la existente entre la de Likert y la de

Thurstone (0,856) y mayor que la correlación existente entre la escala Mixta y la de

Thurstone (0,852). Todos estos valores son extremadamente altos y significan que

la correlación entre cualquiera de estos tres tipos de escala es muy elevado, la

diferencia que pude haber entre ellos es inferior a la diferencia por error técnico en la

aplicación de la escalas. En este sentido, se administró a la misma población la

escala Likert, pero con el orden de los ítem alterado y se obtuvo una puntuación

media de 2,5283 (tabla 5, mediaL2), y al calcularse su correlación con mediaL1 se

obtuvo un valor de 0,888, inferior al encontrado entre mediaL1 y mediaM

N Mínimo Máximo Media Desv. típ.

mediaL1 30 1,000 4,550 2,46583 ,956207

mediaL2 30 1,000 4,700 2,52833 ,972349

mediaTHD 30 ,000 1,000 ,37250 ,277096

mediaTH 30 ,000 ,534 ,19639 ,147452

mediaM 30 ,53 2,45 1,3137 ,52009

¿Cual considera

que es su actitud ? 28 1 5 2,18 1,278

N válido (según lista) 28

Tabla 5. Estadísticos descriptivos

· 93 ·

** La correlación es significativa al nivel 0,01 (bilateral).

Cómo última conclusión y resumen de todo la precedente, puede decirse que la

escala mixta realizada correlaciona con ambos tipos de escala (Likert y Thurstone),

pero mucho más con la de Likert.

Artículos · Manuel Guil Bozal

mediaL

1

mediaL

2

mediaT

HD

media

TH

media

M

¿Cual

considera

que es su

actitud

general?

Media L1

Correlación de Pearson

N

Media L2

Correlación de Pearson

Sig. (bilateral)

N

Correlación de Pearson

Sig. (bilateral)

N

Sig. (bilateral)

Correlación de Pearson

Sig. (bilateral)

N

Correlación de Pearson

Sig. (bilateral)

N

MediaTHD

Media TH

Media M

¿Cual

considera

que es su

actitud

general?

Sig. (bilateral)

N

Correlación de Pearson

1 ,888(**) ,856(**),856(**) ,999(**) ,435

,000 ,000 ,000 ,000 ,464

30 30 30 30 30 5

,888(**) 1 ,939(**),939(**) ,886(**) ,343

,000 ,000 ,000 ,000 ,572

30 30 30 30 30 5

,856(**),939(**) 1 ,999(**) ,852(**) ,684

,000 ,000 ,000 ,000 ,203

30 30 30 30 30 5

,856(**),939(**) ,999(**) 1 ,852(**) ,673

,000 ,000 ,000 ,000 ,213

30 30 30 30 30 5

,999(**),886(**) ,852(**),852(**) 1 ,397

,000 ,000 ,000 ,000 ,508

30 30 30 30 30 5

,435 ,343 ,684 ,673 ,397 1

,464 ,572 ,203 ,213 ,508

5 5 5 5 5 5

Tabla 6. Correlaciones

Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006

· 94 ·

Bibliografía

BARWISE, Jon, (1992)-; PERRY, John. Situaciones y actitudes. Madrid Visor.

BIDNICK, M. L. (1975), The Methodology of Measurement: An Analysis of Selected Scaling

Techniques and Their Applications in Sociology, Ann Arbor, Michigan: Xerox University

Microfilms.

BOLÍVAR BOTÍA, Antonio (1995), La evaluación de valores y actitudes. Madrid: Anaya.

BORICH, G.D. and MADDEN, S. K. (1977), Evaluating Classroom Instruction, A Sourcebook

of Instruments, Reading, Mass.: Addison-Wesley.

BRIONES, Guillermo (2001), Métodos y técnicas de investigación para las ciencias so-

ciales. México: Trillas.

CAMBRIA, Rosario (1974), Los toros: tema polémico en el ensayo español del siglo XX.

Madrid: Gredos.

CASTAÑO (1992), Carlos. Análisis y evaluación de las actitudes de los profesores hacia

los medios de enseñanza. Sevilla Universidad de Sevilla, Facultad de Filosofía y

Ciencias de la Educación.

CLARIN, Rèmy; BRION, Philipe. Manual de Muestreo. Madrid. 2001. Editorial La Muralla.

DIXON, P. N.; BOBO, M. & STEVICK, R. A. (1984) “Responses Differences and Preferences

for All-Categories-Defined” Educational and Psychological Measurement, 44, 61-66

DOMÈNECH I MASSONS, Josep Ma. Bioestadística: métodos estadísticos para investi-

gadores. Barcelona Herder, 1982

EDWARDS, A. L. (1957b). The Social Desirability Variable in Personality Assessment,

New York: Holt, Rinehart and Winston.

ELZO , Francisco Javier (1986), Juventud vasca 1986: informe sociológico sobre com-

portamientos, actitudes y valores de la juventud vasca actual. Departamento de Cul-

tura y Turismo, Dirección de Juventud y Acción Comunitaria, Gobierno Vasco. Vitoria

Gobierno Vasco, Servicio Central de Publicaciones.

Estudio sobre actitudes y hábitos de lectura de prensa diaria en Sevilla capital. (1977)

Prensa Española, S.A.

FERRY, Gilles [et al.] (1976), Nuevas actitudes en la relación pedagógica: la no-directividad,

sus proposiciones, sus aciertos y sus desviaciones. Buenos Aires. Librería del Cole-

gio.

FRISBIE, D. A. & BRANDEMBURG, D. C (1979) «Equivalence of Questionnaire items with

Varying Response Formats» Journal of Educational Measurements, 16, 43-48.

GARCÍA FERRANDO, Manuel. (2001) Socioestadística. Madrid: Alianza.

HENERSON, Mariene E; MORRIS, Lynn & FIZT-GIBBON, Carol Taylor (1988) How measure

Attitudes, London: Sage

JOHNSON, W.L. and DIXON, P. N. (1984), “Response alternatives in Likert Scaling”,

Educational and Psychological Measurement, 44, 567.

KANDYSKY, W. (1995), De lo espiritual en el arte. Barcelona. Labor. 4ª edición.

KING Y ZIEGLER, (1975), Research Projects in Social Psychology, Monterey: Brooks-

Cole.

KLOCKARS, Alan J. and YAMAGISHI, Midori.(1988),”The Influence of Labels and Position

in Rating Scales. “Journal of Educational Measurement. 25, 2.

· 95 ·

LABRADA RUBIO, María Antonia (1982), Comportamientos y actitudes estéticas de la

población madrileña actual: (Metodología y aplicación sectorial.) Madrid Universidad

Complutense de Madrid, Departamento de Historia del Arte.

LAMM, T.C.M, and KLOCKARS, A. J. (1982). «Anchor Point Effects on the Equivalence of

Questionnaire Items» Journal of Educational Measurements, 19, 317-322.

MARTÍNEZ ARIAS, M. Rosario (1995), Psicometría: teoría de los tests psicológicos y

educativos, Madrid Síntesis.

MAYNTZ, R; HOLM, K; HÜBER, P. (1983), Introducción a los métodos de la sociología

empírica. Alianza Universidad. Madrid.

MORALES, Pedro (2000), Medición de actitudes en psicología y educación: construcción

de escalas y problemas metodológicos. Madrid: Universidad Pontificia Comillas.

NUNNALLY, J. C. (1987), Teoría psicométrica. México: Trillas.

NUNNALLY, JUM C. & BERSTEIN, IRA H. (1994), Psychometric Theory, 3ª ed., New York:

McGraw-Hill.

OZAMIZ, José Agustín (1985), Actitudes hacia las enfermedades mentales en el País

Vasco. Oñati. Instituto Vasco de Administración Pública.

PITT-RIVERS, Julián (1984), El sacrificio del toro. Revista de Occidente. Mayo.

REICH, Ben. (1980), Valores, actitudes y cambio de conducta. México. Compañía Edito-

rial Continental.

RODRÍGUEZ LEGIDO, Clementina (1985), Los andaluces, protagonistas de su salud:

opiniones sobre la atención médica. Sevilla. Consejería de Salud y Consumo, Depar-

tamento de Ordenación Profesional, Información y Estudios Sanitarios.

ROTTER (1972), «Attitudinal Point of Agreement and Disagreement» Journal of Social

Psychology, 86.

SCHWARTZ, S. A. (1978), “A Comprehensive System for Item Analysis in Psychological

Scale Construction”, Journal of Educational Measurement, 15, 117-123.

SHARP, L. M. FRANKEL, J. (1983), “Respondent Burden: A Test of Some Common

Assumptions”, Public Opinion Quarterly, 47.

SHUBERT, Adrian (2002), A las mesis, experiencia estética. Madrid: Tecnos.

Artículos · Manuel Guil Bozal

Anduli · Revista Andaluza de Ciencias Sociales Nº 5 – 2006cinco de la tarde. Una historia social del toreo. Turner

Publicaciones. Real maestranza de Caballería de Ronda.

SPECTOR, Paul E. (1992). Summating Ratings Scale Construction: An Introduction,

Newbury Park & London: Sage.

STEVENS, S. S. (1946), “On the Theory of Scales of Measurement”, Science, 103, 677-

680

SUMMERS, Gene F. (1978), Medición de actitudes. México Trillas.

UNIVERSIDAD DE SEVILLA (2001), Anuario estadístico. Sevilla: Universidad, Servicio de

Publicaciones.

URKOLA ELEIZEGI, Mikel (1985), Problemas de actitudes psicosociales de Guipúzcoa.

Director José Luis Pinillos. Madrid: Universidad Complutense de Madrid.

WILSON, G. D. & PATTERSON, J. R. (1968), «A New measure of Conservatism» British

Journal of Social and Clinical Psychology, 7.

TATARKIEWICZ, W. (1976), Historia de seis ideas. Arte, belleza, forma, creatividad, mi-


· 96 ·

MEDICION - REQUISITOS- PROCEDIMIENTO PARA CONSTRUIR UN INSTRUMENTO DE MEDICION

Resumen Cap. 8 del libro Introducción a la Investigación Pedagógica de Ary, Jacobs y Razavieh y cap 9. del libro Metodología de la investigación de Hernández S. y otros.

¿QUE IMPLICA LA ETAPA DE RECOLECCION DE DATOS?

Una vez seleccionado el tipo y el diseño de investigación apropiado y la muestra adecuada de acuerdo a nuestro problema de estudio, la siguiente etapa consiste en recolectar los datos pertinentes sobre las variables involucradas en la investigación.

Recolectar los datos implica tres actividades estrechamente vinculadas entre sí:

1. Seleccionar un instrumento de medición de los disponibles en el estudio del comportamiento o desarrollare uno que sea válido y confiable, de lo contrario, no podremos basarnos en sus resultados para realizar conclusiones.

2. Aplicar ese instrumento de medición, es decir, obtener las observaciones y mediciones de las variables que son de interés para nuestro estudio.

3. Codificar, analizar e interpretar estas mediciones.

¿QUÉ SIGNIFICA MEDIR?

De acuerdo a definiciones clásicas como la de Stevens (1951), significa “asignar números o valores a objetos y eventos de acuerdo a reglas”. Sin embargo, como lo señala Carmines y Zeller (1979), esta definición es más apropiada para las ciencias físicas que para las ciencias sociales, las cuales trabajan con una serie de conceptos más abstractos que no pueden verse directamente o tratarse como productos o resultados.

Este razonamiento nos hace sugerir que es más adecuado definir medición como el “proceso de vincular conceptos abstractos con indicadores empíricos”, proceso que se realiza mediante un plan explícito y organizado para clasificar y frecuentemente cuantificar los datos que me puedan suministrar conductas observables relacionadas con las variables en estudio. El centro de atención es por lo tanto la respuesta observable (bien sea una respuesta marcada en un cuestionario, una conducta grabada o una respuesta dada en una entrevista). Un instrumento de medición adecuado va a ser aquél que me registra datos observables que verdaderamente representan los conceptos o variables (más abstractas) que el investigador tiene en mente.

¿QUÉ REQUISITOS DEBE CUBRIR UN INTRUMENTO DE MEDICION?

Toda medición o instrumento de recolección de datos debe reunir dos requisitos esenciales; confiabilidad y validez.

LA CONFIABILIDAD de un instrumento de medición se refiere al grado de precisión o exactitud de la medida, en el sentido de que si aplicamos repetidamente el instrumento al mismo sujeto u objeto produce iguales resultados. Es el caso de un balanza o de un termómetro, los cuales serán confiables si al pesarnos o medirnos la temperatura en dos ocasiones seguidas, obtenemos los mismos datos.

LA VALIDEZ se refiere al grado en que un instrumento mide la variable que pretende medir. Por ejemplo, un test de inteligencia no será válido, si lo que mide es realmente memoria y no inteligencia. Ciertas variables como el sexo, la nacionalidad, son muy fáciles de observar o de preguntar y obtener una respuesta válida. Pero cuando se trata de diversas variables que se trabajan en ciencias sociales como motivaciones, actitudes, sentimientos, emociones, etc, la validez de un instrumento que pretenda medirlas se torna más compleja, y por lo tanto, cabe preguntarse si ¿realmente el instrumento estará midiendo lo que pretende medir?

LA VALIDEZ ES UN CONCEPTO DEL CUAL PUEDEN TENERSE DIFERENTES TIPOS DE EVIDENCIA:

« Evidencia relacionada con el contenido LA VALIDEZ DE CONTENIDO se refiere al grado en que un instrumento refleja un dominio específico de contenido de lo que se mide. Por ejemplo, una prueba de operaciones aritméticas no tendrá validez de contenido si explora suma y división y excluye problemas de resta y multiplicación. Un instrumento de medición debe contener representados a todos los items del dominio de contenido de las variables a medir.

« Evidencia relacionada con el criterio. LA VALIDEZ DE CRITERIO implica que la medición del instrumento se ajusta o sirve a un criterio externo. Si el criterio se ajusta al futuro se habla de validez predictiva. Por ejemplo una prueba de admisión en las universidades puede comparar sus resultados con el rendimiento futuro de los estudiantes en la carrera. Si el criterio se fija en el presente se habla de validez concurrente; es cuando los resultados del instrumento correlacionan con el criterio en el mismo momento o punto de tiempo. Por ej. una encuesta administrada un día antes de las votaciones para detectar preferencias del electorado, correlaciona con los resultados finales de la elección.

« Evidencia relacionada con el constructo. LA VALIDEZ DE CONSTRUCTO es probablemente la más importante, sobretodo desde la perspectiva científica, ya que se refiere al grado en que una medición aportada por un instrumento relaciona consistentemente con otras mediciones que han surgido de hipótesis y construcción de teorías antecedentes.

VALIDEZ TOTAL = Validez de contenido + validez de criterio + validez de constructo

Cabe agregar que un instrumento de medición puede ser confiable pero no válido, puede medir consistentemente un aspecto más no medir lo que pretende medir el investigador. Por ello es requisito que un instrumento de medición que demuestre ser confiable y válido.

FACTORES QUE PUEDEN AFECTAR LA CONFIABILIDAD Y LA VALIDEZ

a) La improvisación. Algunas personas creen que elegir un instrumento de medición o desarrollar uno es algo fácil y que no requiere de supervisión alguna. Para poder construir un instrumento se requiere conocer muy bien la variable que se pretende medir y la teoría que la sustenta.

b) El no estar validados en el contexto donde se aplican. Traducir un instrumento, aún cuando adaptemos los términos a nuestro lenguaje no es ni remotamente validarlo. Es simplemente un primer paso ya que validar un instrumento implica realizar una investigación extensa y compleja. Los grupos, las personas cambian y tienen valores diferentes de acuerdo a la cultura. Por lo tanto, se deben aplicar instrumentos ya validados en el contexto.

c) El instrumento e inadecuado o no es empático. Hay instrumentos que tienen un lenguaje muy elevado para el entrevistado o no toma en cuenta diferencias de sexo, edad nivel ocupacional y educativo; todo esto puede resultar en errores de validez y confiabilidad del instrumento de medición

d) El cuarto factor lo constituyen las condiciones en que se aplica el instrumento. El ruido, presionar para que una persona conteste un instrumento largo en un período de tiempo corto, el hambre o falta de motivación para responder influirá negativamente en la validez y confiabilidad de la medida.

e) El quinto factor se refiere a los aspectos mecánicos. Que el instrumento tenga instrucciones precisas, que se lea bien (si se trata de un cuestionario escrito), que no le falten páginas, que haya un espacio adecuado para contestar.

¿CÓMO SE SABE SI UN INSTRUMENTO ES CONFIABLE Y VALIDO? PROCEDIMIENTOS:

En la práctica es casi imposible que una medición sea perfecta, generalmente se tiene un grado de error. Desde luego, se trata que este error sea el mínimo posible y para ello hay formas de calcular la confiabilidad y la validez.

Para la confiabilidad, generalmente todos los procedimientos utilizan fórmulas que producen “coeficientes de confiabilidad”, los cuales pueden oscilar entre 0 y 1, donde 0 significa confiabilidad nula y 1 representa el máximo de confiabilidad. Entre más se acerque el coeficiente a 0 habrá mayor error en la medición. Los procedimientos más utilizados son:

« Medida de estabilidad (confiabilidad por test-retest). Un mismo instrumento es aplicado dos o más veces a un mismo grupo de personas. Si la correlación entre los resultados de las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable.. Desde luego, el período de tiempo entre las mediciones es un factor a considerar. Si es muy largo, otros factores como maduración o cambio de condiciones pueden afectar la segunda medida. Si es muy corto, las personas pueden recordar cómo contestaron la primera vez y aparecer como más consistentes la segunda vez.

« Medidas paralelas o formas equivalentes de medir. En este procedimiento no se aplica el mismo instrumento de medición sino dos o más versiones equivalentes de éste. Las versiones deben ser similares en contenido, instrucciones, duración, etc. Por ej. cuando un profesor administra 2 o más modalidades de examen en su grupo de alumnos. El instrumento es confiable si la correlación entre los resultados de las dos o más pruebas administradas es significativamente positiva.

« Método de mitades divididas. Aquí se administra un solo instrumento, una sola vez, pero se dividen las preguntas o los items (Por ejemplo los items pares con respecto a los impares, o la primera mitad con respecto a la segunda mitad). Si correlacionan los resultados de las dos partes, se considera el instrumento confiable. Ahora bien, la confiabilidad varía de acuerdo al número de items de la prueba. Cuantos más items mayor es la confiabilidad.

« Cotejo entre observadores. Se utiliza fundamentalmente cuando se aplican instrumentos de observación y registro. Dos o más observadores aplican el mismo instrumento al mismo tiempo. Luego se calcula la correlación de aspectos coincidentes observados. Se considera confiable el instrumento si hay un porcentaje de coincidencias superior al 80%. Por supuesto que este método implica que los observadores tengan el mismo nivel de preparación o de entrenamiento para observar.

Para calcular la validez, la validez que más interesa obtener en una investigación es la validez de contenido. Para obtener validez de contenido primero que nada hace falta revisar como ha sido tratada esta variable por otros investigadores anteriormente. Segundo, elaborar un universo de items tan amplio como sea posible, para medir la variable en todas sus dimensiones. Posteriormente, se consulta con investigadores familiarizados con el tema y la variable a medir para ver si el contenido es exhaustivo. Esto se conoce con el nombre de validación por expertos.

PROCEDIMIENTO PARA CONSTRUIR UN INSTRUMENTO DE MEDICION

1. El primer paso consiste en listar las variables que se pretenden medir u observar. Recordemos que las variables son propiedades de los objetos o de los sujetos que adquieren distintos valores y que son razón de nuestro estudio o fenómeno a investigar.

2. Revisar su definición conceptual y comprender su significado. Por ejemplo, comprender qué es “integración escolar” y qué dimensiones o grandes aspectos envuelve.

La definición conceptual se refiere a la descripción de la esencia o de las características propias, reconocidas por consenso de un fenómeno u objeto, a la cual se le llama cotidianamente “definición real”; se reconoce la importancia de una conceptualización teórica, dada por autores reconocidos.

3. Revisar cómo han sido definidas operacionalmente las variables. La operacionalización de las variables se refiere a un conjunto de procedimientos que narran o describen las actividades que el investigador realiza para medir las variables en estudio.

Cuando el investigador dispone de varias opciones debe utilizar el procedimiento que le reporte mayor información sobre la esencia del objeto o fenómeno de estudio.

3. Elegir el instrumento o los instrumentos (ya desarrollados) que han sido favorecidos por la comparación y adaptación al contexto de la investigación. Deben seleccionarse los instrumentos que reporten mayor validez y confiabilidad. Si se selecciona un instrumento desarrollado en otro país deben hacerse pruebas piloto más extensas. Tampoco debe olvidarse que traducir no es validar un instrumento, por muy buena que sea la traducción.

4. En caso de no encontrar un instrumento desarrollado adecuado, válido y confiable y se quiera construir o desarrollar uno propio, debe pensarse en cada variable, sus categorías, los indicadores más precisos y los items para cada uno de ellos. Un ejemplo de ello podría ser el siguiente:

Variable

Definición operacional

Categorías

Indicadores

Items

Integración escolar

Grado de aceptación de la comunidad escolar regular para aprender y convivir con niños especiales

Por parte de los Directivos

Interés y voluntad por aceptar niños especiales en su Institución

1. ¿Desde hace cuanto tiempo se realiza integración escolar en este Centro?

2. ¿De qién fue la iniciativa?

3. ¿Cuáles fueron las estrategias para llevar adelante este proceso?

Por parte de los Docentes

Sensibilización y preparación para trabajar con niños especiales dentro de un aula regular

1. ¿Cómo es su perfil de formación para trabajar con estos niños?

2. ¿Qué adiestramiento ha recibido?

3. ¿Cómo planifica y evalúa las actividades con estos niños?

4. ¿Qué estrategias de integración practica?

Por parte de los Padres

Información y opinión sobre el proceso de integrar niños especiales en aulas regulares

1. ¿En qué medida ha sido informado sobre el proceso de integración escolar que adelanta la escuela?

2. ¿Cuáles son a su juicio los aspectos favorables de la integración?

3. ¿Cuáles son los obstáculos o dificultades de este proceso?

En este caso, debemos asegurarnos de tener un número suficiente de items para medir todas las variables en todas sus dimensiones.

Otro ejemplo:

Variable

Definición operacional

Categorías

Indicadores

Items

Nivel de participación de los alumnos de Unimet

Compromisos adquiridos por el alumno para realizar diferentes tareas y funciones propias de la Unimet.

Académicas

Rendimiento

Delegado de curso

Ayudantías Preparadurías

1.¿Cuál es tu índice académico acumulado?

2. ¿Eres actualmente o has sido delegado de curso

3.¿Has realizado alguna ayudantía? Describe.......

4.¿Has realizado alguna preparaduría? Cátedra............... Tiempo.........

No académicas

Deportes

Cultura

Gremiales

Capital Social

5.¿Participas o has participado en algún equipo o selección de portiva en Unimet? ¿Cual.....?

6.¿Participas o has participado en alguna agrupación cultural dentro de Unimet? ¿Cuál?.......

7.¿Has participado en alguna de estas agrupaciones:

-Aisec ___

-Centro de estudiantes____

-Aje (jóvenes empresarios)____

8.¿Participas o has participado en alguna agrupación de proyecto social y comunitarios?

¿Cuál?_____

5. Indicar el nivel de medición de cada ítem y por ende, el de las variables. Recordemos que existen cuatro (4) niveles de medición ampliamente conocidos

· El nivel de medición nominal indica que hay dos o más categorías de respuesta las cuales no tienen orden o jerarquía. Por ej. cuando preguntamos el estado civil, la religión, etc. Las variables nominales pueden ser dicotómicas (admiten solo dos valores, como el sexo, tipo de escuela a la que asiste : privada u oficial, etc.) y politómicas (cuando admiten tres valores de medición o más).

· El nivel de medición ordinal, indica que hay varias categorías, pero además estas mantienen un orden jerárquico, de mayor a menor. Por ejemplo el Grado o Nivel de Instrucción de las personas, el cargo que una persona ocupa dentro de una empresa o Institución, etc. En los dos niveles mencionados no se pueden utilizar las operaciones matemáticas básicas, porque sería absurdo y no tiene sentido, darle numeración en escala a las respuestas.

· El nivel de medición por intervalo, implica crear escalas de medición donde las distancias entre las diferentes categorías de respuestas son iguales. El cero o punto de partida, es arbitrario, es decir no es real, como el caso de la temperatura, donde el cero no significa que no haya temperatura. Algunas escalas de observación y de medición de opinión de actitudes suelen tratarse como si fueran mediciones de intervalo. Aquí se permite utilizar las operaciones matemáticas básicas y algunas estadísticas. Ej. las escalas de evaluación que los estudiantes llenan sobre sus profesores. ¿Cómo considera el sistema de evaluación de la materia? 1 --- 2 --- 3 --- 4 --- 5 (1 = deficiente, 5 = excelente)

· El nivel de medición de razón, además de tener todas las características del nivel de intervalo (distancias iguales entre las categorías de respuesta y aplicación de operaciones matemáticas básicas), implica que parte de un cero real y absoluto donde no existe la propiedad a medir. Por ej. ¿Cuántos hijos tiene usted?

O --- 1 --- 2 --- 3 --- 4 --- 5 --- 6 --- 7 --- 8 --- 9 --- 10 ó más

6. Indicar cómo se han de codificar los datos . La codificación es necesaria para analizar cuantitativamente los datos (aplicar análisis estadísticos). La mayoría de las veces se usan números o cantidades, aunque también se pueden utilizar letras o símbolos.

7. Aplicar una prueba piloto del instrumento de medición. Es decir, aplicar el instrumento a personas con características semejantes a las de la muestra o población objetivo de nuestra investigación

En esta prueba se analiza si las instrucciones se comprenden y si los items funcionan adecuadamente. Los resultados se utilizan para calcular la confiabilidad y de ser posible, la validez del instrumento de medición. La prueba piloto se realiza con una pequeña muestra; los investigadores aconsejan un 10% de personas semejantes a las que integrarán la muestra definitiva.

8. Sobre la base de la prueba piloto, el instrumento de medición preliminar, se modifica, se ajusta y se mejora, para lograr mayor nivel de confiabilidad y validez. En un trabajo de investigación habrá que narrar el procedimiento, el pilotaje y la reestructuración del instrumento posterior al pilotaje.