LAS MUESTRAS EN INVESTIGACIÓN PSICOLÓGICA

Introducción: Conceptos generales




El objetivo de a estadística inferencial es inferir conclusiones válidas aplicables a toda la población a partir de una muestra, es decir, la generalización de los resultados que estarán relacionados con la representatividad de la muestra. La población es cualquier universo que cumple unos criterios y de los que se puede obtener alguna información mediante expresión numérica. Las poblaciones, además de seres, son acciones, palabras, días, etc y siempre está integrada por cúmulos de elementos. Hay dos tipos:



Población blanco: Toda población en la que el investigador está interesado y a la que intenta generalizar los resultados de su estudio.



Población accesible: Población de sujetos disponibles para un estudio particular, n subgrupo no aleatorio de la población blanco.



En Psicología las poblaciones se aplican a todos los organismos que tienen una conducta similar y están interrelacionados entre sí. Así, podemos encontrar:



Muestreo aleatorio: Elementos confinados dentro de un espacio cerrado y mezclado.



Muestreo sistemático: Cada elemento es identificado por su nombre o por su número, que está en una lista.



Muestreo estratificado: Los sujetos se clasifican por estratos (ocupación, escalas de pago..).



Muestreo por conglomerados o grupos: Población encasillada como grupos naturales, pero muy dispersa geográficamente.



Muestreo de etapas múltiples: Población dispersa geográficamente, que sus miembros se encuentran en puntos definibles agrupados, pero a veces sin listas completas.



El muestreo se refiere al proceso de escoger parte de una población (muestra) para que la represente. Las unidades que integran las muestras y las poblaciones son los elementos y los estratos son una o más subpoblaciones, segmentos mutuamente excluyentes de una población. Los valores de una característica desconocida que el experimentador puede medir de todos los elementos de una población se llaman parámetros. Los estadísticos son las cantidades estimadas en una muestra y el error muestral es la diferencia entre estadístico y su parámetro correspondiente (cuanto menor sea, más exacto será e estadístico). Por otro lado, el error típico es la desviación típica de una distribución muestral que se obtiene en un número infinito de muestras del mismo tipo y tamaño, ya que cada una arroja un error muestral y la media de todos ellos sería el error típico. El error muestral máximo es igual al error típico multiplicado por la Z crítica (la que corresponde al nivel de confianza). Esto nos permite hallar entre qué valores se encuentra el verdadero valor de esa media, o sea, el parámetro:







Error típico (ET): ---- ; Error muestral máximo (Emáx): ET.Z ; Parámetro: X+-Emáx



"n



El cociente de evaluación es el número de elementos de la población representados por cada elemento de la muestra. Si es representativa salvará la validez interna y externa.



CE: N/n



El grado de representatividad de una muestra va a venir por el grado en que el estadístico muestral se aproxime al parámetro de la población. La muestra representativa es aquella cuyas características básicas se aproximan con mucha nitidez a las de la población. En la selección de la muestra los errores pueden ser una representación excesiva o deficiente de alguna característica relevante al problema. Para obtener la muestra representativa hay que hace una selección adecuada mediante la selección al azar, en el que cada uno de los miembros de la población tienen la misma probabilidad de pertenecer a la muestra, por lo que las muestras seleccionadas así se llaman muestras aleatorias. En relación a todo lo de las muestras, podemos hablar de:



Muestras no sesgadas o probabilísticas: Son en las que se conoce la probabilidad que tiene un elemento de ser incluido en dicha muestra y que no se cometen errores sistemáticos. Para garantizar la representatividad hay que aplicar la selección al azar y realizar un muestreo probabilístico, confiriendo a cada miembro de la población una probabilidad igual de ser seleccionado.



Muestras sesgadas: Significa que una muestra no es representativa porque hay una restricción introducida en el proceso de selección de los sujetos, con error sistemático.



En Psicología las investigaciones se llevan a cabo con muestras accidentales que son las que están a disposición del investigador: se escogen los sujetos, se trabaja con ellos y después se intenta generalizar los resultados a una población.



Definición de la población de estudio y especificación de criterios de selección



Los elementos de una muestra se han de seleccionar de forma que los resultados descubran lo que ocurre en la población. En todo proyecto de investigación hay que exponer los criterios de selección que se van a utilizar en la extracción de la muestra y definir genéricamente la población a estudiar. Como es muy difícil aplicar pruebas a toda la población, habrá que someterse a condiciones impuestas por el proyecto que reducen una muestra a elementos que puedan ser estudiados con un coste razonable de dinero y tiempo, y controlar el error aleatorio y sistemático. La caracterización nos exige definir y delimitar la población antes de aplicar el diseño de muestreo, diciendo todos los elementos pertenecientes y la homogeneidad o heterogeneidad de la misma. Hay:



Población diana-blanco: Conjunto de individuos a que hace referencia la pregunta principal y el objetivo del estudio, siendo la población a la que se desearía generalizar los resultados que viene definida por características clínicas y/o demográficas generales.



Población de estudio-accesible: Subconjunto de la población diana que se puede estudiar que reúne características geográficas y temporales que la hacen accesible.



Muestra: Conjunto de sujetos realmente estudiados con número mucho menor que la población. Hay que intentar que esta sea representativa, mediante validez interna (buen diseño, correcto registro y apropiada codificación de datos) y externa (afectada por las diferentas externas entre los sujetos de la muestra y la población diana).



El criterio de igual garantía de poder ser elegido quiere decir que cada elemento de la población tiene que tener la misma probabilidad de incluirse en la muestra y se consigue calculando la fracción de muestreo, por tanto por ciento:



n/N.100



La selección de los integrantes debe hacerse para que se optimicen las posibilidades de detectar una diferencia o asociación, lo que exige una definición precisa del fenómeno y las características de los sujetos. La muestra debe ser homogénea respecto a las variables más relevantes del fenómeno y no conviene que difiera mucho de unos límites de la población diana la que se desea generalizar los resultados. Los criterios de selección tienen que venir marcados por los objetivos del estudio y si la variable se refiere a toda la población la muestra será representativa. Cuando se quieren estudiar variables de una comunidad hay que usar muestras de base poblacional y muy cuantiosas. La población de estudio debe definirse con unos criterios que describan las características para alcanzar el objetivo final, que pueden categorizarse en:



Sujetos idóneos: Para observar el efecto estudiado. Si se conocen bien las variables y su mecanismo, son más fáciles de identificar las características para definir a población.



Sujetos en los que existe mucha probabilidad de detectar el efecto hipotetizado



Sujetos que cumplen el protocolo: Excluyendo a los que no van a respetar las normas.



Excluir sujetos en los que no pueda ser medido el criterio de evaluación en toda su extensión: Cuando hay tratamientos prolongados y no van a estar hasta el final.



Los criterios de selección pueden agruparse en cuatro categorías: características sociodemográficas (edad, sexo, nivel cultual o profesión), características de la enfermedad, otras características más especiales y características de accesibilidad de la población. Para saber como elegir a muestra y el tamaño de esta hay que hacer un análisis de poder. Esa reducción del error del muestreo es proporcional al tamaño de la muestra: a mayor tamaño de muestra, menor probabilidad de error y mayor probabilidad de que la estimación de los parámetros de la población sea lo más precisa. El criterio fundamental al evaluar la muestra es su representatividad, que implica que las características básicas se aproximan lo más posible a las de la población.



Estimación del tamaño necesario de la muestra



El número de sujetos en los experimentos suele variar de uno a mil o más. Es frecuente que el tamaño de un estudio de la muestra se fije a priori, poniendo un número redondo y representativo de la población. Cuanto mayor sea, más representatividad tendrá. La muestra debe constar de un número suficiente de elementos elegidos al azar, lo que se llama potencia de la prueba. El problema sobre la estimación del tamaño hay que contemplarlo desde tres perspectivas:



Procedimiento matemático: Nos permite calcular el tamaño de una muestra de determinadas proporciones mínimas según la probabilidad, dependiendo de la amplitud de la población, considerándose infinita si tiene más de 100000 habitantes o finita si tiene menos; el grado de precisión en las estimaciones maestrales que depende del error de estimación que estamos dispuestos a tolerar y, en función de ello, el coste que supone una ganancia en precisión; el nivel de confianza que vamos a tolerar para que dicho error no exceda de cierta cantidad (se suele poner un 95%, siendo de 0'05 = 2 ); y la desviación típica, variabilidad del parámetro en la población y la media. Para la estimación de un verdadero parámetro (tamaño de la muestra) se puede usar un estadístico como la media, X, junto con su desviación típica uno como las proporciones (p) en tanto por ciento. Con la media, la cantidad de error permitido cuando queremos determinar un nivel de confianza viene dado por la siguiente fórmula:



Z. Z.



E = ------- ; n = ( -------- )2



"n E



Con las proporciones sabremos en que proporción está distribuida la variable estudiada y el tamaño de la muestra indica el número de sujetos e los que debe medirse el grado de control de la variable; esta se medirá, según el caso, con las fórmulas:



Infinitos (más de 100000 elementos)



Finitos (menos de 100000 elementos)



Nivel de confianza



Nivel de confianza



Z



2



3



2



3



Proporciones



Z2.p.q



E2



Z2.p.q



E2



Z2.p.q.N



E2 (N-1)+Z2.p.q



Z2.p.q.N



E2 (N-1)+Z2.p.q



Z2 es la desviación por encima y debajo de la media (si trabajamos con un nivel de confianza del 95%, se trabaja con 2 = Z2 = 22 = 4; s trabajamos con un nivel de confianza del 99%, se trabaja con 3 = Z2 = 32 = 9). 2 es la desviación típica al cuadrado. p es la proporción en que se encuentra la variable estudiada en la población, es decir, proporción de casos favorables sobre el total de la población y si no hay datos, se suele poner en un 50%. q = 1 - p, es decir, proporción de casos desfavorables y tanto p como q aparecerán siempre multiplicados por 100. E2 es el límite de error al cuadrado que nos vamos a permitir.



Procedimiento tabular: También se puede calcular n mediante tablas que dan directamente el tamaño de la muestra. Hay diferentes tablas, según sea la población finita, infinita o de 2 o 3 .



Procedimiento práctico: La selección aleatoria no suele llevarse a cabo en Psicología, por lo que hay otros métodos, menos eficaces pero más prácticos, como son:



Estudios de campo: El número máximo está entre 20 y 500 elementos.



Experimentos de umbrales sensitivos de psicofísica: Suelen ser de 1 a 3 sujetos.



Estudios sobre aprendizaje de conducta animal: Suele estar entre 20 y 30 sujetos.



Si hay grupo experimental y grupo de control: Se necesitan un mínimo de 40 sujetos.



En general se recomienda como tamaño de la muestra un mínimo de 20 a 30 sujetos para cada subdivisión y, al menos, 10 elementos para cada celda del diseño factorial.



Decisión del método para obtener la muestra: Las técnicas del muestreo



Los métodos sistemáticos de selección de sujetos se originan en a Teoría Matemática del Muestreo, pero por muy bien que se haga, nunca hay garantía absoluta de que se obtiene una muestra del todo representativa, aunque con algún tipo de estrategia es posible conocer el margen de error. Los diseños de muestreo son las diversas técnicas, estrategias o procedimientos que se emplean para seleccionar una muestra, donde hay:



Diseños de muestreo no probabilísticos: Los sujetos de la muestra se escogen por métodos que no son el azar, por lo que no hay claves ara conocer la probabilidad que tiene cada elemento de ser incluido en dicha muestra ni la seguridad de que todos tengan la misma probabilidad. Estos diseños, con ciertas correcciones, se emplean mucho porque son simples y económicos, pero tienen un menor rigor científico y en ellos queda mermada la representatividad de la muestra. Dentro de estos hay varios tipos:



Diseños de muestreo accidental: Consiste en tomar tantos elementos cuanto se necesiten para completar el número de elementos ya prefijado. Solo cuenta la opinión el entrevistador, ya que es él quien elige las unidades que integrarán la muestra, haciéndolo de forma razonada con los asesoramientos necesarios. Cuando no hay otra alternativa para acercarse a una muestra representativa, pueden hacerse algunos trucos para que la muestra lo sea como identificar las variables extrañas más importantes de la heterogeneidad y eliminarlas, hacer la elección de sujetos para que representen esas variables o tratar de obtener información acerca de la distribución de la variable que se investiga y de las variables extrañas, para estimar la dirección y magnitud de los sesgo.



Diseños de muestreo intencional o de criterio: El investigador tiene que tener el conocimiento de la población y las relaciones entre sus elementos para decidir, voluntariamente, la selección personal que corresponda a los casos más típicos de la población en cuestión, aunque esto no es objetivo. Una vez establecido el criterio de selección, los sujetos de la muestra son seleccionados en cuanto son los más característicos de la población. Si no hay más remedio, puede usar esto con los trucos.



Diseños de muestreo por cuotas: Se conocen y usan los estratos en los que se sabe que está dividida la población que se quiere estudiar y, a partir de ello, se van seleccionando muestras de miembros que sean representativos para los fines de la investigación. El nombre e este diseño deriva de la práctica de asignar a cada encuestados un número proporcional o cuota de entrevistas, que deben responder a unas características según el fin de la investigación.



Diseños de muestreo semialeatorio: En parte son aleatorios y en parte accidentales.



Diseños d muestreo por rutas: Se les asigna una ruta concreta a los entrevistadores.



Diseños de muestreo probabilísticos: En estos se conoce la probabilidad que tiene cada elemento de ser incluido en la muestra (n/N), teniendo en cuenta dichas probabilidades al hacer la estimación de la muestra, y esta es seleccionada mediante algún procedimiento aleatorio según unas probabilidades ciertas. Los principales son:



Diseños de muestreo simple al azar o aleatorio simple: Todos los miembros de la población tienen igual probabilidad de ser incluidos en la muestra. Para ello, es necesario saber la estructura muestral, que hace referencia a la lista real de unidades entre las cuales se elegirá la muestra. Un de los sistemas que se usa con este modelo son las Tablas de Números Aleatorios, en la que hay que identificar cada elemento de la población mediante la asignación de un número y decidir en la tabla el punto de partida y el criterio que vamos a seguir para la elección de números. Para ello, debemos tomar al azar dos números, del 1 al 40, y el primero nos indicará la columna y e segundo la fila en cuya confluencia tendremos el punto de origen. Por último, transcribimos los números que vayamos obteniendo, ya que cada tres dígitos constituirá uno de los números de la muestra, y sol se rechazan aquellos que excedan de un número o que se repitan. Pocas veces se usa esto porque es difícil lograr una lista de toda la población.



Diseños de muestreo estratificado: El investigador conoce que la población puede subdividirse en varias categorías o estratos, y que estos grupos son homogéneos. A partir de uno de estos estratos se selecciona la muestra mediante la técnica del azar. Esto tiene ventajas como que se seleccionan muestras con mayor variabilidad, lo que incrementa la posibilidad de estimar los valores de la población con mayor precisión, se puede seleccionar una muestra en cada estrato, un estrato puede representar un área concreta y podemos hacer la selección para analizar las características de la misma y debemos considerar cada estrato como una población y actuar en consecuencia.



Diseños e muestreo estratificado proporcional: Con estos podemos disponer de un procedimiento idóneo para lograr muestras representativas en proporción a la magnitud de los estratos en la población. Aquí la afijación de la muestra es el procedimiento para determinar cuantos elementos de la muestra s van a tomar de cada estrato. La afijación simple se da cuando a todos los estratos de la población les asignamos el mismo número de elementos de la muestra y se hace para comparar estratos, ajustando después los datos para llegar a la estimación más ajustada de las cifras de la población total, lo que se llama sopesamiento o comparación. En la afijación proporcional es necesario que la cantidad de elementos dentro de cada estrato sea proporcional a la relación entre el estrato y la población. En la afijación óptima hay que tener en cuenta las proporciones de la población en cada estrato y la dispersión (homogeneidad o heterogeneidad) de los resultados dentro de cada estrato.



Diseños de muestreo sistemático: Exige la selección de las unidades de muestreo de acuerdo con un número fijo K y conocer el cociente de elevación. Hallado el cociente de elevación, de intervalo muestral o el número K, se procede a elegir aleatoriamente un número, que será el del comienzo de los límites de ese número K.



Cociente de elevación = K = N/n



Los inconvenientes de éste son la exigencia de tener un listado de toda la población donde todos los elementos estén ordenados aleatoriamente y la dificultad de evitar las tendencias y/o fluctuaciones. Hay que tener muy en cuenta la ordenación de las unidades de la población como primer paso para que se de el principio de aleatoriedad.



Diseños de muestreo por conglomerados: Aquí se realiza la muestra mediante los grupos naturales ya divididos, lo que hace que sea más fácil numerarlos y practicar una selección sucesiva y aleatoria de unidades. Por ello, la unidad de elección son los grupos que se aprecian agrupados antes de que el investigador los divida. Esto plantea el problema de decidir cual va a ser la unidad de muestreo pero, una vez decidida, la selección de los grupos debe hacerse con los principios de azar.



Hay ciertos errores catalogados como errores debidos al muestreo, que son:



Errores de sesgo: Ocurre cuando al elegir una muestra no se tiene en cuenta su representatividad, o sea que no se ha definido la población de la que se saca la muestra.



Errores aleatorios: Son inherentes a la propia técnica muestral, ya que las diferencias entre varias muestras suelen fluctuar entre ciertos límites. Se elimina muy fácil.



Errores sistemáticos: Aparecen cuando en la selección de varias muestras sus valores promediados se desvían sistemáticamente del verdadero valor de la población, siempre en una dirección. No está si su valor promediado coincide con la media de la población.



Comparación entre muestras grandes y pequeñas



Muestras pequeñas



Muestras grandes



Ventajas



Ventajas



Económicas en tiempo, dinero, medios…



Pueden analizarse datos de interés antes de estudiar muestras grandes.



Se deja menos margen de error.



Buenas para estudios piloto o exploratorios, porque acercan más a los datos y los cálculos son más fáciles.



Permiten estudios en profundidad de casos particulares.



Son ventajosas en estudios en los que se emplean técnicas complicadas.



El error muestral queda aminorado.



Se salva mejor la fiabilidad.



Mayor poder estadístico aplicado a los datos.



Dan la posibilidad de realizar estudios de tipo factorial, porque exigen muestras grandes para examinar la interacción entre variables.



Inconvenientes



Inconvenientes



Expuesto a mayor error muestral.



La fiabilidad y la representatividad se salva peor.



Menor poder estadístico aplicado a los datos.



Si los sujetos se toman según la técnica del diseño por conglomerados o grupos naturales, aunque la muestra sea grande pierde valor. Lo mejor es tomar los sujetos individualmente.



Se deja mayor margen a los errores típicos ya que hay más datos y los equívocos humanos pueden ser más.



No puede corregir fallos del diseño de muestreo.

0 comentarios: