EL CONDICIONAMIENTO OPERANTE

1. NOCIONES INTRODUCTORIAS




1.1 INTRODUCCIÓN

El aprendizaje por las consecuencias

Los antecedentes del condicionamiento operante están en Thorndike. Se sitúa en la época en la que se produce el gran impacto de la teoría evolucionista, que coloca a las especies en una escala evolutiva, incluida la especie humana.

Thorndike- La caja problema. Utilizaba gatos hambrientos, a los que ponía la comida en el exterior de la caja. Los introducía en la caja, y al final, por ensayo y error, el animal conseguía salir. Trazó una curva con lo que el animal tardaba en salir de la caja en cada ensayo. Al final, el gato salía automáticamente

Ley del efecto de Thorndike

La asociación E – R se establecía debido a que el gato era recompensado. Thorndike denominó ley del efecto a este fortalecimiento de la asociación debido a un acontecimiento satisfactorio o recompensa. Su complementaria es la ley del ejercicio: cuando a una determinada situación le sigue frecuentemente una cierta respuesta o grupo de respuestas, el vínculo entre el estímulo y la respuesta se fortalece por la práctica.

Skinner y la noción de probabilidad de respuesta

El trabajo de Skinner se basa en estudios anteriores, como el de Thorndike.

“Para llegar a las últimas consecuencias de la ley del efecto de Thorndike, necesitamos poner en claro la noción de probabilidad de respuesta, que salva un problema que se da en la ley del efecto de Thorndike. Este último afirma que la respuesta, o se da o no se da. Skinner, con la probabilidad de respuesta, permite que haya una oscilación entre darse y no darse. Basa la probabilidad de respuesta en la frecuencia.

CAJA DE SKINNER

Moldeamiento- Técnica para la adquisición de una conducta deseada que consiste en seleccionar primero una conducta operante con una tasa alta y posteriormente ir cambiando la contingencia (relación establecida entre una conducta particular y el reforzamiento) hasta que se aprende la conducta deseada.









1.2 DEFINICIÓN Y CONCEPTO



Skinner no era partidario de utilizar el término respuesta, pero en la actualidad si que se utiliza. Él utilizaba el término operante para denominar a un determinado tipo de respuesta.

En el condicionamiento operante fortalecemos una operante, en el sentido de hacer que la respuesta sea más probable o frecuente mediante el refuerzo.

En el condicionamiento pavloviano incrementamos la magnitud de la respuesta provocada por el EC y acortamos el tiempo que trascurre entre el estímulo y la respuesta.

SKINNER: “Hay un gran repertorio de conductas dadas por el equipo biológico, es decir, conductas innatas. Muchas de estas conductas se adquieren porque van seguidas de una consecuencia, que si es positiva, refuerza el comportamiento.

El condicionamiento no es sólo los antecedentes y las consecuencias, también influye el orden de las consecuencias, que podemos manipular. No es lo mismo dar una bola de comida por cada picoteo que por cada 10.

Fases en el condicionamiento operante

1. Habituación.

2. Moldeamiento. Moldear la conducta del animal, para que sepa que si realiza una determinada acción, obtendrá el alimento.

3. Reforzamiento continuo. Se le da comida cada vez que repite la conducta.

Según cual sea el orden de la conducta cambiará también el comportamiento, por ejemplo, si se le da comida cuando ha apretado 50 veces la palanca, apretará muchas más veces que si se le da la comida cada vez que aprieta la palanca.

El 4º paso sería la extinción, que consiste en que desaprenda lo aprendido. Este es un proceso más difícil. También depende del orden de consecuencia con que se haya llevado a cabo el aprendizaje.















Consecuencia a la emisión de la conducta:



Estímulo + (apetitivo) Estímulo – (aversivo)

PRESENTACIÓN

(contingente) RECOMPENSA

(procedimiento de refuerzo positivo) CASTIGO

(castigo punitivo)

RETIRADA

(contingente)

SUPRESIÓN ENTRENAMIENTO

EN OMISIÓN

(CASTIGO NEGATIVO)

COSTE RESPUESTA (por ejemplo: una multa)

TIEMPO FUERA (por ejemplo: castigar al niño en su cuarto) ESCAPE

EVITACIÓN

(procedimiento de refuerzo negativo)





Condicionamiento de recompensa  función que define el incremento en la frecuencia o en el vigor de una respuesta por seguirse de ella una contingencia positiva.



Condicionamiento de escape  función que define el incremento o frecuencia o vigor de una respuesta por seguirse de ella desaparición o supresión de estimulación aversiva.



Condicionamiento de evitación  función que define el incremento o frecuencia o vigor de una respuesta por seguirse de ella la evitación de la aparición de estimulación aversiva.



Condicionamiento de castigo  función que define la supresión de una respuesta por seguirse de ella presentación de estimulación aversiva.



Castigo negativo, entrenamiento en omisión  función que define la supresión de una respuesta por seguirse de ella la desaparición o ausencia o disponibilidad del estímulo positivo.



PARADIGMAS DE REFORZAMIENTO

- Si la conducta aumenta se tratará de recompensa o refuerzo negativo.

- Si la conducta disminuye se tratará de castigo u omisión.

No se puede determinar a priori lo que es positivo o negativo. Depende del sujeto del que estemos hablando.

Reforzamiento:

• Continuo. Se da la recompensa cada vez que se produce la conducta.

• Intermitente. Sólo se da la recompensa en algunos momentos en los que se da la conducta. Ejemplo: las máquinas tragaperras.

Refuerzo negativo:

• Evitación. Un estímulo indica que se va a producir una situación aversiva. Ejemplo: un semáforo indica que no puedes pasar.

• Escape. El sujeto se encuentra en situación aversiva y mediante su conducta puede hacer que esta cese.

Registro acumulativo  Aparato para determinar la frecuencia de la conducta operante. La tasa de respuesta de la conducta operante depende del tipo de refuerzo y de la contingencia existente (si es fuerte o débil).

Condicionamiento operante:

• De razón. El refuerzo se presenta en función del número de respuestas.

• De intervalo. El refuerzo se produce cuando pasa un determinado intervalo de tiempo



ESQUEMA PARA CLARIFICAR LOS PARADIGMAS DE CONDICIONAMIENTO OPERANTE



Si la consecuencia a la emisión de la conducta es la PRESENTACIÓN contingente:

- De un estímulo +: CONDICIONAMIENTO DE RECOMPENSA O PROCEDIMIENTO DE REFUERZO POSITIVO.

- De un estímulo -: CASTIGO (castigo positivo) o CASTIGO PUNITIVO.

Si la consecuencia a la emisión de la conducta es la RETIRADA contingente:

- De un estímulo + (apetitivo): ENTRENAMIENTO EN OMISIÓN O CASTIGO NEGATIVO (coste de respuesta).

- De un estímulo – (aversivo): CONDICIONAMIENTO DE ESCAPE, EVITACIÓN. También llamado refuerzo negativo.



Condicionamiento de recompensa: Función que define el incremento en la frecuencia o en el vigor de una respuesta por seguirse de ella una contingencia positiva.

Condicionamiento de escape: Función que define el incremento en frecuencia o vigor de una respuesta por seguirse de ella una supresión o desaparición de estimulación aversiva.

Condicionamiento de evitación: Función que define el incremento en frecuencia o en vigor de una respuesta por seguirse de ella la evitación de la aparición de estimulación aversiva.

Castigo: Función que define la supresión de una respuesta por seguirse de ella presentación de estimulación aversiva.

Castigo negativo: Función que define la supresión de una respuesta por seguirse de ella la desaparición, ausencia o disponibilidad del estímulo positivo.

Estímulo discriminativo  indica la disponibilidad del refuerzo. Puede indicar que está disponible o no disponible. El estímulo discriminativo no provoca la respuesta (entonces sería un EC). Sólo muestra la disponibilidad para que la operante se emita o no se emita.



Refuerzos positivos  añaden algo a la situación. Una actividad cuya realización aumenta la frecuencia de la conducta que la precede.



Refuerzos negativos  aquellos cuya supresión refuerza la conducta. La terminación de un estímulo aversivo refuerza la conducta que pone fin a dicho estímulo.



Contingencia  relación establecida entre la conducta y el reforzamiento. Según Skinner, el ambiente determina las contingencias y las personas deben realizar la conducta apropiada para obtener el reforzador.



Refuerzo condicionado  El hecho de que determinados estímulos se asocien con refuerzos positivos primarios. Estos estímulos se transforman en refuerzos positivos secundarios. El refuerzo secundario más importante es el dinero.

Diferencia entre condicionamiento operante y aprendizaje instrumental:



Lo que distingue al condicionamiento operante del aprendizaje instrumental es que el sujeto tenga control o no sobre la frecuencia de las respuestas. Si no tiene control, es instrumental; si sí que tiene control, es operante. El experimentador limita las posibilidades de la respuesta en el instrumental, mientras que en el operante no las limita.



PAUTAS DE PRESENTACIÓN DEL ESTÍMULO

PROGRAMAS DE REFORZAMIENTO



Simples: CONTÍNUO

INTERMITENTE: Criterio frecuencia Razón fija (RF)

(programas de razón) Razón variable (RV)



Criterio temporal Intervalo fijo (IF)

(programas de intervalo) Intervalo variable (IV)

Compuestos. Un ejemplo de programa compuesto sería RF 3 IV5. Son combinaciones de los simples.



RF: Por ejemplo RF 5:  . Como la rata del video, que cada 5 presiones de palanca, le daríamos una bolita de comida

RV: RV 5:  . El promedio de número de respuestas que se debe dar es 5.

IF 1: Durante 1 minuto, el comedero no está disponible. Pasado ese minuto, cuando el animal da la primera respuesta, obtiene la comida. Con este reforzamiento se da el festoneo ( Gráfica de la Pág. 156 del Klein)

IV 3: El promedio de tiempo que transcurre el dispositivo bloqueado es 3.

En la gráfica: cuanto más perpendicular quede la línea, más número de respuestas hay.









2. CONDICIONAMIENTO DE RECOMPENSA



2.1 Factores que influyen en la adquisición de la conducta instrumental



La importancia de la contigüidad. La demora de la recompensa: La contigüidad tiene un efecto importantísimo sobre la conducta instrumental: cuanto más próximos en el tiempo estén la respuesta y la recompensa, mayor es el condicionamiento. El aprendizaje instrumental se deteriora si se demora la recompensa. A mayor demora, menor condicionamiento, y se necesita un mayor número de ensayos.



La magnitud de la recompensa: a mayor magnitud de la recompensa, mayor es el nivel de la respuesta instrumental. La probabilidad y la intensidad de una respuesta instrumental dependen de la magnitud de la recompensa.

Para comprobar si esto sucede por aprendizaje o por motivación, se sigue unos procedimientos. Primero se comienza con una recompensa baja y la vamos subiendo poco a poco. Otra opción es empezar con una recompensa alta e ir bajando poco a poco. Si se produce un cambio gradual en la respuesta, se trata de aprendizaje. Si el cambio es brusco, hablamos de motivación.

Efecto de DEPRESIÓN. Proceso por el cual un cambio en la magnitud de la recompensa de un valor alto a uno bajo produce un nivel de conducta instrumental menor del que sería de esperar si la recompensa siempre hubiese sido baja.

Efecto de ELACIÓN. Aumento en la ejecución producido al cambiar la recompensa de baja a alta, en comparación con la producida con una recompensa alta y constante.

Ver gráfica Pág. 167.

El contraste negativo se explica mediante la frustración, que genera una ansiedad que interfiere en la ejecución de la tarea. Al administrar barbitúricos, esta ansiedad desaparece, y también desaparece el contraste negativo. Para el contraste positivo no hay explicación.



2.2 El principio de Premack y la naturaleza del reforzamiento



El principio de Premack está encuadrado en todo lo que es estudiar las condiciones bajo las cuales un evento ambiental es reforzante.

Skinner nunca habló de la naturaleza del reforzamiento, él era totalmente ateórico.



TEORÍA DE LA PROBABILIDAD DIFERENCIAL DE PREMACK



El reforzamiento no son cosas, son las actividades las que son reforzantes.

Un reforzador es cualquier actividad cuya probabilidad es mayor que la de la conducta reforzada.

Premack afirma que el reforzante no es la comida, sino la acción de consumir la comida.

Dado que comer es una conducta más probable que presionar la palanca, comer puede reforzar la respuesta de presión de palanca.

Este trabajo está dentro del contexto de trabajo de investigación que estudia la naturaleza del reforzamiento, y ha tenido mucha repercusión.

Es importante recordar que las actividades pueden ser reforzantes.

Este trabajo también se utiliza para reducir conductas no deseadas, como por ejemplo gritar.



2.3 LA EXTINCIÓN y los factores que contribuyen a la resistencia a la extinción.



La respuesta operante y la instrumental se puede extinguir si el refuerzo deja de darse. Si se suprime el refuerzo, la respuesta poco a poco va perdiendo fuerza hasta que deja de darse.

Cuando se interrumpe el reforzamiento por primera vez, la tasa de respuesta aun sigue siendo alta, por tanto es sólo cuando se persiste en no presentar el reforzamiento cuando la respuesta deja de producirse.

Recuperación espontánea: En un principio, una inhibición reactiva transitoria (Ir) suprime la respuesta debido a la fatiga producida cuando la conducta no obtiene refuerzo. La conducta instrumental reaparece cuando la fatiga se disipa. Si la conducta continúa sin ser reforzada, se desarrolla una inhibición condicionada permanente.

La extinción no tiene como único efecto la inhibición. También existen efectos aversivos, como la frustración. La frustración, como todo lo aversivo, tiende a evitarse.









Resistencia a la extinción de una respuesta instrumental



3 factores:

- Magnitud de la recompensa durante la adquisición.

- Demora de la recompensa durante la adquisición.

- Consistencia del reforzamiento durante la adquisición.



1. Magnitud de la recompensa durante la adquisición.

Depende del nivel de entrenamiento:

• Si entrenamiento mínimo, a mayor magnitud, mayor resistencia.

• Si entrenamiento prolongado, a más magnitud, menor resistencia.

Explicación del fenómeno:

Cuando estamos con la recompensa pequeña, durante la adquisición, un mecanismo que se llama respuesta anticipatoria de meta se desarrolla lentamente. Cuando llega el momento de la extinción, como la recompensa ha sido pequeña, hay muy poca frustración, y así, cuanto más ensayos de adquisición, más resistencia.

Cuando estamos con la recompensa grande, al comenzar la extinción, el sujeto experimenta una gran frustración, que ayuda a la extinción.

2. Demora de la recompensa durante la adquisición.

Cuando el tiempo de demora es variable, la resistencia a la extinción es mayor, pues el sujeto está acostumbrado a que la recompensa a veces tarda un poco más, y se queda esperando.

Si la demora está entre 20-30 segundos, la extinción es más difícil, aunque también depende de la especie, la recompensa...

3. La consistencia del reforzamiento.

El refuerzo intermitente o parcial, provoca una mayor resistencia a la extinción, que cuando se trata de un refuerzo continuo. A eso se le llama efecto del refuerzo parcial. Pág. 183.





RESUMEN



La frecuencia e intensidad de la respuesta instrumental se incrementa durante la adquisición y disminuye durante la extinción.

La ausencia del refuerzo lleva a una inhibición de la respuesta instrumental, y además también da lugar a frustración.

La frustración se relaciona con conductas de escape y evitación ante estímulos asociados con la situación de ausencia de refuerzo.

Hay 3 factores que afectan a la ausencia de la extinción:

- Recompensa. Su efecto depende del nivel de entrenamiento.

- Demora variable. Más resistencia a la extinción.

- El refuerzo intermitente o parcial, más resistencia a la extinción.



CONDICIONAMIENTO AVERSIVO



La recompensa consiste en la eliminación del estímulo aversivo.

El condicionamiento aversivo consiste básicamente en escapar de un estímulo aversivo, es decir, el sujeto aprende que haciendo una tarea evita el estímulo aversivo que se proporciona como recompensa.

Ejemplo: cuando en un lugar te ocurre algo malo, después evitar pasar por allí, porque ese sitio te provoca ansiedad.

La fobia es un miedo adquirido. Los estímulos que lo rodean son como señales de que viene el estímulo fóbico, es decir, que el individuo buscará conductas de evitación.

Desensibilización sistemática. Relajación del sujeto mientras se imagina escenas que producen ansiedad.

Inundación. Mantiene al sujeto expuesto al estímulo aversivo para que se de cuenta de que no pasa nada, de que no debe tener miedo. Finalmente, se extingue el miedo.



En el condicionamiento aversivo se pueden dar dos tipos de situación:

• Situación de escape.

• Situación de evitación.

** Mucho cuidado en no confundir refuerzo negativo con aplicación de la estimulación aversiva. El refuerzo negativo está indicando que se elimina, se quita una conducta. El refuerzo negativo es una recompensa.

Factores que afectan a la adquisición de la respuesta de escape

3 factores:

- Intensidad del estímulo aversivo.

- Mayor reducción de estimulación aversiva (en relación con intensidad).

- Demora en la terminación del aversivo.



1. Intensidad del estímulo aversivo.

Yo puedo manipular la intensidad del estímulo aversivo, y así comprobar como afecta al comportamiento.

A mayor intensidad del estimulo aversivo, más rápido se adquiere la respuesta de escape.

2. Mayor reducción de la intensidad del aversivo.

Esto es equivalente a una mayor recompensa. Si eliminas una descarga de 300, esto es percibido como una recompensa mayor que si eliminas uno de 150.

3. Demora en la terminación del aversivo.

A más demora, la adquisición es más lenta.

La demora no afecta cuando hay claves secundarias que indican que viene la recompensa. Los refuerzos secundarios tienen un papel muy importante en neutralizar los efectos de la demora del refuerzo primario.



Extinción de la respuesta de escape.

Existen 2 vías para la extinción:

1. Supresión del reforzamiento negativo o supresión de la recompensa. Consiste en mantener la intensidad del estímulo aversivo; entonces la respuesta de escape deja de ser funcional para reducir o eliminar la estimulación aversiva.

A mayor número de entrenamientos, mayor número de respuestas en la fase de extinción.

2. Ausencia del estímulo aversivo. Aunque desaparezca el estímulo aversivo, la respuesta de escape seguirá dándose durante algún tiempo. Esto se debe al miedo condicionado (respuesta anticipatoria de dolor).



EVITACIÓN

Lo que se suele hacer es evitar la estimulación aversiva cuando se sabe que ésta se va a producir.

2 tipos de evitación:

• Activa. Hacer algo para evitar algo. Ejemplo: las excusas.

• Pasiva. Dejar de hacer algo para evitar. Ejemplo: no presentarse a un examen.

El condicionamiento aversivo se puede producir con un solo ensayo.



Teoría bifactorial de Mowrer

Afirma que la conducta de evitación no está motivada para prevenir un acontecimiento aversivo. En realidad escapan de un estímulo que provoca miedo. Su conducta es una respuesta de escape ante un estímulo que produce miedo y no una respuesta para evitar un acontecimiento aversivo.

Viene a decir que no es una conducta de escapar de algo, sino que es una conducta para evitar el miedo que le produce un estímulo. Este miedo se produce por condicionamiento clásico; la segunda parte de la respuesta, es decir, la conducta de evitación, se produce por condicionamiento operante.

2 factores:

1. Se condiciona como una respuesta de miedo.

2. Escapar de la estimulación aversiva.

Ejemplo: condicionas luz como EC, como si fuera un estímulo aversivo, como una descarga eléctrica. El animal evitará la luz para evitar la situación de miedo que le produce la descarga eléctrica.

4 problemas surgidos de esta teoría:

1) Los experimentos demuestran que aunque el EC deje de ser seguido de la estimulación aversiva, es muy difícil la extinción de lo aprendido. En realidad, lo lógico sería que una vez descondicionado el EC a la situación aversiva, desapareciese la conducta de evitación o de escape del miedo; pero esto no es lo que ocurre.

2) Ausencia aparente de miedo cuando la respuesta de evitación está bien establecida. En este nivel ¿cómo funcionan? Aquí ya no responden al condicionamiento de evitación porque escapen del miedo.

3) Paradigma de evitación de Sidman.

Sidman quería saber como conseguir un condicionamiento de evitación sin que hay señal (EC).



2 factores a tener en cuenta para conseguir esto:

o La distancia o intervalo entre estímulos.

o El intervalo de tiempo fijado que tiene que transcurrir después de que la rata de respuesta por 1ª vez a un estímulo.

El animal recibe exposiciones periódicas al acontecimiento aversivo, a no ser que la rata responda impidiendo su presentación. La respuesta hace que se demore la aparición del siguiente estímulo aversivo durante un periodo de tiempo determinado. El intervalo entre las presentaciones del acontecimiento aversivo se denomina E-E, y el tiempo durante el cual se demora el estímulo aversivo sería el intervalo R-E. Si el animal responde consistentemente antes de que finalice el intervalo R-E, no experimentará el estímulo aversivo. En este procedimiento no se presenta ningún estímulo condicionado que provoque miedo antes de la respuesta de evitación, lo cual se supone que impediría el aprendizaje de evitación. No obstante, se ha observado que los animales aprenden bajo estas circunstancias.

4) Trabajo de Kamin. Tiene 4 grupos:

1. Evitación tono-shock. Interrupción EC, impedía aparición EI.

2. Hace que la conducta del sujeto pare el tono, pero el shock persiste. Paran EC, pero persiste EI.

3. La conducta para el shock, pero el tono persiste. Desaparece EI, pero persiste EC.

4. Condicionamiento clásico EC-EI. (tono-shock).

Al contrario de lo que predice la teoría de Mowrer, el grupo que mostró una mayor conducta de evitación fue el 3 (evitación del EI, persistencia EC).

Con este trabajo estudió el papel que tiene la señal y el papel del estímulo aversivo. Vio que estos 2 factores también son importantes, además del miedo y la evitación del miedo.



Factores que afectan a la adquisición de la respuesta de evitación



1. Intensidad del estímulo aversivo.

Conducta de evitación pasiva. Cuanto más intensa es la estimulación aversiva, más rápido se produce la adquisición.

Conducta de evitación activa de un sentido. Al incrementar intensidad, más rápida es la adquisición y el nivel de ejecución es mayor.

Conducta de evitación activa de dos sentidos. Adquisición y ejecución se deterioran cuando aumenta la intensidad del estímulo aversivo; se produce un conflicto de intereses entre alejarse del estímulo que provoca el miedo y dirigirse al lugar donde se presentó el estímulo aversivo

2. Intervalo de demora entre el EC y el EI. El nivel de condicionamiento del miedo depende del intervalo EC-EI; cuanto más largo es el intervalo, menor es el condicionamiento de la respuesta de miedo.

La adquisición de la conducta de evitación es más lenta cuanto más largo es el intervalo EC-EI.





Aplicación. Extinción de las fobias.

Watson sugirió que las fobias son conductas de evitación aprendidas. En las fobias, los estímulos que rodean al sujeto son como señales que anuncian el estímulo fóbico; por eso el sujeto realizará conductas de evitación. Por ello, cabe suponer que las técnicas de extinción de la respuesta de evitación son válidas para tratar las fobias.

Existen dos tratamientos diferentes para las fobias: desensibilización sistemática (consiste en el condicionamiento de una respuesta de relajación ante estímulos que están provocando la ansiedad) y la técnica de inundación.

La inundación mantiene al sujeto en contacto con el estímulo fóbico para que establezca la conexión de que no pasa nada. La eficacia de la inundación aumenta al incrementar el tiempo de exposición al estímulo de miedo. Es más eficaz que el procedimiento de extinción.

La extinción de la respuesta de miedo no es por completo responsable de la eficacia del procedimiento, ya que se puede extinguir una respuesta de evitación, aunque no aparezca una reducción del miedo. La extinción de la contingencia de evitación puede producirse sin la extinción del condicionamiento pavloviano del miedo.



CASTIGO

Dos tipos de castigo: castigo positivo o punitivo y castigo negativo (tiempo fuera o coste de respuesta).

En el castigo positivo se refiere a la utilización de un evento físico o psicológicamente doloroso como castigo.

En el castigo negativo el reforzamiento se pierde o no está disponible como consecuencia de la realización de una conducta inapropiada (también llamado entrenamiento de omisión). Existen dos tipos: coste de respuesta y tiempo fuera.

Coste de respuesta: la respuesta no deseada hace que se retire o que no se pueda obtener el reforzamiento. Ejemplo: un empleado pierde su empleo por llegar tarde.

Tiempo fuera: tras la respuesta no deseada, se produce un período de tiempo durante el cual el reforzamiento no está disponible. Ejemplo: un soldado que es enviado al calabozo por ausentarse del cuartel.

La eficacia del castigo ha sido muy cuestionada



Factores que afectan al castigo

Intensidad. Cuanto más intenso es el castigo, más intensa es la supresión. También es importante para determinar si la supresión de la conducta será permanente o temporal.

Consistencia. Un castigo no producirá la supresión de la conducta por intenso que sea si a su vez no es consistente. Para que el castigo elimine eficazmente la conducta inapropiada, esta se debe castigar cada vez que ocurra.

Demora. El castigo es menos eficaz cuanto mayor es la demora entre conducta inapropiada y castigo.



Consecuencias del castigo

Agresión inducida por el dolor. Al recibir el castigo, los sujetos experimentan dolor. Este dolor puede producir una emoción de ira, que a su vez activa una conducta de agresión. La condición agresiva subsecuente reduce el nivel de activación.

El castigo no siempre produce agresión. Cuando a ese mismo sujeto se le ha reforzado por mostrar reacciones no agresivas ante la estimulación aversiva o cuando han sido previamente castigados por mostrar respuestas agresivas.

Todas las personas no reaccionan emocionalmente igual ante estímulos aversivos.

Modelado de la agresión. Los niños imitan las conductas que ven. Por ello, un niño castigado también puede aplicar el castigo que él ha recibido a otros niños. También existen estudios que demuestran una relación entre el uso del castigo por parte de los padres y el nivel de conducta agresiva de sus hijos.

Propiedades aversivas del que administra el castigo. El niño puede adquirir un miedo condicionado a la persona que le castiga, lo que le lleva a mostrar conductas de evitación. Esto se ve reducido si la misma persona que administra el castigo reparte recompensas cuando el niño muestra una conducta positiva.

Otros efectos del castigo.

Los efectos supresores del castigo pueden generalizarse a otras conductas que no son tan indeseables.

Si el sujeto no relaciona la conducta con el castigo (por ejemplo, con la demora), se crea un estado de indefensión, y conducir a un estado depresivo, si el sujeto no percibe que tenga control.



Aplicación del castigo

Castigo punitivo. Se ha utilizado con eficacia para suprimir una amplia variedad de conductas no deseadas (vómitos, ideación obsesiva, alucinaciones, automutilación y rabieta en niños autistas y retrasados...).

Coste de respuesta. Ha eliminado conductas como fumar, comer de forma excesiva, tartamudeo, habla psicótica, agresividad, tardanza, habla perseverante, ansiedad y conductas depresivas e hiperactivas.

Tiempo fuera. Pérdida del reforzamiento durante un periodo de tiempo. Elimina sólo conductas que provocan la retirada del reforzamiento.

Empleo ético de castigo. El castigo corporal tiene riesgo de desviarse y llegar a ser un abuso físico.

Existen numerosos estudios para delimitar qué es abuso físico y que no.

El castigo punitivo (pegar) ha creado numerosos debates éticos.

0 comentarios: