Condicionamiento Operante

Es el aprendizaje por consecuencias.

El sujeto tiene que operar sobre el medio para conseguir una consecuencia.

Este es el condicionamiento que Watson decía que era el que tenia que darse para que hubiera aprendizaje E-R

Desde Skiner se adopta una ampliación del esquema E-R-Consecuencias.

Tras una mayor evolución se paso a E-Organismo-R-C.

No todos los CO son conscientes pero casi todas las R operantes son conscientes y voluntarias.





1. Elementos básicos



 La respuesta operante

Puede ser cualquiera incluida en nuestro repertorio de conductas. Es cuando la emisión de la R tiene alguna consecuencia para la ha dado.

“cualquier R que se puede modificar en función de las consecuencias”

Lo normal es que sea una R motora, normalmente son voluntarias, pero hay excepciones Ej. Se pueden aprender a controlar R automáticas (del SN autónomo) como controlar la sudoración.





 Estimulo reforzador

Es aquel suceso que va detrás de la R y altera su probabilidad de emisión.

Er+ : hacen más probable o mantienen la R.

Er- : disminuye o hace menos probable la R.



Los reforzadores pueden ser:

 Primarios: su valor reforzante (+ o -) es innato, no aprendido. Son muy importantes desde el punto de vista biológico, y son positivos o negativos para todas las personas.

Ej. la comida, la bebida, algunos incluyen el sexo (positivos)

el dolor (negativo)



 Secundarios: su valor reforzante es aprendido, depende de mi experiencia. La mayoría de los reforzadores son secundarios Ej. El dinero... pueden ser positivos o negativos dependiendo de la persona y de sus experiencias.





No hay que confundir un reforzador positivo con un suceso agradable y un reforzador negativo con uno desagradable, porque son diferentes cosas.

Los estímulos se definen como reforzadores por el efecto que tienen en la conducta.

La mayoría de los reforzadores funcionan como tales dependiendo de la historia de la persona, una misma cosa puede ser lo que más desea una persona o lo que más evita otra. Por lo que no puedo predecir si algo es un reforzador a priori, tengo que probarlo.

Un reforzador funciona por definición, por que si no funciona no va a ser reforzador.

El principio de Premack surgió porque Premack pensaba que no poder predecir si algo es reforzador o no es una gran limitación. Y dijo, cuando tenemos un sujeto que tiene la posibilidad de elegir una u otra R, la que el sujeto elija con mas probabilidad puede funcionar como un reforzador para la siguiente. Si primero hace la menos probable y luego la más probable, esta ultima esta funcionando como reforzador.





 Estímulo discriminativo

En todo aprendizaje operante siempre hay una R y un E, pero no siempre son discriminativos.

Los E discriminativos, van delante de la R, no la desencadenan sólo alteran su probabilidad de emisión, son señales, forman parte del contexto presente en el que esta el sujeto y señalan si una R va a tener una consecuencia positiva o negativa.





 Contingencia

Es la relación estadística entre la emisión de la R y la presentación de la consecuencia.

Es la asociación entre la R y la consecuencia. No hace referencia sólo a la relación estadística objetiva que hay, sino también a la asociación subjetiva del sujeto. Ej. Haces un examen con un jersey rosa y lo suspendes, hay un aprendizaje operante, aunque la contingencia no sea real (superstición) y aunque tengas experiencia de lo contrario porque has hecho exámenes con el jersey y los has aprobado sino te fijaste, se establece la contingencia. Además en un solo ensayo se aprende.

Si el sujeto percibe la contingencia, aunque no la haya realmente habrá aprendizaje, y si hay contingencia real y el sujeto no la percibe no habrá aprendizaje.

El esquema de la contingencia seria: R - consecuencias



Si ..........entonces..........







 Posibles contingencias



 Reforzamiento

Proceso por el cual se incrementa o se mantiene la probabilidad de la emisión de la R.

Hay dos tipos:

 Reforzamiento positivo: Cuando a la R le sigue un reforzador positivo, incrementa la probabilidad de emisión de la R. Se añade algo.



 Reforzamiento negativo: cuando la R obtiene como consecuencia la retirada de un reforzador negativo, esto también incrementa mi R. Supone la retirada de algo.

Ej. si miro por la ventana y veo que hace frío me pondré el abrigo y así me evitare el frío, al ver que no lo paso, esto reforzara que la próxima vez me lo ponga.

Dentro del reforzamiento negativo hay dos tipos:



 Podemos dar una R de escape: el reforzador negativo ya estaba presente, y me escapo de él, de una situación presente.

Ej. Llevo el abrigo en la mano, tengo frío y para escapar de la situación de frío me lo pongo. Me quito de encima el E.



 Podemos dar una R de evitación: el E no estaba presente, evito que llegue a producirse.

Ej. Estoy dentro de mi casa, miro el termómetro y me pongo el abrigo, por lo que evito llegar a tener frío.





 Castigo

Proceso por el cual disminuye la probabilidad de emisión de la R, por la contingencia establecida entre esa R y su consecuencia.

Siempre que disminuye la R es un castigo.

Hay dos formas:

 Castigo positivo: se da la R y como consecuencia aparece un reforzador negativo. Se llama positivo porque se añade algo. Y disminuye la R.



 Castigo negativo: la R disminuye porque la consecuencia me deja sin algo que me gusta. Como consecuencia de la R desaparece o disminuye un reforzador positivo.

 Extinción

Procedimiento por el cual disminuye la probabilidad de emisión de una R por la desaparición del reforzador que la mantiene.





 DIFERENCIAS ENTRE CASTIGO NEGATIVO Y EXTINCIÓN



Castigo negativo: desaparece un reforzador positivo (te quedas sin refuerzo) hace más desagradable a la R.



Extinción: primero se busca el reforzador que mantiene la conducta y el que le quito es precisamente ese, y así disminuye la R porque le quitan lo que esta buscando. Hace inútil la R.

Ej. Le quito las risas de apoyo de sus compañeros, que es lo que pretende.





 ESQUEMAS



R - E r+ : reforzamiento positivo.

R - E r- : reforzamiento negativo.

R - E r- : castigo positivo

R - E r+ : castigo negativo

R - E r+ : extinción.



Esto es la consecuencia





*Todo lo que va detrás de gustar, desear, encantar...es E r+





Reforzamiento positivo



Para reforzar esa conducta tenemos que esperar a que se de.

¿Qué pasa si queremos reforzar una conducta que se da muy poco frecuentemente o no se da? Ej. Espero a que mis hijos recojan su habitación para recompensarlos pero nunca lo hacen.

En esos casos se emplea la técnica del moldeamiento, que consiste en que voy haciendo que lo que tienen se parezca cada vez mas a lo que yo quiero conseguir.

Establecemos una R final (objetivo)

una R inicial (lo que el sujeto tiene)



y el camino que hay de una R a la otra lo descomponemos en pequeñas R, que se llaman aproximaciones sucesivas. Y se van dando reforzadores a los pasos que la persona va dando.





R final E r+

R cuando consigo que de una R dejo de

R reforzarla y empiezo a reforzar la

R...... siguiente, así vamos progresando hasta

R E r+ llegar a la R final, donde se aplica el

R inicial REFORZAMIENTO POSITIVO







Si las R no se dan bien, se aplica la extinción y se vuelve a empezar.

Todos los hábitos se crean poco a poco, no se puede pasar de nada a todo de golpe.

Este tipo de reforzamiento es para enseñar R nuevas.

Cuando ya se tiene la R se empiezan a aplicar los reforzadores.



Variables que afectan a la adquisición de una R por reforzamiento positivo



1. programa de reforzamiento



continuo



fijo

razón variable

simple

intervalo fijo

intermitente variable



complejo





Es una regla o pauta que regula la forma y el momento en el que la aparición de la R va a ir seguida del reforzador.

Hay dos tipos fundamentales:

 Continuo: siempre que se da la R se da el reforzador. Con este se consigue que la R se aprenda muy rápidamente, que el nivel de ejecución sea muy alto, y una resistencia a la extinción pequeña.

Normalmente se utiliza para el principio del reforzamiento y luego se cambia al intermitente.





Nº de R











tiempo

 Intermitente: no siempre que se da la R aparece el reforzador, algunas veces viene y otras no.

Este programa puede ser de dos tipos:



 De razón: el reforzador viene o no dependiendo del numero de R que emita el sujeto. Ej. cada 3 veces que la rata de ala palanca le cae una bolita de comida.

La razón es el numero de R necesarias para que venga el reforzador.



 De intervalo: el reforzador viene cuando transcurre un determinado intervalo de tiempo desde el ultimo reforzador. Pero siempre el sujeto tiene que dar la R, se refuerza la primera R que se de pasado el intervalo de tiempo fijado.



Variando razón e intervalo encontramos dos tipos de programas de reforzamiento intermitente.



 Simple: que se de la R solo depende de una cosa, o del intervalo o de la razón. Hay varios tipos:

De razón: puedes ser de dos tipos:

Existe un fenómeno llamado, tensión del intervalo: son las pausas que muestra el sujeto cuando la razón es mucho mayor. A mayor razón mayor pausa.



 De razón fija: que venga el reforzador o no depende de un numero de razón fijo. Ej. RF3, hacen falta tres R para que venga el reforzador.





El grafico que refleja el aprendizaje se llama registro acumulativo. (en el C

Operante)



Nº de R











tiempo



cuando hay una recta es que no hay R y cuando el grafico es más vertical es que hay mas R.







Cuando aprendemos algo con un programa de estos, hay una actuación estable y constante, pero observamos una pausa después de la obtención del reforzador, sobre todo cuando la razón es grande.









Nº de R









Tiempo



Si la razón fuera muy pequeña la pausa casi no se ve, casi parece una línea continua. Cuanto mayor sea la razón mayor es la pausa.



¿Cómo se extingue una conducta que se ha aprendido con este programa?

El sujeto da una R de las que se le pedían antes, luego pausa, mas R, pausa, y deja de darla.















Se deja de dar la R bruscamente, de repente.



 De razón variable: lo que se refuerza es un promedio de R. Ej. RV3, quiere decir que más o menos cuando da 3 R viene el reforzador, pero es una estimación.

Ej. las maquinas tragaperras.

Estos programas producen R muy estables, no hay pausas, la persona puede estar dando R sin parar hasta que físicamente no pueda más.

















Es menos elevado que el continuo pero también lo es mucho. Es él más resistente a la extinción porque si no se cuando me van a dar el reforzador, sigo y sigo dando R porque creo que lo puedo obtener.





De intervalo: el reforzador esta disponible cuando pasa un determinado tiempo, y se otorga tras la primera respuesta.

Ej. tu esperas que empiece una serie de TV, por eso para verla debes encender la tele primero.



 Intervalo fijo: el periodo de tiempo que pasa es fijo, es siempre el mismo.

Se refuerza la primera R que se emite tras ese intervalo. Se observa que los sujetos dan menos R.

Hay una tasa de actuación alta??

Actúan mas lentamente, porque dan menos R.

Ej. si te gusta el telediario de las 9, esperaras un intervalo de 24 h, así que cuando termina esperas al día siguiente, no estas dando continuamente la R.

Para la extinción, no hay tasas intermedias. Hace un par de intentos y si no se extingue. Si el intervalo es de 5 seg. y no viene espera 10, luego 15 y si no viene se extingue.















*Tensión del intervalo: cuando la razón entre intervalos es mucho mayor, se producen pausas(es de razón)



 Intervalo variable: es una actuación lenta, y una R lenta. La tasa de actuación es baja.

Ej. inspecciones de trabajo, pueden hacértela dos veces al mes o una al año. Es un proceso estable. La extinción es una curva gradual.













Los de razón producen una tasa de R más alta. Y las variables (tanto de razón o intervalo) consiguen una R más resistente a la extinción.

Feston: entre prueba y prueba, aceleración al final.



 Complejos:

Hay varios programas de reforzamiento:



P. complejos múltiples: afectan a una sola R. Los programas son sucesivos, pero no se dan simultáneamente. Van primero uno y luego el otro. Y el cambio de programa va predecido siempre por un Ed.

Ej. conducta de trabajo en clase (R). Cada profesor actuara de manera diferente para conseguir la R



Ed - R - E r+ / Ed - R - Er



Cada programa puede funcionar mejor o peor.



Ej. hay personas muy divertidas en una situación A y en una situación B son muy tímidas.

R: contar chistes

Ed1: mi madre Ed2: el decano



Ed - R - E r+ / Ed - R - Er+





P. complejos compuestos: son dos o más programas, y tienen una sola R sobre la que actúan todos. Los programas actúan a la vez. Puede ser de cuatro tipos:



 Conjuntivo: para conseguir el reforzador se deben cumplir los requisitos de todos los programas que están actuando.

Ej. R = estudio frente a los exámenes.

 Por un lado tienen que pasar cuatro meses.

 Por otro estudiar un mínimo de 100h en casa.



Si no espero 4 meses y estudio 100h, no aprobare mis exámenes.



100h







4 meses







 Alternativo: basta con que se cumplan los requisitos de uno de los programas que están actuando.

Ej. un examen, siendo el reforzador el salir de clase, puedes salir cuando terminas el examen o cuando se acaba el tiempo.



 Entrelazados: combinan el tiempo con el numero de R, pueden ser de los tipos:



 Decrecientes: voy disminuyendo el numero de R necesarias para dar el reforzador. Tengo en cuenta el tiempo.

 Crecientes: voy aumentando la razón necesaria para conseguir el reforzador.

Ej. tratamiento de la anorexia, cada vez la voy dando un poco mas de comida.

Si hay un incremento demasiado alto y no todos los individuos pueden seguirlo, el grupo se subdivide en dos, y el que no puede seguirlo deja de responder (en ambos).



 Diferenciales: puede ser de dos tipos:



 Tasa alta: establezco un mínimo de R a dar en un intervalo de tiempo, si no llega a ese numero no le doy Er+ . exijo un numero o una R.

Ej. para combatir la lentitud de una tarea. Como hacer 10 ejercicios en una hora.



 Tasa baja: establezco un numero máximo de R a dar en un intervalo. No quiero que desaparezca, solo que disminuya.

Ej. para dejar de decir tacos. Hay tres tipos:



 Reforzamiento de R espaciada: se establece un intervalo de tiempo en el que solo se pueden dar un numero X de R. Ej. en vez de establecer un numero de tacos, estableces un tiempo.



 Sesión completa: establezco un numero máximo de R y un intervalo de tiempo, pero el reforzador esta al final de la sesión.

Ej. si solo preguntas en clase 5 veces al final de la clase (1h)te doy el reforzador.

Hay un solo reforzador al final. Se usa

bastante para la bulimia, agresividad...



 De intervalo: establezco un numero máximo de R en un tiempo. Y solo refuerzo ese numero, una vez que se pasa no vuelvo a darle reforzador hasta que no pasa la hora. Si me pregunta no le contesto.







p. complejo concurrente: afectan a dos R. Dan cuenta de la elección entre dos R.

Se pensaron para estudiar la conducta de elección.

El programa de reforzamiento 1 afecta a la conducta 1

El programa de reforzamiento 2 afecta a la conducta 2

Son independientes, no interfieren el uno en el otro. Nos sirven para estudiar los factores que influyen a la hora de elegir una R.

Ej. el viernes a las 7 de la tarde, tengo dos opciones:

1. irme a estudiar

2. salir por ahí



R1: estudiar P. De reforzamiento1: me gusta aprobar

R2: salir P. De reforzamiento2: me lo paso bien



No están mezclados, pero tengo que elegir. No se pueden dar los dos a la vez.

En general, se hace aquello que este mas reforzado, es la ley de igualación: la tasa (o numero de veces) relativa de responder ante una situación de alternativa, es igual a la tasa relativa de reforzamiento obtenido con dicha R.

Pero esta tasa es relativa porque se compone de varios factores, el programa es uno de los factores, otro es la inmediatez, la importancia del reforzador, la facilidad para conseguirlo... sumando todas esas variables, elegiremos la R mas reforzada.

Estos programas son muy complejos.







2. magnitud del reforzador



Según como varia esta, afecta de una manera u otra al aprendizaje. Por lo general el aprendizaje mejora (se aprende mas y antes) conforme aumenta la magnitud del reforzador.

Dentro de la magnitud hay dos excepciones:



1. El llamado efecto de contraste conductual: es el cambio de cantidad de reforzador respecto a lo que el sujeto estaba acostumbrado a recibir.

Ej. tenemos dos clases con niños. A una le promete 15 sugus cuando terminan las practicas en media hora, y ese grupo hace 12 practicas. A otro les promete 10 sugus, y ese hace 10 practicas.

Si al primer grupo de repente un día les dices que les das 10 sugus (les reduzco la magnitud del reforzador) harán menos de 10 practicas, menos de lo que seria habitual por 10 sugus. Desciende por debajo de lo esperable según la magnitud del reforzador, porque notan mas la diferencia y esto se llama efecto de depresión (es un tipo del efecto de contraste conductual).

Si a los de los 10 sugus les prometo 15 sugus hará mas de 12 practicas, esto es el efecto de elación, la tasa de R se incrementa por encima de lo esperable si tenemos en cuenta la magnitud del reforzador. Lo importante es la diferencia.



2. Hay otra excepción en la magnitud del reforzador, es la saciación: cuando se da un reforzador con niveles muy elevados, es posible que el sujeto se sacie, entonces el reforzador pierde su valor reforzante. En ese caso ya no se cumpliría la ley general de a mayor magnitud del reforzador mejor aprendizaje.





3. motivación



es un concepto muy sencillo. Hace referencia a la relación entre privación y saciedad del reforzador.

Cuando estoy saciada no estoy motivada, no tengo razones para conseguir el reforzador porque ya tengo demasiado, para mí ya no es un reforzador.

Ej. si estoy en el desierto y me muero de sed y me ponen un vaso de agua, estoy muy motivado para ir y bebérmelo.

Si me he bebido ya dos litros, no estaré motivado.



¿Cómo afecta la motivación al aprendizaje?



Hay dos tipos de motivación:



 intrínseca: es aquella en la que el reforzador que se consigue con la R esta implícito en la tarea. La propia actuación es en si reforzante.

Ej. cantar R Er+



 extrínseca: el reforzador es externo, artificial, no tiene nada que ver con la tarea. El reforzador está fuera de la conducta que hace que lo consigamos, es añadido.

Ej. si pintas durante media hora te doy un sugus.



Lo normal y deseable es que pasemos de motivación extrínseca a motivación intrínseca. La extrínseca es un primer paso, poco a poco vamos haciendo que esa situación sea reforzante en si misma, añadiendo a los reforzadores materiales los sociales (lo has hecho muy bien...) y después dejamos de darles poco a poco los sociales hasta que se lo diga el niño solo así mismo.

Cuando una conducta esta motivada intrínsecamente y a esa conducta le añadimos un reforzador externo (motivación extrínseca) el resultado es que desciende la R, empeora la conducta. El niño haya la causa de su conducta en reforzadores externos y dejara de buscar la causa en si mismo (porque le gusta hacerlo).





4. demora del Er+



Es el tiempo que transcurre entre la emisión de la R y la aparición del reforzador.

Cuanto más inmediatamente se presente el reforzador mejor aprendizaje, porque más fácilmente establecerá el sujeto la contingencia entre la R y el reforzador.

Sin embargo a medida que crecemos aprendemos a funcionar con reforzadores demorados. Cuanto más pequeños somos menos capacidad de demora tenemos.

Hay diferentes técnicas para obtener la capacidad de demora: economía de fichas...

Cuando hay capacidad de demora no funciona la inmediatez del reforzador como variable para un mayor aprendizaje. Pero en general, cuanto más inmediato es el reforzador mejor, porque hay mayor aprendizaje.





CADENAS CONDUCTUALES



Serie de R conductuales unidas entre si por E y mantenidas por un reforzador final.



Ed – R1 – Er+ - R2 – Er+





El Er+ de la anterior R es discriminativo para la siguiente R, y así sucesivamente.



Ej. yo estoy en casa y quiero llegar pronto a clase:



Ed – R1 – Edr+ - R2 – Edr+ - R3 - Edr+ - R4 - Edr+ - R5 - .………Er+

         

miro la abro la estoy llamar llega entro estoy doy al bajar salgo del

hora puerta fuera al el dentro botón ascensor

y salgo ascensor ascensor



Los Edr+ son secundarios, y están relacionados de forma lejana con el Er+ final.



Todas las cadenas se aprenden por asociación con el Er final, por lo que la manera más fácil de enseñarlas es fijándonos en la ultima R.

Solo se puede enseñar la cadena conductual hacia delante cuanto se tiene capacidad de demora.

Para eliminar una conducta habría que quitar el reforzador final y así se eliminaría la cadena. Pero muchas veces no es posible eliminar el final, en esos casos habría que eliminar los E que están por el final, aunque no sea el ultimo.

Ej. en el caso de que tenga bollos en el armario, uno de los primeros Ed seria abrir el armario para llegar a comérmelo. Sin embargo si cortamos la cadena por ahí, cuando valla a algún sitio y me los ofrezcan los comeré. Si lo que hago es quitar algún Er final, aunque no el ultimo, conseguiré dejar de comer bollos definitivamente.

Ej. Si el Ed que elimino es coger el bollo, cuando valla a algún sitio no lo cogeré, y por tanto no lo comeré.

Es muy difícil eliminar una cadena, porque el caso de que se realicen los comportamientos y no se obtenga el Er final, estaríamos ante una extinción y es muy aversivo para el sujeto. Si le quitas los Er, el sujeto se quedara sin cosas positivas en su vida, por lo que hay que enseñarle conductas alternativas.





Variables De Que Depende El Proceso De Extinción De Una Respuesta Por Reforzamiento Positivo:



La extinción consiste en eliminar el reforzador que produce la respuesta, es decir, en convertir esa respuesta en inútil.

Se trata de eliminar la contingencia que existía.

1. Número de ensayos durante la adquisición:

A mayor numero de ensayos, más difícil resultara la extinción.

2. La intensidad o magnitud del reforzador:

Tiene unos efectos combinados con la anterior. Puede pasar que:

 La intensidad sea baja y haya habido un bajo numero de ensayos: la asociación es débil y no hay un aprendizaje fuerte y consolidado.

 La magnitud sea baja y haya habido un alto numero de ensayos.

 La magnitud sea alta y haya habido un bajo numero de ensayos.

 La magnitud sea alta y haya habido un alto numero de ensayos: Es una situación cercana a la saciación, hay mucho reforzador.

En el primer y en el ultimo caso es más fácil la extinción.

3. Programa de reforzamiento durante la adquisición:

 La más fácil de extinguir es la respuesta de un reforzamiento continuo.

 Dentro de los programas de reforzamiento intermitente: cuanto más parecido sea al reforzamiento continuo, más fácil de extinguir.

 Más fácil si el programa ha sido de fijo.

 Mas difícil si el programa ha sido variable.

Es frecuente encontrar lo que se conoce como estallido de extinción; un aumento de la respuesta por encima de los valores acostumbrados antes de que empiece a disminuir o desaparezca.







Estallido de extinción.



Nunca se deba aplicar la extinción con respuestas agresivas o peligrosas.

Una vez planteada la extinción no podemos dar nunca mas el reforzador porque en ese caso lo que enseñamos al sujeto es un programa de reforzamiento intermitente variable y la respuesta se vuelve mucho más resistente a la extinción.

4. El esfuerzo que hace falta para dar la respuesta:

Si el esfuerzo que requiere una respuesta es muy elevado ésta desaparece mas rápidamente. Es decir, si se realiza un gran esfuerzo y no se ve ningún reforzador la respuesta desaparece mas fácilmente.

5. Nivel de motivación:

Si necesitamos un reforzador determinado, o lo que es lo mismo, tenemos una alta motivación por conseguirlo, la respuesta es mucho más difícil de extinguir.

Ejemplo:

Un jugador que ya no juega por diversión sino por recuperar lo perdido

6. Conducta alternativa:

Si la respuesta que damos es la única manera de conseguir el reforzador que buscamos será mucho más difícil de extinguir.

Para la extinción de una respuesta es muy útil:

Extinguir R1 + Dar un reforzamiento alternativo a un R2

Lo que se pretende es conseguir el reforzador buscado a través de otra respuesta alternativa.

7. La señal facilita la extinción:

Si existe un Ed, una señal clara o aviso que indique que comienza la extinción el proceso es mucho más fácil.

Nota: No hay que olvidar que no estamos retirando un reforzador cualquiera sino aquel que el sujeto estaba buscando.





Reforzamiento negativo



 R - Er-



Normalmente estamos en una situación desagradable y es esta la que nos hace responder para escapar de la situación. (R de escape)



Ed - R - Er-

De escape

(Er-)



Es discriminativo porque va antes, pero a la vez es aversivo.



Aparte del Ed hay otros estímulos en ese medio, y a medida que tenemos esta experiencia uno de ellos se convertirá en una señal que me avisa de ese E aversivo. Porque se han ido asociando, y a la vez que esto sucede varias veces la señal me enseña a predecir.



Ed - R - Er-

señal De evitacion



La R de evitacion necesitaría siempre antes una R de escape, porque para evitar algo ha tenido que experimentarlo.

Hay dos excepciones a este orden de aprendizaje. No necesariamente siempre tenemos que experimentar una situación para evitarla:



1. R. Genéticas: estamos preparados innatamente para evitar ciertas situaciones y a interpretar determinados E como señales.

Este lo compartimos con los animales.



2. Aprendizaje vicario: (en lugar de otro) podemos aprender de las situaciones que experimentan otros y ano tener necesidad de experimentarlas nosotros para evitarlo. Podemos aprender de forma simbólica por observación.

Este es solo en el hombre.



Necesitamos aprender situaciones de escape y de evitacion para la supervivencia.

En ocasiones aprendemos conductas que resultan ser mas dañinas que las propias situaciones que se quería evitar (y que en principio era adaptativa) cuando en realidad no era tan aversiva y la evitamos, nos impide el aprendizaje.



Variables que afectan a la adquisición de una R por reforzamiento negativo



1. intensidad del E aversivo

(que se evita o del que se escapa)



En principio a mayor intensidad, mejor aprendizaje. Pero hay un limite, si el E aversivo es demasiado intenso se producirá una paralización, y no habrá escape ni evitacion. No hay aprendizaje.

2. intervalo entre el Ed y el Er-



El intervalo de tiempo que transcurre entre ellos.

Afectara a la R de evitacion (sólo) porque en la R de escape el Ed y el Er- es el mismo, no hay intervalo.

Es mejor un intervalo corto porque sino no lo voy a asociar, porque necesito una señal que me avise claramente, sino me buscare otra señal.

Si el intervalo es demasiado corto será buena señal y lo asociare enseguida, pero será inútil porque no me dará tiempo a evitarlo.

La curva de esta variable seria:



aprendizaje





hay un intervalo optimo



Intervalo de tiempo





A poco  mal

A mucho  mal





3. Demora en la terminación?? Del Er-



cuanto tarda en desaparecer desde que doy la R.

Solo afecta a las R descape



Er- - (R - Er-)



Tiempo



Es mejor que tarde poco, cuanto más inmediato mas fácilmente adquiriremos la contingencia (reforzamiento negativo)

Si doy una R y veo que no llega el efecto que quiero, intentare otra R y para cuando llega el refuerzo de la primera no sabe a cual asociarla.





4. tiempo que transcurre entre aprendizaje y ejecución de la R

(tanto de evitacion como de escape)



Si pasa mucho tiempo desde que la aprendo hasta que tengo que darla, se vera deteriorada. Aunque estas R son tremendamente resistentes al tiempo. Solo si transcurre muchísimo tiempo la ejecución se deteriorara.



Teorías explicativas de la R de evitacion



Ed - R - Er-

evitacion 

no aparece

Con la conducta de evitación lo que logramos es una ausencia, no aparece ningún E ni positivo ni negativo. Es la única R que se da sin un cambio en el medio, das una R y no aparece ni desaparece nada (solo se evita).



¿Cómo es posible que la ausencia de algo (no hay cambio en el ambiente) se produzca aprendizaje?



1. teoría bifactorial de MOWRER (1941)

(es equivalente a la de Rescorla y Wagner)



luz











Descarga no descarga





La rata ha tenido que aprender experimentando en su piel la descarga asociada a la luz.



Descarga (EI) ------ dolor (RI)

+

luz (EC) ------ miedo (RC)





Esta es la primera fase de la que habla el autor, es el C. Clásico.

Eso que va a ser un Ed es también un EC (no solo hay un condicionamiento operante sino que también hay un condicionamiento clásico)

A la RC la llama respuesta condicionada emocional RCE, porque tiene un componente emocional (el miedo)



Cuando la rata ya ha aprendido la evitacion segunda fase  C. Operante. Esta RC funciona como una señal, la señal no es la luz sino el miedo; y es una señal aversiva. Es ahora cuando tengo que dar la R de salto (evitacion) y con esta de lo que escapo es del miedo (RCE). En realidad la R de evitacion no es para escapar de una descarga sino para reducir el miedo, por lo que esa R de evitacion es en realidad una R de escape.



Un buen Ej. de esta teoría, serian las obsesiones. Yo no me lavo las manos porque piense que pueda estar infectada, sino por escapar de la ansiedad que me produce.



Hay posteriores variaciones de esta teoría, que dicen que de lo que se escapa es del EC.











Teoría de Bolles

Dice que hay dos factores para explicar la conducta de evitación.

1. Todos los animales incluido el hombre, tiene R de defensa (frente a peligros) especificas de especie (innatas)

2. Todos tenemos capacidad para establecer relación entre una conducta y sus consecuencias (contingencia)



El autor dice que ante una situación de peligro de forma automática se dispara la conducta que tenemos innata de defensa, y vamos comprobando los efectos de la conducta en esa situación. Si pruebo una y no me da resultado y sigue el peligro, pruebo otra y así hasta que una me hace salir de esa situación y aquí es cuando aprendo. Aprendo reforzando una R que yo ya tenia, no aprendo R nuevas. No hay extinción ni adquisición.

Ed R1

peligro R2

R3 Er-



Según esta teoría habrá R que sean más fáciles de fortalecer que otras, serán las más primitivas las que primero voy a probar y solo si estas no funcionan probare otras, y efectivamente se ha comprobado que esto es así.







indefensión aprendida

Fenómeno de interferencia el la evitacion y el escape.

Dificultad del animal de aprender a evitar o escapar de algo. No la entendemos, por lo que para explicarla se utiliza:



Teoría de la indefensión aprendida de seligman 1960



Seligman estaba estudiando la teoría de la evitacion y hace el siguiente experimento:



1ª fase

Coge tres grupos de perros:

 Grupo de escape: recibe una serie de descargas, y tiene la posibilidad de detenerlas si aprietan una palanca.

 Grupo acoplado: les dan las descargas pero no pueden pararlas aunque den a la palanca.

 Grupo control: no reciben descargas.



2ª fase (24 h después)

quieren enseñarles la conducta de salto para que eviten la descarga.

 Grupo de escape: aprenden bien a saltar para evitar la descarga. Aprenden rápido.

 Grupo control: les dan la descarga y aprenden también bien a saltar.

 Grupo acoplado: se quedan en un rincón recibiendo descargas.



Definición de indefensión aprendida: estado psicológico que muestran los animales que son sometidos a una situación aversiva incontrolable e inapreciable, que se canaliza en el estado por:



 Disminución de la R, apatía, sumisión, falta de motivación.

 Ansiedad y depresión.

 Tienen expectativas de no contingencia, de falta de control. Esto les lleva a no aprender.



Esto no depende del sujeto, depende de lo que haga.

La probabilidad de aparición tiene que ser de 0,5



1º ejemplo en humanos

Fracaso escolar: hagan lo que hagan suspenden, no depende de los, siempre suspenden. No es predecible porque no saben cuando un examen les a salido bien y cuando mal, llega un momento en que lo dejan porque piensan que hagan lo que hagan van a suspender.



2º ejemplo en humanos

la depresión: lo que hay debajo de la depresión es la indefensión.



3º ejemplo en humanos

los maltratos: el síndrome de Estocolmo domestico.

ff



1. Sock, desorientación.

2. Orientación, buscar una solución y apoyo.

3. Indefensión, afrontacion, intentar entender al agresor.

4. Desesperación, se asume y se ponen del lado del agresor. Falta de respuestas.



¿Qué se puede hacer?

1. inmunizar: si antes de la indefensión le enseñamos que el con su esfuerzo puede conseguir cosas (motivación de logro) le estaré inmunizando contra la indefensión.

Er- --- R --- Er-



Se da para cualquier R de escape o evitacion.

La superstición es una defensa de la indefensión.



2. reducirla: obligando al sujeto a dar la R y centrarse en los resultados, asi hasta que se vuelva consciente de que puede dar la R y controlar la situación, y darse cuenta de que obtiene consecuencias. La indefension es eso, aprender que no tengo control ante las situaciones.







Tas explicativas



 T ª de la respuesta incompatible



Me viene un estimulo aversivo (la descarga) y empiezo a dar diferentes R, veo que no para y dejo de darlas, doy la R de estarme quieto y entonces en algún momento el E para, pero no tiene nada que ver. El sujeto aprende poco a poco una contingencia que consiste en que cuando se queda quieto el E aversivo desaparece.

No es que no aprenda una R de evitacion o de escape, sino que aprende una R de inmovilidad.



 Tª de la R de ansiedad



El hecho de que el sujeto este ante una estimulación aversiva incontrolable e impredecible (que es lo que genera indefensión) genera una r de ansiedad. Todo el mundo que esta expuesto a esa situación experimenta ansiedad.

Por lo que la situación seria un EI, para una R de ansiedad, y esta dificultaría el aprendizaje, porque cuando el nivel de ansiedad es demasiado alto impide la concentración.



 Tª del estilo atribucional



Es la que mejor explica la indefensión.

El SH tiene necesidad de buscar las causas y explicaciones de todo lo que le pasa y de dar razones a su comportamiento. Por lo que hacemos atribuciones causales de aquello que nos pasa.

Todos tenemos un estilo atribucional propio y las atribuciones que hacemos pueden ser:



 Internas: la causa seta dentro de mi.

 Externas: la causa seta fuera.

Ej. me ascienden en el trabajo, y puedo pensar que me lo merezco por que he trabajo mucho, o que ha sido cuestión de suerte y se lo podían haber dado a cualquiera.

Esto se llama locus de control externo o interno, lo que me pasa depende o no de mi.



Además la atribución puede ser:

 Estable: va a persistir en el tiempo, y es definitoria.

 Inestable: es lago puntual, no tiene porque pasar siempre.

Ej. suspendo un examen y pienso que no voy a aprobar nunca o que este le he suspendido pero el próximo lo puedo aprobar.



Además puede ser:

 Global: cuestionan su valía por el fracaso de un área, lo hago todo mal

 Especifica: se refiere a un aspecto determinado.

Ej. si suspendo matemáticas puedo pesar, que soy una persona poco inteligente o que se me dan mal las matemáticas.



La teoría dice que favorece la indefensión el que las personas tengan un estado atribucional interno, estable y global y además este favorece la depresión.



Indolencia o pereza aprendida: es el estado al que llegan aquellos sujetos para los que el estado incontrolable e impredecible se convierte en un Er+. Se le vienen dando las cosas positivas, y ellos no tienen que hacer nada para conseguirlas. Da igual que no de la R, siempre llega el Er+, esto provoca una desmotivación total.





Castigo



Es el procedimiento por el cual se reduce la R, al hacerla contingente por la aparición de un Er- (castigo positivo) o la desaparición de un Er+ (castigo negativo)

Si no hay reducción de la R, no hay castigo. El castigo funciona por definición, si no es así no es castigo, algo falla.



R – Er- no es castigo, tenemos que ver que funciona R – E r-



Con el castigo queremos reducir una conducta, es decir, esa conducta se esta dando de forma frecuente por lo que esta siendo reforzada (o porque conlleva un Er+ o porque evita de un Er-) por lo que el sujeto consigue tener consecuencias positivas con esa conducta, y el castigo tiene que acabar con esto.



Tiene que ser un castigo que luche contra ese reforzamiento, no vale un castigo débil, porque vencerán las consecuencias negativas.



El sujeto con esa conducta esta obteniendo un Er, si yo soy capaz de ofrecerle una alternativa mediante la cual pueda conseguir ese reforzador, será más fácil luego aplicar el castigo para esa R anterior. Lo que queremos no es quitar el Er sino la primera R, que es perjudicial para el sujeto.



Variables que afectan a la eficacia del castigo

¿De que depende que un castigo sea mas o menos eficaz?



1. Modo de presentarse el reforzador (Er- o supresión del Er+)

Tiene que ser repentino y nunca gradual, porque con eso lo que haríamos seria que el sujeto se acostumbre a la nueva situación. No hay que dejar que se acostumbre porque entonces el estimulo aversivo pierde valor.





2. Intensidad del estimulo aversivo

En principio, a mayor intensidad mejor eficacia.

Pero en el SH esto no siempre es cierto, porque si el sujeto percibe que el castigo es desproporcionado o injusto deja de tener eficacia.

El Er- tiene que ser mas fuerte que el Er- porque sino no podrá acabar con el, ya que le aportara mas beneficios de lo que le perjudica el otro. Si no es demasiado intenso la R se volverá a aparecer enseguida.

A mayor intensidad, mayor rapidez y duración en la supresión de la R.



3. Demora del Er-

Cuanto más inmediato, mejor eficacia. Esto depende del nivel de madurez del sujeto. Hay sujetos que saben establecer contingencias aunque pase mucho tiempo, y otros que no. Esto depende sobre todo de la edad, los niños pequeños por ejemplo son incapaces de captar contingencias con mucha demora.



4. Programa del castigo

Es mejor que el programa sea continuo, es decir, cuantas más R hayan sido castigadas mejor aprendizaje. Esto se llama consistencia.

Se tiene que castigar la conducta siempre que se pueda, si no se puede siempre y el programa es intermitente, tengo que castigar el mayor numero de Rs que pueda. Cuanto mas se parezca a uno continuo, mejor.



5. Tipo de Rs

Solo obedecen al castigo las Rs operantes, es inútil intentar castigar una RC, porque las RC dependen del EC y no de lo que venga después.



6. Orden de presentación de los Er



R ----- Er+

----- Er-



El aversivo tiene que estar el ultimo, que lo ultimo que experimente el sujeto sea el Er-, no al revés porque lo que se asocia es el resultado final de la conducta, y este tiene que ser negativo, para que deje de tenerla. Hay que dejar que primero obtenga el Er+ que busca.



7. Reforzamiento de la R alternativa

Este reforzamiento de la R alternativa mejora el aprendizaje, porque coincide el castigo de la R1 con el reforzamiento de la R2. No le quitas algo sin darle nada a cambio.













Características de la supresión de la R con castigo



 La permanencia

un castigo bien hecho consigue la supresión permanente de la conducta, porque el sujeto no necesita la R1, tiene otra R con la que consigue el Er.

Si se ha castigado bien, el castigo perdura incluso cuando dejamos de castigar la conducta. El sujeto ha aprendido a conseguir el Er de otra forma.



 Produce una supresión muy rápida

Incluso mas que cualquier otro método, la conducta se suprime inmediatamente.



No se pueden castigar dos conductas con el mismo Er-



Efectos colaterales o secundarios del castigo



1. reacciones emocionales

castigar resulta desagradable para el castigado. Siempre que el sujeto recibe un Er- es desagradable, por lo que tiene que ser utilizado con mucho cuidado porque el sujeto va a tener reacciones emocionales.

Además de reducir la conducta, el castigo genera agresividad, malestar...

En personas, estas reacciones emocionales son mucho más fuertes. Y si el castigador es siempre el mismo hace que este se convierta en el E aversivo, incluso el colegio puede convertirse en un EC y generar una RC de agresividad.

Con la repetida aplicación de E aversivos puede producirse una R de ansiedad y se impediría el aprendizaje.



2. agresión operante

Es la agresión que se hace para librarse del castigo. Un castigo puede generarla para neutralizar la fuente de agresión.



Er- --- R --- Er-

agredir castigo

esta agresión siempre va a conseguir lo que quiere, por eso se puede convertir en un Er



3. autoafirmaciones

Es una consecuencia de un castigo mal aplicado que se produce cuando no se castiga la R sino al sujeto.

Hay que dejar claro que lo que se quiere es que se deje de dar la R porque es mala para el sujeto.

Esto es muy peligroso, sobretodo porque cuando el adulto castiga esta recibiendo un Er- 8la conducta aversiva del niño) y castiga con una gran carga emocional por lo que el castigado percibe negatividad hacia el, por lo que hay que dejárselo claro. Hay que pensarse el castigo, no puede ser impulsivo.



4. castigo modelado

La persona castigada ve que el castigador tiene una situación aversiva (mi conducta) da la R de castigar y se quita la situación aversiva. Entonces el castigado aprende que es útil y que el castigador sale ganado. Por lo que aprende a castigar.



5. perpetuación del castigo

el sujeto que castiga tiene la consecuencia de quitarse el reforzador negativo

Er- R --- Er-

castigar





Es inmediato, may rápido. Por lo que el castigador la próxima vez que quiera conseguir algo lo va a utilizar, por que le ha reforzado.





El castigo por lo tanto nunca tendría que utilizarse, excepto en las ocasiones en que la conducta a evitar sea peligrosa o agresiva y no se pueda tolerar, y por tanto tenga que dejar de darse inmediatamente.

Siempre hay alternativas al castigo.



Resumen de las condiciones que hacen mas eficaz el castigo



1. Hacer imposible la R de escape

Si la persona castigada pudiera escapar y solo fuera castigado algunas veces, afectaría al programa de castigo (seria intermitente) y esto disminuye la eficacia.

2. Hacer el E tan intenso como sea posible

3. el E aversivo debe ser inmediato

4. el E aversivo debe presentarse de forma repentina, no gradual

5. deben evitarse los castigos largos para evitar la habituación

6. el E aversivo no debe ser presentado junto con ningún Er+

7. se debe potenciar una R alternativa para conseguir el Er+

8. Se debe dar un aviso claro de que empieza el proceso de castigo (Ed) y avisar con que se va a castigar (cuando hagas...te va a pasar esto... si no el castigo se va a vivir como injusto.

9. se puede utilizar como E aversivo la reducción en la entrega de ese Er+

10. nunca se debe quitar en el castigo negativo algo beneficioso para el sujeto





















Control de estímulos



Se dice que aprendizaje por control estimular de la conducta? Cuando hay una elevada probabilidad de que la R se de en presencia de un E antecedente.

E -- R

Un E antecedente y solo el altera la probabilidad de emisión de la R, sin que haya ninguna consecuencia.

Ej. la profesora llega muy seria el primer día de clase y da unas normas, el 90% de ellas se cumplen. Hemos respondido a un E antecedente sin que haya consecuencias.

En el C. Operante el sujeto tenia que haber experimentado las consecuencias.

El Clásico es un ejemplo muy claro de control de estímulos.



Ed -- R (se refiere a el)

La función que tiene el Ed o señal es facilitar la emisión de la R correcta sin que se equivoque.



Como llega una conducta a estar bajo control estimular:

 por C. Clásico

 mediante un Ed, puede ser:

 por experiencia propia del sujeto

 por aprendizaje vicario u observacional



Ed son por Ej. los alicientes



Fenómenos del control de estímulos



 la discriminación

un sujeto aprende a discriminar E cuando responde de forma diferente en diferentes situaciones estimulares



Ed1 -- R1 aprendo cual es el único E que controla mi conducta

Ed2 --





Un Ej. en el C. Clásico es la inhibición condicionada

Uno aprende a discriminar por experiencia, por razonamiento diferencial. Se ha reforzado por que se da la R con el Ed adecuado y no cuando hay otro Ed, hasta que se aprende.

Para aprender lo mejor es que al principio los E sean muy diferentes, el Ed correcto y los otros deben ser muy diferentes.

El sujeto tiene que centrar su atención en la dimensión más importante del E, tenemos que enseñarle a que se tiene que fijar por lo que es un ejercicio de atención.

Ej. Cuando la madre llama al niño a comer, este tiene que aprender a fijarse por ejemplo en el tono de voz y no en la frase que le dice.







Dentro de la discriminación hay un tipo concreto:

 Discriminación condicional: el sujeto aprende a responder de una manera delante de un estimulo y de manera diferente delante de otro E. Se emplea por ejemplo en el adiestramiento animal.





Variables de las que depende la discriminación



1. dificultad del problema

Se refiere a lo fácil o difícil que sea distinguir los E, si son semejantes o claramente diferentes. Se discrimina mejor cuanto más fácil es la tarea.



2. la discriminación previa

La discriminación se facilita si el sujeto ha tenido antes experiencias de discriminación, en ese caso será más fácil y más rápido. Se facilita incluso cuando la tarea previa es completamente diferente.

Ej. si le he enseñado a discriminar entre dos colores, y la siguiente vez es entre dos sonidos, también lo hará mejor.

El haber discriminado anteriormente hace más fácil el discriminar.



3. información del E

La carga predictiva del E. Tengo un Ed que me avisa que es probable que a la R le siga un Er+, en ocasiones le sigue pero en otras no. Por lo que habrá mejores y peores señales, serán mejores aquellas que han ido asociadas a la consecuencia mayor proporción de veces (índice de reforzamiento) si la señal es muy buena se facilita la discriminación.



4. efecto de la consecuencia diferencial

(solo afecta a la discriminación condicional)

uno aprende mas fácilmente la discriminación condicional si las consecuencias que siguen a un E son de un tipo y las que siguen al otro de otro.

Ej. Si cuando digo sit al perro se sienta le doy una galleta, y cuando le digo que se levante lo hace le acaricio.





 La generalización

Es el fenómeno contrario a la discriminación. El sujeto aprende a dar la conducta ante estímulos distintos al original.



Ed1 -- R1

Ed2 -- R1

Ed3 -- R1









Variables que afectan a la generalización



1. la fuerza de la R o motivación para darla

Si es una R que me interesa mucho o me ha sido ha sido reforzada antes, tenderé a generalizarla antes. A mayor motivación o fuerza, mayor generalización.



2. la conciencia de la semejanza entre situaciones (E)

aumenta la generalización a medida que somos conscientes de la semejanza entre situaciones.



3. entrenamiento previo en discriminación

la discriminación anterior dificulta la posterior generalización.

Sobre esto hay una teoría: la hipótesis inversa que dice que la generalización no es un fenómeno en si, sino que es un fallo de la discriminación, y cuando esto sucede se produce la generalización.



4. cantidad de entrenamiento en generalización

cuanto más tiempo haya estado aprendiendo a generalizar menor es la generalización. Esto se debe a que cuanto más contacto haya tenido con el Ed original, mas le costara generalizar la R para otros Ed, por tanto estaremos fomentando la discriminación.



5. intervalo entre el entrenamiento y la prueba

Yo aprendo a que un E produce la R y luego compruebo si se ha aprendido. Cuanto más tiempo pasa mas generalización, esto se produce porque se van olvidando los detalles y se generaliza más.



6. contexto del aprendizaje o entrenamiento

si en este aprendizaje estoy siempre en el mismo contexto me resultara más difícil generalizar a otros E.

Ej. si yo quiero estudiar en un determinado contexto y me pongo todos los días a las 7 de la mañana, aprenderé muy bien pero no generalizare. Y si otro día me pongo a las 5 de la tarde no podré, por lo que si se quiere generalizar hay que variar de contexto.





























Aprendizaje vicario o por observación o social

0 comentarios: