40018604- Capítulo+7+Resumen+Final PDF

Title 40018604- Capítulo+7+Resumen+Final
Author nathan dragneel
Course Psicología del Aprendizaje
Institution UNED
Pages 14
File Size 391 KB
File Type PDF
Total Downloads 13
Total Views 110

Summary

Download 40018604- Capítulo+7+Resumen+Final PDF


Description

TEMA 7: CONTROL AVERSIVO EN EL CONDICIONAMIENTO OPERANTE Vamos a centrarnos en el efecto de la estimulación aversiva (primaria o secundaria) en la conducta operante, por lo que abordaremos los procedimientos de reforzamiento negativo y castigo. Además, se reflexionará sobre algunos aspectos relacionados con la supresión de la conducta operante, como ciertos efectos paradójicos o métodos alternativos al castigo, así como en la influencia de la estimulación aversiva en la conducta de elección. 1. ESTIMULACIÓN AVERSIVA EN EL CONDICIONAMIENTO OPERANTE 1.1. Procedimientos de condicionamiento operante (los recordamos): NOMBRE DEL PROCEDIMIENTO

CONTINGENCIA RESPUESTACONSECUENCIAS

Reforzamiento positivo (recompensa)

Positivo: La respuesta produce Reforzamiento o un estímulo apetitivo incremento en la tasa de respuesta.

Castigo (castigo positivo). “Evitación pasiva”

Positivo: La respuesta produce Supresión o un estímulo aversivo disminución de la tasa de respuesta

Reforzamiento negativo (escape o evitación). “Evitación activa”

Negativo: la respuesta elimina o Reforzamiento o previene la ocurrencia de un incremento en la estímulo aversivo. tasa de respuesta.

RESULTADOS

Entrenamiento de Negativo: la respuesta elimina la Supresión o ocurrencia de un hecho disminución de la omisión (RDO) agradable o reforzador apetitivo. tasa de respuesta

1.2. Castigo, escape y evitación  Los procedimientos de reforzamiento negativo (escape-evitación) y de castigo presentan ciertas características en común pero también importantes diferencias. 

Mediante el reforzamiento negativo aumentamos la probabilidad de la operante mientras que con el castigo la reducimos. Sin embargo, en ambos casos la conducta del sujeto es modelada para reducir al máximo su exposición a la estimulación aversiva (se suele denominar «evitación activa» a la conducta reforzada negativamente y «evitación pasiva» a la castigada positivamente).

1.3. Procedimientos condicionamiento operante y estados emocionales.

 Los estímulos elicitadores provocan en los sujetos estados emocionales, estados que pueden asociarse al resto de los eventos antecedentes (convirtiéndolos en ECs). Los eventos presentes durante el refuerzo, nos hacen sentir bien (alegría), y por las mismas razones, no nos «gustan» los eventos presentes durante el castigo (miedo). Existen diferentes teorías que EIs-ECs Emociones intentan explicar el efecto en la EIs apetitivos ALEGRÍA conducta de los procedimientos de EIs aversivos MIEDO castigo, es de especial relevancia la ECs excitatorios ESPERANZA Teoría de la respuesta emocional (apetitivos) condicionada (Estes y Skinner ECs excitatorios ANSIEDAD (1941): se basa en las (aversivos) observaciones del procedimiento de supresión condicionada. ECs inhibitorios TRISTEZA (apetitivos) La idea básica es que un EC ECs inhibitorios ALIVIO excitatorio aversivo provoca ciertas (aversivos) respuestas emocionales (como la paralización) por el hecho de estar emparejadas con una descarga (incompatibles con la respuesta de presión de palanca). No obstante, a diferencia del experimento de Supresión Condicionada, los procedimientos de castigo no suelen incluir un EC explícito que señale la administración de la descarga . Estes sugirió que cumplen esta función los diversos estímulos (visuales, táctiles y propioceptivos) que el sujeto experimenta antes de dar la respuesta castigada, como la visión de la palanca y/o de los discriminativos (luces, sonidos, etc.).

La estimulación aversiva producida por la respuesta es mucho más eficaz para suprimir la conducta que la aversiva independiente de la respuesta. 2. CONDUCTA DE EVITACIÓN

(Schlosberg, 1934; Brogden, Lipman y Culler, 1938) exploraron una característica del estudio de Bechterev que lo diferenciaba radicalmente de las preparaciones habituales de condicionamiento clásico: que el EI no aparezca si se presenta la RI. Replicas del experimento original de Bechterev añadiendo un grupo control en el que el EI se presentaba en todos los ensayos independientemente de la respuesta del sujeto. Tanto la velocidad de adquisición como el nivel de ejecución de la supuesta RC eran mucho mayores en el grupo experimental (en el que se podía evitar la descarga) que en el control. Estaban ante dos tipos de conductas diferentes y marcó el inicio de una línea de investigación (en el marco del condicionamiento operante) cuyos principales métodos y hallazgos se describirán a continuación. GE: (luz (EC)-descarda (EI)-levantar el dedo de la placa (RI) EC-EI RI // ECRI (grupo evitación) /+Velocidad y mejor ejecución GC: (luz (EC)-descarda (EI)-levantar el dedo de la placa (RI) EC-EIRI // EC RIEI (en todos los ensayos)/-Velocidad y peor ejecuc. 2.1. Procedimientos de evitación 2.1.1. Evitación discriminada (o señalada): debido a la existencia de claves que señalan el acontecimiento aversivo, frecuentemente una descarga. Cada ensayo se inicia con la presentación de un evento neutro (que suele ser un tono o una luz) al que se le denomina «señal» (discriminativo positivo). Depende de lo que haga el sujeto (dos posibilidades):

A) Si el sujeto no emite la respuesta requerida para la evitación durante el intervalo entre la señal y el EI aversivo, se presenta el EI y se mantiene hasta que la emite, después de lo cual tanto la señal como el EI cesan ensayo de escape, (suprime la descarga eléctrica en curso). Predominan al principio del entrenamiento. B) Si el sujeto emite la respuesta requerida antes de que se presente el EI aversivo, la señal cesa y se omite el EI en ese ensayo.  ensayo de evitación con éxito. Predominan al final.

Se barajan tres elementos: la señal de aviso, la respuesta operante y la consecuencia aversiva. Relaciones básicas de contingencia que se producen entre ellos, así como la interdependencia de tales relaciones: Señal de aviso (EC) Respuesta Instrumental (RI)Consecuencias (EI) 1) Contingencia Respuesta-Señal de aviso: dar la respuesta operante

conlleva la desaparición de la señal de aviso, lo que convierte su relación en una contingencia de escape. RI desaparece EC(escape) 2) Contingencia Respuesta-Consecuencia. Inicialmente contingencia de

escape, cuando el entrenamiento avanza contingencia de evitación. 3) Contingencia Señal de aviso-Consecuencia. Cuando consigue evitar

con su respuesta la descarga, aparece únicamente la señal de aviso, pero no la consecuencia. ECRINo descarga (Evitación) Un efecto muy robusto de la conducta de evitación discriminada en situaciones de laboratorio es la elevada cantidad de ensayos que requiere.  Todas las investigaciones apuntan a que la elección de la operante que se pretende reforzar determina el tiempo necesario para adquirirla cuánto más se asemeje a la respuesta elicitada específica de la especie mayor es la velocidad de aprendizaje. Se proponen diferentes teorías para explicar el efecto que el entrenamiento de evitación discriminada tiene sobre los individuos. Destacamos: - La Teoría Bifactorial de Mowrer: motivada por la preocupación acerca de la paradoja: una conducta pudiera estar reforzada por la ausencia de un evento. Están implicados dos procesos interdependientes: el condicionamiento clásico de miedo al EC y el reforzamiento operante de la respuesta de evitación a través de la reducción del miedo (interacción entre dos procesos clásico y operante). 1) EC (señal)  EI (descarga)  RC miedo (o ansiedad) 2) EC (señal)  R evitación (escape del miedo generado por EC impidiendo el EI y provocando que el EC se extinga (al no aparecer el EI). 3) Una vez se extingue el EC deja de emitir la respuesta, volviendo a presentarse el EI (lo que nos lleva de nuevo al punto 1). -

Hipótesis de Schoenfeld: el miedo como una variable intermediaria en el aprendizaje de la evitación es innecesaria. La señal adquiere, por condicionamiento clásico, funciones de consecuencia aversiva secundaria o condicionada; lo que emiten es una respuesta de escape reforzada por la retirada de la señal de aviso (no considera necesario aludir al efecto emocional en proceso). Escapa del EC

2.1.2. Evitación no discriminada de operante libre de Sidman La descarga se programa para que ocurra periódicamente, sin aviso, (cada 10 segundos, por ejemplo). El resultado es que los individuos aprenden a evitar las descargas aun cuando no exista un estímulo de aviso (al presentar las descargas en intervalos temporales fijos los estímulos internos pueden adquirir esa función). Dos intervalos de tiempo: 1) Intervalo E-E, Er-Er, o Reloj choque-choque: es el intervalo entre las descargas en ausencia de una respuesta. 2) Intervalo R-E, R-Er, o Reloj respuesta-choque: que es el intervalo entre la respuesta y la descarga programada, es decir, el período de seguridad. Permite que las respuestas de evitación se den en cualquier momento, ya que, ocurran cuando ocurran, reinician el intervalo R-EI (evitación de operante libre). Diferencias respecto a la evitación discriminada: 1. Implican generalmente períodos mucho más largos de entrenamiento que los experimentos de evitación discriminada. 2. Con frecuencia, aun después de un entrenamiento extenso, los animales no aprenden nunca a evitar todas las descargas. 3. Los sujetos a menudo se diferencian enormemente en la forma de responder ante el mismo procedimiento de evitación de operante libre. Entre las hipótesis explicativas del fenómeno de la evitación de operante libre vamos a destacar: -

Hipótesis Propioceptiva de Sidman (1953): el papel de la señal de aviso (no existente) lo ocupa la propia conducta del individuo. Todas las conductas que realiza (excepto la respuesta instrumental) quedan asociadas a la aplicación de la descarga, en el futuro, sufrirá una ansiedad comparable a la del sujeto al que, en un procedimiento de evitación discriminada, se le presentara la señal de aviso (luz, tono,...). La única manera que tendría de escapar de esa ansiedad es emitiendo la operante reforzada.

-

Hipótesis Interoceptivo-temporal Anger (1963). Sería el paso del tiempo (a través de la «interiorización» los dos intervalos) el que produciría la ansiedad que conduce al sujeto a responder.

-

Hipótesis de la Señal de Seguridad (Dinsmoor, 2001): los estímulos asociados a los periodos de seguridad provocados por la respuesta de evitación (fundamentalmente los que son resultado de la retroalimentación de desplazarse hacia una zona de la caja, saltar a una plataforma o pulsar una palanca) se convierten en estímulos condicionados inhibitorios aversivos por su contingencia negativa con la descarga. Acaban como reforzador

2.1.3. La evitación de descarga aleatoria de Herrnstein-Hineline  Ratas en caja de Skinner que contaba con una palanca y dos máquinas dispensadoras de descargas (A y B) conectadas al suelo de rejilla metálica de la caja. Las descargas de cada máquina eran intensas, breves y programadas en períodos de tiempo irregulares . La única diferencia entre ambas es que la frecuencia (número de choques por unidad de tiempo) de las descargas producidas por A era mayor que las producidas por B. Al principio se conectaba la maquina A, una presión de la palanca la desconectaba y conectaba la B, que se mantenía activa hasta dispensar una descarga, entonces se volvía a conectar A. 





La máquina A sería como un registro E-E de Sidman, mientras que la B sería como un registro R-E, excepto que las descargas se dan a intervalos variables en ambos casos. Todo lo que se podía hacer era cambiar las condiciones para decrecer la tasa total de descargas (mantener una frecuencia baja de administración de descargas). Los resultados obtenidos por estos autores mostraron un aumento de la probabilidad de emisión de la presión de la palanca (conducta de evitación). Herrnstein (1969) explicó el reforzamiento de la conducta de evitación como el debido a la reducción de su frecuencia total o densidad, entendida ésta como una contingencia molar negativa entre las tasas de respuesta y de consecuencias aversivas.

2.2. Variables que afectan al reforzamiento negativo Cuanto mayor es la intensidad de la estimulación aversiva, mayor es la velocidad de adquisición de la conducta reforzada negativamente. La habituación (en los EI) y la extinción (en los EC) pueden también reducir la efectividad de las consecuencias aversivas, tanto para la adquisición de conductas (evitación/escape) como para su supresión (castigo). Además de la intensidad existen otros parámetros que determinan el reforzamiento negativo: 



En el procedimiento de evitación libre de Sidman la tasa de respuestas está determinada por los intervalos E-E y R-E. Cuanto mayor es la frecuencia de las descargas en ausencia de respuestas (menor intervalo E-E) y mayores sean los períodos de seguridad (mayor intervalo R-E), mayor será la probabilidad de que el animal aprenda la respuesta de evitación. En la evitación de descarga aleatoria esta relación también se da, no obstante, hay que tener en cuenta que, dada la naturaleza del procedimiento, la evitación no será nunca absoluta.

3. CASTIGO Thorndike (1911): reforzamiento positivo (fortalece la conducta) y castigo (la debilita) implican procesos simétricamente opuestos. Teoría de la respuesta emocional condicionada (REC), propuesta de Estes (1944), ya comentada. Teoría de las respuestas competitivas reforzadas negativamente (Dinsmoor, 1954): explica el castigo en términos de la adquisición de respuestas de evitación incompatibles con la respuesta castigada. La supresión de la conducta se explica en términos del fortalecimiento de aquellas respuestas competitivas que evitan eficazmente la estimulación aversiva. 3.1. Variables que afectan al castigo: consiste en presentar un estímulo aversivo contingentemente después de una respuesta específica. El resultado esperable del procedimiento es la supresión (reducción de su probabilidad de emisión) de la respuesta en cuestión. * Premack, (1971): El reforzamiento no es absoluto sino relativo. Si tras establecer una jerarquía de preferencias, en función de la frecuencia en la ocurrencia de diferentes respuestas, hacemos contingente la emisión de una conducta menos preferida con el acceso a otra más preferida, la primera es reforzada. Pero si forzamos al sujeto a emitir una respuesta tras la emisión de una más preferida, el efecto es el contrario: la que se emitió en primer lugar ve reducida su probabilidad de emisión en el futuro, es decir, es castigada. La mayoría de la investigación sobre el castigo se ha realizado siguiendo este esquema (adquisición de alguna operante mediante refuerzo positivo para luego superponer una contingencia de castigo-descarga), lo que implica que: a) no parten de la concepción relativista de Premack, b) los resultados son la suma del efecto del castigo y del reforzamiento (ya que se aplican simultáneamente). Variables de las que depende la efectividad del castigo para suprimir la conducta: a) Intensidad del estímulo aversivo: cuanto más intensa sea la estimulación aversiva, más eficaz resultará para suprimir las respuestas (puede hacerlo totalmente (Appel, 1961). Cuando esto pasa y la respuesta se suprime por completo, puede darse un fenómeno paradójico: que la conducta reaparezca más tarde. + Skinner (1953): castigo no es un método eficaz para suprimir la respuesta. + Masserman (1946) comprobó con gatos que las conductas suprimidas con castigo podían seguir sin aparecer incluso 20 meses después de aplicar el procedimiento.

b) Inmediatez y demora del estímulo aversivo : la alta contigüidad es un elemento favorecedor (el aumento del intervalo R-Er produce una menor supresión de la conducta (Cohen, 1968). + (Estes, 1944; Hunt y Brady, 1955): encuentra que los resultados son muy parecidos independientemente de si el castigo se aplica de manera demorada o inmediatamente tras la respuesta. + Azrin (1956): ha matizado estos datos, esto se debe a una exposición a las contingencias demasiado breve (con el tiempo suficiente, el castigo demorado suprimía en menor medida la conducta). c) Cambios graduales en la intensidad del estímulo aversivo. Un factor muy importante del castigo es la forma en que se introduce la consecuencia aversiva. Se producirá mucha menos supresión de la conducta si se utiliza inicialmente un castigo suave, y se va incrementando gradualmente la intensidad de la descarga a lo largo del entrenamiento. d) Experiencia previa. Si la fase de reforzamiento previo fue muy larga y el volumen de reforzamiento muy grande, los efectos del castigo serán menores. e) Efectos discriminativos del estímulo aversivo. Si la respuesta se castiga en presencia de un estímulo discriminativo, pero no cuando el estímulo está ausente, a esto se le llama Castigo Discriminativo (y al discriminativo estímulo delta o discriminativo negativo). Con una exposición continuada al discriminativo, los efectos supresores del castigo se limitan a la presencia de dicho estímulo. f) Programa de castigo: el castigo puede también administrarse intermitentemente (los programas de castigo continuos son más efectivos que los intermitentes (Zimmerman y Fester, 1963). g) Programa de reforzamiento compuesto: toda técnica de castigo es una técnica mixta, ya que castigar una conducta requiere que esa conducta haya sido reforzada o esté siendo reforzada a la vez. Así, podemos encontrarnos estos tres casos: + Castigo sobre líneas-base apetitivas: aquí actúan simultáneamente el castigo y el reforzamiento positivo sobre la misma respuesta. + Castigo sobre líneas-base defensivas: concurren el castigo y el reforzamiento negativo (escape/evitación). + Castigo sobre líneas-base de extinción: se castiga una respuesta que previamente ha sido reforzada, pero que en el momento de aplicar el castigo está siendo extinguida.

La eficacia del castigo se verá reducida por la eficacia relativa del procedimiento con el que esté compitiendo (en el caso del reforzamiento positivo y negativo) o aumentada por la eficacia de proceso de extinción de la misma conducta. h) Existencia de una conducta alternativa reforzada: la tener una fuente alternativa de reforzamiento aumenta enormemente la supresión de las respuestas producida por el castigo (Herman y Azrin, 1964). i) Manipulaciones motivacionales: la eficacia para suprimir una conducta es mayor si se reduce la motivación para realizar esa respuesta (Dinsmoor, 1952), para una conducta reforzada con comida, se ha comprobado que no sólo la supresión es mayor si los animales se encuentran al 85% de su peso que si están al 60% (Azrin, Holz y Hake, 1963), sino que incluso cuando se aumenta su motivación (nivel de privación) la operante suprimida no reaparece (Masserman, 1946). 3.2. EFICACIA RELATIVA DEL CASTIGO PARA SUPRIMIR LA CONDUCTA Pierce y Cheney (2008): sólo podemos hablar de castigo cuando efectivamente la consecuencia suprime la conducta (lo que implica que, por definición, siempre funciona. Usando los parámetros adecuados la conducta se puede suprimir de forma absoluta). Ojo: Niño-reprimenda-puede asociarla a mayor atención y repetirla: reforzamiento positivo, no castigo. El uso del castigo conlleva ventajas y desventajas que hay que valorar antes de su puesta en práctica como técnica para la supresión: Provoca una reducción de la conducta a corto y largo plazo, pero, sobre todo, con un alto grado de inmediatez. Además, el recondicionamiento de la conducta es mucho más lento y difícil que el condicionamiento de esa misma conducta si no ha sido anteriormente castigada. + Genera una serie de efectos colaterales que pueden no ser deseables (ansiedad, agresión, neurosis o una redistribución no prevista de la conducta del sujeto (aumentando la tasa de ciertos comportamientos y bajando la de otros, que no han sido sometidos al castigo). 

Con el uso extendido del castigo, se corre un riesgo considerable de ampliar los estímulos generadores de ansiedad para el sujeto (lugar, sujeto que aplica, generalización a otros estímulos…), con el desarrollo de trastornos del comportamiento.



Agresión elicitada...


Similar Free PDFs