TEMA 2. Condicionamiento Instrumental PDF

Title TEMA 2. Condicionamiento Instrumental
Author Marta Pacheco Díaz
Course Memoria y Aprendizaje
Institution Universidad de La Laguna
Pages 15
File Size 772.2 KB
File Type PDF
Total Downloads 38
Total Views 115

Summary

Apuntes de Aprendizaje completos del profesor José Miguel Díaz Gómez....


Description

TEMA 2: EL CONDICIONAMIENTO INSTRUMENTAL INTRODUCCIÓN: De las distintas cuestiones que aparecen al comienzo del Capítulo 3 del libro de Anderson, y que nos ayudarán a entender el proceso del condicionamiento operante, la más importante puede ser establecer en qu se parece y en qu se diferencia del condicionamiento clásico.

La base del condicionamiento operante es la emisión de una respuesta. Nunca va a haber condicionamiento como tal si no es a travs de las consecuencias que tiene la cultura, para lo cual es imprescindible que esto ocurra. Sin embargo, podemos establecer una especie de paralelo porque en el caso del CC lo que explica la permanencia del aprendizaje es la relación de contingencia entre los dos estímulos. El CC es un proceso por el cual se establece un vinculo entre dos estimulo. La 2 diferencia es tener claro que el CC es un fenómeno restringido. El CI/O actúa sobre un conjunto amplio de respuestas. La 3 diferencia es que en el CC podríamos decir que el EI tiene un papel parecido al del refuerzo. Hay una especie de analogía en el refuerzo en el instrumental y el incondicionado en el clásico. Las preguntas representan uno de los modos de identificar que procesos tuvieron lugar. Si el psicólogo desea aproximarse a una situación en la que ha habido un proceso de aprendizaje, necesita hacer aproximaciones distintas, si lo que uno supone es que ha habido CC tiene que preguntarse cuales eran los estímulos que estaban presentes. De modo entonces que se trata de dos procesos que, aunque tienen un cierto parecido (ambos son señales de una capacidad de flexibilizar la conducta y ajustarla) son miembros evidentes de la misma familia, pero tienen sus diferencias. “La diferencia entre los dos [El condicionamiento clásico y el instrumental] incluye la función de la respuesta. En el condicionamiento clásico, el organismo no puede controlar el EI resultante, pero su respuesta puede prepararlo para este. En el condicionamiento instrumental, la respuesta del organismo determina si ocurrirá8 el reforzador resultante.” (p. 86).

Además de este aspecto de las diferencias entre ambos procesos, tambin nos podríamos preguntar con respecto al condicionamiento instrumental si su desarrollo depende de que el sujeto sea consciente de lo que está ocurriendo. Anderson aborda así8 esta cuestión: “(...) Algunas veces los humanos se encuentran en situaciones de condicionamiento instrumental en que deben descubrir la contingencia. Por ejemplo, muchos estudiantes tienen que descubrir por ensayo y error qu clase de trabajo merecerá8 una calificación alta de un maestro.” (pp. 84-85). A. ¿Es lo mismo sensibilidad a la contingencia que conocimiento de su existencia? B. ¿Es lo mismo conocimiento de la contingencia que conciencia de su existencia? C. ¿Qu sucede cuando las creencias conscientes de los sujetos no reflejan las contingencias que están operando en su entorno? D. ¿Se pueden crear falsas creencias mediante condicionamiento instrumental? EL EC Y LA RC EN EL CONDICIONAMIENTO INSTRUMENTAL: ¿Qué es el estimulo condicionado? A) El componente de generalización

Relación entre colores percibidos y longitudes de onda.

Gradientes de generalización ante estímulos visuales de diferentes longitudes de onda (color) Sujetos: palomas. Autores: Guttman y Kalish (1956) Tenemos representada la pauta de respuesta del picoteo de una palomas colocadas en la caja de Skinner cuando previamente han sido sometidas a un proceso de aprendizaje instrumental, de forma que la presencia del alimento es contingente solo a la presencia de determinada señal luminosa. El gradiente de generalización se mantiene prácticamente idntico en todos los casos.

La conducta del picoteo tenia como reforzador la comida si había una imagen con una determinada longitud de onda (color) Pauta de palomas que fueron entrenadas que fueron entrenadas que recibieron el reforzador cuando picoteaban si tenían una luz de 530 nanómetros, de color verde. Gradiente que se registra de la tasa de picoteo por aquellos animales en que la luz solo aparecía si había una luz verde.

Las conductas de picoteo tienden a ajustarse a las condiciones de iluminación. La conducta de picoteo alcanzara la máxima frecuencia mientras este expuesta a estímulos similares a aquel que originalmente presentaba la existencia de comida. Una pequeña variación en la gama de color presente es suficiente para que la tasa de picoteo caiga. Se trata de gradientes de generalización con unas pendientes muy acusadas, lo que significa que el nº de respuestas que daban estos animales caen y tan pronto como es distinta, disminuye mucho. Este es sólo el primer eslabón de una serie de experimentos que demuestran esa plasticidad. Lo interesante es que van a recibir comida siempre que picoteen con determinadas longitudes de onda (color de la luz) 1. Si las palomas han sido entrenadas para que la comida aparezca solo con la luz verde, cuando comienza la fase de extinción, ocurrirá lo mismo que con el condicionamiento clásico. Cuando vuelve a ver la luz verde, es cuando va a tener una tasa de picoteo mas alta. 2. Cuanto mas se parezcan los nuevos estímulos, al estimulo original, mas alta será la tasa de picoteo La tasa mas alta/punto mas alto, corresponde a la repetición del estimulo con el que fueron condicionados. Sucede lo mismo que en el condicionamiento clásico, sea cual sea el gradiente e independientemente de la variabilidad de cada uno.

Gradiente de inhibición: Es el gradiente de generalización, pero invertido. Hay 14 colores, de los cuales todos van asociados al reforzador, MENOS UNO, el 570 (amarillo oscuro). Las palomas aprenden que su conducta ante esta luz no tiene reforzador, por tanto, reducen su tasa de picoteo, a casi nula (o nula). Sujetos: palomas. Autor: Terrace (1972)

Gradiente de generalización: Gradiente de generalización ante estímulos visuales de 580um. Comparar ese con la figura anterior. Sujetos: palomas. Autores: Guttman y Kalish (1956)

Gradiente de generalización(mínimo) ante estímulos auditivos de diferentes frecuencias y un estimulo visual critico. Sujetos: Palomas. Autores: Jenkis y Harrison (1960) Se observa que es relativamente fácil que los animales descubran cuales son las regularidades asociadas. Si la paloma que ve la luz y oye el pitido, descubre que la agudeza o gravedad del pitido no tiene relevancia para el reforzador, la paloma no tarda nada en ignorar ese aspecto del estimulo. La explicación de Anderson es la siguiente: “Las palomas estaban registrando su ‘opinión’ de que la intensidad real del tono era irrelevante para distinguir si fuese entregado el reforzamiento; las aves se comportaron como si la única característica crítica fuera la tecla iluminada sin importar cuál fuera el tono. En efecto, ignoraron la intensidad del tono.” (p. 91). Señalemos algunas palabras del fragmento: “Las palomas estaban registrando su ‘opinión’ de que la intensidad real del tono era irrelevante para distinguir si sería entregado el reforzamiento; las aves se comportaron como si la única característica crítica fuera la tecla iluminada sin importar cuál fuera el tono. En efecto, ignoraron la intensidad del tono.” (p. 91). Debemos tener cuidado a la hora de utilizar expresiones como “opinar”, “distinguir” o “ignorar” a la hora de describir la conducta de un animal. Y mucho más cuidado todavía si lo que queremos es explicar esa conducta. B) Componente de discriminación Generalización Discriminación

 procesos antagonistas.

G: Estímulos que son diferentes, provoquen la misma respuesta. Las regularidades del entorno hacen que los estímulos no siempre coincidan. D: atenúa el efecto de la generalización. Porque si esta no tiene ninguna frontera, haría que la conducta del animal fuera indiscriminada. El que se de el principio de generalización o diferenciación: Depende de la pauta de contingencia del entorno. Es decir, la magnitud física de las diferencias tiene una influencia comparativamente mas pequeña que el patrón de contingencia.

Modalidad auditiva:

En la izquierda, el animal ha descubierto que el predictor de la comida no es el sonido sino la luz. Y en la derecha hemos hecho que el reforzador sea contingente con el sonido. Experimento de Jenkis y Harrison (1960). Gradientes de generalización en ausencia (izquierda) y presencia (derecha) de un proceso de discriminación. Gradientes de generalización ante estímulos auditivos de diferentes frecuencias, tras un aprendizaje discriminativo. Sujetos: Palomas. Autores: Jenkis y Harrison (1962) La respuesta que se registran cuando hacemos un experimento en 2 fases. El de fuera, corresponde a la situación anterior, animales que reciben la comida si el picoteo se produce ante una señal sonora de 1000 HZ. Y el de dentro representa una segunda etapa, a la que son sometidos los mismos animales. Esta definida por una nueva demanda, ya que ahora seguimos reforzando el picoteo ante los 1000 Hz, pero introducimos una nueva estimulación que NO va a ser reforzada. Este gradiente apenas difiere 100hz. Es un estimulo sonoro muy parecido al que hasta ahora anunciaba la comida, pero este no va a ser reforzado con ella. Si el animal es sensible a la nueva regularidad, tendrá que modular su respuesta a las nuevas condiciones. (ahora es un poco mas difícil discriminar) APRENDIZAJE DE CATEGORIAS: “La sólida evidencia a favor de la integración multidimensional de los estímulos indica que los organismos responden a las categorías de objetos más que a dimensiones individuales de los mismos.” (p. 100). Los investigadores se preguntaron en que medida las palomas son capaces de generar una categoría compleja, por ejemplo, un árbol. La clave del asunto es que no existe ningún aspecto singular o individual que permita distinguir los arboles de los no arboles. La única forma de que las palomas pudieran discriminarlos con xito era que fueran capaces de hacer una integración multidimensional. Herrnstein, R. J., Loveland, D. H. y Cable, C. (1976). Natural concepts in pigeons. Journal of Experimental Psychology: Animal Behavior Processes, 2, 285-302. “Las aves fueron entrenadas con unas 700 diapositivas de árboles y no árboles para que picotearan ante casos de la categoría ‘árbol’. La única característica que tenían en común las imágenes positivas (y que las

diferenciaban de las imágenes negativas) era que incluían un árbol. Las imágenes positivas no podían discriminarse de las imágenes negativas con base en (sic) características simples.” (p. 100) “Despus de ser entrenadas para discriminar un conjunto de imágenes de árboles de un conjunto el que no había árboles, las palomas pudieron generalizar esta capacidad a nuevas imágenes que no se habían usado para el entrenamiento.” (p. 100) Tuvieron mucho cuidado para que en el caso de las palomas no hubiera ninguna característica aislada. Ahora exige que los animales sean capaces de hacer una Integración, en la que participen características mas o menos heterogneas. “Cuando se producía delante del árbol, picoteo, cuando no no” Conclusión “Los animales aprenden con facilidad a responder ante combinaciones dimensionales complejas que definen categorías significativas.” (p. 102) ¿QUE ES LA RESPUESTA CONDICIONADA? ¿Qu es lo que aprende el animal en un condicionamiento instrumental? “Parece que los organismos llegan a alguna representación de la estructura funcional de su ambiente y seleccionan sus respuestas en forma apropiada. [...] Como en el condicionamiento clásico, la respuesta es la adaptación del organismo a lo que ha aprendido acerca del ambiente.” (p. 102) “Skinner (1938) reconoció8 la naturaleza de la respuesta en su definición de operante, al identificar como casos de la misma operante a diferentes respuestas que tienen efectos idnticos en el ambiente (es decir, consecuencias de refuerzo idnticas).” (p. 102, nfasis añadido). “Los organismos tienden a no discriminar entre respuestas que son equivalentes en su efecto sobre el ambiente.” (p. 103) Tolman, E. C., Ritchie, B. F. & Kalish, D. (1946). Studies in spatial learning II. Place learning versus response learning. Journal of Experimental Psychology, 36, 221-229. El condicionamiento operante indica a los animales cual es la manera más eficaz para adaptarse a las regularidades del entorno. Por tanto, no seria un proceso que añade destrezas mecánicas o superficiales a la conducta, con esto, Anderson pretende demostrar que hay algo más allá, una definición de las regularidades del medio y una elaboración mental. Tambin es una figura fundamental en la primera mitad del siglo XX de la psicología, pues representa la transición del conductismo al cognitivismo. Esto varia el esquema de un laboratorio visto desde la parte superior (desde perspectiva cenital) es articuladamente sencillo pues Oslo tiene dos estructuras lineales que se cruzan en dos puntos. “Un grupo de ratas siempre encontraba comida al girar a la derecha. Por tanto, si empezaba en S1, encontraba comida en F1, mientras que, si empezaba en S2, encontraba comida en F2.

El otro grupo de ratas siempre encontraba comida en F1, sin importar donde comenzaba. Este grupo tenía que girar a la derecha o a la izquierda dependiendo del punto de inicio.” (p. 20) En cada ensayo solo había una salida y un lugar con comida.

Tolman registraba cuantas veces el animal elegía el camino correcto y cuantas veces se equivocaba (error=dirección donde no estaba la comida) El 50% de las ratas participantes estaban en una condición fija (para ese grupo, la comida siempre estaba en el mismo sitio, ej. F1). No variaba la comida, sino la conducta que tenían que realizar para encontrarla. Por el contrario, en la otra condición la comida podía encontrarse tanto en F1 como en F2 (con la misma probabilidad), dependiendo del punto de salida. Si salía de S1, la comida se encontraba en F1. Los animales de esta condición siempre tenían que girar a la derecha para encontrar la comida. ¿En qu grupo se registraría un aprendizaje más rápido? * Grupo 1: Conducta fija: girar a la derecha. (response _____) * Grupo 2: Conducta variable: buscar F1 (place ---------) Antes de responder, debemos considerar cuál de las dos conductas se parece más a las que realizan los animales en su entorno. En trminos de aprendizaje y adaptación la conducta fija va ligada a mayores problemas. Es mas adaptativo la conducta variable. Si uno considera la extrapolaridad al contexto de donde viven las ratas, la situación del grupo dos es más parecida a la vida real. Si quieren sobrevivir tienen que aprender donde está la comida. Si una rata aprende pautas fijas de comportamiento, que no le permitirían buscar la comida, en la realidad son más susceptibles a las modificaciones del entorno. Se manipulaba para impedir que le llegará el olor o la visión de la comida. Se ponía la “black curtain” para evitar que le llegase algún indicio que le dijese donde estaba la comida

Conclusión: “Las ratas del segundo grupo, que estaban aprendiendo a ir a un lugar, aprendieron mucho más rápido que las ratas del primer grupo, que estaban aprendiendo una respuesta constante. Por tanto, Tolman afirmó que no se aprendían respuestas específicas, sino más bien que las ratas aprendían a localizar en un mapa cognitivo.” (pp. 20-21) “[Lo que los animales aprendían] no era un conjunto específico de asociaciones entre estímulo y respuesta, sino más bien un modelo del ambiente en el que la criatura podía elegir como actuar. En el caso de los laberintos, dicho modelo fue llamado mapa cognitivo; este incluía información acerca del esquema espacial y no solo rutas específicas.” (p. 19)

“La mayor contribución de Tolman fue demostrar que lo que se aprende no es comportamiento, sino más bien conocimiento, que puede usarse para guiar el comportamiento.” (p. 21, nfasis añadido) Esto es una prueba de que no se obtiene una respuesta motora, las ratas lo que aprenden es a crear una representación mental cognitiva del entorno. Representación espacial = mapa cognitivo. ASOCIACION: ¿CONTIGUIDAD O CONTINGENCIA? Aquí8 nos vamos a plantear una cuestión similar a la que veíamos en el Tema anterior: ¿Cuál es la sensibilidad de los organismos a la contigüidad temporal respuesta – refuerzo, en comparación a su sensibilidad ante una autntica relación de contingencia entre la respuesta y sus consecuencias? Hammond (1980) realizó un experimento con ratas en el que se manipulaba la relación de contingencia entre: a. La conducta de apretar una palanca b. El refuerzo de obtener una bola de comida. Hubo cuatro fases, caracterizadas por la presencia o ausencia del vínculo de contingencia. - Fase 1: Existencia de contingencia: la única manera de que apareciera la comida era presionando la palanca. - Fase 2: Ausencia de contingencia: la probabilidad de obtener la comida era igual, se presionase o no la palanca. Cambio fundamental, la comida se presenta aleatoriamente independientemente de la conducta de los animales  no hay relación de contingencia. - Fase 3: Existencia de contingencia: Vuelta a la situación inicial: se obtenía la comida si y solo si se presionaba la palanca. - Fase 4: Ausencia de contingencia: Repetición de la Fase 2. Las fase dos y cuatro se caracterizan por una ausencia de contingencia, el experimentador ha definido, que la presencia de comida sea independiente de la conducta del animal. Se ha manipulado la caja de Skinner para que el reforzador aparezca presione o no la palanca, mediante un patrón aleatorio. El patrón de contingencia que había antes se rompe.

En la gráfica se ve el número de veces que presiona la palanca por hora. - La media de la F1 es de 3600 veces/h, por lo que es 60 veces por minuto. Tienen una tasa de pulsación x segundo, las ratas solo están pulsando la palanca. La rata está constantemente dándole a la palanca para conseguir comida. - La media de la F2 es de 300 veces/h (5 veces por minuto). Es evidente que el animal “ha descubierto” la contingencia y no vale la pena pulsar la palanca. - En la fase 3, la tasa baja, ya no está tan empeñada en dar a la palanca. - En la fase 4, la palanca se presiona alrededor de una vez por minuto, porque ya no detectan la contingencia.

“Estos animales mostraron ser sensibles a las contingencias del experimentador, del mismo modo en que los animales mostraron ser sensibles a la contingencia EC – EI en el condicionamiento clásico.” (p. 109) Ahora bien, no siempre ocurre así…: Dada la plasticidad conductual de estos animales, puede que alguno acabe desarrollando una conducta supersticiosa. Llamamos conducta supersticiosa a aquellas que no responden a la contingencia. Según Skinner lo único que hace falta es hacer una programación aleatoria, es decir, el experimentador ha elegido dos momentos en los que aparecerá el reforzador sin que el animal realice la conducta. “Algunos de los experimentos famosos de Skinner (Skinner, 1948) sobre lo que ha sido llamado aprendizaje supersticioso fueron ideados para aportar evidencia de que la contigüidad era suficiente para el aprendizaje y que la contingencia no era necesaria.” (p. 109) ¿Que sucede si los reforzadores son independientes de la conducta? Uno define que los reforzadores aparecerán en segundos aleatorios. En un contexto tan simple aparece el aprendizaje supersticioso, la reiteración de una conducta en ausencia de un patrón de contingencia que lo justifique. Se puede aplicar el mismo esquema a humanos. La respuesta que con mucha probabilidad daría una persona que lleva un amuleto a un examen es que una vez llevó el amuleto y le fue bien, al siguiente no lo llevó y le salió mal y al siguiente lo llevó y le salió bien. Nadie puede dar una respuesta mas allá de que una vez o mas de una vez ha habido una asociación. Registro acumulativo: skinner 1948 Es el dispositivo experimental directamente asociado a esta poca del conductismo. Suponemos que seguimos con el paradigma de Condicionamiento Operante de las palomas en una caja de Skinner. El eje X marca la dimensión temporal, el proceso desde que empieza hasta que termina. El eje Y representa qu estamos registrando, con un carácter sumativo o acumulativo. Estos dispositivos funcionan de manera parecida a cómo lo hacen los sismógrafos. Un sensor detecta una señal, que se amplifica y hay un dispositiv...


Similar Free PDFs