Repaso Final Aprendizaje Nessa PDF

Title	Repaso Final Aprendizaje Nessa
Course	Aprendizaje
Institution	UNED
Pages	28
File Size	1.9 MB
File Type	PDF
Total Downloads	597
Total Views	825

Preview

CLICK TO PREVIEW PDF

Summary

REPASO FINAL APRENDIZAJENESSA T.CURSO 2020/APRENDIZAJE  cualquier cambio duradero en el repertorio conductual de un organismo que tiene lugar como resultado de la experiencia con los acontecimientos ambientales. Se incluye dentro de la psicología experimental, pretende explicar y predecir cambios e...

Description

La ejecución en los programas RDA es más fácil que en los RDB porque es difícil reforzar específicamente una respuesta y que no se haga de forma repetida. TEORÍA DEL REFORZAMIENTO DIFERENCIAL DE LOS TER En cada programa se refuerza el TER que ocurre justo antes del Reforzador. Según esta teoría se deberían reforzar los TER cortos.  A FAVOR los programas Variables tienen tasas de respuesta constantes, no hay pausas y, la duración de los TER, es muy homogénea.  EN CONTRA los programas Fijos tienen tasas de respuesta con pausas, y a duración de los TER no es homogénea. ¿Qué explicación dan a esto? Mecanismo de discriminación temporal: las pausas post-reforzamiento en programas de RF e IF son debidos a que los sujetos experimentales son capaces de discriminar eficazmente el momento de entrega del reforzador, y saben que después de entregar el último es improbable conseguir uno nuevo después. Otra explicación fue la dada por Tanno y Silberberg, hablaban de competición entre respuestas  los TER más alejados del reforzador pesan menos. Su explicación se centra en los TER perspectiva molecular. Dicen que se tiene una mayor sensibilidad a los emparejamientos locales que a una función más global (dada en las funciones de retroalimentación). PROGRAMAS COMPUESTOS DE REFORZAMIENTO aplicación de dos o más programas básicos de reforzamiento. Pueden dividirse en dos grandes bloques: (combinaciones secuenciales y simultáneas). 1) SECUENCIALES  (uno tras otro, cuando finaliza vuelve a empezar)  ALTERNANTES (se alternan VARIOS programas ordenados al azar) • Mixto  el orden es indistinto (al azar), pero con un tiempo marcado: p.ej. un programa de IF-60 durante 10’ en el cual se obtienen los reforzadores que correspondan, junto con uno de RF-50 durante 10’ con sus reforzadores correspondientes, cuando se completan los dos programas, en el orden que sea, se vuelve a empezar.

Múltiple  mismo programa que el anterior, pero con el añadido de un Ed que señala el programa en el que está a la rata.  SECUENCIALES (ESTRICTOS, VARIOS programas siempre en un mismo orden) • Tándem un programa tras otro, NO HAY un tiempo estipulado para el cambio, es el sujeto el que con su acción cambia de un programa a otro. Y el reforzador tan solo se obtiene una vez completados los DOS PROGRAMAS: p.ej. un programa de IF-60 que, al ser completado, cuando la rata pulsa la palanca salta a un programa de •

RF-50, cuando lo complete recibirá la comida, se vuelve a empezar hasta completar lo marcado por el experimentador.

•

Encadenado  mismo programa que el anterior, pero con el añadido de un Ed que aparece en el segundo programa y permanece en él hasta que finaliza el mismo, dicho Ed señala a la rata en qué programa está. Los programas encadenados se han utilizado para estudiar el reforzamiento condicionado, que se refiere al hecho de que algunos estímulos adquieren capacidades reforzantes por su asociación con los reforzadores primarios. Las propiedades reforzantes de estos estímulos se miden por su capacidad para encadenar respuestas, de manera que los sujetos experimentales responden para conseguir dichos cambios en el ambiente. Esta técnica del encadenamiento ha permitido estudiar en los estímulos capacidades reforzantes de segundo orden, de tercer orden, e incluso de órdenes superiores.

2) SIMULTÁNEAS  DOS PROGRAMAS a la vez con el orden al azar. Se utilizan para provocar una conducta de elección, indicando que los dos están disponibles.  CONCURRENTES  Dos programas distintos entre los que se debe elegir. Una vez que ha emitido sus respuestas en uno u otro programa, o en los dos, se mide la tasa de respuesta de cada uno de ellos (TASA RELATIVA DE RESPUESTA).  “COMBINADOS”: • Alternativo  la rata debe responder al programa de Razón y al de Intervalo, es indiferente, se obtendrá el reforzador cuando acabe uno u otro. + • Conjuntivo  Programa de Razón + Programa de forzador • Entrelazado  la disposición de uno de los programas altera el otro. P. pide a la rata IF-10 que dé 6 respuestas (razón) en 10 segundos (intervalo). Se combinan. RF-6

CONDUCTA DE ELECCIÓN: Muchos investigadores utilizaron procedimientos que se podrían definir como de premios concurrentes donde, normalmente, se daba a elegir a los sujetos entre dos actividades diferentes, por ejemplo comer o beber, y se medía el tiempo que dichos sujetos experimentales empleaban en cada una de estas dos actividades conductuales. Pero esta no era una buena forma de medir la elección. En los programas concurrentes los sujetos ya no eligen directamente entre diferentes premios, lo hacen entre distintas alternativas que requieren una respuesta operante idéntica (p.ej. dar a una palanca) pero que pueden llevar a premios diferentes. Este procedimiento, frente a la elección entre premios concurrentes, se puede denominar de elección entre respuestas instrumentales concurrentes, y es el utilizado en los programas concurrentes de reforzamiento la elección o preferencia entre las alternativas de respuesta se calcula por la tasa relativa de respuesta y se representa por el cociente (que nos habla de proporciones %):

LEY DE IGUALACIÓN de HERRNSTEIN en programas concurrentes de IV dice que la tasa relativa de respuesta entre dos alternativas de respuestas concurrentes es igual a la tasa (frecuencia) relativa de reforzamiento (f) asociada con cada una de dichas alternativas de respuesta. Esta ley surgió a raíz de experimentos que hizo con palomas, donde observó que éstas distribuían sus respuestas en función de la frecuencia de reforzamiento en cada una de las alternativas. Ecuación 1:

La ley de igualación establece una equiparación entre la distribución de las tasas de respuesta en las alternativas a y b y la distribución de las tasas de reforzamiento en dichas alternativas de respuesta. Si los reforzadores se distribuyesen al 50% entre las dos alternativas, la ley de igualación establece que las respuestas se distribuirían por igual entre las dos alternativas. Esto, Herrnstein lo demostró en sus experimentos con tres palomas. Pero, se ha observado que los animales igualan la tasa relativa de respuesta con otros parámetros que definen al reforzador, como pueden ser la magnitud del reforzador o su inmediatez. De esta manera se puede extender la formulación de la ley de igualación para incluir estos dos parámetros de reforzamiento, siguiendo la Ecuación 2:

La Ecuación establece que todos los factores de reforzamiento influyen de forma igual en la elección, en concreto de forma multiplicativa, de manera que cualquiera de esos factores (frecuencia, magnitud, demora) puede reducir la elección por una alternativa de respuesta, aunque los otros factores sean altamente favorables. MAXIMIZACIÓN EN PROGRAMAS DE RAZÓN se da un comportamiento adaptativo cuando se presentan dos programas de razón, los sujetos tienden a elegir la alternativa de respuesta que tiene una razón más baja (la mejor opción). La maximización no contradice la ley de igualación. Es más, es el único comportamiento que en una situación de programa concurrente de razón cumple con la ley de igualación.

IGUALACIÓN TEMPORAL (FINDLEY) se trata de igualar el tiempo que se pasa en cada una de las alternativas. El experimento de Findley consistía en presentar en una única tecla de respuesta los dos programas de IV en sucesión, cada uno señalado por una clave discriminativa distinta, como en un programa múltiple. Sin embargo, los sujetos pueden cambiar de programa de reforzamiento respondiendo en una segunda tecla, denominada de cambio. La gran ventaja del programa concurrente de Findley es que separa la respuesta de cambio de la respuesta instrumental, permitiendo comparar entre diversas respuestas instrumentales e, incluso, eliminar alguna de ellas. Findley separa: -

Tecla RO respuesta operante CAMBIO

Brownstein y Pliskoff (1968) emplearon un programa concurrente tipo Findley para estudiar las preferencias de las palomas entre varias fuentes de reforzamiento, sin emplear respuestas instrumentales: En su experimento los picotazos en la tecla de cambio modificaban el color de la otra tecla, pero los animales no tenían que picotearla para obtener los reforzadores. La medida de preferencia en este estudio fue el tiempo de permanencia en los programas de reforzamiento, asumiéndose que una mayor permanencia reflejaría una mayor preferencia.

Brownstein y Pliskoff -

No hay R.O. Sólo hay palanca en la respuesta de Cambio Reforzadores aparecían solos

La igualación temporal es un hallazgo muy corriente en los experimentos de elección. Es posible encontrar igualación temporal con procedimientos concurrentes normales, así como, con procedimientos concurrentes tipo Findley donde sea necesaria la respuesta instrumental, donde la respuesta instrumental no sea necesaria, e, incluso, donde la respuesta instrumental sea necesaria para un programa, pero no para el otro. Baum y Rachlin propusieron por ello esta Ecuación 3:

LEY GENERALIZADA DE IGUALACIÓN: Ya se comentó que la forma de medir la elección denominada “premios concurrentes” tenía sus limitaciones, pero, también, en el método de “respuestas instrumentales concurrentes” hay que considerar algunas influencias no deseables que intervienen en la elección de los sujetos. Cuando se tiene que elegir entre dos o más alternativas de respuesta se suele producir un tipo de comportamiento denominado de alternancia cambio intermitente de una alternativa de respuesta a otra sin que guarde relación con los reforzadores asociados a cada una de dichas alternativas de respuesta. En las situaciones de elección en los laboratorios de psicología del aprendizaje interesa que el comportamiento de elección se guíe sólo por las consecuencias de reforzamiento en las diferentes alternativas de respuesta, se tiene que controlar la influencia extraña que se introduce con este comportamiento alternante de los animales experimentales. Para ello los investigadores añaden la limitación de que no se refuerce la respuesta de cambio de alternativa por un tiempo. Este procedimiento se denomina demora por el cambio (DPC) introducir un periodo temporal breve, de aproximadamente 2 ó 3 segundos, después de la primera respuesta a una de las alternativas para que pueda entrar en funcionamiento el programa de reforzamiento asociado a dicha alternativa de respuesta esto es, si los sujetos experimentales persisten en su comportamiento de alternancia, y se ha introducido la contingencia de DPC, no podrán obtener ningún reforzador en ninguna de las alternativas de respuesta. La consecuencia es que los sujetos abandonan su comportamiento de alternancia y realizan la elección en base, exclusivamente, a las contingencias de reforzamiento asociadas con cada una de las alternativas de respuesta. Además de prevenir el reforzamiento inmediato de la conducta de alternancia, la DPC garantiza la independencia de los operandos de respuesta. CORREGIR SESGOS los sesgos son tendencias que se tienen y que constituyen otra fuente de influencia (desconocida) no deseable en los experimentos de elección:

    

Conducta de alternancia entre alternativas. Disposición espacial por ejemplo preferir derecha o izquierda en la cama a la hora de dormir. Color de las aternativas preferido. Iluminación. Fuerza requerida.

Baum ideó un método para corregir la influencia de los sesgos. Partió de la idea de que los sesgos influyen en la elección de forma idéntica a los factores de reforzamiento (frecuencia, magnitud, demora), y formuló la ley generalizada de la igualación. Ecuación 4.

EL METODO DE BAUM DE TRES PASOS: 1) Equiparar los factores de las alternativas (F, M, D). 2) Medir las preferencias relativas.  Si distribuyen las respuestas de forma igual no hay sesgo.  Si hay una preferencia mayor en una que en otra desviación (SESGO). 3) Variar los factores de reforzamiento asociados con las alternativas de respuesta. No es extraño que ajustes tan exactos como los predichos por la ley de igualación de Hernstein, en realidad, no se cumplan, y que las estimaciones en cuanto a las ventajas de reforzamiento de las alternativas de respuesta conduzcan a errores de estimación, que es lo genuinamente psicológico. Ya hemos visto que el valor no es algo que provenga exclusivamente de unos rasgos estrictamente objetivos, sino que pueden ser comparados con otras alternativas o con experiencias previas. Por otro lado, también se puede tener en cuenta la tasa de respuesta en la alternativa más favorable. En el caso de los programas concurrentes sucede que, a veces, la alternativa de respuesta es sobrevalorada (si la otra alternativa es significativamente peor) y, otras veces, es infravalorada (si la otra alternativa es manifiestamente mejor). Y este cálculo del valor de los reforzadores es la generalidad.  Sobreigualación  cuando la mejor alternativa es valorada en exceso, por encima de la preferencia establecida por la igualación perfecta;  Infraigualación  cuando la mejor alternativa es valorada por debajo de la preferencia establecida por la igualación perfecta. Es más común encontrar infraigualación que sobreigualación (Baum), debido a la tendencia a cambiar de alternativa cuando se ha obtenido reforzamiento en una de ellas (el comportamiento de alternancia descrito anteriormente). Baum amplió de nuevo la Ley de Igualación para incluir las desviaciones de sobreigualación e inflaigualación. Ecuación 5.

Valore Valore

y S =  Hernstein S inferiores a  infr . S superiores a  supr .

Siendo k la constante que representa los sesgos relativos (una constante calculada por el método explicado más arriba) y s un exponente que representa la sensibilidad hacia los programas de reforzamiento. Cuando k y s sean igual a 1, la ecuación se reduce a la de Herrnstein (con el cambio de que en los denominadores no se consideran el total de respuestas y de reforzamiento, sólo la tasa de respuesta y de reforzamiento de la alternativa b). Los valores de s inferiores a 1 se corresponderían con la infraigualación, los valores de s superiores a 1 con la sobreigualación. La sobreigualación sería más frecuente cuando se utilice una contingencia de DPC relativamente larga o cuando resulte muy costoso el cambio de una a otra alternativa de respuesta; en otras circunstancias, resulta más frecuente obtener infraigualación. En el caso extremo en que s sea igual a 0, las tasas de respuesta en las alternativas a y b serán siempre las mismas, independientemente de las tasas de reforzamiento que acompañen dichas alternativas de respuesta,

reflejando una completa insensibilidad a las contingencias de reforzamiento. Esto podría ocurrir cuando los sujetos obtuviesen todos los reforzadores respondiendo simplemente a las dos alternativas de respuesta en estricta alternancia o, de acuerdo a cualquier otro patrón de comportamiento que fuese independiente de los valores de los programas de reforzamiento. sobreigualación EJEMPLOS PRÁCTICOS: - Me dicen que la tasa relativa de reforzamiento es 0,7 Fa/Fa+Fb= 0,7 70% de reforzadores en alternativa a. a) 0,6 (infraigualar) b) 0,8 (sobreigualar) c) 0,7 (ley de igualación) - La tasa relativa de reforzamiento es 0,2 Fa/Fa+Fb= 0,2 20% de reforzadores en a, 80% de reforzadores en alternativa b (“al revés”).

infraigualación

a) 0,2 (ley de igualación) b) 0,3 (infraigualar porque si le doy 0,3 a la alternativa a le estaré dando 0,7 a la mejor alternativa, la b) c) 0,1 (sobreigualar, porque si le doy 0,1 a la alternativa a estoy dando 0,9 a la alternativa mejor, la b)

Tengo dos programas concurrentes, uno de IV-60 y otro de IV-30 cuando recibo dos reforzadores en b, tan sólo obtengo 1 reforzador en a, por lo que, la mejor alternativa de elección sería la b. Según la Ley de Igualación, si la mejor opción es la b deberé darle el doble de veces que a la alternativa a para obtener IGUALACIÓN.  

Si le doy el triple a la mejor alternativa, la b estaré SOBREIGUALANDO Si le doy las mismas veces a b que a la alternativa a estaré INFRAIGUALANDO

a) IV-60 b) IV-30

Si los programas son de Razón, siempre habrá Maximización la elección siempre será la de la mejor alternativa. Si me dan un programa RF-20 y uno de RF-10, siempre escogeré el de RF-10, por lo tanto, infraigualar sería darle menos a esa alternativa, y sobreigualar sería darle en exceso.

TEORIAS DE LA IGUALACIÓN: 1) Teoría MOLECULAR basa su análisis en el cálculo de las probabilidades de reforzamiento en cada momento. 2) Teoría MOLAR afirma que los animales distribuyen sus respuestas de acuerdo a un cálculo global de las tasas relativas de reforzamiento entre las dos alternativas de respuesta, eligiendo más aquella alternativa que proporciona una mayor tasa de reforzamiento. Esta teoría no puede dar explicación a porqué se escogen programas de Razón antes que los de Intervalo, tampoco saben explicar porqué se prefieren los programas Variables a los Fijos. 3) Teoría del MEJORAMIENTO síntesis de las otras dos teorías. los organismos eligen entre dos fuentes de premio, de manera que se igualen las tasas locales de reforzamiento respondiendo a la alternativa que, en un momento dado, presenta una mejor tasa local de reforzamiento (tomar decisiones a corto plazo teniendo en cuenta a largo plazo). La mejora se establece en términos de tasa local de reforzamiento, más que en términos de probabilidad momentánea de reforzamiento (como hacía la aproximación molecular). Así, los resultados tienen un alcance a más largo plazo que la teoría molecular, pero no se refiere a tasas globales de reforzamiento, como ocurre con la teoría molar. IMPULSIVIDAD Y AUTOCONTROL Inmediatez vs. Cantidad. Las Cadenas Concurrentes de Respuestas no son para medir:  la elección directa entre premios: premios concurrentes (dos elecciones, comer o beber).  directamente la elección entre respuestas instrumentales concurrentes: programas concurrentes. Son para medir la elección entre DIFERENTES FUENTES DE PREMIO.

El programa concurrente encadenado (abajo), contrario al simple, se compone como mínimo de dos pasos, un eslabón inicial donde el sujeto tiene que elegir entre dos alternativas de respuesta idénticas (blanco frente a blanco), y un eslabón terminal donde se proporcionan los reforzadores por responder en la alternativa de respuesta elegida durante el eslabón inicial. Si se hubiese elegido la alternativa de la izquierda, la tecla central se iluminaría en rojo y se acompañaría de un programa de reforzamiento particular; si se hubiese elegido la alternativa de la derecha, la tecla central se iluminaría en verde y se acompañaría de otro programa de reforzamiento. Una vez transcurrido un tiempo predeterminado en el eslabón terminal, se vuelve a presentar el eslabón inicial hasta que el sujeto elija otra vez una de las alternativas de respuesta y se vuelva a pasar al eslabón terminal. Al ser sometidos a programas concurrentes encadenados, los sujetos experimentales normalmente igualan la tasa relativa de respuesta en los eslabones terminales con la tasa relativa de reforzamiento en dichos eslabones terminales (el resultado normal de la igualación), pero también igualan la tasa relativa de respuesta en el eslabón inicial con la tasa relativa de reforzamiento en los eslabones terminales. Los programas concurrentes encadenados se asemejan más a las elecciones en la vida cotidiana, donde optar por una alternativa te compromete por un tiempo hasta poder cambiar de opción y donde, normalmente, no se puede estar cambiando caprichosamente de alternativa en cada momento.

ESTUDIO DE AUTOCONTROL: Estudios con PROGRAMAS CONCURRENTES SIMPLES evidencian conductas IMPULSIVAS:  recompensas pequeñas e inmediatas SON PREFERIDAS a  recompensas grandes-demoradas AUTOCONTROL. Los Programas Concurrentes añaden una demora y demuestran que se puede transformar una conducta impulsiva en una autocontrolada. Rachlin y Green realizaron un trabajo seminal que ilustra perfectamente las implicaciones diferenciales de utilizar un programa concurrente simple o uno encadenado dieron a elegir a sus animales entre una opci...