7- Condicionamiento instrumental- mecanismos motivacionales PDF

Title	7- Condicionamiento instrumental- mecanismos motivacionales
Author	blanca sebastián
Course	Psicología del aprendizaje
Institution	Universidad de Zaragoza
Pages	5
File Size	146 KB
File Type	PDF
Total Downloads	25
Total Views	118

Preview

CLICK TO PREVIEW PDF

Summary

Download 7- Condicionamiento instrumental- mecanismos motivacionales PDF

Description

TEMA 7. PROGRAMAS DE REFORZAMIENTO Y CONDUCTA DE ELECCIÓN Un PROGRAMA DE REFORZAMIENTO es un programa o regla que determina cómo y cuándo la ocurrencia de una respuesta irá seguida de un reforzador. Puede establecerse en infinidad de formas. Influyen tanto en la forma de aprender una respuesta instrumental como en la forma en que se mantiene por el reforzamiento. Sin embargo, los que han investigado los efectos de los programas se han interesado fundamentalmente en el mantenimiento de la conducta. Los programas de reforzamiento han demostrado su importancia entre los empresarios que tienen que asegurar la continuidad de trabajo. Incluso los profesores están interesados en alentar la ocurrencia de respuestas ya aprendidas.

RAZÓN

INTERVALO

FIJO

VARIABLE

Se necesita un número fijo de respuestas para dar el reforzador. (RF2)

Se requiere un número variable de respuestas para conseguir el reforzamiento

Se refuerza la primera respuesta después de Se refuerza la primera respuesta después de un tiempo variable in tiempo fijo desde la última entrega del desde la última entrega del reforzador reforzador.

PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE Programas de razón La característica de los PROGRAMAS DE RAZÓN es que el reforzamiento depende sólo del número des respuestas que realiza el organismo. Si este número es uno, cada respuesta provocará la entrega del reforzador. Este programa recibe el nombre de REFORZAMIENTO CONTINUO (tasa constante que se hace más lenta a medida que se sacia). Si se da sólo alguna vez es un REFORZAMIENTO PARCIAL O INTERMITENTE. Razón fija: la entrega de un reforzador se produce tras un número fijo de respuestas, como por ejemplo, 10. El reforzamiento continuo constituye también un programa de razón fija. Sólo se dan pausas breves e impredecibles. Por ejemplo, un trabajador que cobra por producir un número concreto de piezas. La tasa cero de respuesta que se observa justo después del reforzamiento se denomina PAUSA POSREFORZAMIENTO (reforzamiento – pausa). La pausa aumenta sistemáticamente a medida que se incrementa el requisito de razón. La tasa des respuesta alta y estable que completa cada requerimiento de la razón se denomina CARRERA DE LA RAZÓN. La pausa periódica realizada cada vez que se completa la acción requerida es la TENSIÓN DE RAZÓN (acción – pausa).

Razón variable: la entrega del reforzador se produce tras un número variable de respuestas requeridas. Se necesita un número de respuestas distintas para la entrega de la recompensa. El valor (RV10) indica el número medio de respuestas para conseguir el reforzador. Patrón de respuestas muy estable (no pausas posrreforzamiento). Por ejemplo, una tragaperras o la pesca con moscas. Programas de intervalo En un programa de intervalo las respuestas son reforzadas sólo si ocurren cuando ha transcurrido una cierta cantidad de tiempo. Intervalo fijo: una respuesta se refuerza sólo si se da después de que haya transcurrido un tiempo desde la última entrega del reforzador. En un programa de intervalo fijo el tiempo establecido no varía. Se dan en situaciones donde se requiere una cantidad fija de tiempo para dispensar el reforzador. El patrón de respuesta que se desarrolla con los programas de reforzamiento de IF se denomina FESTON DE INTERVALO FIJO. Sirve para estudiar cómo los sujetos miden el tiempo. Un ejemplo sería fichar en el trabajo o avisar de algo cada 30' a tu madre. Intervalo variable: en un programa de intervalo variable las respuestas se refuerzan si se dan tras haber transcurrido un intervalo variable desde la administración del reforzador previo o desde el comienzo del programa. Los reforzadores no se dan gratis, así que hay que realizar la respuesta instrumental. Tasas de respuesta constantes y estables. Por ejemplo, un examen sorpresa o asomarte a la ventana hasta que ves lo que quieres. Comparación de los programas de razón y de intervalo Tanto los programas de intervalo fijo como de razón fija, producen una pausa posreforzamiento después de la administración de cada reforzador. Tanto los programas de RF como de IF producen altas tasas de respuesta justo antes de la administración del siguiente reforzador. Sin embargo, los programas de RV y IV mantienen tasas estables de respuesta sin pausas predecibles. RF e IF:  Pausa después del reforzador.  Altas tasas de respuesta antes del siguiente reforzador. RV e IV:  Tasas estables sin pausas predecibles.  Tasas más altas los de razón. Reforzamiento diferencial del tiempo interrespuesta: el intervalo que hay entre una respuesta y la siguiente se denomina TIEMPO INTERRESPUESTA (TIR). Programas de reforzamiento de tasas de respuestas Los PROGRAMAS DE TASAS DE RESPUESTA requieren que el organismo responda a una tasa particular para obtener el reforzador. El reforzamiento de una respuesta particular depende de cuan pronto ocurra tras la respuesta precedente. Si el animal realiza una respuesta cada 5 segundos, responderá 12 veces por minuto. Por lo tanto, el programa proporciona reforzamiento si la tasa de respuesta es 12 por minuto o mayor. Este reforzamiento que fomenta tasas altas de respuesta se llama REFORZAMIENTO DIFERENCIAL DE TASAS ALTAS (RDA), donde una respuesta se refuerza sólo si ocurre antes de que haya transcurrido cierta cantidad de tiempo tras la respuesta precedente.

Y si sólo se refuerza cuando ocurre después de que haya transcurrido cierta cantidad de tiempo desde la respuesta previa se le denomina REFORZAMIENTO DIFERENCIAL DE TASAS BAJAS (RDB). CONDUCTA DE ELECCIÓN: PROGRAMAS CONCURRENTES En un experimento realizado con palomas, se las situó en una caja con dos teclas, A y B. A funcionaba a IV 60 segs. Y la tecla B, a RF 10. El animal podría picotear libremente porque picotease donde picotease recibiría reforzador. El objetivo del experimento es ver cómo la paloma distribuye sus picotazos en las dos teclas y cómo influye el programa de reforzamiento de cada tecla. Esta técnica se denomina PROGRAMA CONCURRENTE, donde el sujeto puede elegir y ambos programas funcionan al mismo tiempo. Medidas de la conducta de elección La conducta de elección de un individuo en un programa concurrente se refleja en la distribución de su conducta entre dos respuestas alternativas. Una técnica común es calcular la TASA RELATIVA DE RESPUESTA. Ésta se calcula dividiendo la tasa de respuesta en la tecla A por la tasa total de respuesta (A + B). RA / (RA + RB) Y otra técnica sería la TASA RELATIVA DE REFORZAMIENTO que sería la tasa de reforzamiento de la respuesta A dividida por la tasa total de reforzamiento (A + B). La tasa de respuesta es igual a la tasa de refuerzo.

La Ley de Igualación La tasa relativa des respuesta en una alternativa se iguala con la tasa relativa de reforzamiento en esa alternativa. Hay dos expresiones comunes a esta ley:

Ambas expresiones representan el mismo principio: las tasas relativas de respuestas se igualan con las tasas relativas de reforzamiento. ELECCIÓN CON COMPROMISO En algunos casos elegir una alternativa hace que otras alternativas no estén disponibles, y la elección puede involucrar planificaciones complejas a largo plazo. Por ejemplo, ¿debería ir a la universidad o trabajar a tiempo completo?

Programas concurrentes encadenados Un PROGRAMA CONCURRENTE ENCADENADO de reforzamiento involucra al menos dos fases o eslabones. Durante la primera fase, el eslabón de elección le permite al participante elegir entre dos programas alternativos realizando una de las dos respuestas. La oportunidad para el reforzamiento sucede sólo después de que la elección inicial haya sido realizada y la paloma se encuentre en el eslabón terminal. Otra característica que es una vez que el participante ha realizado la elección, está comprometido con esta elección hasta el final del eslabón terminal del programa. Por tanto los programas concurrentes encadenados implican elección con compromiso.  

Eslabón de elección: sin reforzamiento Eslabón terminal: con reforzamiento

Los estudios han mostrado que los sujetos prefieren la alternativa de razón variable, incluso cuando implica un esfuerzo mayor. Esta preferencia está guiada por el hecho de que ocasionalmente un programa de RV proporciona reforzamiento por un número relativamente pequeño de respuestas. Estudios de autocontrol (preferencia por una recompensa grande demorada) El AUTOCONTROL es a menudo, elegir una recompensa grande demorada sobre una recompensa pequeña inmediata. Es más fácil si la alternativa tentadora no está tan claramente disponible. Por ejemplo, es más fácil renunciar a un trozo de tarta si se está hablando de qué se va a comer más tarde. Explicaciones del autocontrol: el valor de un reforzador se reduce en función de cuánto tiempo se tiene que esperar para obtenerlo. Osease, la FUNCIÓN DESCONTADORA DEL VALOR: V = M / (1 + KD) V: valor del reforzador. M: magnitud de la recompensa. D: demora. K: tasa descontadora. Cuanto más se demora el reforzador, menos es su valor (+D...