Programas de reforzamiento PDF

Title	Programas de reforzamiento
Course	Aprendizaje, Motivación y Emoción
Institution	Universitat de Barcelona
Pages	3
File Size	131.3 KB
File Type	PDF
Total Downloads	43
Total Views	145

Preview

CLICK TO PREVIEW PDF

Summary

Download Programas de reforzamiento PDF

Description

Tema 6 1. Los programas de reforzamiento Un programa de reforzamiento es una pauta o regla que determina la forma y el momento en que una respuesta del sujeto irá seguida de un reforzador. Hay dos tipos de reforzamiento, el continuo y el intermitente. El reforzamiento continuo es que después de la conducta viene el refuerzo. Se entregará siempre reforzador después de la conducta. No refleja lo que se encuentra en un ambiente natural ya que pocas veces todas las respuestas van seguidas de una recompensa. De reforzamiento intermitente hay de razón e intervalo. Dentro de los de razón hay razón fija o variable y en los de intervalo también. Programas de razón En el de razón fija, la rata necesitará apretar la palanca 5 veces para obtener el refuerzo, y esto nunca va a variar. Si es razón fija=1, es lo mismo que un programa continuo. Ex: un vendedor del corte inglés, cada 5 prendas de ropa que vende le dan algo más de dinero. El reforzamiento depende sólo del número de respuestas que realiza el organismo, i en este caso el número de respuestas es predecible. Carrera de razón: cada vez que quede menos para llegar a la meta vas más rápido, pero cuando te dan el plus y tienes que volver a empezar vas más lento (pausa postreforzamiento). Este tipo de programa no tiene un rendimiento continuo. Con el de razón variable, vas cambiando cada vez el número de conductas que necesitas para recibir el reforzador, de manera que este no es predecible. Lo que tienen en común estos dos es que dependen del número de conductas del sujeto. Las máquinas tragaperras siguen un programa de razón variable. Como nunca sabes cuándo vas a ser reforzado el ritmo de conductas se mantiene. Programas de intervalo Los de intervalo se diferencian en el paso del tiempo. Las respuestas son reforzadas sólo si ocurren cuando ha transcurrido una cierta cantidad de tiempo. Aunque se necesite que transcurra un intervalo temporal, eso no quita que la conducta se tenga que dar. Si ponemos un intervalo fijo de un minuto no me van a dar el reforzador hasta que no pase ese minuto pero tampoco me lo van a dar si no hago la conducta. Si es fijo, es a partir de un momento. Una respuesta se refuerza sólo si se da después de que haya transcurrido un tiempo desde la última entrega del reforzador. El tiempo establecido no varía de una ocasión a la siguiente. Para recibir el reforzador una vez que está disponible el sujeto tiene que realizar la respuesta instrumental. Al principio la respuesta es baja e inestable pero aumenta a medida que se acerca el reforzador (festón del intervalo fijo). Cuando hemos recibido el refuerzo también hay una pausa postreforzamiento. Si no sabemos cuando recibimos el refuerzo (intervalo variable) el ritmo se mantiene constante y no hay pausas. Una respuesta se refuerza si se dan tras haber transcurrido un intervalo variable desde la administración del reforzador previo. Por lo tanto, es impredecible.

Comparación de los programas de razón y de intervaloƒ El de razón variable es el que tiene ritmo más alto y estable en el tiempo. Los programas de RF y IF producen pausas predecibles en las respuestas después de la presentación del refuerzo. Los programas de RV y IV mantienen tasas estables de respuestas, sin pausas predecibles. En los dos de variable, el sujeto no sabe las conductas que ha de hacer. Si en el examen nos pone RV=8 esto es la media de todas las conductas que necesita el sujeto en cada ensayo. Los dos de variable son los que van a tener más resistencia a la extinción. En el de razón variable porque no es tan obvio que te van a dejar de reforzar porque no sabes si necesitas más conductas o no.

Conducta de elección Programas concurrentes En los programas concurrentes se mide la preferencia (la elección) de los animales por un programa u otro Medida: calcular la tasa relativa de respuesta a cada alternativa. El de razón fija es el preferido por el animal porque sabe cuantas conductas necesita. Para ver preferencias lo hacemos con programas de intervalo variable. TA= tasa de respuesta de la tecla A. TB: tasa de respuesta de la tecla B. Ley de la igualación Hernstein describió que la tasa relativa de respuesta en una alternativa estaba siempre muy cerca a igualar la tasa relativa de reforzamiento logrado en esta alternativa. Es decir, si se conseguía una mayor proporción de reforzador en una opción, se realizaban una mayor respuestas en esa opción (se igualaba). Nuestra tasa de respuesta en procedimientos variables depende de la tasa de reforzadores. Si la tasa de reforzadores es más alta, va a haber más

respuesta en esa tecla que no en la otra. Esta ley se expresa de la siguiente manera: tA: tasa de reforzamiento de la tecla A. tB: tasa de reforzamiento de la tecla B. La tasa relativa de reforzamiento en la tecla A se calcula dividiendo la tasa de reforzamiento en la tecla A dividido por la tasa de reforzamiento en la tecla A más la tasa en la tecla B No siempre se sigue esta ley, se ven tres errores: -

Infraigualación: cuando se responde menos de lo que se espera en el mejor programa. Sesgo de respuestas: tener una preferencia clara por una de las dos teclas. Supraigualación: cuando se responde más de lo que se espera en el mejor programa....