Tema 10. Condicionament operant PDF

Title Tema 10. Condicionament operant
Course Processos Psicològics: Aprenentatge i Condicionament
Institution Universitat Autònoma de Barcelona
Pages 10
File Size 499 KB
File Type PDF
Total Downloads 34
Total Views 132

Summary

Download Tema 10. Condicionament operant PDF


Description

Aprenentatge i condicionament

Bloc III. aprenentatge associatiu: el condicionament instrumental Tema 10: Fonaments del condicionament instrumental o operant 1. Introducció al condicionament instrumental 2. Antecedents històrics del condicionament instrumental: E. L. Thorndike (1874-1949) i B. F. Skinner (1904-1990) 3. El procediment de condicionament operant i la gàbia de Skinner 4. Anàlisi dels elements del condicionament instrumental a. La resposta instrumental b. Les conseqüències de la resposta c. Tipus de reforçadors 5. Procediments bàsics de condicionament instrumental

És un tipus de condicionament associatiu

1. Introducció al condicionament instrumental -

Ass Associ oci ociació ació re resp sp spost ost osta-co a-co a-cons ns nseq eq eqüè üè üènci nci ncies es (no es fa entre estímuls) R --> conseqüències

La conducta és l’instrument o mitjà a través del qual aconseguim unes determinades conseqüències. Aquesta conducta no té uns estímuls que la causin. Tenen un estímul que s’associa a la resposta, no és E --> R sinó R --> E. Així com en el condicionament clàssic aprenem predic prediccio cio cions ns ns, que un estímul és causa d’un altre, en el instrumental o operant es basa en control control, adquirir control del què ens passa, a través de la nostra conducta. Si aprenem que una conducta té unes conseqüències, tindrem un control sobre aquestes conseqüències. Si fem la conducta apareixen els estímuls conseqüents, i sinó la fem, no hi haurà estímuls conseqüents.

2. Antecedents històrics del condicionament instrumental El primer autor que va estudiar el condicionament instrumental, (sense donar-li aquest nom ni adonar-se que estudiava això), va ser Eduard Thorndike (1874-1949). 107

Aprenentatge i condicionament -

Tenia un interès sobre les capacitats mentals, sobretot en intel·ligència animal, així que va estudiar les capacitats d’aprenentatge indirectament.

-

Posava els seus subjectes en situacions que suposaven un problema per l’animal i estudiava com aquests solucionaven els problemes, no pas per raonament sinó que el mecanisme que es donava era a través de l’aprenentatge assaigassaig-err err error or (antecedent del condicionament instrumental) o

Fa experiments amb laber laberiints i observava com un pollet per exemple aprenia arribar al final on havia menjar.

o

Un altre aparell van ser les caixe caixess p pro ro robl bl blema ema (puzzle box o caixes de Thorndike)

*Mesures de la resposta en les puzzle box--> temps des de que tancava l’animal a la gàbia fins que sortia, és a dir, mesurava la latència.

Puzzle box El gat que veia el menjar fora, feia conductes a l’atzar fins que es donava una conducta atzarosa que donava lloc a unes conseqüències, en aquest moment, s’enforteix i es forma una associació entre la resposta i les conseqüències, és per això que la latència cada cop anava disminuint.

Thorndike a més, proposa la llei d de e l‘e l‘efec fec fecte te (Animal Intelligence, 1911) “Si una resposta, realitzada en presència d’una determinada situació, és seguida per un esdeveniment satisfactori, l’associació entre els estímuls de la situació i la resposta s’enforteix; si és seguida per un esdeveniment insatisfactori o molest, l’associació es debilita” si una resposta feta en una determinada situació té com a conseqüència un esdeveniment satisfactori, l’associació entre la situació y la conducta s’enfortirà. Inversament, si una conducta fet en presencia d’una situació té com a conseqüència un esdeveniment insatisfactori o molest, l’associació i la resposta es debilitarà. Encara no s’ha trencat amb el condicionament clàssic, perquè proposa què hi ha estímuls situacionals que provoquen la resposta. Aquesta proposta de la llei de l’efecte, es rebutja posteriorment per Watson i d’altres. Es parlava d’esdeveniments satisfactoris i insatisfactoris i el van rebutjar donat que pensaven que

108

Aprenentatge i condicionament era subjectivisme i ells proposaven un conductisme, veien la proposta poc objectiva i diferent del condicionament clàssic.

Finalment s’adonen de l’existència del condicionament instrumental i és Skinner el que proposa i formula teòricament aquest nou tipus d’aprenentatge associatiu.

Skinner (1904-1990) Llei de dell re refor for força ça çame me ment nt (la conducta dels organismes, 1938) “la freqüència d’emissió d’una conducta és modificada per les seves conseqüències” Skinner proposa que la llei de l’efecte té bones idees i cal tenir en compte el paper de les conseqüències tan sols, donat que la llei de l’efecte no acabava de trencar amb el condicionament clàssic, i amb això formula la llei del reforçament.

Skinner s’adona que la conducta operant o respostes instrumentals no és causada per estímuls antecedents, simplement proposa que la freqüència d’emissió d’una resposta és modificada o determinada per les seves conseqüències. Les respostes s’emeten, no són provocades o elicitades per estímuls. Una conducta emesa és una conducta que es fa de forma lliure, voluntària i que no és provocada per cap estímul.

Comparació llei efecte i llei del reforçament El superior és la llei de l’efecte 1. La caixa problema li provoca aquesta conducta y les conseqüències reforcen o debiliten l’associació. Les conseqüències modulen aquesta connexió. 2. No hi ha cap estímul que causi la resposta instrumental, sinó perquè aprenem que s fem una conducta tindrem unes conseqüències. Es parla d’una resposta que s’emet o no en funció de l’experiència prèvia, perquè són les conseqüències les que modulen aquesta conducta, augmentar la freqüència en què es fa una conducta (núm. vegades/temps).

109

Aprenentatge i condicionament 

S’eliminen estímuls antecedents o situacionals



S’eliminen termes de subjectivisme

3. El procediment de condicionament operant i la gàbia de Skinner  Pràctica 4  Domjan La caixa de Skinner (1930-1932) -

Manipulandum: palanca o tecla

-

Dispensador: pellet (boleta de menjar)

-

Menjadora: on cau el pellet

-

Registre acumulatiu: aparell que de forma automàtica registra la resposta, taxa de resposta (rs/min) o freqüència al llarg de tota la sessió experimental.

Si l’animal no apreta la palanca, es traça una línia recta. En el moment que s’apreta la palanca, la ploma fa un moviment ascendent (però no disminueix). Si l’animal apreta la palanca es presenta el menjar, es a dir, la conseqüència i es fa una ratlla obliqua (que implica la presentació de conseqüència). Si després fa una altra resposta continuarà ascendint, si arriba un moment 110

Aprenentatge i condicionament que no hi cap al paper, la ploma torna a disminuir. A major inclinació del pendent, major taxa de resposta i viceversa.

Procediment Moldejament per reforçament diferencial de les aproximacions successives (shaping). Es moldeja la conducta de manera gradual. Per això em de fer que aprengui una conducta que no es troba al repertori conductual del subjecte. La conducta que volem que faci és la conducta final, i per això observem les conductes que fa i busquem un element que sigui com un pas de la conducta final. Per exemple: si volem que un nen toqui el piano, sabrem que el nen té una conducta de apretar una tecla. Per tant hem d’analitzar el repertori conductual i torbar una conducta que sigui un pas necessari per assolir la conducta final. Per això és parla de moldejament. Les rates no apreten palanques (conducta final) i utilitzem una conducta prèvia, que no sempre és la mateixa, poden ser diferents. Per exemple, podríem escollir com a conducta inicial, apropar-se a la palanca, perquè no es pot apretar la palanca si no està a prop. Fixem la conducta inicial i esperem a que es doni la conducta inicial. Quan es doni, donar-me la conseqüència i això modificarà la conseqüència, la resposta, de manera que ho farà més freqüentment, però com no volem aquesta conducta, el moment que la faci haurem de superar un següent pas. 1. Sessió d’adaptació a l’aparell experimental Es posa l’animal en la caixa i no es fa res, perquè hi hagi una línia basal (la no resposta) i que l’animal s’adapti, i reduir les respostes d’orientacions. 24h després..... 2. Sessió de moldejament (acabarà apretant a palanca) Situació inicial, apropar-se a la palanca, s’apropa i cau menjar (conseqüència). Esperem a que l’animal s’allunyi i es torni a apropar per tal de presentar el menjar. En el moment que la rata ja no s’allunya, y que de forma consistent s’ apropi al menjador, es passa a una altre aproximació successiva. Ara en aquest moment no reforcem la conducta anterior, la d’aproximar-se, volem que faci una més complexa així que reforçarem una nova conducta. Hi haurà una altra conducta inicial a moldejar, la d’olorar (apropar el nas al menjador). Quan s’apropi no hi ha menjar, però quan olora, si hi ha menjar. La següent conducta pot ser contactar una pota amb la palanca, quan la toqui menjar, però no menjar quan s’apropa o olora. Finalment, quan ja toques consistentment la palanca, per assaig error l’apretarà la palanca. Quan l’accioni finalment tindrà menjar i no quan s’aproximi, l’olori o la toqui. Aquí ja s’ha condicionat i 111

Aprenentatge i condicionament el menjar es dóna ja no per l’experimentador, sinó per la rata mateixa. Aquesta conducta que espontàniament no es fa, s’acaba fent per poder menjar donat que està privat de menjar). És molt eficient perquè s’aprengui conductes noves, i es fa de manera gradual. És molt important el paper de la motivació atès que si l’animal no estigués privat de menjar, estigués saciat, seria molt difícil que es condicionés, impossible. Per tant, la conseqüència ha de ser important pel subjecte i només és important si és prou motivant.

4. Anàlisi dels elements del condicionament instrumental Elements que intervenen:

La resposta instrumental: R o RC (po (pott sser er q qu ualse alsevo vo voll re resp sp spost ost osta) a) Podem condicionar instrumentalment molt tipus de conceptes: respostes condicionades, cognicions (imaginació), respostes fisiològiques, etc. Quina és la resposta operant ho escollim nosaltres arbitràriament. No hi ha cap relació entre la resposta i l’estímul que presentem com a conseqüència. La resposta condicionada instrumental pot ser un sentiment, una emoció, un pensament, una resposta fisiològica, etc. Un pensament pot comportar una emoció agradable la freqüència del pensament augmentarà. Així doncs, la resposta instrumental pot ser qualsevol resposta que es trobi en el repertori habitual de l’organisme, però hi ha limitacions en funció de l’estímul reforçador que utilitzem. D’altra banda, com menys esforç requereixi, més ràpidament s’assolirà.

Tot i que l’anomenem RC sabem que no està provocada per l’associació de dos estímuls, sinó que és una resposta condicionada instrumental.

Hem de destacar: -

Pot ser qualsevol resposta que es trobi en el repertori habitual de l’organisme 112

Aprenentatge i condicionament -

Hi ha limitacions en funció de l’estímul reforçador que utilitzem

-

Quan menys esforç requereixi més ràpidament s’assolirà

Conseqüències de les respostes: *no són conductes inapropiades en càstig i apropiades en reforçament, en cada cas hi ha conductes apropiades o inapropiades. o

Conseqüències que augmenten la freqüència de resposta--> condicionament operant de re refor for força ça çamen men mentt

↑R

Qualsevol esdeveniment que augmenta la freqüència d’emissió de la resposta a la qual segueix --> ER o

Conseqüències que disminueixen la freqüència de resposta--> condicionament operant de càsti àstigg

↓R

Refo Reforrçam çament ent ent:: dóna lloc a un increment en la probabilitat d'aparició d’una conducta. Tipus de condicionament operant en què, per les conseqüències que l’han seguida, una resposta augmenta de probabilitat o freqüència. La conseqüència serà l’estímul reforçador. Els estímuls que segueixen a una resposta operant, que l’efecte que tinguin sigui reforçar (enfortir) la resposta. Existeix, llavors, l’estímul reforçador: qualsevol esdeveniment que succeeixi després de realitzar la conducta i que provoqui un augment de la seva probabilitat d’aparició. Qualsevol estímul no és un estímul reforçador, serà reforçador quan el presentem i la conducta posterior augmenti de freqüència.

Estí Estímu mu mull re refor for força ça çador dor (E (Er): r): qualsevol esdeveniment que augmenta la freqüència futura d’emissió de la resposta a la qual segueix. És a dir, és qualsevol fet que succeeixi després de realitzar la conducta i que provoqui un augment de la seva probabilitat d’aparició.

Càs Càstig: tig: dóna lloc a una disminució en la probabilitat d’aparició d’una conducta. En aquest cas, la presentació dels estímuls que segueixen una resposta operant produeixen un efecte contrari al reforçament, és a dir, disminueixen la freqüència de la resposta. Per tant, la conducta es fa menys probable. No hi ha cap estímul reforçador, perquè, de fet, la conseqüència disminueix. És a dir, el càstig dóna lloc a una disminució en la probabilitat d’aparició d’una conducta.

113

Aprenentatge i condicionament Tipus de reforçadors 

Inco Incond nd ndici ici icion on onats, ats, pri prim maris o iin nnat natss Existeixen estímuls que, sense necessitat de cap aprenentatge previ, actuen com a reforçadors. Per tant, actuen de manera innata. Actuen com a tal sense necessitat d’experiència prèvia per part del subjecte. Exemples: aliment, aigua, temperatura ambiental adequada (no cal experiència prèvia amb el fred), etc.



Con Condi di dicio cio cionats nats nats,, ssecu ecu ecund nd ndar ar aris is o ap apres res resos os Han estat consistentment associats a un reforçador primari. Aquest tipus d’estímuls provenen d’un aprenentatge previ, és a dir, han adquirit la propietat reforçadora a partir d’un condicionament clàssic. Actuen com a reforçadors només si en l’experiència prèvia del subjecte s’han associat a reforçadors primaris. Exemple: so que precedeix l’aliment. Pitjar una palanca (resposta reforçada amb el menjar). Quan l’animal pitja la palanca s’emet un so de forma immediata (aquest so d’entrada no actuaria com a estímul reforçador). Però si s’associa el so amb el menjar, en un moment donat quan la recompensa que li entreguem no sigui el menjar sinó el so, aquest últim actuarà com a reforçador secundari, ja que s’haurà associat amb un primari (menjar). Potser una música s’ha convertit en un reforçador secundari, atès que ja s’ha associat amb una etapa molt feliç de la teva vida.



Gen Gener er eralit alit alitza za zats ts Són estímuls reforçadors apresos però, a diferència dels secundaris, no han estat a un estímul reforçador primari sinó a més d’un. Han estat consistentment associats a diversos reforçadors primaris o condicionats. S’han convertit en reforçadors per condicionament clàssic. Associat no a un, sinó a molts estímuls reforçadors. Exemple: diners, etc.

Algunes aplicacions del condicionament clàssic -

Clínica: modificació de la conducta

-

Escola: aprenentatge programat

-

Esport: arribar a una meta reforçant petites aproximacions

-

Treball: primes de productivitat

-

Entrenament d’animals per ajuda a persones amb minusvalies (gossos pigall), a bombers (rescat de persones), policia (drogues), etc. 114

Aprenentatge i condicionament -

Moldejament de conductes senzilles (minusvàlids, nens, etc.)

-

Autocontrol (establir objectiu, registrar comportament, reforçar comportament desitjat, finalment reduir incentius i reforçament intern).

5. Procediments bàsics de condicionament instrumental Els quatre procediments bàsics de condicionament instrumental es classifiquen en funció del tipus d’estímul que es manipuli (apetitiu o aversiu) i del fet que aquest tipus d’estímul es presenti o es retiri com a conseqüència de la resposta realitzada (contingència positiva o contingència negativa).

Per tant, Tipus de condicionament instrumental en funció de la conseqüència que es presenta després de la conducta: -

Estímul apetitiu

-

Estímul aversiu

O bé quin és l’efecte de la conducta sobre la conseqüència: -

Presentació de l’estímul com a conseqüència de la nostra conducta (contingència positiva entre la resposta (conducta) i la conseqüència).

-

Retirada o no presentació de l’estímul com a conseqüència de la nostra conducta (contingència negativa).

Recordar: un estímul pot ser aversiu o apetitiu i es pot presentar o no però, un no-E apetitiu no vol dir un E aversiu, i un no-E aversiu no és un E apetitiu. Podríem dir que un estímul és positiu perquè sigui apetitiu? NO. El terme positiu fa referència al tipus de contingència, no al tipus de conseqüència (tenir-ho molt en compte perquè és un error freqüent).

115

Aprenentatge i condicionament

Pres Presen en enta ta tació ció (Con (Contin tin tingè gè gènc nc ncia ia pos positiv itiv itiva) a)

Retir Retirad ad ada/n a/n a/no o pres presen en enta ta tació ció (Con (Contin tin tingè gè gènc nc ncia ia ne negativ gativ gativa) a)

E. A Apeti peti petitiu tiu Augmentarà la probabilitat de la freqüència de la conducta, és a dir, la resposta tendirà a repetir-se. Refo Reforrçam çament ent po positi siti sitiu uo Reco Recom mpen pensa sa (Au (Aumen men menta ta la R R E+)

S’ha retirat un estímul apetitiu. La conducta disminuirà. Càs negat Càstig tig negat gatiu iu o en entr tr tren en ename ame ament nt d’o d’omis mis missió sió No est estímu ímu ímull ap apet et etitiu itiu ((aqu aqu aquest est estí estímu mu mull n no o rrep ep cap al altre tre no nom m en con concre cre cret). t).

E. A Aver ver versiu siu Disminuirà la probabilitat de la freqüència de la conducta, és a dir, la resposta tendirà a disminuir. Càstig (po Càstig (positi siti sitiu) u) L’es ’estím tím tímul ul s’a s’ano no nome me mena na pun puniti iti itiu. u. La conducta tendirà a repetir-se perquè la conseqüència serà la retirada d’un estímul aversiu. Aquest estímul s’anomenarà estímul reforçador negatiu. Refo Reforrçam çament ent n nega ega egatiu tiu tiu:: Fu Fugid gid gida/ a/ ev evita ita itació ció (dif (difer er erènci ènci ènciaa ttem em empor por poral al en entre tre eelles) lles) lles).. -Ex de resposta de fugida: conducta d’abrigar-me té com a conseqüència la retirada o evitació del fred. Tinc fred, docs m’abrigo. -Ex de resposta d’evitació: conducta d’abrigar-me abans de sortir de casa (perquè m’anticipo al fred, però encara no l’he sentit).

Exer Exerci ci cici ci 1. Caminar mirant a terra (cond (condu ucta op opera era erant nt o ins instr tr trum um ument ent ental) al) i trobar un bitllet de 50€ (con (conseq seq seqü üèn ència) cia) 

Con Contin tin tingè gè gènc nc ncia ia po posi si sitiv tiv tivaa ref refor or orçam çam çamen en entt p pos os ositiu itiu

2. Fer tard (cond (conduc uc ucta ta op opera era erant) nt) a una cita i trobar que l’altra persona ja ha marxat (con (conseq seq seqü üèn ència) cia) 

Con Contin tin tingè gè gènc nc ncia ia n neg eg egativ ativ ativaa  cà càsti sti stigg po positi siti sitiu u

3. Agafar un camí alternatiu (con (condu du duct ct ctaa oper operan an ant) t) quan sentim a la ràdio que més endavant trobarem un embús de trànsit (el no eemb mb mbús ús és la con conse se seqüèn qüèn qüènci ci cia) a) 

Con Contin tin tingè gè gènc nc ncia ia n neg eg egativ ativ ativaa  rre efor forçam çam çamen en entt n neg eg egatiu atiu  eevit vit vitac ac ació ió


Similar Free PDFs