Vizuális észlelés PDF

Title Vizuális észlelés
Course Kísérleti és általános pszichológia I
Institution Szegedi Tudományegyetem
Pages 19
File Size 595.3 KB
File Type PDF
Total Downloads 149
Total Views 204

Summary

1. tétel Vizuális észlelési folyamatok jellemzése és patológiájaCsépe, V., Győri, M., & Ragó A. (Szerk.) (2010). Általános pszichológia I. Észlelés és figyelem. Osiris Kiadó, Budapest. 1-7. fejezet Sekuler, R., & Blake, R. (2004). Észlelés. Osiris Kiadó, Budapest. 1-8. fejezet, 19-31...


Description

1. tétel Vizuális észlelési folyamatok jellemzése és patológiája Csépe, V., Győri, M., & Ragó A. (Szerk.) (2010). Általános pszichológia I. Észlelés és figyelem. Osiris Kiadó, Budapest. 1-7. fejezet Sekuler, R., & Blake, R. (2004). Észlelés. Osiris Kiadó, Budapest. 1-8. fejezet, 19-317. oldal Általános lélektan 1. előadás diái, jegyzetek + Neuropszichológia diasor (vizuális észlelés sérülései) Közvetlen észlelés: James J. Gibson nevéhez fűződik az ökológiai észleléselmélet kidolgozása. Az elméletrendszer kiindulópontja az, hogy az észlelés aktív és közvetlen folyamat. Az érzékelőészlelő szervezet közvetlenül veszi fel az információt, olyan hatékony rendszerek segítségével, melyek az evolúció során, a környezeti ingerek optimális feldolgozásának céljából alakultak ki. A direkt észlelés nélkülözhetetlen eleme a mozgás, ez biztosítja, hogy a vizuális környezetet különböző szögből észleljük, és a vizuális információkat saját mozgásunkra vetítve értelmezzük. Segítségével vonjuk ki a releváns információt a szemhez érkező összes információ közül, így nincs szükség olyan közvetítő folyamatokra, amelyek az információk értelmezését szolgálják. Gibson szerinte felesleges a mentális mechanizmusok bevonása, hiszen a jelentés nélküli érzékletek és az észlelés megfeleltetése nem többlettörténés, inkább egy kivonás jellegű folyamat. A szervezet kivonja az ingerek ismétlődő, változatlan, úgynevezett invariáns mozzanatait, így ezek az invariáns tulajdonságok a környezet fizikai jellegzetességeinek állandóságát tükrözik, így lehetséges, hogy nincs szükség önálló kognitív struktúrák feltételezésére. Az észlelés tehát nem más, mint a környezeti információknak, mindenekelőtt pedig a változatlan tulajdonságoknak a felvétele. Gibson elméletében a tárgyak lehetséges affordanciája, használati tulajdonsága is meghatározza észlelésünket. Gibson eredeti példája a kivágott fatörzs, amelyet nem egyszerűen csak lapos felületként észlelünk, hanem annak lehetőségét látjuk benne, hogy mire lehet használni (pl.: rá lehet ülni, rá lehet tenni valamit). Ez az úgynevezett tárgyaffordancia. Az akció-affordancia a tárgyak közvetlen észleléséhez kapcsolódó cselekvési komponens (pl.: ha egy békáról, vagy élénk emberről van szó). Mind a két fogalom elválaszthatatlan része az észlelésnek. Gibson szerint a tárgy „rezonál” az akció lehetőségeivel, a direkt észlelés pedig magában foglalja ezeket, mégpedig együtt a tárgyra vonatkozó fizikai információkkal. A fizikai valóság környezeti (kontextuális) jelzései tehát elégséges információt adnak az észlelt tárgyakról, személyekről, azok helyzetéről, illetve használati értékéről. Gibson elmélete és az abból kiinduló közvetlenészlelés-elméletek

alapvetően adatvezérelt (bottom-up), azaz a fizikai valóság tulajdonságai által irányított feldolgozást feltételeznek. Közvetett észlelés: A közvetett (indirekt) észlelés elméletei szerint a környezeti ingerek (input) csak pontatlan és szegényes adatokat nyújtanak a világ tárgyairól és eseményeiről, így az észlelés lényegét csak a meghatározó kognitív műveletek, számítások megismerésével érthetjük meg. Ezek eredményeként egészülnek ki, kapnak jelentést a környezetből beérkező ingerek. Az észlelés konstruktív, azaz beavatkozás, tapasztalat-, ismeret- vagy koncepcióvezérelt (az angolban egyszerűen csak top-down) mechanizmus. A konstrukció egyik alapműködése, hogy a környezeti ingerek forrására vonatkozó információk sémává alakulnak, és ez lesz az, amely az észlelést mintegy felülről irányítva hangolja. Következésképpen az észlelés nem lehet objektív, hiszen az észlelő az érzékelés során feldolgozott fizikai ingerek alapján felépíti, megkonstruálja az észleletet, ezzel pedig magában hordozza a tévedés, a szubjektív torzítás lehetőségét. Az ilyen, úgynevezett mentális számítások (komputációk) során az észlelő élőlény a feldolgozott ingerekhez illeszti, hozzáteszi saját tapasztalatait, elvárásait. A közvetettészlelés-elméletek szerint tehát a világ konstruktív észleléséhez mentális reprezentációra, tudásra, azaz sémákra van szükség. Richard L. Gregory elmélete jellegzetesen konstruktív, azaz top-down észleléselmélet. Legfőbb megállapítása, hogy annak felfogása, hogy éppen mit látunk, elképzelhetetlen előzetes tapasztalat és tudás nélkül. Gregory szerint az észlelés hipotézis-ellenőrzés, eredménye pedig az aktuális ingerek legvalószínűbb magyarázata, értelmezése. A legtöbb esetben ez az értelmezés igen pontos, így nincs szükség arra, hogy alternatív értelmezés után kutassunk. Gregory érvrendszerének egyik érdekessége az értelmező észlelés és a tudományos hipotézisvizsgálat összehasonlítása. Amikor az észlelőrendszerben a hipotézistesztelés pontatlan, akkor következnek be az észlelési illúziók. Az észlelési illúziók természete Gregory szerint eltérő aszerint, hogy valamilyen fiziológiai mechanizmus vagy kognitív stratégia áll-e a hátterükben. Előbbieket nevezi Gregory 1.mechanizmusillúzióknak. Mechanizmusillúzió például a negatív utókép (pl.: fekete-fehér minta eltűnése után inverz utóképet látunk), a vízeséshatás (adott irányban mozgó tárgyról elnézve az álló tárgy ellentétes irányban mozog), az autokinetikus hatás (statikus fénypont a sötétben mozogni látszik) és a phi-jelenség (egymás után elég gyorsan felvillanó pontok folyamatos mozgás látszatát

keltik).

Az

értelmezésnek

köszönhető

illúziókat

nevezi

Gregory

2.stratégiaillúzióknak, és számos formájukat különbözteti meg. Az egyik típusba azokat sorolja, amelyek a vizuális környezet állandóságát biztosítják, ezek az úgynevezett észlelési

konstanciák. A stratégiaillúziók további nagy csoportját képezik a kétértelmű tárgyak, a paradox illúziók (az úgynevezett lehetetlen tárgyak ilyenek) és a kreatív illúziók. A hetvenes években számos, Gregory koncepcióvezérelt (top-down) észleléselméletéhez hasonló elképzelés születetett. A messze legkomplexebb Ulrich Neisseré, akinek elméletében egyesül a kognitív pszichológia észlelésfelfogása a szelektív figyelem és a perceptuális készenlét elméleteivel. A konceptuálisan vezérelt feldolgozás elméletei azonban nem képesek számot adni az észlelés pontosságáról, túl nagy hangsúlyt fektetnek az inferenciális folyamatokra. A felülről lefelé irányuló folyamatok hatása ugyanis csak akkor jelentős, ha az ingerek túl gyorsan, vagy torzítottan jelennek meg, hiszen ekkor csökken az alulról felfelé irányuló folyamatok hatása. Gestalt iskola: Első pszcihofizikai modell, mely a látott kép tárgyakká szerveződését írja le (Gestalt jelentése németül: egész). A koncepciót először 1879-ben Wilhelm Wundt írta le, de csak később, a századforduló után, Max Wertheimer, Kurt Koffka és Wolfgang Köhler munkáinak köszönhetően (1923-1947

között) formálódott ki teljesen. A Gestalt-megközelítés

hangsúlyozza, hogy a tárgy (az „egész”) több, mint a részek összessége. 3 fő területre koncentrálták munkájukat: 1. az alakzat és a háttér összefüggései, 2. a csoportosítás szabályai, 3. az alakzatok „jósága”, pregnanciája. Alakká, tárggyá formálódás legfontosabb Gestalt-törvényei: 1. Egyszerűség: minden mintázatot úgy látunk, hogy a lehető legegyszerűbb struktúra szolgál domináns értelmezésként (domináns interpretáció). Az ismert olimpiai öt karikát például tehát valóban mint öt kört észleljük, és nem mint kilenc bonyolult alakzatot (a ábra). 2. Hasonlóság: az egymáshoz hasonló dolgokat egymással csoportosítva, mint egységet észleljük. Ezért látjuk az egymástól egyenlő távolságra lévő köröket és kereszteket, mint sorokat, és nem, mint oszlopokat (b ábra). 3. Jófolytatás

(pregnancia):

azokat

a

körvonalszegmenseket csoportosítjuk

körvonalegésszé, melyek görbülete a legkevesebbet változik, más szavakkal: az egyenes vagy a folyamatos görbület mentén elhelyezkedő pontok tartoznak össze. Ezért látunk egy kört és egy X-et az c-ábrán. 4. Közelség: az egymáshoz közelebbi tárgyakat csoportosítjuk (d ábra). 5. Közös sors: az együtt (egy irányban, azonos sebességgel) mozgó tárgyakat egységnek látjuk.

6. Ismertség: a dolgok könnyebben alkotnak csoportokat, ha a kialakuló egész ismert, és könnyen értelmezhető.

Kialakulásuk: tanulás és tapasztalat útján: az egyedfejlődés alatt a környezettel való interakció során észlelt szabályszerűségek alakítják őket. A szabályszerűségeket azonban a vizuális feldolgozórendszer működési sajátosságai határozzák meg. Strukturális felismerési modellek: A

strukturális

modellek

között

Marr

komputációs

megközelítését

és

Biederman

komponensalapú felismerés modelljét kell megemlítenünk. 1.David Marr és kollégái a bostoni MIT-en alkották meg az első olyan tárgyfelismerési modellt, mely komplex módon képes válaszolni a tárgylátás problémáira, mely a kognitív pszichológusok körében máig népszerű. A következő kérdéseket próbálták megválaszolni: „Mit kellene egy számítógépprogramnak tennie ahhoz, hogy egy képen a tárgyakat pontosan regisztrálják? Milyen program lenne erre képes?” A tárgyészlelés folyamatát három fő szinten tárgyalták: 1. a komputációs elmélet, 2. a reprezentáció és a végrehajtó algoritmus, valamint 3. a szükséges hardver. Az elmélet a retinára vetülő képpel kezdődik (1. ábra). Az algoritmus ezután a képben lévő sötét és világos részeket analizálja. Ennek eredménye egy durva első vázlat, amelyen, a képen található vonalak, körvonalak és olyan zárt alakzatok, mint egy kör, ellipszis, is megtalálhatóak már. Ebből a vázlatból azután a Gestalt-szabályok alapján egy a már általunk látott képhez is hasonló, úgynevezett két és fél dimenziós (2,5 D) vázlat keletkezik. A végső lépésben ez a vázlat alakul tovább háromdimenziós (3-D) képpé. A Marrmodell erőssége, hogy könnyen létre tud hozni egy nézőpont független tárgyreprezentációt (ugyanakkor nem világos, hogy hogyan is jön pontosan létre ez a háromdimenziós reprezentáció: sem az elméletben nincs világosan kifejtve, sem kísérleti adatok nem támasztják alá a részleteit).

1. ábra. David Marr komputációs alakfelismerés-elméletének vázlata 2. A Los Angeles-i Irving Biederman által megalkotott komponensalapú felismerés modell vagy RBC-elmélet (Recognition by components) nagyon hasonló az előzőekben vázolthoz, ugyanakkor lényegesen tovább is fejleszti azt. Biederman szerint a tárgyakat határoló körvonalaik konkáv területein részekre bontjuk, és ezek a részek, mint háromdimenziós elemek (henger, kocka, gömb, piramis stb. – 2. ábra) tárolódnak el memóriánkban. Ezek az elemek az úgynevezett geometrikus ikonok, rövidített elnevezésük a geon. A geonok elkülönítése olyan, „nem véletlenszerű” tulajdonságokon alapul, amelyek pusztán véletlenül nem vagy csak nagyon ritkán fordulnak elő (ilyen tulajdonság például az, hogy egy görbe vonal csak speciális nézőpontból látszik egyenesnek, vagy, hogy az egymás felé konvergáló vonalak nem látszanak párhuzamosnak). Emiatt az egyes geonok nézőponttól függetlenül felismerhetők és megkülönböztethetők egymástól. Az, hogy mind a geonoknak, mind a létrehozott tárgynak a felismerése nézőpontfüggetlen lesz, azt jelenti, hogy egy adott tárgynak egy, vagy csak néhány nézőpontját kell a memóriánkban eltárolni. Az RBC-elmélet szerint a világ körülbelül harmincféle ilyen geonból legójátékszerűen felépíthető, ha a tárgyat alkotó geonok közötti térbeli viszonyokat meghatározzuk (a gomba törzsét alkotó henger tetején van a kalapot reprezentáló kúp).

2. ábra. Irving Biederman strukturális alakfelismerés elméletének néhány eleme, geonja

Az RBC-elmélet egyik legnagyobb előnye, hogy korlátozott számú elem felhasználásával képes a tárgyak nézőpontfüggetlen leírására. Ugyanakkor az elmélet nem tér ki arra, hogy számos esetben nemcsak a határoló körvonalak, hanem a tárgyak felülete is fontos a tárgyfelismerésben (gondoljunk például arra, hogy sokkal nehezebb egy piros, mint egy sárga banán felismerése). Többek között azt is nehéz az RBC-elmélet segítségével magyarázni, hogy miként történik az azonos geonokból felépülő, de egymástól részleteikben nyilvánvalóan különböző tárgyak megkülönböztetése, kategorizációja (például számos szék azonos számú és elrendezésű geonból áll, mégis megkülönböztethetőek egymástól). Vita folyik arról is, valójában mennyire nézőpontinvariáns a tárgyak felismerése, és úgy tűnik, hogy ezeket az ellentmondásokat próbálják megoldani a képalapú elméletek. Campbell és Robson: többszörös téri csatorna modell (1960-as évek) csatorna = bizonyos sávszélességre érzékeny neuroncsoportok. Az 1960-as években kezdődött elektrofiziológiai kísérletek paradigmaváltást hoztak a látáskutatásban. Évtizedekig tartó kísérletsorozatokban mára a kutatók leírták az emlősök látórendszerét alkotó egyes kérgi területeket és azok tulajdonságait. Egyik első és legtöbbet vizsgált agykérgi terület a nyakszirti lebenyen elhelyezkedő primer (elsődleges) látókéreg (Broadman 17-es terület, V1) volt. Ennek neuronjairól kiderült, hogy eltérő méretű és irányú vizuális ingerekre a legérzékenyebbek. Campbell és munkatársai (Campbell-Robson 1968, Blakemore-Campbell 1969) voltak az elsők, akik felvetették, hogy ezek a neuronok fontos szerepet játszhatnak a körvonalak detekciójában és a perceptuális szegregációban. Elméletük szerint a látórendszer olyan neuroncsoportokból áll, melyek legjobban egy adott téri frekvenciasávra érzékenyek, vagyis téri frekvenciaszűrőkként működnek. Fő gondolatok: 

Minden látvány leírható világosabb és sötétebb régiók (sávok) téri elhelyezkedéseként – azaz meghatározott téri frekvencia mintázatokként



A vizuális kéreg sejtjei a látvány téri frekvencia mintázatainak analízisét és szintézisét végzik el (nem pedig az egyes vonásokat vonja ki).



A kisebb receptív mezejű neuronok a magasabb, míg a nagyobb receptív mezejű neuronok az alacsonyabb téri frekvenciákra reagálnak a legjobban, így mintegy többszörös, egymástól független téri frekvenciacsatornákat hoznak létre, és a látott kép Fourier-analízisét végzik el.



A magasabb térbeli frekvenciákra érzékeny neuronok a finomabb részletek, az alacsonyabb térbeli frekvenciákra érzékeny neuronok a durvább mintázatok felismerésében játszanak inkább szerepet.



A

téri

frekvencia

mintázatok

matematikailag

leírhatóak



elemezhetőek

szinuszhullámok összegeként (Fourier-analízis)



Fourier-analízis: Eljárás bármilyen idői, vagy téri jel frekvenciatartalmának számítására, vizuális jelenet, vagy bármilyen célinger téri frekvenciájának meghatározására alkalmas.



A látórendszer működése leírható különböző téri frekvenciákra hangolt csatornák („sávszűrők”) párhuzamos működéseként



“KI” és “BE” sejtek funkciói: ezek más néven az on/off, bemeneti, illetve kimeneti sejtek a retinán. Az on sejtek kisülést váltanak ki a kérgi sejtből, az off sejtek ezt gátolják Az on sejtek a fény be-, az off sejtek a fény kikapcsolására reagálnak



Összetett rácsok: az egyszerű szinuszos rácsok összegződésének eredményei



Mach-sávok (vagy gyűrűk): középen fekete, a szél felé egyre fehéredő körök. Ahol az átmenetek vannak, 1-1 világosabb vagy sötétebb csíkot lát az ember. Vagyis széli gátlás van a mezők között, ez biztosítja az éles látást.

Előnyök: 

A rács lehetséges „szótár” a vizuális formák leírásához



Sokléptékű feldolgozás magyarázata



Matematikailag jól elemezhető (Fourier analízis)



Használható az ember kontrasztérzékenységének mérésére (KÉF)

Korlátok: 

Jól magyarázza a korai látás egyes sajátságait, de más nem: Pl.: alakkonstancia, topdown hatások

Bizonyítéka: Az elmélet legfontosabb bizonyítéka a szelektív adaptációs technikával végzett kísérletekből ered. Blakemore és Campbell (1969) több percen át mutattak a kísérleti személyeknek egy adott (7,5 ciklus/fok) térbeli frekvenciájú rácsmintázatot (adaptáció), miután azt találták, hogy az alanyok érzékenysége erre a mintázatra lecsökkent. Az érzékenységcsökkenés szelektív volt az adott térbeli frekvenciára, ami arra utalt, hogy az egyes térbeli frekvenciákra hangolt neuronok egymástól független csatornákon dolgozzák fel a látott információt. Mélységészlelés alapjai: Tudnunk kell, hogy a tárgyak, hol helyezkednek el a háromdimenziós térben, más szóval milyen messze vannak tőlünk, ahhoz, hogy megfelelően reagáljunk az adott szituációra. Erre a képességünkre a mélységészlelésként utalunk, a tárgy elhelyezkedésének hozzánk

viszonyított irányát pedig énközpontú iránynak nevezzük. Énközpontú irány: egy tárgynak az észlelő jelenlegi helyzetéhez viszonyított elhelyezkedése, ezt kétdimenziós koordináta rendszerben (fent-lent; jobb-bal) meg lehet adni. A tárgyaknak megmarad ez a kétdimenziós elrendezése a szem hátulsó részére vetülő képén, tehát a kétdimenziós retinális kép megtartja az énközpontú koordináta rendszer összes fent-lent és jobb-bal irányú információját. A mélységészlelés fogalmát két, egymástól eltérő módon használhatjuk: 1. megfigyelő és tárgy távolsága (abszolút távolságnak is nevezhetjük), 2. két tárgy, vagy egyetlen tárgy, különböző részei közötti távolság (viszonylagos távolság). A távolsági- és mélységinformáció forrásaira, a távolság jelzőmozzanatai kifejezéssel is utalhatunk. Ezeket két nagy csoportba oszthatjuk: 1. szemmozgásos jelzőmozzanatok Általában kinesztetikus természetűek, ez azt jelenti, hogy a jelzőmozzanat az izom összehúzódás érzetéből származik. Önmagukban csak korlátozott szerepet játszanak a mélységészlelésben. o Akkomodáció: A szem optikai erejének változása, amit a lencse alakjának átmeneti változása hoz létre. o Konvergencia: A szem azon képessége, hogy befelé forduljanak egy közeli tárgy fixálása céljából. 2. látási jelzőmozzanatok Valóban vizuális természetűek, további két csoportra osztható. 

monokuláris (egyszemes) jelzőmozzanatok:  statikus jelzőmozzanatok:



takarás Amikor az egyik tárgy eltakarja, vagy elhomályosítja a másik tárgy egy részét, a részben eltakart tárgyat automatikusan távolabbinak észleljük.

Egy

tárgy

takart

részeinek

észlelését

amodális

kiegészítésnek nevezzük.



méret Ahogy köztünk és egy tárgy között változik a távolság, a tárgy képének a mérete is megváltozik a retinán. Ha ismerjük egy tárgy méretét, retinális képének méretéből meg tudjuk ítélni, milyen messze van a tárgy. Ismeretlen tárgy esetében azonban a retinális

kép semmilyen egyértelmű jelzést nem ad a távolságról. Nem csak a méret határozhatja meg az észlelt távolságot, hanem az észlelt távolság is befolyásolhatja a látszólagos méretet. Erre példa az Ames-szoba és a holdillúzió (a Hold a horizonton sokkal nagyobbnak tűnik, mint a fejünk fölött, a zeniten).



perspektíva A felszínek, vagy tárgyak megjelenése változik, ahogy a megfigyelőtől valóságban

távolabb

kerülnek.

párhuzamos

vonalakat,

Lineáris a

perspektíva:

megfigyelő

még

a is

összetartónak látja (képi megjelenítése nagyon erős mélységérzetet kelt). Ames-szoba esetében a lineáris perspektíva, által keltett mélységérzet befolyásolta a méretet. Textúragrádiens: ha a felület nem merőleges a látótengelyünkre, úgy tűnik, mintha a textúrája változna a távolsággal (James J. Gibson támasztotta elsőként alá). Levegőperskeptíva: a távolabbi tárgyakat nem látjuk olyan tisztán, mint a közelebb elhelyezkedőket. Azért jelenhet meg, mert a fény szóródik, miközben áthalad a levegőn, a fény szóródása csökkenti a kontrasztot, ezáltal a tárgyak részleteinek tisztaságát (a távolabbi tárgyakról visszaverődőnek „több levegőn” kell keresztülhatolnia). Árnyékolás: a lapos, kétdimenziós felületek nem vetnek árnyékot, a látórendszer az önárnyékot a háromdimenziós tárgyakhoz kapcsolja...


Similar Free PDFs