Title | Factoranalyse ws - Factornalayse |
---|---|
Author | julei ds |
Course | Gevorderde Analysetechnieken en Onderzoekssoftware |
Institution | Universiteit Gent |
Pages | 8 |
File Size | 271.5 KB |
File Type | |
Total Downloads | 42 |
Total Views | 148 |
Factornalayse...
Verschil cluster- en factoranalyse
Principal Factor Analysis (PCA): factoranalyse Factoranalyse is een datareductietechniek:
Voor een aantal geobserveerde variabelen een kleiner aantal achterliggende, niet observeerbare variabelen identificeren
Set van factoren/componenten bekomen die de beschikbare informatie in de data zo goed mogelijk samenvat
Maximale totale variantie die verklaard kan worden door het kleinst mogelijk aantal lineaire componenten
Kernbegrippen
Latente variabele (factor, component): onderliggende variabele die niet direct observeerbaar is
Bepaalde facetten van dit construct kunnen wel expliciet gemeten worden: manifeste variabelen
Reden: kwantificeren en zo meetbaar maken (vaak nodig bij sociaalwetenschappelijke schalen: abstracte concepten)
Als uit de factoranalyse blijkt dat de manifeste variabelen samen één en dezelfde achterliggende variabele meten, kunnen de items worden samengevoegd tot één schaalvariabele voor die latente variabele
Deze nieuwe variabele is de factor en op die manier kan een groot aantal variabelen gereduceerd worden tot een kleiner aantal
Factorlading: hoeveelheid variantie van een waargenomen variabele die de latente variabele representeert
Twee soorten
Exploratieve factoranalyse (Principale Componenten Analyse, PCA) op zoektocht o
Factoranalyse wordt uitgevoerd zonder dat de onderzoekers op voorhand weten wat de mogelijke latente variabelen zouden kunnen zijn
o
Op basis van de sterkst ladende manifeste variabelen een naam aan de gevonden factoren geven
Confirmatorische factoranalyse (Confirmational Factor Analysis, CFA) ter bevestiging o
Verwachten op theoretische gronden dat we met een aantal manifeste variabelen bepaalde latente variabelen kunnen meten
o
Bevestiging of de vooraf bedoelde latente variabelen met de factoren in verband staan
Factoranalyse in SPSS Analyze > Dimension Reduction > Factor
Factorrotatie: VARIMAX maximalisatie van variantie: factoren makkelijker interpreteerbaar
Leidt tot een Rotated Component Matrix om tot een zo goed mogelijk interpreteerbare structuur te komen
Het interpreteren van factoren is moeilijk omdat variabelen vaak een hoge lading op één factor hebben en een lage op andere factoren
Interpreteren wordt makkelijker als de factoren een rotatie ondergaan, waarbij variabelen een maximale lading krijgen op de ene factor en een minimale lading op de andere factor
Factorladingen worden zo optimaal mogelijk voorgesteld
Startpunt PCA: correlatiematrix
Indien variabelen sterk met elkaar correleren, meten ze aspecten van eenzelfde onderliggend concept en laden dus hoog op dezelfde factor
Variabelen die laag met elkaar correleren, meten een ander onderliggend concept en laden hoog op een andere component
Deze resultaten bieden een opstap voor de factoranalyse: PCA maakt duidelijk wat impliciet in de correlaties aanwezig is (kunnen al enkele verbanden tussen items zien: zouden we componenten kunnen opmaken uit de variabelen?)
Evaluatie: voldoende correlaties > .30 o
Hoofddiagonaal allemaal 1 want is de samenhang tussen de variabele met zichzelf
o
Voldoende correlaties buiten deze diagonaal moeten voldoende hoog zijn
PCA niet zinvol indien veel variabelen een lage correlatie hebben (dicht bij 0)
Correlatie mag ook niet te hoog zijn (dicht bij 1) omdat dit erop kan wijzen dat de variabelen eigenlijk hetzelfde meten
KMO en Bartlett’s Test: indicatoren die aangeven of PCA wel interessant is om uit te voeren op de data
KMO: hoe geschikt is je data voor factoranalyse? o
Maat voor de proportie van de variantie tussen de variabelen die gedeelde variantie zou kunnen zijn
o
Waarde tussen 0 en 1
Indien laag, dicht bij 0: niet relevant
Hoe hoger, hoe beter want meer gedeelde variantie (idealiter > .60)
Bartlett’s Test: statistische toets die nagaat of er een significante relatie is tussen de variabelen o
Belangrijke voorwaarde want PCA modelleert items als lineaire combinaties van factoren
o
Ho: er is geen relatie tussen de variabelen (orthogonaal)
o
Ho verwerpen indien p < .05 data geschikt voor PCA
Total variance explained: verklaarde variantie door de componenten
Hoeveel factoren zitten er in de data? o
Hoeveel rijen lopen door over de volledige tabel?
o
Hoeveel variabelen hebben een eigenwaarde > 1?
Cumulatief %: hoeveel variantie verklaren de componenten samen? Minstens 60%
Rotated component matrix (na VARIMAX): evaluatie en interpretatie van de analyse
Aantal kolommen = aantal factoren in de data
Kijken welke variabele op welke component laadt via factorladingen: correlatie tussen variabele en component (enkel focussen op de hoge, lage negeren)
Op basis van de inhoud van de items kan je de componenten interpreteren en benoemen: wat is de gedeelde betekenis van de items, de reden waarom ze hoog laden op de component
Cronbach’s alpha per factor: maat voor de interne betrouwbaarheid of consitentie: mate van samenhang tussen de items in een schaal die hetzelfde onderliggende concept meten.
Rapporteren: (1) aangeven waar de vragenlijst in het algemeen over gaat (2) de gevonden factoren benoemen en aangeven welke items hiertoe behoren (3) per item de factorlading aangeven (4) de eigenwaarde voor elke factor (5) hoeveel variantie elke factor afzonderlijk verklaard en samen (6) cronbach’s alpha van elke factor...