Chapitre 1 - statistique- ANOVA PDF

Title Chapitre 1 - statistique- ANOVA
Author Sara Svtre
Course Psychologie Clinique
Institution Université de Reims Champagne-Ardenne
Pages 10
File Size 311.1 KB
File Type PDF
Total Downloads 18
Total Views 133

Summary

statistique- ANOVA...


Description

Informations diverses : ➢ Le CM se déroule sur 10 semaines. ➢ Un CC se déroulera le 20 Novembre (50% de la note). Il n’y aura que des exercices. Il portera exclusivement sur les tables d’ANOVA. ➢ L’ET aura une partie théorique et une partie exercice (50% de la note). ➢ Les formules les plus complexes seront fournies à l’examen.

INTRODUCTION Ce CM est composé de 3 chapitres : 1. Mesures indépendantes 2. Mesures répétées 3. Contrastes analytiques Les 2 premiers chapitres sont les 2 grandes catégories de plans d’expériences. I.

PREREQUIS

L’analyse de variance vise à comparer des moyennes. C’est la technique la plus utilisée en psychologie pour les traitements statistiques. Cela suppose, pour l’utiliser, d’avoir des variables numériques (sur lesquelles je peux calculer une moyenne). Une variable numérique est une variable qui correspond à quelque chose de réel, ce n’est pas un code attribué à une réponse qualitative. Ex : le temps de réaction. On ne peut faire des analyses de variance sur des effectifs. En général, en psychologie, les moyennes concernent les performances d’un individu. On va comparer des scores de performance d’un individu par rapport aux scores des individus du groupe en général. L’analyse de variance permet de comparer les deux. Ces performances moyennes sont issues de la méthode expérimentale. Ex : comparer les performances d’un groupe de femmes et d’hommes. Il faut prendre des précautions méthodologiques au préalable. La méthodologie et les statistiques sont deux choses différentes. On peut faire des statistiques sans méthodologie, mais les résultats seront impossibles à généraliser. L’analyse de variance nécessite deux conditions : ➢ Avoir deux moyennes. ➢ Comparer ce qui est comparable : il faut que les tests soient les mêmes pour les deux individus/groupes à partir desquels on va faire les moyennes. L’analyse de variance s’apparente au t de Student. C’est un test qui vise à comparer des moyennes. L’analyse de variance a le même objectif. Elle a deux avantages par rapport au t de Student : ➢ Elle permet de comparer plus de deux moyennes. ➢ Elle permet d’étudier l’interaction entre deux variables. On peut étudier les effets principaux et d’interaction.

II.

LES PLANS D’EXPERIENCE

Petit rappel sur les effets d’interaction : les sujets sont représentés par la lettre « S ». Il y a des facteurs différents : ils peuvent être catégoriels par exemple (groupe des femmes, population schizophrène, population de tout venant, enfants de 6 ans…). Ce facteur est noté « A ». Il peut représenter : ➢ Un groupe : cette variable permet de catégoriser les personnes en groupe. Il peut y en avoir plusieurs. Exemple : la variable A peut avoir 4 modalités (enfants de 6, 7, 8, 9 ans dans une étude développementale). Cela dépend des plans d’expérience. Le nombre de modalités définit le nombre de moyennes. Dans un plan d’expérience, j’ai donc a minima un sujet et un facteur A. Lorsqu’on a plusieurs groupes, on n’a pas les mêmes sujets dans les groupes. C’est ce qu’on appelle un car ce que je connais d’un sujet dans un groupe ne me donnera aucune information sur ce qui se passe dans un autre groupe) : Un sujet est attribué à une des modalités de la variable. ➢ Une condition : on compare les résultats obtenus à différentes tâches ou épreuves. Je n’ai pas de groupe mais des conditions expérimentales. Exemple : on passe une tâche visuospatiale et une tâche verbale. On obtient deux scores par individu. C’est un . Un sujet se distribue dans toutes les modalités de la variable. . Le facteur A est la variable « sexe » (être un homme A1 ou une femme A2). Le ² signifie qu’il y a deux modalités. Le facteur B est la variable « âge » (être jeune B1, ou être vieux B2). Il est possible d’étudier l’effet du sexe seul, ou de l’âge seul, ou de l’interaction des deux seuls. A1 : HOMME

A2 : FEMME

B1 : JEUNE B2 : VIEUX

Femme âgée

S*A²*B² : plan croisé à deux facteurs. A1 est la tâche verbale. A2 est la tâche visuospatiale. Les individus passent les deux tâches. B est le niveau de difficulté de la tâche : simple (B1) ou difficile (B2). On a donc 4 conditions expérimentales : A1 : TÂCHE VERBALE B1 : SIMPLE B2 : DIFFICILE

A2 : TÂCHE VISUOSPATIALE

Le sujet est dans toutes les conditions. Il obtient 4 résultats. ➢ Il est possible d’avoir des plans mixtes : un facteur est croisé et l’autre est emboîté. S*B. Exemple : des hommes et des femmes qui passent tous les deux des tâches visuospatiales et verbales. Dans chacun de ces plans, il y a des différences statistiques majeures D’autres éléments sont indispensables : le nombre de sujets doit apparaître dans le plan d’expérience. On l’indique par N, qui est la taille de l’échantillon globale. Dans l’écriture du plan d’expérience, on le note « S ». Exemple : si dans un plan emboîté j’ai S20 , j’ai 80 sujets. Si dans un plan croisé j’ai S20*A², j’ai 20 sujets mais 40 observations. Si S20*A²*B², j’ai toujours 20 sujets mais avec 80 observations. Les plans d’expérience permettent de voir le nombre de sujet, de groupes, de conditions… il donne toutes les informations. On connaît la nature du plan (répété ou à mesure indépendante). Le plan d’expérience décrit comment sont agencés les groupes et/ou les conditions et avec quelle méthodologie les données ont été recueillies.

III.

RAPPEL SUR LES VARIABLES DEPENDANTES ET INDEPENDANTES

Les scores recueillis (la variable que l’on mesure) sont appelés variables dépendantes. On l’appelle comme cela car elle dépend du sujet qui nous la donne, elles dépendent de nous, correspondent à la mesure. A et B (les variables, facteurs…) sont des variables indépendantes : elles ne dépendant pas du sujet, qui ne sait pas ce que le chercheur manipule, en tant que sujet quand j’appartiens à une modalité ça veut dire que je ne peux pas appartenir aux autres modalités. Exemple : si je suis une femme, je ne peux pas appartenir à la catégorie des hommes. Dans un plan à mesure indépendante, ce ne sont pas les mêmes sujets qui participent aux modalités de la variable indépendante. Ex : connaitre le score d’une femme ne permet pas de prédire le score d’un homme. Dans ce plan, les sujets ne voient qu’une seule modalité de la variable indépendante. Un plan d’analyse ne porte que sur une VD. Plusieurs questions sont à se poser : ➢ Quelle est ma mesure VD ? Cette mesure doit être numérique. ➢ Combien j’ai de facteurs (VI) ? ➢ Combien chaque facteur a de modalités ? ➢ Combien j’ai de sujets ? ➢ Combien j’ai d’observations ? Les mesures répétées se trouvent dans les études dans lesquelles les sujets passent toutes les modalités d’une variable. Fréquemment ce sont des conditions où on varie du matériel. Ex : on va appréhender les performances en maths ou en français des étudiants de psychologie. Dans ce cas-là, ce n’est pas pertinent de faire des mesures indépendantes. La condition méthodologique est que la mesure doit être sur la même échelle pour toutes les variables.

Dans les plans à mesure répétée les sujets voient l’ensemble des modalités de la variable indépendante. La motivation à avoir des mesures répétées ou indépendantes est méthodologique et dépend des hypothèses. Chapitre 1 : 1. Plan à un facteur S30 N=60 (sujets/observation) 2. Plan à deux facteurs S30 N=120 (sujets/observation) Chapitre 2 : 1. Plan à 1 facteur S60*A2 N=120 (scores/observation) 2. Plan à 2 facteurs S30*A2*B2 N=120 3. Plan mixte S30*B2 N=120

CHAPITRE 1 : LES PLANS A MESURE INDEPENDANTE I.

Introduction

Le modèle structurel de l’ANOVA à mesures indépendantes découle du modèle linéaire général en statistiques. Exemple : l’objectif est d’essayer d’expliquer la taille x d’un individu lambda. On sait que la taille moyenne des humains est de 175cm (x=175). Sachant que lorsqu’on est un homme, cela rajoute 6cm. Hors, l’homme que l’on a mesuré fait 178cm. Donc : X = 175+6+(-3). -3 est l’erreur, c’est ce que notre modèle ne nous permet pas de prévoir. X=μ+τ+ε X est le score d’un individu. µ est la grande moyenne. C’est l’ensemble des scores de tous les sujets ayant participé à l’expérience. τ est l’effet des tr à l’échelle de l’échantillon. C’est l’effet supposé de la variable indépendante. Degré en valeur absolue avec lequel chaque moyenne ma s’écarte de la moyenne générale. Sur l’ensemble des scores, il correspond à la somme des ε est la caractéristique individuelle du sujet. C’est comment le score de l’individu s’écarte de la – (µ+τ). C’est l’erreur individuelle, qui n’est expliquée ni par la moyenne de l’échantillon, ni par la moyenne du groupe d’appartenance. Cela

On peut donc chiffrer la part explicable par la caractéristique de l’individu et la part variable qu’est l’erreur. Une moyenne peut être représentative d’une population comme elle ne peut ne pas l’être. Si ε est aussi grande que τ, on ne peut rien prédire, le modèle n’est pas pertinent. Le modèle linéaire permet de quantifier sur l’ensemble des individus la part liée au traitement et la part liée au traitement et la part liée à l’erreur. Le modèle structurel ne porte que sur la population (pas d’échantillon). Exemple : On participe à une expérience dans laquelle on nous demande de mémoriser des mots. On attribue les sujets aléatoirement dans un groupe parmi 3 groupes. ➢ Le groupe 1 doit lire des mots et leur trouver des rimes. ➢ Le groupe 2 doit essayer de former des images à partir des mots. ➢ Le groupe 3 doit mémoriser les mots pour les rappeler ultérieurement. Pour tous les groupes de sujets, on demande de rappeler les mots. On compte le nombre de mots correctement rappelés (VD) en fonction de la consigne (VI). Le plan est donc le suivant : S. Les 3 modalités sont : rimes, images, ou intentionnel. Les scores sont les suivants :

Sujets 1 2 3 4 5 6 7 8 9 10 m

Rimes (1) 7 9 9 6 6 11 6 3 8 7 ma1 = 6,9

Sujets 11 12 13 14 15 16 17 18 19 20

Image (2) 12 11 16 11 9 23 12 10 19 11 ma2 = 13,4

Sujets 21 22 23 24 25 26 27 28 29 30

Intentionnel (3) 10 19 14 5 10 11 14 15 11 11 ma3 = 12

On a S10 (10 sujets par groupe). Donc, on a N=30. Le score de chaque sujet est appelé « x ». Par exemple, le score x1a1 est le score du sujet 1 dans la modalité A1. On va ensuite calculer les moyennes par groupe. On les notes « m ». Exemple : mA1, mA2, mA3. On va comparer les trois moyennes pour voir s’il y a un effet de la consigne sur la mémorisation des mots. On peut déjà répondre juste en voyant les moyennes. Pourquoi faire une analyse de variances en plus d’un simple constat de variation de moyennes ? ➢ Car je ne sais pas à partir de quand une variation est importante. ➢ Car je ne tiens pas compte de la variabilité à l’intérieur des groupes. Exemple : les sujets très forts et très faibles. L’analyse de variance permet de calculer une variabilité entre les groupes (variabilité intergroupe) et à l’intérieur des groupes (variabilité intragroupe). Je dois avoir une variabilité intergroupe la plus grande possible, et une variabilité intragroupe la plus réduite possible. La moyenne des groupes est de 10,77. Si l’effet intra est aussi important que l’effet inter, alors il n’est pas notable. Calculer une variance globale :

Σ(x−M)² N−1

. Le numérateur est la somme des carrés (SC).

Pour calculer une variabilité inter : faire mA1, mA2, ou mA3… – M. La variabilité inter dépend de la VI. Pour calculer une variabilité intra : faire x – mA1, ou mA2… La variabilité intra dépend des sujets (comment ils se sentent ce jour-là, etc…). La variabilité intragroupe est appelée « erreur » en statistiques, car elle ne peut pas être expliquée par le plan d’expérience. La variabilité intergroupe est l’effet potentiel de la VI. Si j’ai une erreur à l’intérieur du groupe, pourquoi je n’en aurais pas une entre les groupes ? Ce qu’il se passe entre les groupes est donc une somme de l’effet potentiel de la VI et de l’erreur. On considère que l’erreur observée dans les groupes est à peu près la même entre les groupes. Exemple : dans le groupe 3, un sujet a 10 et un autre 19. Je peux expliquer cette différence par plusieurs choses, mais pas par la VI. C’est donc une erreur. On doit considérer la variabilité intragroupe pour interpréter la variabilité intergroupe.

F = 𝑉𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑡é 𝑖𝑛𝑡𝑒𝑟/𝑉𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑡é 𝑖𝑛𝑡𝑟𝑎 Si les deux sont du même ordre, le résultat sera de 1 : c’est lorsque les deux sont de même nature et qu’on n’a pas d’effet de la VI. Le résultat n’est que le reflet de l’erreur de mesure. La VI n’a pas d’effet sur la VD. Un F...


Similar Free PDFs