Statistiques - Cours Magistral de Première année de Licence psychologie. PDF

Title Statistiques - Cours Magistral de Première année de Licence psychologie.
Author Laurie Godart
Course Statistiques en psychologie
Institution Université de Paris-Cité
Pages 21
File Size 1.1 MB
File Type PDF
Total Downloads 57
Total Views 151

Summary

Cours Magistral de Première année de Licence psychologie....


Description

Statistiques Introduction Les statistiques sont un outil indispensable pour tous les psychologues… Les statistiques peuvent être plaisantes C’est avant tout une démarche intellectuelle Initier aux premières notions primordiales Rem : il existe de nombreux ouvrages contenant des exercices « Les statistiques, ça se comprend et ça se pratique… » La psychologie et l’ergonomie sont des sciences : Comme pour toutes les disciplines scientifiques, la démarche expérimentale peut être utilisée Rappel de toute démarche expérimentale : -

Le chercheur manipule des facteurs (aussi appelées « variables ») … afin d’en constater les effets sur des indicateurs objectifs, mesurables et quantifiables

Cf. sciences naturelles, physique, chimie Le chercheur recueille donc des données issues de manipulations expérimentales (En psychologie et en ergonomie, les données = des comportements, des états émotionnels, des attitudes, des verbalisations, ….) Les statistiques sont un outil permettant : -

De décrire les données recueillies (rôle des statistiques descriptives) D’analyser les données recueillies…

… Pour notamment déterminer si ces résultats sont généralisables (càd extrapolables sur l’ensemble de la population) (Rôle des statistiques inférentielles) à abordées principalement à partir de L2

1

A1 – Les variables indépendantes (« que l’on manipule ») Une variable indépendante notée VI est une dimension extraite de l’environnement qui peut prendre plusieurs valeurs ou états différents « Indépendante » = indépendante du facteur humain Ces différentes valeurs sont nommées « modalités » Par convention : -

Une variable indépendante (VI) est symbolisée avec une lettre majuscule qui la représente. Par ex : G pour la VI genre A pour âge T pour la VI temps Il n’y a pas de nomenclature précise

Par convention toujours : -

Les différentes valeurs que peut prendre une VI (= les modalités) sont indiquées en lettres minuscules… … Et en indice sous la VI

Par ex : -

La VI « genre » notée « G » a deux modalités : « G1 » et « G2 » avec « G1 » fille et « G2 » garçon (ou inversement, cela n’a aucune importance !) Si un psychologue s’intéresse à 3 groupes d’âges différents à VI « A » pour âge avec 3 modalités : « A1 » 10-11ans « A2 » 12-13ans « A3 » 14-15ans

Il existe 2 grands types de VI : (1) VI invoquées = VI extraites de caractéristiques des participants = VI que le chercheur ne peut créer Ex : Le genre, l’âge, la CSP (métier)… è Le chercheur va sélectionner VI invoquées pour réaliser des comparaisons (par ex : « femmes » versus « hommes » ; « jeunes » versus « âgés ») (2) VI provoquées = VI extraies de caractéristiques de l’environnement = VI que le chercheur peut créer = Conditions créées de toutes pièces pour l’expérience Ex : le temps pour réaliser une tâche, la présence d’un observateur ou non, … è Le chercheur va provoquer ces VI pour tester les impacts (par ex : « tâche facile » versus « tâche difficile » ; « présence de bruit » versus « silence ») 2

Exercice n°1 Un psychologue cherche à voir si les femmes ont un meilleur sens de l’orientation que les hommes. Il demande à 30 femmes et à 30 hommes de rejoindre un point précis en ville en partant d’un même point de départ. La moitié des femmes et la moitié des hommes doit apprendre le plan. La moitié des femmes et la moitié des hommes doit apprendre le plan de la ville avant de démarrer l’étude. L’autre moitié doit également apprendre le plan de la ville, mais pourra regarder deux fois ce même plan durant leur déplacement. -

Quelles sont les VI ? Sont-elles invoquées ou provoquées ? Quelles sont les modalités ?

C Il y a deux VI : VI « genre », notée « G » à deux modalités : - G1 femme - G2 homme è VI invoquées VI « plan », noté « P », à deux modalités : - P1 apprentissage seul - P2 apprentissage + deux consultations è VI provoquées Exercice n°2 Un psychologue cherche à voir les femmes si les femmes ont un meilleur sens de l’orientation que les hommes. Il demande à 45 femmes et à 45 hommes de rejoindre un point précis en ville en partant d’un même point de départ. Un tiers des femmes et un tiers des hommes doit apprendre le plan de la ville avant de démarrer l’étude. Un autre tiers … C Il y a deux VI : VI « genre », notée « G » à deux modalités : - G1 femme - G2 homme è VI invoquées VI « plan », noté « P », à trois modalités : è

P1 apprentissage seul P2 apprentissage + deux consultations P3 : apprentissage + consultation libre VI provoquées

3

A2 – Les variables dépendantes (« que l’on mesure ») Variable dépendante (notée VD) correspond à la mesure de la réponse du participant « Dépendante » = Dépendante du facteur humain Une VD peut-être un temps de réponse, un nombre de réussite (ou d’échec), une opinion (mesurée à l’aide d’une échelle)… La VD est censée fluctuer selon les modalités de la ou des VI Une « bonne » VD doit être : -

Pertinente (=adaptée à ce qu’elle est censée mesurer) Précise et sensible (par ex= nombre de mots lus par minute si on estime la vitesse de lecture)

Il y a deux VI : Les genres L’ambiance musicale Il y a deux VD : Performances Niveau de stress

4

A3 – Les variables « contrôle » (ou contrôlées) Le chercheur veut tester l’impact de variables (VI) sur des indicateurs (VD) … mais des paramètres de l’environnement et/ou du participant sont susceptibles de perturber les résultats. è Il faut donc neutraliser (contrôler) ces paramètres éventuellement perturbateurs =Variables dont on ne cherche pas à connaître les effets… mais qu’il faut maintenir constantes pour éviter de possibles effets

A4 – Le facteur « Participant » Toute étude en psychologie ou ergonomie cherche à tester l’impact de variations de VI (=modalités) sur des réponses de sujets humain Réponses motrices, verbales, comportementales,… Rq1 : La lettre « S » est donc réservée au facteur « sujet » ! Rq2 : De plus en plus, la dénomination « participants » est préférée à celle de « sujets » Par convention, le nombre de sujets par groupe est indiqué en indice : Exemples : • • • •

Si 1 groupe de 32 sujets à S32 Si 2 groupes de 20 sujets à S20 Si 5 groupes de 18 sujets à S18 Si nombre de sujets différent selon les groupes à On ne précise pas S

S15 à 35F, 35H à P = 30, 3 5

A5 – Les relations entre une VI et le facteur « Participant » Deux cas principaux : 1) Soit chaque sujet « voit » toutes les modalités d’une VI - On dit que « S est croisé avec la VI » - Par convention : notée 2) Soit chaque sujet ne « voit » qu’une seule modalité d’une VI - On dit que « S est emboîté avec la VI » - Par convention, notée < > Exemple : Une étude de la vitesse de lecture de textes par des garçons et des filles âgés de 10 à 14ans Il y a trois VI dans cette expérience : VI « Âge » avec 5 modalités (10 ans/11 ans/12 ans/ 13 ans/ 14ans) : A5 è S est forcément emboîté avec cette VI (un sujet ne peut avoir qu’un âge à un moment donné ; il ne « voit » qu’une modalité) Le facteur Sujet « S » est donc emboîté avec la VI « Âge » : S < A5 > VI « Genre » avec 2 modalités : G2 è S est forcément emboîté avec cette VI (un sujet est dans l’une ou l’autre modalité) Le facteur « Sujet » est donc emboîté avec la VI « Genre » : S < G2 > VI « Type de textes lus » avec 3 modalités (narratif, argumentatif, descriptif) : T3 Pour cette VI, le chercheur doit déterminer si : -

S sera emboîté avec cette VI

(=chaque sujet ne lira qu’un seul type de texte) à S < T3< Ou bien si : -

S sera croisé avec cette VI

(=chaque sujet lira les trois types de textes) à S * T3 Mais le chercheur doit écrire dans un seul plan toutes les relations (d’abord les emboîtements, puis les croisements) : S < A5 * G2 > * T3

6

A7 – Comprendre les relations entre les variables Le croisement : S10 * T2 è 1 seul groupe de 10 sujets voient toutes les modalités VI

G2

Modalités

G1

G2

S1

X



X

S10 S11

X X X

…. S20

X

GROUPE DE 10 SUJETS L’emboîtement : S10 < G2 > è 1 sujet ne voit qu’une modalité è Il y a 2 groupes de 10 sujets Le croisement + emboîtement : S10 < G2 > * T3 è 1 sujet ne voit qu’une modalité de G è Il y a 2 groupes de 10 sujets (10 dans G1 et 10 dans G2) è 1 sujet voit toutes les modalités de T Prendre tableau DIAPORAMA Le double emboîtement : S10 < G2 * T3 > è 1 sujet ne voit qu’une modalité de G è 1 sujet ne voit qu’une modalité de T è Il y a 3 * 2 groupes avec 10 sujets par groupe (soit 60 sujets)

7

Rappel ! Il est 3 types de variables : (I) Les variables indépendantes (VI) « Ce qu’on manipule ! » Elles sont : Invoquées : Extraites des caractéristiques des participants (sont créée par l’expérimentateur) Provoquées : Extraites des caractéristiques de l’environnement (sont créées par l’expérimentateur) (II) Les variables dépendantes (VD) « C’est ce qu’on mesure ! » (III) Les variables contrôlées (VC) « C’est ce qu’on neutralise ou contrôle ! » Les plans expérimentaux : S à Variable sujet (S pour sujet -_-) Les VI : A=Age G=Gender Elles sont emboitées : < > Ou croisées * S20 < A3 *> G2 * T3 Pour connaître : -

Le nombre de groupes de sujets à lire l’indice des VI emboitantes

S10 < T3 > 3 groupes S23 < G2 > * T4 à 2 groupes S48 < P6 > * J3 * K6 à 6 groupes S10 < P3 * T3 > * D2 à 3*3 groupes (soit 9 groupes) S15 < K2 * J3 > L4 * H7 2*3 groupes (soit 6 groupes) -

Le nombre de sujets par groupe à Lire l’indice 5

S10 < T3 à 10 sujets par groupe S23 < G2 > * T4 à 23 sujets par groupe S48 < P6 > * J3 * K6 à 48 sujets par groupe 8

-

Le nombre total de sujets participant à l’étude à indice de S x indice de la VI emboîtante

S10 < T3 > 10 x 3 (soit 30 sujets) S23 < G2 > * T4 à 23 x 2 sujets (soit 46 sujets) S48 < P6 > * J3 * K6 à 48 x 6 sujets (soit 288 sujets) -

Le nombre de conditions expérimentales à multiplication des indices de toutes les VI

S10 < T3 > à 3 conditions S23 < G2 > * T4 à 4 x2 conditions (soit 8 conditions) S48 < P6 > * J3 * K6 à 6 x 3 x 6 conditions (soit 108 conditions) I. Soit le plan suivant : S25 < D3 * F2 > * R6 * J2 Nombre de groupes ? 6 Nombre de conditions expérimentales ? 72 Nombre de sujets par groupe ? 25 Nombre total de sujets dans cette étude ? 150 Représentation sous forme de tableau ? II. Soit les plans suivants : S12 < D4 > * R6 * J2 Nombre de groupes ? Nombre de conditions expérimentales ? Nombre de sujets par groupe ? 12 Nombre total de sujets dans cette étude ? 48 Représentation sous forme de tableau ? S12 < D4 > * R6 * J2 Nombre de groupes ? 1 Nombre de conditions expérimentales ? 48 Nombre de sujets par groupe ? 12 Nombre total de sujets dans cette étude ? 576 Représentation sous forme de tableau ? Tableau diaporama S21 < D4 * R6 * J2 > 9

Nombre de groupes ? 48 Nombre de conditions expérimentales ? 48 Nombre de sujets par groupe ? 21 Nombre total de sujets dans cette étude ? 48X21 = 1008 Représentation sous forme de tableau ? S12 * D4 * R6 * J2 Nombre de groupes ? 48 Nombre de conditions expérimentales ? Nombre de sujets par groupe ? 12 Nombre total de sujets dans cette étude ? 576 Représentation sous forme de tableau ? A-8 Les types de données Le chercheur manipule des VI pour en constater des effets sur des VD, afin de valider des hypothèses è Plusieurs types de données peuvent être recueillis Il est primordial de connaître et d’identifier le type de données recueillies car cela détermine : -

Les traitements statistiques que je peux/dois utiliser Les représentations graphiques que je peux/dois utilise

Remarque : Pour faciliter le traitement des données continues, on les regroupes souvent en « classes » Par ex, il est impossible de distinguer tous les âges possibles è On procède à des regroupements tels que : [5-7ans], [8-10ans], [11-13ans], [14-16ans] Il faut faire attention aux intervalles intra-classes… [5-7ans], [8-10ans], [11-13ans], etc… à 3 ans par classe Et aux intervalles inter-classes [5-7ans], [8-10ans], [11-13ans], etc… à 1 an entre chaque classe A la fin de cette partie, je sais… *… Donne les définitions et fonctions des VI, VD et variables contrôlées *… Identifier les VI, les VD, les variables contrôlées Prendre fin sur arche 10

B) Les hypothèses Toute discipline scientifique ne vise pas la vérité… … Mais vise à établir une certaine vérité … Valide jusqu’à ce que l’on ait prouvé qu’elle était infondée ou incomplète Les études scientifiques en psychologie visent donc à valider (ou invalider) des hypothèses Hypothèse = supposition à partir de laquelle : -

On construit un raisonnement scientifique Des conséquences sont envisagées

Les statistiques exigent que soient posées préalablement des hypothèses Remarque : il faut envisager comme un ensemble cohérent les enseignements en méthodologie et les enseignements en statistiques Il faut distinguer 3 types d’hypothèses : -

Hypothèse générale (ou théorique) Hypothèse opérationnelle Hypothèse statistique

B1) Hypothèse générale (=hypothèse théorique) Aussi appelée hypothèse théorique =Explication anticipée, affirmation provisoire qui décrit ou explique un phénomène = Prédiction consistant à mettre en relation une variable et un comportement… … Sur la base d’une théorie précise S’exprime généralement sous la forme suivante : « Si telle théorie est juste dans telle situation, il se produira tel phénomène » Reste relativement « générale » et vague car reste à un niveau théorique Exige de solides connaissances théoriques Exemples : -

Les seniors ont des capacités de mémoire de travail limitées Le QI est lié au développement langagier Le dessin enfantin permet de déceler certains troubles chez des enfants

11

B2) Hypothèse opérationnelle Est la « traduction » opérationnelle de l’hypothèse théorique Se présente comme l’exemple concret d’application de l’hypothèse générale Reprend le même schéma que l’hypothèse théorique… -

…Mais en précisant les variables indépendantes (VI), …Les indicateurs comportementaux étudiés (VD), …Et les effets attendus des VI sur les VD

Doit toujours être la plus concrète et la plus précise possible Exemples : Les textes écrits en Times 12 sont lus plus lentement, en mots par minutes, que les mêmes textes écrits en Arial 12 ∞ « Times et Arial » = les deux modalités d’une VI ∞ « En mots par minutes » = la VD ∞ L’effet attendu de la VI sur la VD est annoncé Rappel Des chercheurs s’intéressent à l’impact de la série Games Of Thrones sur la peur des dragons ils s’intéressent aux différences de niveaux de peur des dragons (évalué selon une échelle type « Likert » allant de 1 : « pas du tout peur des dragons » à 10 « très peur des dragons ») chez 120 hommes et 120 femmes répartis équitablement en 4 classes d’âges (18-25ans ; 26-35ans ; 46-60ans). Les chercheurs s’intéressent aussi à l’impact de la fréquence de visionnement des épisodes sachant que les individus regardent soit un épisode par semaine, soit un épisode un jour, soit plusieurs épisodes par jour Définissez : -

Les VI, VD, VC Définissez pour chaque VI si c’est une variable provoquée ou invoquée Définissez aussi pour chaque VI si elle est croisée ou emboitée

3 VI : -

Genre = G2= deux modalités ; g1 homme, g2 femme C’est une variable invoquée et emboîtée Age = A4 = 4 modalités ; A1 18-25ans, A2 26-35ans, A3 36-45ans A4 46-60ans C’est une variable invoquée et emboîtée Fréquence de visionnement = F3 – 3 modalités ; F1 : 1 fois par semaine, F2 : une fois par jour, F3 : plusieurs fois par jour C’est une variable provoquée et emboîtée

12

1 VD : Différents niveaux de peur. Evolué comment ? Avec une échelle type « Likert » allant de : 1 « pas du tout peur des dragons » à 10 « très peur des dragons ») On aurait pu utiliser aussi les expressions faciales, le rythmes cardiaques, la conductivité électrodermale… VC : -

La culture L’expérience (fan/novice) Présence ou absence de dragon domestique Etc…

-

Ecrivez le plan expérimental

S ? < G2*A4*F3> -

L’hypothèse théorique (générale)

La série Games Of Thrones à un impact sur la peur des dragons • •

Le(s) hypothèse(s) opérationnelle(s) La série Games Of Thrones a un impact positif sur la peur des dragons (elle fait baisser la peur que nous avons des dragons) Ou elle a un impact négatif ; elle fait augmenter la peur que nous avons des dragons)

-

Calculez le nombre de groupes

Multiplication des modalités des variables emboitées : 2x4x3 = 24 -

Calculez le nombre de conditions expérimentales

Multiplication de toutes les modalités de toutes les variables donc comme toutes les variables sont emboitées : 2x4x3 =24 -

Calculez le nombre de sujets par groupe

-

Calculez le nombre total de sujets dans cette étude

10

S10 < G2xA4xF3> Il y a donc 240 sujets dans l’étude ! -

Calculez l’intervalle inter-classe et intra-classe

Intervalle inter-classe : 1an Intervalle intra-classe : 7ans puis 5ans

13

B-3 Hypothèse statistique Décrit le modèle mathématique permettant de procéder aux inférences Un modèle mathématique est une traduction de la réalité pour pouvoir lui appliquer les outils, les techniques et les théories Remarque : la statistique est l’ensemble des instruments et de recherches mathématiques au service d’une autre discipline. Ici, la psychologie et l’ergonomie En sciences (donc, en psychologie), le chercheur ne cherche pas à valider une hypothèse statistique … mais à invalider une hypothèse statistique appelée « hypothèse nulle »… … Car cherche à (in)valider l’absence de différence entre les modalités de la VI Hypothèse nulle : notée H0 Correspond à l’absence d’effet de la VI sur la VD Exemple de « passages » entre les trois hypothèses Hypothèse générale : la familiarité des mots facilite l’identification des mots. Hypothèse opérationnelle : Plus un mot est fréquent dans notre langue, plus vite on l’identifie Hypothèse statistique nulle (H0) : Il n’y aura pas de différences entre les vitesses d’identification des mots selon leur fréquence Si H0 est invalidée, alors l’hypothèse opérationnelle sera validée. Noter diapo exercice 1- opérationnel 1- opérationnel 2- théorique 3- opérationnel 4- statistique

Exemples de « passages » entre les trois hypothèses Hypothèse générale: La familiarité des mots facilite l'identification des mots. Il existe une différence de genre dans la capacité d'orientation en fonction de la densité informationnelle de l'environnement. Hypothèse opérationnelle: Plus un mot est fréquent dans notre langue, plus vite on l’identifie. 14

Hypothèse statistique nulle (H0): Il n’y aura pas de différence entre les vitesses d’identification des mots selon leur fréquence Si H0 est invalidée, alors l’hypothèse opérationnelle sera validée C. La statistique descriptive La statistique descriptive sert à décrire des variables. La statistique descriptive se compose de 3 domaines complémentaires : Type de statistique

Fonctions

La statistique uni-variée

Pour étudier la répartition d'un échantillon se lon une variable (la taille, l'âge, le poids, le Q I,...) Pour étudier la relation qui existe entre deux

La statistique bi-variée

La statistique multi-variée

variables (par ex., entre le poids et la taille; e ntre l'âge réel et l'âge mental) Pour étudier les relations entre plus de deux variables (par ex, entre le poids, la taille, le Q I...)

C.1- la statistique uni-variée C.1.1. Les indices de position Indices de position Valeur minimale Valeur maximale

Fonctions pour connaître la valeur minimale d'une variable Pour connaître la valeur ...


Similar Free PDFs