Statistica feuille de route PDF

Title Statistica feuille de route
Author Delphine Guérin
Course Introduction à la méthodologie et aux analyses de données en psychologie
Institution Université de Genève
Pages 58
File Size 3.4 MB
File Type PDF
Total Views 177

Summary

Download Statistica feuille de route PDF


Description

Intro. à la méthodo. et à l’ana. de données - 2019-2020 https://moodle.unige.ch/course/view.php?id=4332 Professeur : Julien Chanal Assistante : Delphine Paumier Auxiliaires : Arnaud Brun & France Vonaesch Réception aux. : M5183 mardi 12-14h00, M5183 mercredi 13-14h00

Ce Crash Course sera entièrement réalisé en salle informatique, aucune préparation à la maison n’est nécessaire !

Objectifs — Savoir installer Statistica chez soi. — Ouvrir un fichier Statistica, un fichier Excel et un fichier texte. — Savoir ajouter des observations et des variables dans une base de données Statistica. — Savoir créer une feuille de calcul (« spreadsheet »).

Utiliser Statistica sur son ordinateur personnel Il y a deux options pour pouvoir utiliser Statistica depuis votre ordinateur personnel. 1. La première option consiste à installer Statistica (version 13.5 1 ) sur votre ordinateur. Attention, le programme n’est malheureusement disponible que pour Windows. Vous pouvez suivre la procédure définie ici : https://plone.unige.ch/distic/pub/logiciels/ statistica/comment-installer-statistica-13-5-sur-windows 2. La seconde option proposée convient aussi bien aux utilisateurs Mac que PC. Elle peut constituer une alternative utile en cas d’échec d’installation de Statistica sur votre PC. Il s’agit d’installer le programme VMware Horizon View 2 . Vous pouvez suivre la procédure définie ici : https://plone.unige.ch/distic/pub/logiciels/vmware-horizon/

1

Lancer Statistica sur un poste informatique de l’université

Double-cliquez sur l’icône Statistica qui se trouve sur votre bureau Windows.

2

Télécharger les fichiers du TD

Connectez-vous au site Moodle du cours (https://moodle.unige.ch/course/view.php?id= 4332), sous Crash Courses rendez-vous dans le dossier Crash Course 1, et enregistrez les 1. Si vous avez la version 13.4 déjà installée, nous vous conseillons fortement de passer à la 13.5 pour deux raisons : (1) il est possible que certaines manipulations diffèrent et (2) votre version ne pourra PAS être prolongée au delà de juillet 2020, et ne sera donc pas disponible pour les examens d’août-septembre. 2. Ce logiciel vous permet d’accéder aux postes de travail virtuels VDI.

2 documents s’y trouvant (les trois documents jeunesadultes) sous votre lecteur H: 3 ou sur une clé USB.

3

Introduction à Statistica

Démarrez Statistica → lorsque la fenêtre Welcome to Statistica apparaît, cliquez sur Close. Fermez également le document vierge Data:Spreadsheet1 s’étant ouvert automatiquement.

3.1

Interface de travail

Statistica 13.5 par défaut vous offre la possibilité de travailler avec une interface plus "moderne". Toutes les instructions qui vous seront proposées lors des TDs sont basées sur l’interface classique. Si vous souhaitez travailler avec l’interface classique, vous devez cliquer en haut à droite : Options → décochez ribbon bar 4 . Pour retourner à l’interface plus "moderne", il faut cliquer : View→ ribbon bar. De toute façon, les TDs peuvent être faits avec les deux interfaces.

3.2

Barre des menus

La barre des menus est tout en haut de la fenêtre Statistica ; elle contient entre autres les menus File, View, Statistics, etc. : — File : ouverture ou importation des fichiers de données (format Statistica, Excel, SPSS, texte, etc.) — Statistics : méthodes statistiques proposées par Statistica. — Graphs : graphiques proposés par Statistica. — Help : menu d’aide.

3.3

Ouvrir un fichier avec Statistica

Dans les parties qui suivent, vous allez devoir ouvrir trois types de fichiers avec des extensions différentes depuis Statistica (jeunesadultes.sta, jeunesadultes.xls, jeunesadultes.csv). Pour chaque type de fichiers, il y a quelques spécificités à connaître pour ouvrir le fichier correctement. 3.3.1

Ouvrir un fichier Statistica (.sta)

File → Open... → Indiquez le fichier (ici jeunesadultes.sta) que vous souhaitez ouvrir, cliquez sur Ouvrir. 3. Pour accéder à votre disque H: depuis chez vous : https://educloud.unige.ch:8443/ 4. Vous pouvez également aller sur l’onglet Home → dans Tools, sélectionnez Options→ décochez ribbon bar.

3 3.3.2

Ouvrir un fichier Excel dans Statistica (.xls)

File → Open... → Indiquez le fichier (ici jeunesadultes.xls) que vous souhaitez ouvrir, cliquez sur Ouvrir. Dans la fenêtre qui s’ouvre, cliquez sur Import selected sheet to a Spreadsheet → dans la fenêtre Open Excel File, afin que les noms des variables apparaissent en tête des colonnes cochez l’option Get variable names from first row (qui est certainement déjà cochée) → OK 3.3.3

Ouvrir un fichier avec extension csv dans Statistica

5

File → Open... → Indiquez le fichier (ici jeunesadultes.csv) que vous souhaitez ouvrir, cliquez sur Ouvrir. Dans la fenêtre qui s’ouvre, sélectionnez Delimited → OK. Dans la fenêtre Import Delimited Text Files : — sous Variable Delimiting, sélectionnez Semicolon, — sous Import Options, sélectionnez Take variable names from first row in the file et Skip blank lines → OK. Pour voir ce que cela peut donner, appuyez sur Refresh view : vous obtiendrez un aperçu de votre feuille de données → OK 6 .

3.4

Manipulation des classeurs et des bases de données

Utiliser un classeur (Workbook) Pour le moment, les trois bases de données sont dans trois fenêtres séparées. Pour l’enregistrement, il est mieux de grouper les bases de données avec les outputs que vous produirez : Dans la barre des tâches, cliquez sur Add to Workbook → New Workbook. Sélectionnez ensuite un des deux autres jeux de données , puis cliquez sur Add to Workbook → Workbook1. Deux feuilles de calcul sont donc maintenant dans le classeur. Afin d’insérer la troisième base de données dans le classeur (Workbook1), faites la même démarche : sélectionnez le troisième jeu de données, puis cliquez sur Add to Workbook → Workbook1. Trois feuilles de calcul sont maintenant dans le classeur 7 . Enregistrez ensuite le classeur Cliquez sur File → Save as... → et enregistrez le classeur sur votre lecteur H: (les classeurs s’enregistrent en .stw). Définir une base de données à utiliser dans un classeur : Clic droit sur une des 3 icônes de la base de donnée (jeunesadultes) → Use as active input → un rectangle rouge apparaît entourant l’icône. 5. Un fichier avec extension csv est un fichier tableur contenant des données sur chaque ligne séparées par un caractère de séparation (généralement une virgule ou un point virgule) 6. Si vous cliquez sur OK sans avoir précédemment appuyé sur Refresh view, vous recevrez un message d’avertissement → cliquez oui. 7. Notons qu’ici, les trois bases de données sont exactement identiques, ce qui n’a pas beaucoup d’intérêt (à part pour vous exercer à insérer plusieurs bases de données dans un même Workbook !)

4

3.5 3.5.1

Ajouter un sujet Procédure

Pour ajouter un nouveau sujet, il faut d’abord créer une nouvelle ligne en bas de fichier : double-cliquez en-dessous du 12 de la première colonne grise → OK. Pour l’exercice, saisissez les données pour un homme non marié de 32 ans, n’ayant pas d’enfant. 3.5.2

Procédure alternative

Cliquez sur le menu Insert → Add Cases... → en face de How many: saisissez 1 → en face de Insert after case: saisissez 13 8 → OK. Pour l’exercice, saisissez les données pour une femme mariée de 27 ans ayant 1 enfant.

3.6 3.6.1

Ajouter une variable Procédure :

Pour ajouter une nouvelle variable, il faut d’abord créer une nouvelle colonne : double-cliquez à droite de nb-enfants de la première ligne grise → OK Pour l’exercice, créez la variable longueur : en face de Name: mettez le nom de la variable (ici longueur), en bas, sous Long name : saisissez La longueur des cheveux → OK. 3.6.2

Procédure alternative

Cliquez sur le menu Insert → Add Variables... → en face de How many: saisissez 1 → en face de After: saisissez longueur → en face de Name: mettez le nom de la variable (ici : anxiete) et sous Long name : saisissez Score d’anxiété → OK.

3.7

Votre tout premier graphique...

Etant donné que vous devrez faire la partie clics seul, les consignes des TD seront toujours très détaillées. Chaque fois que nous vous demanderons de faire une analyse (graphique, tableau, etc.), nous vous mettrons la procédure entière comme dans l’exemple qui suit. Vous allez aujourd’hui faire un graphique que l’on appelle un Pie Chart. Il vous permet de représenter, p.ex., les pourcentages d’hommes et de femmes dans votre base de données jeunesadultes. Pie Chart du sexe des personnes Dans la barre des menus, sélectionnez Graphs → 2D Graphs → Pie Charts...→ Cliquez sur Variables. Là, une nouvelle fenêtre s’ouvre. Sélectionnez votre variable d’intérêt, ici : Sexe → OK → OK. Réactivez l’analyse 9 et allez dans l’onglet Advanced. Dans Type, cochez 2D à la place de 3D → OK. 8. Etant donné qu’il y a déjà 13 sujets dans la base de données, cette commande permet d’insérer le nouveau sujet à la fin, autrement dit après le 13ème sujet. 9. Vous lirez souvent sur nos TD Réactivez l’analyse. Explication : quand vous êtes dans Statistica, les analyses réalisées (graphiques, tableaux, etc.) se mettent automatiquement tout en bas de l’écran l’une à côté de

5 Réactivez l’analyse et, toujours dans l’onglet Advanced, sous Shape, cochez Circle à la place d’Ellipse → OK. Réactivez l’analyse et, toujours dans l’onglet Advanced, sous Pie Legend:, cochez Text and Percent → OK. Vos premiers Pie Charts sont nés !

3.8 3.8.1

Créer une feuille de calcul Procédure

Cliquez sur le menu File → New... → onglet Spreadsheet → en face de Number of variables: saisissez 5 → en face de Number of cases: saisissez 10 → OK. Les variables de votre feuille de calcul sont les suivantes : — Var1 correspond au sexe de l’individu, Sexe, — Var2 correspond à la nationalité de l’individu, Nat, — Var3 correspond à la couleur des yeux de l’individu, CY, — Var4 correspond à la taille de l’individu en centimètre, Taille, — Var5 correspond à l’âge de l’individu, Age. Pour insérer ces informations dans Statistica : Cliquez sur le menu Data → All Variable Specs... → dans la colonne Name, double-cliquez sur Var1 et remplacez Var1 par Sexe. → dans la colonne Long Name (label or formula), double-cliquez dans la case de la ligne correspondant à la variable Sexe et saisissez Sexe de l’individu. Effectuez la même démarche pour les autres variables → OK. Enregistrez votre feuille de calcul : File → Save As..., → sélectionnez votre lecteur H:, → en face de Nom du fichier: saisissez IMAD_CC01_1, → en face de Type: sélectionnez STATISTICA Spreadsheet Files (*.sta) → Enregistrer. 3.8.2

Procédure alternative

Cliquez sur le menu File → New... → onglet Spreadsheet → en face de Number of variables: saisissez 3 → en face de Number of cases: saisissez 8 → OK. Les variables de votre feuille de calcul sont les suivantes : — Var1 correspond à la couleur des pétales d’une fleur, Coul, — Var2 correspond à la longueur des pétales d’une fleur, Long, — Var3 correspond à la largeur des pétales d’une fleur, Larg. l’autre. Là, vous n’en avez fait qu’une : Pie chart. Pour réactivez l’analyse, vous devez cliquer sur Pie Charts qui se trouve justement en bas. Cela va ouvrir à nouveau l’analyse en cours, donc, ici, celle du Pie Chart venant d’être créé. Le fait que Statistica "stocke" les analyses est très pratique : ça vous évite de devoir tout refaire si vous voulez juste en modifier une petite partie...

6 Pour insérer ces informations dans Statistica : Double-cliquez sur Var1, → en face de Name: saisissez Coul, → sous Long name (label or formula with Functions): saisissez Couleur des pétales → OK. Effectuez la même démarche pour les autres variables. Enregistrez votre feuille de calcul : File → Save As..., → sélectionnez votre lecteur H:, → en face de Nom du fichier: saisissez IMAD_CC01_2, → en face de Type: sélectionnez STATISTICA Spreadsheet Files (*.sta) → Enregistrer. Vous venez de travailler sur un fichier Statistica .sta. Il correspond à ce que l’on appelle une feuille de calcul (ou « spreadsheet » en anglais).

Intro. à la méthodo. et à l’ana. de données - 2019-2020 https://moodle.unige.ch/course/view.php?id=4332 Professeur : Julien Chanal Assistante : Delphine Paumier Auxiliaires : Arnaud Brun & France Vonaesch Réception aux. : M5183 mardi 12-14h00, M5183 mercredi 13-14h00

Objectifs — Reconnaître les différents types de variables — Reconnaître les échelles de mesure des variables — Représenter les différents types de variables graphiquement à l’aide de Statistica

Marche à suivre Ce TD est à faire entièrement chez vous. Nous ferons uniquement les corrections en auditoire. Dans un premier temps, vous pouvez faire toutes les analyses qui sont décrites ci-dessous avec Statistica. Une fois que vous avez réalisé ces analyses, vous pouvez répondre aux questions du TD à l’adresse suivante 1 : https://moodle.unige.ch/mod/quiz/view.php?id=184083 Lorsque vous aurez terminé de répondre aux questions, vous pourrez imprimer vos réponses pour la correction de jeudi 2 . Bon travail !

Ouvrir la base de données SDT_TD3.sta Rendez-vous, comme d’habitude, sur Moodle et enregistrez le document SDT_TD3.sta. Ouvrez Statistica et fermez les deux fenêtres s’ouvrant automatiquement. Dans le menu File → Open → sélectionnez le fichier SDT_TD3.sta là où vous l’avez enregistré → Ouvrir.

Explication de la base de données SDT_TD3 est la base de données sur laquelle nous allons travailler durant la majorité des TDs du semestre. Ces données ont été récoltées pour la recherche intitulée "Etude du style d’enseignement et de ses effets sur les ressources motivationnelles et l’activité physique scolaire des jeunes enfants dans le canton de Genève", dont vous avez lu l’article lors du TD1. Cette base de données contient les données récoltées chez 212 élèves. Une ligne dans la base de donneées 1. Nous vous recommandons d’utiliser le navigateur Mozilla Firefox. 2. Si vous avez besoin d’aide pour réaliser et imprimer le TD en ligne, vous pouvez vous référer au document intitulé Marche_A_Suivre_TD_en_Ligne disponible sur Moodle dans les documents du TD03.

Intro. à la méthodo. et à l’ana. de données - TD03 - Mad - Fapse

2

représente une personne. La base de données contient également les variables suivantes (en colonnes) : — SportExtrascol: indique si l’élève pratique du sport en dehors de l’école ("Jamais", "Rarement", "Parfois", "Souvent", "Tout le temps"). — FreqSport: indique le nombre de fois que l’élève pratique du sport en dehors de l’école pendant la semaine (de 1 à 7). — Sexe: indique le sexe de l’élève (fille, garçon) — ActPhys3: indique l’intensité et la quantité d’activité physique déployées par l’élève durant les cours d’éducation physique. — MotivAutonome: indique le score de motivation autonome de l’élève en éducation physique. Ce score correspond à la moyenne de différents items mesurant les différents types de motivation autonome (i.e., intrinsèque et identifiée). — IndexMotiv: se réfère à la motivation autonome qu’a l’élève envers l’éducation physique. Plus spécifiquement il s’agit d’un index d’autonomie relative. L’index d’autonomie relative est un score total de motivation autonome qui prend en considération les différentes régulations motivationnelles. La formule d’index d’autonomie relative utilisée est la suivante : 2(intrinsèque) + 1(identifiée) - 1(introjectée) - 2(externe) (Grolnick & Ryan, 1989). Plus ce score est élevé, plus l’élève est motivé·e de manière autonome. — PercepAutonomie: indique à quel point l’élève considère que son enseignant·e soutient son autonomie durant les cours d’éducation physique. Ce score correspond à la moyenne de différents items mesurant la perception du climat soutenant l’autonomie (e.g., "Certains maîtres d’éducation physique proposent de nombreux exercices à réaliser parmi lesquels on peut choisir ceux que l’on a envie de faire"). Plus ce score est élevé, plus l’élève considère que l’enseignant·e soutient son autonomie. — ConceptSoi: correspond au concept de soi qu’a l’élève en éducation physique. Le concept de soi mesure le niveau de compétence que s’accorde l’élève en éducation physique. L’élève peut avoir un concept de soi en éducation physique bas (bas) ou élevé (eleve).

1

Représentations graphiques avec Statistica

Avant tout, commencez par insérer la base de données SDT_TD3 dans un nouveau Workbook, comme nous avons fait lors du Crash Course 01 : Cliquez sur Add to Workbook → New Workbook.

1.1

Représentations des

(a)

: Statistics → Basic Statistics/Tables → Frequency tables → OK. Cliquez sur Variables → Sélectionnez les variables qualitatives SportExtrascol, Sexe et ConceptSoi → OK → Summary. Statistica crée alors automatiquement 3 tableaux de fréquences différents, un pour chaque variable.

(b)

: Graphs → 2D Graph → Pie Charts... → cliquez sur Variables: → sélectionnez les variables qualitatives Sexe et ConceptSoi → OK. Dans l’onglet Advanced, faites les mêmes démarches qu’au Crash Course 01 :

Intro. à la méthodo. et à l’ana. de données - TD03 - Mad - Fapse

3

— Sous Pie legend : sélectionnez Text and Percent — Sous Type, cochez 2D — Sous Shape, cochez Circle → OK. Statistica crée alors automatiquement 2 Pie Charts différents, un pour chaque variable. (c)

:

(d) Pour créer un diagramme à bâtons, commencez par créer un diagramme à bandes rectangulaires verticales de la variable SportExtrascol (ce que vous venez de faire). Ensuite, t sur le graphique venant d’être créé → Graph Options → Plot: Bars → Sous Type, sélectionnez Lines → OK.

1.2

Représentations des

— Pour une variable quantitative discrète qui contient peu de valeurs, on peut opter pour la même démarche que pour les variables qualitatives ordinales (e.g. diagramme à bandes rectangulaires verticales). — Pour une variable quantitative discrète avec beaucoup de valeurs, ou une variable quantitative continue, on optera pour d’autres représentations graphiques (e.g. histogramme, diagramme de dispersion).

Graphs → 2D Graph → Histograms... (Si la fenêtre Starting Duplicate Analysis s’ouvre, cochez Start New) → cliquez sur Variables: sélectionnez la variable quantitative FreqSport → OK. Sous Dans l’onglet columns et Show percentages → OK. (f) Graphs → 2D Graph → Histograms... (Si la fenêtre Starting Duplicate Analysis s’ouvre, cochez Start New) → cliquez sur Variables: sélectionnez la variable quantitative ActPhys3 → OK. Dans l’onglet Advanced:, sous Réactivez l’analyse → Sous Boundaries (un peu plus bas). Une nouvelle fenêtre s’ouvre. Cochez Specify boundary range:, puis : — Mimimum: spécifiez 0 — Interval Step: spécifiez 10 — Maximum: spécifiez 80 → OK → OK

puis cliquez sur Specify

Intro. à la méthodo. et à l’ana. de données - TD03 - Mad - Fapse Réactivez l’analyse → Sous Intervals: cochez

10 → OK.

Réactivez l’analyse → Sous Intervals: cochez

1.3

4

→ OK.

Représentation de

(g) Statistics → Basic Statistics/Tables (Si la fenêtre Starting Duplicate Analysis s’ouvre, cochez Start New) → Tables and banners → OK → Specify tables (select variables) Sous List1, sélectionnez Sexe et sous List2 sélectionnez SportExtrascol → OK → OK → Summary: Review summary tables. Réactivez l’analyse du tableau à double entrée → onglet Options, sous Compute tables, cochez Percentages of total count, Percentages of row counts et Percentages of column counts → Summary. (h) Réactivez l’analyse du tableau à double entrée →

Optionnellement, il est possible de : Clic droit sur le graphique → Graph Options... → menu Graph → Categorization. Sous Categories Layout sélectionnez Overlaid → ...


Similar Free PDFs