Informatique et Analyse des données - poly-2 PDF

Title Informatique et Analyse des données - poly-2
Course Informatique et analyse de données
Institution NEOMA Business School
Pages 67
File Size 3.4 MB
File Type PDF
Total Downloads 10
Total Views 136

Summary

Download Informatique et Analyse des données - poly-2 PDF


Description

Programme Grande Ecole

Informatique & Analyse des Données

2018-2019

Table des matières INTRODUCTION - CONTEXTE ET OBJECTIF - LE CAS ETUDIE ................................................. 4 1

COMMENT RECUEILLIR LES DONNEES ......................................................................... 5

1.1 Nature des données .................................................................................................................................. 5 Le tableau de données, individus et variables ..................................................................................................... 5 Les différentes catégories de variables : variables qualitatives (nominales ou ordinales) / variables quantitatives (discrètes ou continues) ................................................................................................................. 6 1.2

Comment poser les questions quand les hypothèses concernent des associations entre des variables 8 Si possible, mesurer les variables à expliquer avec une échelle quantitative ...................................................... 8 Envisager l’usage d’échelles « multi-items » ..................................................................................................... 8 Eviter autant que possible les questions à réponses multiples et les questions ouvert es .................................. 10

1.3 Comment constituer l’échantillon ........................................................................................................ 12 Origine des données : données primaires / données secondaires ...................................................................... 12 Choix des individus .......................................................................................................................................... 12 Taille de l’échantillon ....................................................................................................................................... 12 1.4

2

Comment construire le questionnaire et l’administrer....................................................................... 12

L’ETUDE EN EQUIPE .................................................................................................. 13

2.1 Les contraintes ....................................................................................................................................... 13 Type d’étude ..................................................................................................................................................... 13 Type d’hypothèses à tester ................................................................................................................................ 13 Usage d’échelles numériques ........................................................................................................................... 13 Autres contraintes ............................................................................................................................................. 13 2.2

Recommandations .................................................................................................................................. 13

2.3 Les étapes ................................................................................................................................................ 14 Création d’un questionnaire sous Qualtrics ...................................................................................................... 14 Elaboration d’un premier questionnaire : avant la 2e séance ............................................................................ 14 Diffusion du questionnaire définitif : avant la 3e séance .................................................................................. 14 Dépôt du rapport de l’étude : au plus tard 8 jours après la dernière séance ...................................................... 15

3 3.1

PRISE EN MAIN DE SPSS ........................................................................................... 15 Installation de SPSS ............................................................................................................................... 15

3.2 Gestion des données avec SPSS ............................................................................................................. 15 Les fichiers de données de SPSS ...................................................................................................................... 15 Importation des données ................................................................................................................................... 19 Transformation de variable ............................................................................................................................... 19 3.3 Les sorties de SPSS ................................................................................................................................ 22 Les tableaux ...................................................................................................................................................... 22 Les graphiques .................................................................................................................................................. 24 Sauvegarde ....................................................................................................................................................... 25

2

4 4.1

ANALYSE UNI-VARIEE ............................................................................................... 25 Objectifs et méthode .............................................................................................................................. 25

4.2 Description d’une variable qualitative ................................................................................................. 26 Tableau de fréquences ...................................................................................................................................... 26 Représentations graphiques : diagrammes en secteurs et en tuyaux d’orgue ................................................... 26 4.3 Description d’une variable quantitative ............................................................................................... 28 Le cas des variables discrètes : tableau de fréquences et diagramme en bâtons ............................................... 28 Le cas des variables continues : tableau de fréquences par classe et histogramme .......................................... 29 Description numérique de la distribution : les quartiles ou le couple moyenne et écart-type ........................... 30 Le cas particulier des échelles quantitatives de 5 à 7 points : résumer les distributions avec la moyenne et l’écart-type ........................................................................................................................................................ 31 4.4

5 5.1

Recommandation - résumé des outils et méthodes .............................................................................. 33

ANALYSE BI-VARIEE .................................................................................................. 34 Objectif et méthode ................................................................................................................................ 34

5.2 Description d’une association entre 2 variables .................................................................................. 35 Le cas où la variable à expliquer est qualitative : comparaison de profils ........................................................ 35 Le cas où on veut expliquer une variable quantitative par une variable qualitative : comparaison de moyennes .......................................................................................................................................................................... 38 Le cas où les deux variables sont quantitatives : le coefficient de corrélation linéaire ..................................... 40 5.3 Tests de signification .............................................................................................................................. 45 Rappels sur les tests d’hypothèses - la p-value ................................................................................................. 45 Le cas où on veut expliquer une variable qualitative : le test du Khi-deux ...................................................... 48 Le cas où on veut expliquer une variable quantitative par une variable qualitative : le test t de Student et le test de l’analyse de la variance ................................................................................................................................ 49 Le cas où les deux variables sont quantitatives : le test du coefficient de corrélation linéaire ......................... 51 5.4

6

Recommandations - Interprétation d’une association - résumé des outils et méthodes .................. 52

MODELISATION PAR REGRESSION LINEAIRE ............................................................. 54

6.1

Contexte et objectifs ............................................................................................................................... 54

6.2

Détermination des coefficients de la droite .......................................................................................... 54

6.3

Le coefficient de détermination, R² ...................................................................................................... 55

6.4

Introduction à la régression linéaire multiple ..................................................................................... 56

7 INTRODUCTION AUX ANALYSES MULTIVARIEES - L’ANALYSE EN COMPOSANTES PRINCIPALES ................................................................................................................... 59 EXTRAIT DU QUESTIONNAIRE DE L’ETUDE SUR LA PERCEPTION DES VINS ........................ 61

Informatique & Analyse des Données

3/67

2018-2019

Introduction - Contexte et objectif - Le cas étudié Introduction - Objectif Voir le syllabus. Le cas étudié Nous utiliserons les données d’un mémoire réalisé par une étudiante du PGE de NEOMA Business School1. Le mémoire avait pour thème la perception des vins chez les jeunes de la génération Y. Les données ont été recueillies au moyen d’un questionnaire adressé en ligne à de jeunes adultes Français. Le questionnaire montrait une bouteille de vin dont l’étiquette indiquait le pays d’origine. Certaines personnes voyaient indiqué « France », d’autres « Mexique » (représentant les vins du nouveau monde), un dernier groupe « Arménie » (inconnue dans le domaine des vins). L’image était identique à l’exception de l’indication du pays d’origine et tirée de manière aléatoire par Qualtrics, l’outil utilisé pour la conception et la diffusion du questionnaire. Les personnes interrogées ont été ensuite invitées à exprimer leur avis sur le vin. Voir le questionnaire page 61. L’étude en équipe Vous réaliserez toutes les phases d’une enquête par questionnaire : 1. définition de la problématique et des hypothèses de recherche 2. conception et administration du questionnaire 3. gestion informatique et traitement statistique des données (sur le logiciel SPSS) 4. interprétation et présentation des résultats Qu’est-ce qu’une hypothèse de recherche ? Une hypothèse de recherche est une proposition de réponse à une problématique, une problématique étant une question posée de manière précise, dans un contexte bien défini. Posons la problématique suivante : « Comment l’origine d’un vin affecte-t-elle la manière dont le vin est perçu par les jeunes Français de 20 à 35 ans ? ». « L’origine modifie la perception de sa qualité » est une hypothèse liée à cette problématique.

1

Caroline Vergote, encadrée par Nathalie Spielmann. Le mémoire a donné matière à une publication dans une revue internationale à comité de lecture : Spielmann N., Babin B. J., Verghote C. (2016) A personality-based measure of the wine consumption experience for millennial consumers . International Journal of Wine Business Research, Vol. 28 Iss 3 pp. 228 - 245

4

Dans le contexte d’une étude empirique quantitative (étude reposant sur des statistiques, comme celle que vous allez mener), les hypothèses seront validées ou non selon les résultats que l’on pourra tirer à partir de l’étude de données observées.

Remarque La problématique et les hypothèses sont l’aboutissement d’une première recherche : la phase exploratoire. Vous ne pourrez réaliser cette recherche correctement par manque de temps. Essayez malgré tout de poser une problématique et des hypothèses pertinentes. Contexte Dans les études quantitatives, une hypothèse peut concerner la distribution d’une statistique comme le pourcentage de personnes présentant un caractère donné dans la population ciblée, par exemple : « La majorité des jeunes Français préfèrent les vins d’origine française ». Ce type d’hypothèses ne peut être testé que sur des échantillons représentatifs (constitués par tirage aléatoire ou par la méthode des quotas) et de grande taille (autour de 1000). Nous allons tester des hypothèses qui concernent des associations entre des variables, par exemple « L’intention d’achat est liée à l’origine du vin » ou « l’intention d’achat est liée à l’appréciation de la qualité du vin ». Tester ce type d’hypothèses est à votre portée parce qu’on peut être moins exigeant sur la représentativité de l’échantillon.

1 Comment recueillir les données 1.1 Nature des données Le tableau de données, individus et variables Les données se présentent par convention sous la forme d’un tableau où les individus, c'est-à-dire les unités sur lesquelles sont relevées les données, sont placés en ligne et les différents caractères relevés sur les individus sont placés en colonne. On appelle variables les colonnes du tableau.

Informatique & Analyse des Données

5/67

2018-2019

Individual I0001 I0002 I0003 I0004 I0005 I0006 I0007 I0008 I0009 I0010

Origin Convivial Laid-back Open Mexican 3 5 Mexican 4 3 French 7 7 Armenian 3 1 Armenian 2 2 French 1 1 Armenian 6 6 Mexican 5 5 French 3 4 French 2 4

6 5 7 2 2 2 6 3 3 5

… … … … … … … … … … …

Consumption 1-4 per month...


Similar Free PDFs