Chapitre 3 Les paramètres de position d’une série statistiques PDF

Title Chapitre 3 Les paramètres de position d’une série statistiques
Course statistique appliquée
Institution Université Paris-Est Créteil Val de Marne
Pages 6
File Size 464.2 KB
File Type PDF
Total Downloads 78
Total Views 135

Summary

Note de cours...


Description

Chapitre 3 : Les paramètres de position d’une série statistiques

I.

LE MODE

1) Définition Le mode est la valeur de la variable qui correspond au plus grand effectif ou à la plus grande fréquence relative. C’est la valeur qui se rencontre le plus fréquemment. On l’appelle aussi “valeur dominante”. Exemple : Soit la série suivant : 2, 5, 6, 6, 6, 8, 9. Le mode est la valeur 6.

2) Cas des variables continues Lorsque les données sont regroupées en classe, on définit d’abord “la classe modale” correspondant à la classe qui a l’effectif le plus élevé. Ensuite, on désigne le centre de classe comme le mode.

3) Cas de variables continues à amplitudes inégales Lorsque les amplitudes sont inégales, le mode correspond à la classe qui a l’effectif (ou la fréquence) corrigé le plus élevé. Dans un premier temps on calcule les amplitudes des classes. On s’aperçoit que les amplitudes varient entre 10 et 40. Il faut donc corriger les effectifs. La méthode de correction la plus simple consiste à diviser chaque amplitude de classe par l’amplitude modale puis à diviser les effectifs observés par le précédent ratio pour obtenir les effectifs corrigés h 𝑖. La classe modale se détermine en regardant les h𝑖. Il s’agit de la classe [30 ; 50[. Le mode est donc égal à 40. Avantage et limite : -

Le mode a l’avantage qu’il se détermine rapidement et sa signification est simple

-

On l’utilise surtout dans le cas des variables discrètes t pour faire apparaître facilement une première notion de valeur centrale.

-

Mais on lui préfère souvent la moyenne.

II.

LA MOYENNE

Il existe plusieurs moyennes et chacune est rattachée à une situation précise. Par exemple la méthode pour calculer la moyenne de ses notes ne convient pas pour calculer la moyenne des taux de croissance ou la moyenne des rapports. Par conséquent, avant de se lancer dans le calcul d’une moyenne, il faut vérifier que l’on utilise le bon outil. 1

1) La moyenne arithmétique

2) La comparaison des moyennes et l’effet de structure La comparaison des valeurs moyennes de deux phénomènes peut parfois être non pertinente parce que les pondérations peuvent introduire des erreurs de jugements. Ces erreurs de jugement viendraient du fait que l’on aurait omis de faire ressortir des éventuels effet de structure. Considérons le cas de deux entreprises présentant les salaires moyens suivants et faisons le constat d’une situation paradoxale.

Dans l’ensemble le salaire moyen de B est supérieur à celui de A alors que paradoxalement les salariés hommes de A sont mieux payés que ceux B et ainsi que les femmes. Cette situation s’explique par l’effet de structure. Définition selon l’INSEE : Lorsqu’une population est répartie en sous-populations, il peut arriver qu’une grandeur évolue dans un sens sur chaque sous-population et dans un sens contraire sur l’ensemble de la population. Ce paradoxe s’explique parce que les effectifs de certaines sous-populations augmentent alors que d’autres régressent : c’est l’effet de structure. On peut donc considérer que l’écart global des moyennes s’explique par un effet de structure lié à la différence des pondérations et un effet pur lié à la différence des valeurs de la variable.

2

La mes mesu ur e de l’effet de structure et l’effet pur : Pour mesurer l’effet de structure (Share) et l’effet pur (Shift) de variation on calcule les moyennes mixtes. On appelle moyenne mixte une moyenne calculée avec les valeurs de la variable dans un contexte et les pondérations d’un autre contexte. Il existe deux moyennes mixtes qui peuvent être interprétées différemment selon que l’on se place du point de vue de la situation A ou de celle de B.

3) L’évolution du salaire moyen et l’effet de structure La mesure de l’évolution d’un salaire moyen peut être décomposée en deux éléments : -

Une évolution pure à structure constante (la structure choisie est le plus souvent celle de l’année 0.

-

Un effet de structure due à la modification de la structure des salaires

Pour l’écart absolu on a :

Exemple :

3

4) La moyenne géométrique simple C’est la racine nième du produit des n valeurs positives du caractère (x). On l’emploie dans le calcul du taux d’accroissement moyen ou de la moyenne des coefficients multiplicateurs

Exemple : Soit la série suivante : 10 ; 15 ; 18 ; 25. La moyenne géométrique est :

5) La moyenne géométrique pondérée La moyenne géométrique est dite pondérée lorsqu’à chaque valeur de (xi) peut correspondre plusieurs observations.

Exemple : Soit la série suivante : 3 ; 3 ; 5 ; 9 ; 9 ; 9 ; 11 ; 11 ; 11 ; 11. La moyenne géométrique pondérée est :

6) La moyenne harmonique simple La moyenne harmonique d’une série statistique (xi) est la moyenne arithmétique de l’inverse des (n) valeurs de la variable. On l’emploie pour calculer la moyenne des rapports et notamment celle des vitesses moyennes.

Exemple : Sur un trajet un chauffeur fait 60Km/h à l’aller et 30km/h au retour. La vitesse moyenne est :

7) La moyenne harmonique pondérée La moyenne harmonique est dite pondérée lorsqu’à chaque valeur de (xi) peut correspondre plusieurs observations.

Exemple : Un conducteur fait un trajet à plusieurs étapes : 4fois 60Km/h et 3fois 30Km/h. Sa vitesse moyenne est :

4

8) La moyenne quadratique simple La moyenne quadratique d’une série statistique (xi) est égale à la racine carré de la moyenne arithmétique des carrés des (n) observations. On l’emploie surtout pour trouver la moyenne des écarts à une valeur centrale, l’élévation au carré permet de ne pas manipuler des écarts négatifs.

Exemple : Soit la série suivante : 4 ; 8 ; 10. La moyenne quadratique est :

9) La moyenne quadratique pondérée La moyenne quadratique est dite pondérée lorsqu’à chaque valeur de (xi) peut correspondre plusieurs observations.

Exemple : Soit la série suivante : 40 ; 40 ; 40 ; 80 ; 80. La moyenne quadratique pondérée est :

III.

LES QUANTILES

1) La médiane

La médiane d’une distribution statistique est la valeur du caractère qui partage la série en deux sous ensembles égaux. Elle suppose pour sa détermination que les individus de la population soient rangés dans un certain ordre (croissant ou décroissant). 2) La médiane : série discrète, effectif impair

Lorsque l’effectif de la population est impair (𝑛 = 2𝑝 +1) avec p, un entier naturel, la médiane est la valeur de rang 𝑝+1. Exemple : Soit la série 4 ; 6 ; 12 ; 24 ; 28 ; 35 ; 60. L’effectif est 7= 2𝑥3+1 ; p=3. La médiane est la valeur de rang 4 c’est-à-dire 𝑀 = 24. Il y a 3 valeurs en avant et 3 valeurs après 24. 3) La médiane : série discrète, effectif pair

Lorsque l’effectif de la population est pair (𝑛 = 2𝑝) avec p, un entier naturel, la médiane est le centre de l’intervalle des valeurs de rang 𝑝 et de rang 𝑝+1. Exemple : Soit la série 20 ; 24 ; 32 ; 35 ; 55 ; 60 ; 70, 100. L’effectif est 8 = 2𝑥4 ; p=4. La médiane est la valeur de rang 4 et de rang 5 c’est-à-dire que l’intervalle médian est [35 ; 55] et donc : 𝑀=(35+55)/2=45. 5

4) La médiane série continue

Dans le cas d’une variable continue, la médiane se calcule par les fréquences cumulées relatives F(x) ou absolues N(x).

M = 35ans signifie que 50% des effectifs ont moins de 35ans. 5) Les quantiles : généralisation de la formule

Pour calculer un quantile xQ il suffit de connaître son pourcentage associé 𝑃(𝑄) et d’appliquer la formule suivante :

6) Les quartiles

Il existe trois quartiles qui partagent l’effectif en quatre sous-ensemble. Le deuxième quartile est la médiane (50%). Le pourcentage associé au premier quartile est 25% ; celui du troisième est 75%. Exemple : - 𝑄1 = 20𝑎𝑛𝑠 signifie que 25% des effectifs ont moins de 2o ans, - 𝑄3 = 42𝑎𝑛𝑠 signifie que 75% des effectifs ont moins de 42 ans. L’intervalle 𝑸𝟑 −𝑸𝟏 s’appelle intervalle interquartile. Il contient 50% des observations. 7) Les déciles

Les déciles sont les valeurs du caractère qui partagent l’effectif en dix sous -ensembles. On s’intéresse généralement au 1er et au 9ème déciles sachant que le 5ème décile c’est la médiane. Le pourcentage associé au 1er décile est 10% et celui du 9ème est 90%. Exemple : - 𝐷1 = 18𝑎𝑛𝑠 signifie que 10% des effectifs ont moins de 18 ans - 𝐷9 = 42𝑎𝑛𝑠 signifie que 90% des effectifs ont moins de 42 ans. L’intervalle 𝑫𝟗 −𝑫𝟏 s’appelle intervalle interdécile. Il contient 80% des observations.

6...


Similar Free PDFs