Chapitre 4 Les paramètres de dispersion de série statistique PDF

Title Chapitre 4 Les paramètres de dispersion de série statistique
Course statistique appliquée
Institution Université Paris-Est Créteil Val de Marne
Pages 4
File Size 297 KB
File Type PDF
Total Downloads 15
Total Views 162

Summary

Note de cours...


Description

Chapitre 4 : Les paramètres de dispersion de série statistique

Les caractéristique de tendances centrales (paramètres de position) ne renseignent que sur l’ordre de grandeur d’une série. Elles ne donnent pas d’indication sur la façon dont sont groupés les informations. Par exemple, les deux séries suivantes ont la même moyenne et la même médiane mais pas la même dispersion. Xi

1

1

5

9

9

Yi

4

4

5

6

6

I.

LES ÉCARTS

1) L’étendue C’est la différence entre la plus grande et la plus petite des valeurs observées de la variable. C’est la largeur de la série statistique. L’étendue (E) est : 𝑬 = 𝒙𝒎𝒂𝒙 – 𝒙𝒎𝒊𝒏 L’étendue est la dispersion entre deux valeurs extrêmes qui donne un aperçu de l’hétérogénéité des données. Exemple : Soit la série des salaires suivante : 800 ; 900 ; 1300 ; 2500 ; 3800 ; 6700 ; 8800. 𝑬 = 𝟖𝟖𝟎𝟎 − 𝟖𝟎𝟎 = 𝟖 𝟎𝟎𝟎€

2) Les intervalles interquantiles Ils sont utiles pour éviter des calculs sur les valeurs extrêmes ou aberrantes. Ces outils permettent de gagner en homogénéité mais écarte des observations de l’étude. Tout dépend donc de l’objectif poursuivi. On cite 3 intervalles : o L’intervalle interquartile : ∆𝑸 = 𝑸𝟑 − 𝑸𝟏 il contient 50% des observations. o L’intervalle interdécile : ∆𝑫 = 𝑫𝟗 − 𝑫𝟏 il contient 80% des observations. o L’intervalle intercentile : ∆𝑪 = 𝑪𝟗𝟗 − 𝑪𝟏 Il contient 98% des observations.

1

3) L’écart absolu Les écarts absolus sont les moyennes arithmétiques des écarts par rapport à une valeur centrale. On aura donc : o L’écart absolu moyen par rapport à la moyenne :

o L’écart absolu moyen par rapport à la médiane :

II.

LES ÉCHELLES

1) L’échelle globale C’est le rapport entre la valeur la plus élevée et la valeur la plus petite du caractère. EG = (xmax) / xmin Une échelle globale des salaires égale à 5 signifie que l’échelle des salaires varie de 1 à 5. Donc le salaire le plus haut est 5 fois supérieur au salaire le plus bas.

2) Le rapport interdécile C’est le rapport entre le 9ème et 1er décile donc il ne concerne que 80% des observations. RID = D9 / D1 S’agissant des revenus par exemple, un RID égal à 3 signifie que pour 80% de la population, exclusion faite des 10% les plus pauvres (càd inférieur à 𝐷1 ) et des 10% les plus riches (càd supérieur à 𝐷9 ), l’échelle varie de 1 à 3.

III.

LA VARIANCE

Définition : La variance notée V(x), d’une variable statistique (xi) à laquelle correspondent les effectifs ni est la moyenne arithmétique des carrés des écarts à la moyenne arithmétique. Elle est toujours positive.

2

1) L’écart-type On appelle écart type, notée 𝜎x , la racine carrée de la variance. On a donc :

Par rapport à la variance, l’écart-type présente l’avantage de s’exprimer dans la même unités que la variable étudiée alors que la variance est élevée au carré.

2) Calcul (série discrète) Soit la série suivante 5 ; 8 ; 12 ; 15 ; 25.

3) Calcul variable continue

4) Coefficient de variation (CV) Le coefficient de variation que l’on exprime en pourcentage est le rapport de l’écart-type par la valeur moyenne de la série. Il permet de comparer deux dispersions (mesurée par l’écart-type) et de caractériser une dispersion autour de la moyenne.

Par convention, la dispersion autour de la moyenne sera : -

Faible si le CV est inférieur à 40% Moyenne si le CV est compris entre 40% et 60% Élevée si le CV est supérieur à 60%. 3

5) La décomposition de la variance o Soit une population 𝑷 d’effectif n caractérisée par une variable (𝑥i) composée de deux sous-population 𝑃1 et 𝑃2 décrites respectivement par (𝑥1 ) et (𝑥2 ) et d’effectifs respectifs 𝑛1 et 𝑛2. On peut écrire :

n = n1 + n2 𝑥 = 𝑥1 + 𝑥2 La moyenne totale de la population est égale la moyenne pondérée des moyennes des sous-populations. On a donc :

o La variance totale de la population est égale à la moyenne des variances des différentes sous-populations augmentée de la variance des moyennes des différentes sous-populations. On a donc :

En d’autres termes : -

La moyenne des variances est la variance intrapopulation càd celle que l’on obtiendrait si toutes les sous-populations avaient la même moyenne.

-

La variance des moyennes est la variance interpopulation càd celle que l’on obtiendrait si toutes les sous-populations étaient homogènes en ce sens que chaque variable de chaque sous-population serait égale à sa moyenne.

o Soit la distribution suivante des salaires dans une entreprise ayant deux établissement A et B :

La variance globale des salaires (entreprise E) est :

Conclusion : La dispersion des salaires est principalement interne aux établissements et moins entre les établissements. 4...


Similar Free PDFs