Statistiques - Un cours de L1 filière economie gestion de Mr. Boutoubba Mohammed Amine à PDF

Title Statistiques - Un cours de L1 filière economie gestion de Mr. Boutoubba Mohammed Amine à
Course Statistiques
Institution Université de Rouen
Pages 16
File Size 290.7 KB
File Type PDF
Total Downloads 22
Total Views 162

Summary

Un cours de L1 filière economie gestion de Mr. Boutoubba Mohammed Amine à l'université de droit à Rouen. ...


Description

Statistiques

Chapitre 1 : Notion de statistiques et représentation graphique

Section 1 : Langage et notion statistique I. Vocabulaire A. Définition - ensemble statistique : un ensemble statistique détermine la nature de l'ensemble des éléments sur lesquels doit…. - L'ensemble statistique étudié pourra, par exemple, être l'ensemble des salariés d'une entreprise ou l'ensemble des entreprises d'une branche. Les éléments constitutifs de l'ensemble statistique sont appelés unité statistique ou individu. L'ensemble statistique doit être défini avec la plus grande précision afin que seules les unités statistiques qui le compose soient observées par le statisticien. - variable statistique : chaque unité statistique d'un ensemble statistique donné peut être spécifié par un ou plusieurs caractères appelés variable statistique. Elle constitue l'objet d'étude du statisticien, les unies statistiques étant le support de cette variable. Tout caractère ou variable statistique doit présenter au moins 2 modalités ou valeur. Les valeurs d'une variable correspondent aux différentes situations dans lesquelles se trouvent les unités statistiques au regard de cette variable. Les valeurs d'une variable devront vérifier les propriétés d'exhaustivité et les propriétés d'incompatibilité. La propriété d'exhaustivité assure que toutes les unités ont été étudiées et la propriété d'incompatibilité vérifie que chaque unité a été établit qu'une seule fois. On distingue 2 types de variables statistiques : - une variable quantitative qui se caractérise lorsque la mesure peut être donnée à l'aide de nombre (exemples : âge, rémunération). Elle peut être discrète ou continue. On dit qu'elle est discret lorsqu'elle ne peut prendre que certaines valeurs au sein d'une intervalle de variations (exemple : nombre d'enfants par famille, à ne pas confondre avec le nombre d'enfants par ménage ; nombre des pièces dans les logements) On dit qu'une variable quantitative est continue lorsqu'elle peut prendre toutes les valeurs au sein d'un intervalle de variations (exemple : taille, poids). La mesure des variables continues est toujours de

nature discrète. Par convention, les variables en unité monétaire sont considérées comme des variables continues. - une variable est qualitative lorsqu'elle n'est pas, à priori, mesurable par des nombres. Habituellement, les "modalités ou valeur" d'une variable qualitative sont les différents postes ou rubriques d'une nomenclature (exemple : appartenance à une catégorie socio professionnelle) Une série statistique (ou variable statistique) est le résultat du classement des unités statistiques en fonction des valeurs ordonnées de la variable étudiée. L'ordre des valeurs privilégiées est celui de l'ordre croissant. On distingue deux types de séries statistiques : - La série statistique simple (série individualisée) comporte autant de valeur que d’unité statistique Ensemble statistique de la population : P Effectif total : nombre d’unité statistique N Variable X

Unité statistique « i »  valeur X « xi » I varie de 1 à N Série simple : x1  x2  x3  …  xn

- La série distributive de fréquences (série regroupée) Valeurs xi  effectifs ni (ou fréquence : f = ni / N Valeur de la variable x1 x2 . . . xk

Effectif n1 n2 . . . nk

Fréquence f1 = n1 / N f2 = n2 / N . . . fk

Il varie de 1 à k et k est le nombre de valeurs différentes de X.

Cas particulier : la série classée Il est possible de regrouper les valeurs de la variable au sein d’intervalle appelée « classe ». Toute classe est définie par une borne supérieure et une borne inférieure. L’écart entre les deux bornes est appelé intervalle de classe ou amplitude de classe. L’élaboration d’une série classé doit respecter la propriété

suivante : le centre d’une classe (ou valeur centrale) doit être représentatif des valeurs prises par des unités statistiques associées à la classe. Classes

Effectifs

Fréquences

L 0 – L1 L 1 - L2 . . . Lk – Lk-1

n1 n2 . . . nk / N

f1 f2 . . . fk / 1

05.10.10 II. Opérateurs « somme » et « produit » A. Opérateur « somme » Définition Notation :  a) cas d’une série simple Effectif total : N ; variable : X N valeur xi ; i varie de 1 à N S : somme des valeurs S = x1 + x2 + … + xn N

S = xi b) cas d’une série distributive de fréquences Variable : X ; effectif total : N k couples d’informations : (xi : ni) ou (xi ; fi) i varie de 1 à k k : nombre de valeurs différentes de X S : somme des valeurs S = n1x1 + n2xx2 + … + nkxk k

S = nixi On vérifie N = n1 + n2 + … + nk k

N = ni

Valeur calculée des classes x1 = L 1 + L 0 / 2 x2 = L2 + L3 / 2 . . . xk = Lk + Lk-1 / 2

Propriété 1 : Série simple à 2 variables X et Y Effectif total : N Valeurs de X x1 x2 x3 . . . N

N

N

(xi+yi) = xi + yi Propriété 2 : Série simple à 2 variable X N unités statistiques Terme constant : a N

N

axi = axi Propriété 3 : Série simple à 1 variable X N : effectif total N

i=k

i=N

 = xi + xi Propriété 4 : Terme constant : a N

a = a + a + … + a  N fois N

a = Na B. Opérateur « produit » Définition Notation :  a) cas d’une série simple P : produit des valeurs P = x1 x x2…x xn

Valeur de Y y1 y2 y3 . . .

N

P=

 xi

b) cas d’une série distributive de fréquences P : produit des valeurs P = x1n1 + x2n2 + … + xknk k

P =  ini Propriété 1 : Série simple à 2 variables N

N

N

 xiyi = xi x yi Propriété 2 : Série simple à une variable Terme constant : a axi = aNxi Propriété 3 : N

i=k i=N

xi = xi xi Propriété 4 : Terme constant : a N

a = aN Exercice 1 : Série à deux variables Valeur de X : xi x1 = -1 x2 = 2 x3 = 4 x4 = 6 x5 = 10 N:5 …

III. Notion de taux de croissance

Valeur de Y : yi y1 = 3 y2 = 7 y3 = 5 y4 = 7 y5 = 8

A. Définition Variable X ; 2 périodes : 0 et 1 2 variables de X : x0 et x1 r1/10 : taux de croissance de X de la période 1 par rapport à la période 0. Période 1 : période d’analyse ou courante Période 0 : période de base R1/10 = x1-x0 / x0  r1/10 = (x1/x0) – 1 x1/x0 : indice d’évolution de X de la période 1 par rapport à la période 0  x1/x0 = 1 + r1/10  x1= x0 (1 + r1/10) Exemple : x1 = 600 x0 = 500 r = 600 – 500 / 500 = 100 / 500 = 1 / 5 = 0,2 ou 20% r0/1 = x0 – x1 / x1 = -100 / 600 = 1 / 6 = 0,167 ou -16,7% Intervalle de variation du taux de croissance : -1  r < +infini B. Taux de croissance global Notation : rg R1/0 ; r2/1 ; r3/2 ; … ; rn/n-1 X1 = x0 ( 1 + r1/0) X2 = x1 ( 1 + r2/1) = x0(1+ r1/0) (1 + r2/1) Xn = x0 ( 1 + r1/0)……(1 + rn/n-1)  1 Par définition, Xn = x0 (1 + rg)  2 2=1  1 + rg = (1 + r1/0) (1 + r2/1)…….(1 = rn/n-1) N

1 + rg =  (1 + ri/i-1)

Exercice 1 : évolution d’un indice de prix sur une année Périodes

Taux de croissance de l’indice

+ 2% - 0,5% - 2% +8% +25%

Janvier Février Mars 2é trimestre 2é semestre Taux trimestriel moyen ? Taux mensuel moyen ?

Exercice 2 : évolution du pouvoir d’achat Pouvoir d’achat : PA Indice des prix : P Salaire nominal : S PA = S / P 1é cas : taux de croissance du S : rs = 3% et taux de croissance du P : P = 5% rpa ? 2é cas : rs = 30% et rp = 50% rpa ? 3é cas : rs = 300% et rp = 500% rpa ? C. Taux de croissance périodique moyen Notation : rm On sait que : xm = x0 (1 + r1/0) (1 + r2/1) + … + (1 + rn/n-1)  1 xn = x0 (1 + rm)n  2 n période de même durée N

n

2 = 1  (1 + rm) =

N

 (1 + ri/i-1)  1 + rn =  (1 + ri/i-1)1/n

Section 2 : Représentation graphique Une représentation graphique permet de visualiser une ou plusieurs caractéristiques importantes d’une série. Habituellement, la caractéristique importante et la répartition des unités statistiques en fonction de la valeur de la variable. I. L’histogramme C’est la représentation graphique privilégié pour représenter des séries classées.

A. Construction de l’histogramme Sur l’axe des abscisses sont représentées les classes. Et pour chaque classe, l’effectif ou la fréquence sera représentée par un rectangle dont la surface est proportionnelle à l’effectif (ou fréquence) associé à la classe. a) Série classée à intervalle de classe constant k couples d’informations (xi ; ni) ou (xi ; fi) i varie de 1 à k k classes ; xi : centre de classe de la classe « i » (voir histogramme 1) b) Série classée a intervalles de classe différents (voir histogramme 2) A i = a ni 1 a : coefficient de proportionnalité A i : hi ai 2 hi : hauteur du rectangle de la classe « i » ai : intervalle de la classe « i » 2=1  hi ai = ani  ki = ani / ai (ou : ki = afi / ai) si on pose a = 1  hi = ni / ai hi : densité hi = ni / ai 2 2 2 2 2 (voir histogramme 3)

B. Remarques a) remarque 1

ai intervalles 5 15 30 25 5

classes 0–5 5 – 20 20 – 50 50 – 75 75 – 80

Effectifs 10 30 60 50 10 160 = N

Par définition, l’aire totale de l’histogramme est proportionnelle à l’effectif total ou la somme des fréquences. Il est possible de construire le polygone des effectifs ou des fréquences à partir de l’histogramme. Polygone des effectifs ou des fréquences : (voir histogramme 4) Le polygone des effectifs ou des fréquences définit, avec l’axe des abscisses, une aire égale à l’aire totale de l’histogramme (principe de la conservation des aires) (voir histogramme 5) b) remarque 2 Histogramme des effectifs cumulés ou des fréquences cumulées. Effectifs cumulés (croissants) : Notation : ni cum = n1 + n2 + … + ni n1 cum = n1 nk cum = N Fréquences cumulées : fi cum = fi f1 cum = f1 fk cum = fi = 1 L’histogramme des effectifs ou des fréquences cumulées est obtenu en reportant sur un graphique les valeurs de la variable définie en classe sur l’axe des abscisses et des effectifs ou fréquences cumulées sur l’axe des ordonnées. (voir graphique 6) La courbe diagonale visualise l’hypothèse de la répartition uniforme des unités statistiques au sein de chaque classe.

II. Graphique semi-logarithmique C’est la représentation graphique privilégié pour visualiser les séries chronologiques. Une série chronologique est une série à deux variables dont une est le temps.

A. Echelle logarithmique

Sur une échelle logarithmique, les valeurs de la variable sont représentées par leurs logarithmes. Le logarithme d’un nombre en base a est égale à la puissance à laquelle il faut élever la base pour obtenir ce nombre. Rappel : log xy = log x + log t x = 100 y = 1000 2 x = 10 y = 103 log xy = log 102.103 = log 106 log xy = 5 = 2 + 3 log y/x = log y – log x log 103 / 102 = 1 = 3 -2) Exemple : Log décimaux (en base 10) Variable X ; 4 périodes : de 1 à 4 4 valeurs x1 = 10  log x1 = 1 x2 = 20  log x2 = 1,3 x3 = 100  log x3 = 2 x4 = 200  log x4 = 2,3 (voir graphique 1) Sur une échelle logarithmique, des segments égaux représentent des rapports égaux et donc des taux de croissance égaux. L’échelle logarithmique permet de visualiser les taux de croissance. Propriété de l’échelle logarithme : AB = 1,3 – 1 = 0,3 CD = 2,3 – 2 = 0,3  AB = CD (voir graphique 2) AB = log x2 – log x1 = log x2/x1n CD = log x4 – log x3 = log x4/x3  log x2/x1 = log x4/x3  x2/x1 = x4/x3 rapports ou indices égaux (x2/x1)-1 = (x4/x3)-1 taux de croissance égaux

A. Propriété du graphique semi-logarithmique

a) construction (voir graphique 3) b) variable évoluant à taux de croissance constant Variable X ; n périodes Xn = x0 (1 + rm)n rm : taux de croissance périodique constant  log xn = log x0 (1 + rm)n  log xn = log x0 + log (1 + rm)n  log xn = log xn + nlog (1 +rm) (voir graphique 4) Sur un graphique semi-logarithmique, une variable évoluant selon un taux de croissance constant est représentée par une droite Le graphique semi logarithmique permet de représenter des valeurs d’ordre de grandeur très différentes. Il n’est pas possible de représenter sur ce type de graphique des valeurs négative ou nulle.

Chapitre 2 : Paramètres élémentaires Section 1 : Les paramètres de position Les paramètres de position rendent compte de l’ordre de grandeur de la variable étudiée. Tous les paramètres de position s’expriment dans la même unité de mesure que celle de la variable étudiée.

I. Les moyennes Série distributive de fréquences Les couples d’informations (xi ; ni) ou (xi ; fi) I varie de 1 à k N : effectif total A. La moyenne arithmétique Notation : /x (x barre) 1- définition moyenne arithmétique = somme des valeurs / effectif total  /x = ∑nixi / N (k, i=1)  /x = ∑fix (k, i=1) ou ∑fixi = ∑n/N xi  ∑fixi = 1/N∑nixi 2- Propriété La somme des écarts à la moyenne arithmétique est nulle. ∑ni(xi - /x) = 0 vérification : ∑ni(xi - /x) = ∑nixi - ∑ni - /x = ∑nixi - /x∑ni On sait que : ∑ni = N  ∑ni ( xi - /x) = (∑nixi - /x).N si ∑ni (xi - /x) = 0  ∑nixi - /x.N = 0   /x = 1/N ∑nixi Propriété 2 Nouvelle série : (axi ; ni), N a : terme constant /x’ : moyenne arithmétique

 /x’ = 1/N ∑ni.axi   /x’ = a.(1/N) ∑nixi 1/N ∑nixi : /x /x’ = a./x Propriété 3 Nouvelle série : (x2 + a ; ni) ; N /x’ : moyenne arithmétique  /x’ = 1/N ∑ni (xi + a)   /x’ = 1/N ∑ (nixi + nia)   /x’ = 1/N ∑nixi + 1/N ∑nia   /x’ = 1/N ∑nixi + a/N ∑ni On sait que ∑ni = N et 1/N ∑nixi = /x  /x’ = /x + a Si on ajoute un terme constant alors la variable arithmétique augmente de ce terme contant. Propriété 4 Série 1 (xi’ ; ni’), N’, /x’ Série 2 (xi’’ ; ni’’), N’’, /x’’ Série 1+2 (xi’ ; ni’) U (xi’’ ; ni’’) N = N’ + N’’ /x : moyenne arithmétique /x = 1/N (n1’x1’ + n2’x2’ + … + n1’’x1’’’ + n2’’x2’’ +…)   /x = 1/N (∑ni’xi‘ + ∑ni’’xi’’) On sait que : /x’ = 1/N’ ∑ni’xi’  ∑xi’ni’ = N’./x’ De même : ∑ni’’xi’’ = N’’./x’’  /x = 1/N (N’./x’ + N’’./x’’)   /x = (N’/N)./x’ + (N’’/N)./x’’ C’est la moyenne arithmétique des moyennes arithmétiques (MM) Exercice : valeur /x’ /x’’

/x = 1/N (N’./x’ + N’’./x’’) B. Autres moyennes 1- Moyenne géométrique Notation : G produit des valeurs P = π.xini

Effectif N’ N’’ N

  P = x1n1 . x2n2 . … G = [π.xini]1/N   G = (xn1 . xn2 . …)1/N   G = x1n1/N . x2n2/N …  G = x1f1 . x2f2 . …   G = π xifi (π variant de R à i ou i = 1) Remarque : Cas d’une série simple : N valeurs xi Ii varie de 1 à N G = [π.xi]1/N (π varie de N à i ou i = 1) Remarque bis : /x = 1/N ∑xi

(de N à i ou i = 1)

Exercice : xi : taux de croissance 0,5% 3% 5% 7,5%

ni : nombre de mois 3 2 3 4 12

rm : taux de croissance mensuel moyen (1+ rm)12 = 1,0053 + 1,032 + 1,053 + 1,0754   1 + rm = (1,0053 + 1,032 + 1,053 + 1,0754)1/12 G = [π xini]1/N  G = (1,0053 + 1,032 + 1,053 + 1,0754)1/12 donc G = 1 + rm 2- Moyenne harmonique Notation : H La moyenne H est égale à l’inverse de la moyenne arithmétique des inverses des valeurs Xi  1/xi  ni/xi  1/N ∑(nixi)  N / ∑(ni/xi) N / ∑(ni/xi) : H H = N / ∑(ni/xi)   H = N / (ni/x1 + n2/x2 + … + nk/xK)  H = 1 / ∑fi/xi (de i à i ou i = 1) Remarque : Cas d’une série simple : H = N / ∑1/xi (de N à i ou i = 1) Exercice : 3 voitures parcourant le même trajet 60 km/h 80 km/h

1.

0---------------|D/2|---------------D

2.

50 km/h 90 km/h 0---------------|D/2|---------------D

3.

40 km/h 120 km/h 0---------------|D/2|---------------D

vitesse moyenne = distance / temps  temps = distance / vitesse 1. V1 = D / (D/2 / 60 + D/2 / 80) = 1 / (0,5 / 60 + 0,5 / 80) = … xi : vitesse 60 80

fi : distance 0,5 0,5 1

H = 1 / ∑(fi/xi) = 1 / (0,5/60 + 0,5/80) Pour 3., à quelle vitesse doit-elle rouler sur la deuxième moitié du trajet pour être aussi rapide que 1. ? 3-Moyenne quadratique Notation : Q Elle est égale à la racine carré de la moyenne arithmétique des carrés de la valeur Q = [1/N ∑(n1x12 + n2x22 + …)]1/2 (de k à i ou i = 1)   Q = [1/N ∑nixi2]1/2  Q = [1/N ∑fixi2]1/2 (de k à i ou i = 1) Remarque :  Q = [1/N ∑x2]1/2 Conclusion sur les moyennes : a-Généralisation de la notion de moyenne xal moyenne d’ordre alpha xal = [1/N ∑nixial]1/al al = -1  H al = 1  /x al = 2  Q b-Pour une série statistique donnée, on vérifie : H < G < /x < Q La moyenne G est la moyenne la plus stable c’est à dire la moyenne qui est la moins influencée par les valeurs extrêmes de la série.

Exercice Classes 0 – 10 10 – 50 50 – 100 100 – 200 200 – 500

Effectifs 120 90 45 30 15 N = 300

II. Les quantiles A. La médiane Notation : Me C’est la valeur de la variable qui partage l’effectif total en deux parts égales. 1- Cas d’une série simple Exemple : 3, 5, 9, 14, 18 N = 5 (5 valeurs) Déterminer la médiane : 9 Si N est impaire, la médiane est la valeur de rang N + 1 / 2 La Me présente comme caractéristique principale le fait d’être stable, de pas être influencée par les valeurs extrêmes. Exemple : 3, 5, 9, 14, 18, 22 N=6 Intervalle médian : 9, 14 Si N est pair, on définie un intervalle entre les valeurs de rang N / 2 et (N / 2) + 1 2- Cas de série classée Graphique AB / AC = A’B’ / A’C’ A’B’ / A’C’ = A’’B’’ / A’’C’’  A’’B’’ / A’’C’’ = AB / AC...


Similar Free PDFs