Les-statistiques-inférentielles PDF

Title Les-statistiques-inférentielles
Author Payauka Enterin
Course Statistiq1
Institution Université Catholique de Lille
Pages 19
File Size 407.7 KB
File Type PDF
Total Downloads 25
Total Views 125

Summary

M. Craddock...


Description

PSY 2- STATISTIQUES

Les statistiques inférentielles.

Définitions : Population parente La plupart des cas, la population parente est

échantillon

inconnue. C’est la population de laquelle elle a été

Extrait aléatoirement d’une population parente.

tirée de notre échantillon. Effectif : N Moyenne, on sait rarement sa moyenne,

Effectif : n

donc on fait une inférence sur la moyenne de

Moyenne (une moyenne toute seule, n’a pas de

l’échantillon, on part de x barre pour inférer

sens):

sur le :

μ

Ecart-type : Variance :



Ecart-type, l’indice de dispersion : s

σ

Variance : s2

σ2

Exemple : population parente : ensemble des Français. On sait que le QI moyen en France est de 100. Comment on écrit Son écart-type : centre sur

μ=100 ?

σ =15 . On sait que les QI suivent une distribution Gaussienne ou normal qui est

μ . Autour de

μ , il y a beaucoup de personne qui ont cette note là, sur

μ

c’est la

meilleure note, mais plus on s’éloigne de 100 au moins il y a de personne concernée. Pour vérifier la courbe Gaussienne, on utilise une loi mathématique qui consisterait à décompter aléatoirement la population parente en échantillon de taille équivalente. Si on utilise des échantillons n=10 000 au lien de n=6 900 000. On aurait donc réparti les moyennes





sur un axe, on va avoir quelque chose qui sera centré sur

i

; ni & si. Si on

μ

et on aura

une courbe gaussienne et sera plus écrasée que celle pour toute la population parente. La moyenne

sera

μ mais l’écart type de la distribution va s’appeler « l’erreur type » et sera

quelque chose de petit car on a prit un N.

σ √n

.Et on aura

Pour donner un sens à une note, on utilise :

centrée sur 0 et plus sur

μ

z=

avec :

z=

x−´x . On transforme la distribution qui va être s

x´ −μ . Ce qui rend les études universelles. σ n √

encadrement de Z :



60) d’une population parente normale (gaussienne), la distribution des moyennes



i

Z

1−

α 2

+

μ

de tous les échantillons de taille n

suivra également une loi normale de moyenne

μ et d’indice de dispersion : erreur de dispersion

σ √n La dispersion des moyennes d’échantillons sera moins dispersée que la distribution des données brute. L’avantage de la loi normale est que les scores distribués peuvent être transformée en note Z qui

correspond pour la distribution de moyenne (à la transformation suivante)

 Lorsque σ Si on transforme les



i

z=

x´ −μ σ √n

est inconnu, il sera estimé par s.

en note Z, on a une distribution de note Z qui sera centrée sur 0 donc la

moyenne de ces notes Z sera 0. L’indice de dispersion (écart-type) est 1. 2

Tous les Z sont compris entre -2 et 2 L’avantage de tout transformer en note Z, c’est que cela permet d’avoir un résultat, une table universelle qui nous donne la probabilité qu’un Z se trouve inférieur à une valeur de droite. Rappel : probabilité entre 0 et 1

Comment s’appel –Z.99 ? Donc 99% se retrouve « en deçà » et donc il reste Z.01 Quelle est la probabilité qu’on ne se trouve pas entre Z.99 et Z.01 ? .02 car 1% (.01) et un autre 1% à l’extrémité. Donc

α =.02

 ce qui permet d’établir un intervalle de confiance

La valeur numérique du Z sera négative a gauche de 0 et positive à droite de 0.

Exemple : Echantillon de 100. On demande de mettre les notes en note Z. Ces notes Z se dispersent par la loi normale (forme gaussienne). Z= 1.96  la probabilité que Z soit < a 1.96 : P = .975

95% seront entre 1.96 et -1.96 et 5% n’y seront pas .

Z= - 1.96  la probabilité que Z soit < à -1.96 : P = .025 La probabilité que ça se trouve entre -1.96 et 1.96 : P = 1 – α La probabilité que ça se trouve entre 1.96 et



:P:

1−

α 2

La table du Z (la table du t) va nous permettre de trouver la valeur numérique du Z tel que la probabilité que un Z tiré au hasard se trouve en deçà de cette valeur Ex : P= .975, la valeur numérique du Z est de 1.96, cette probabilité correspond donc à la probabilité que un Z tiré au hasard dans une population parente normale soit inférieur ou égale à 1.96. On nommera donc ce Z, Z.975 et on le situera à l’extrême droite de la courbe car il indique que la probabilité qu’un Z soit inférieur ou égale à sa valeure est grande.

Le symétrique de Z.975 à la valeur de -1.96, ce qui correspond à –Z.975 qui s’écrit aussi Z.025. Si

05 alors Z.975 correspond à

Z

1−

α 2

et Z.025 correspond à

α =.

Zα 2

3

Lorsque l’on fait un interval de confiance et qu’on souhaite déterminer les valeurs pour lesquels Z a

95% de chance de se trouver ( α=.05 ¿ , on regarde à

Z

1−

α 2

ici Z.975 et on déduira que

Zα 2

vaut

1.96. On pourra établir que Z à 95% de chance de s’établir entre -1.96 et 1.96.

Si l’échantillon est tiré aléatoirement d’une population parente normale, le Z de cet échantillon aura de forte chance de se trouver entre -2 & 2. Ce qui veut dire que, si le Z calculé est > à 1.96 ou < à -1.96, on préfèrera considérer que l’échantillon n’était pas extrait aléatoirement de la population parente concernée.

Ex : QI nordique de 104 donc,

z=

x´ −μ 4 σ = 1.5 √n

= 2.75>1.96  extrême droite. Cela veut dire que

ce n’est pas extrait de la population parente des QI Français

II. Inférence sur une moyenne

La moyenne sur laquelle on fait de l’inférence est

μ

En d’autres termes, cela revient à tester si l’échantillon dont nous disposons est extrait aléatoirement d’une population parente donc la moyenne est

μ

Exemple : Si je veux voir si l’échantillon d’étudiants sélectionné est extrait d’une population parente dont la moyenne est 100, je vais calculer la valeur soit du Z (si mon échantillon est supérieur ou égale à 60) soit du t au ddl = n-1 (si l’effectif est inférieur à 60).

Mais désormais, nous suivrons une démarche statistique en 7 points : 1. Identification de la problématique : nous allons procéder à une inférence sur une moyenne, c.à.d. que nous allons comparer la moyenne extrait l’échantillon à la moyenne μ 0

μ

de la population parente d’où est réellement

(c’est une moyenne qui nous ai donné dans l’énoncé et on

essaie de voir si c’est la moyenne qui correspond à la moyenne de la population parente).

4

On prendra le seuil

α donné dans l’énoncé. Si il n’est pas donné alors

α =0.05

2. Hypothèse : o

H0 : la moyenne

On ne conclut jamais sur H0  on ne peut jamais affirmer H0

μ0 o

de la population parente d’où est extrait l’échantillon est égale à

μ

H1 : la moyenne de la population parente d’où est extrait l’échantillon est soit différente soit supérieure, soit inférieure (c’est suivant l’énoncé) a

μ0

Ex : la moyenne de la population parente des QI des étudiants de psychologie est supérieure à 100.

3. Statistique de décision et sa loi sur H0 :

o

o

Si n ≥ 60

z=



Si n < 60 : «

x´ −μ0 s √n

t n−1 =

x´ −μ 0 s √n

sous H0 » de loi normale centrée sur 0 et de variance 1

sous H0 » de la loi student a n-1 ddl. A condition que la

population parente de l’échantillon suive la loi normale. 4. Statistique observée : calcule du Z ou du t 5. Valeur(s) critique(s) et région critique : o

Si n 

BL : bilatéral

≥ 60 Si H1 BL : on a deux valeurs critiques

RC (Z) α

¿ ¿−∞; Z α [ U ] Z

=

UL : unilatéral

2

RC : région critique



Z

1−

α 2

et

Zα 2

 0 ne peut pas faire partir de 1−

α 2

;+ ∞ ¿

la région critique

SI H1 UL a droite (numérateur positif) : on a une valeur critique

Z 1−α

¿

RC (Z) α=¿ Z 1−α ;+∞ ¿ 

SI H1 UL a gauche (numérateur négatif) : on a une valeur critique RC (Z) α

o

=



¿ ¿−∞; Z α ¿

Si n...


Similar Free PDFs