Title | Les-statistiques-inférentielles |
---|---|
Author | Payauka Enterin |
Course | Statistiq1 |
Institution | Université Catholique de Lille |
Pages | 19 |
File Size | 407.7 KB |
File Type | |
Total Downloads | 25 |
Total Views | 125 |
M. Craddock...
PSY 2- STATISTIQUES
Les statistiques inférentielles.
Définitions : Population parente La plupart des cas, la population parente est
échantillon
inconnue. C’est la population de laquelle elle a été
Extrait aléatoirement d’une population parente.
tirée de notre échantillon. Effectif : N Moyenne, on sait rarement sa moyenne,
Effectif : n
donc on fait une inférence sur la moyenne de
Moyenne (une moyenne toute seule, n’a pas de
l’échantillon, on part de x barre pour inférer
sens):
sur le :
μ
Ecart-type : Variance :
x´
Ecart-type, l’indice de dispersion : s
σ
Variance : s2
σ2
Exemple : population parente : ensemble des Français. On sait que le QI moyen en France est de 100. Comment on écrit Son écart-type : centre sur
μ=100 ?
σ =15 . On sait que les QI suivent une distribution Gaussienne ou normal qui est
μ . Autour de
μ , il y a beaucoup de personne qui ont cette note là, sur
μ
c’est la
meilleure note, mais plus on s’éloigne de 100 au moins il y a de personne concernée. Pour vérifier la courbe Gaussienne, on utilise une loi mathématique qui consisterait à décompter aléatoirement la population parente en échantillon de taille équivalente. Si on utilise des échantillons n=10 000 au lien de n=6 900 000. On aurait donc réparti les moyennes
x´
x´
sur un axe, on va avoir quelque chose qui sera centré sur
i
; ni & si. Si on
μ
et on aura
une courbe gaussienne et sera plus écrasée que celle pour toute la population parente. La moyenne
sera
μ mais l’écart type de la distribution va s’appeler « l’erreur type » et sera
quelque chose de petit car on a prit un N.
σ √n
.Et on aura
Pour donner un sens à une note, on utilise :
centrée sur 0 et plus sur
μ
z=
avec :
z=
x−´x . On transforme la distribution qui va être s
x´ −μ . Ce qui rend les études universelles. σ n √
encadrement de Z :
Zα
60) d’une population parente normale (gaussienne), la distribution des moyennes
x´
i
Z
1−
α 2
+
μ
de tous les échantillons de taille n
suivra également une loi normale de moyenne
μ et d’indice de dispersion : erreur de dispersion
σ √n La dispersion des moyennes d’échantillons sera moins dispersée que la distribution des données brute. L’avantage de la loi normale est que les scores distribués peuvent être transformée en note Z qui
correspond pour la distribution de moyenne (à la transformation suivante)
Lorsque σ Si on transforme les
x´
i
z=
x´ −μ σ √n
est inconnu, il sera estimé par s.
en note Z, on a une distribution de note Z qui sera centrée sur 0 donc la
moyenne de ces notes Z sera 0. L’indice de dispersion (écart-type) est 1. 2
Tous les Z sont compris entre -2 et 2 L’avantage de tout transformer en note Z, c’est que cela permet d’avoir un résultat, une table universelle qui nous donne la probabilité qu’un Z se trouve inférieur à une valeur de droite. Rappel : probabilité entre 0 et 1
Comment s’appel –Z.99 ? Donc 99% se retrouve « en deçà » et donc il reste Z.01 Quelle est la probabilité qu’on ne se trouve pas entre Z.99 et Z.01 ? .02 car 1% (.01) et un autre 1% à l’extrémité. Donc
α =.02
ce qui permet d’établir un intervalle de confiance
La valeur numérique du Z sera négative a gauche de 0 et positive à droite de 0.
Exemple : Echantillon de 100. On demande de mettre les notes en note Z. Ces notes Z se dispersent par la loi normale (forme gaussienne). Z= 1.96 la probabilité que Z soit < a 1.96 : P = .975
95% seront entre 1.96 et -1.96 et 5% n’y seront pas .
Z= - 1.96 la probabilité que Z soit < à -1.96 : P = .025 La probabilité que ça se trouve entre -1.96 et 1.96 : P = 1 – α La probabilité que ça se trouve entre 1.96 et
∞
:P:
1−
α 2
La table du Z (la table du t) va nous permettre de trouver la valeur numérique du Z tel que la probabilité que un Z tiré au hasard se trouve en deçà de cette valeur Ex : P= .975, la valeur numérique du Z est de 1.96, cette probabilité correspond donc à la probabilité que un Z tiré au hasard dans une population parente normale soit inférieur ou égale à 1.96. On nommera donc ce Z, Z.975 et on le situera à l’extrême droite de la courbe car il indique que la probabilité qu’un Z soit inférieur ou égale à sa valeure est grande.
Le symétrique de Z.975 à la valeur de -1.96, ce qui correspond à –Z.975 qui s’écrit aussi Z.025. Si
05 alors Z.975 correspond à
Z
1−
α 2
et Z.025 correspond à
α =.
Zα 2
3
Lorsque l’on fait un interval de confiance et qu’on souhaite déterminer les valeurs pour lesquels Z a
95% de chance de se trouver ( α=.05 ¿ , on regarde à
Z
1−
α 2
ici Z.975 et on déduira que
Zα 2
vaut
1.96. On pourra établir que Z à 95% de chance de s’établir entre -1.96 et 1.96.
Si l’échantillon est tiré aléatoirement d’une population parente normale, le Z de cet échantillon aura de forte chance de se trouver entre -2 & 2. Ce qui veut dire que, si le Z calculé est > à 1.96 ou < à -1.96, on préfèrera considérer que l’échantillon n’était pas extrait aléatoirement de la population parente concernée.
Ex : QI nordique de 104 donc,
z=
x´ −μ 4 σ = 1.5 √n
= 2.75>1.96 extrême droite. Cela veut dire que
ce n’est pas extrait de la population parente des QI Français
II. Inférence sur une moyenne
La moyenne sur laquelle on fait de l’inférence est
μ
En d’autres termes, cela revient à tester si l’échantillon dont nous disposons est extrait aléatoirement d’une population parente donc la moyenne est
μ
Exemple : Si je veux voir si l’échantillon d’étudiants sélectionné est extrait d’une population parente dont la moyenne est 100, je vais calculer la valeur soit du Z (si mon échantillon est supérieur ou égale à 60) soit du t au ddl = n-1 (si l’effectif est inférieur à 60).
Mais désormais, nous suivrons une démarche statistique en 7 points : 1. Identification de la problématique : nous allons procéder à une inférence sur une moyenne, c.à.d. que nous allons comparer la moyenne extrait l’échantillon à la moyenne μ 0
μ
de la population parente d’où est réellement
(c’est une moyenne qui nous ai donné dans l’énoncé et on
essaie de voir si c’est la moyenne qui correspond à la moyenne de la population parente).
4
On prendra le seuil
α donné dans l’énoncé. Si il n’est pas donné alors
α =0.05
2. Hypothèse : o
H0 : la moyenne
On ne conclut jamais sur H0 on ne peut jamais affirmer H0
μ0 o
de la population parente d’où est extrait l’échantillon est égale à
μ
H1 : la moyenne de la population parente d’où est extrait l’échantillon est soit différente soit supérieure, soit inférieure (c’est suivant l’énoncé) a
μ0
Ex : la moyenne de la population parente des QI des étudiants de psychologie est supérieure à 100.
3. Statistique de décision et sa loi sur H0 :
o
o
Si n ≥ 60
z=
:«
Si n < 60 : «
x´ −μ0 s √n
t n−1 =
x´ −μ 0 s √n
sous H0 » de loi normale centrée sur 0 et de variance 1
sous H0 » de la loi student a n-1 ddl. A condition que la
population parente de l’échantillon suive la loi normale. 4. Statistique observée : calcule du Z ou du t 5. Valeur(s) critique(s) et région critique : o
Si n
BL : bilatéral
≥ 60 Si H1 BL : on a deux valeurs critiques
RC (Z) α
¿ ¿−∞; Z α [ U ] Z
=
UL : unilatéral
2
RC : région critique
Z
1−
α 2
et
Zα 2
0 ne peut pas faire partir de 1−
α 2
;+ ∞ ¿
la région critique
SI H1 UL a droite (numérateur positif) : on a une valeur critique
Z 1−α
¿
RC (Z) α=¿ Z 1−α ;+∞ ¿
SI H1 UL a gauche (numérateur négatif) : on a une valeur critique RC (Z) α
o
=
Zα
¿ ¿−∞; Z α ¿
Si n...