Echantillonnage estimation PDF

Title Echantillonnage estimation
Course Probabilités- statistiques
Institution Université de Pau et des Pays de l'Adour
Pages 4
File Size 483.4 KB
File Type PDF
Total Downloads 2
Total Views 141

Summary

Download Echantillonnage estimation PDF


Description

Echantillonnage-Estimation-Intervalle de confiance I.

Echantillonnage

1. Introduction En sélectionnant une partie de la population, on obtient une représentation assez proche de la réalité. Cette sélection, plus ou moins "représentative", est appelée échantillon. L'objectif de cette partie est de savoir dire, à partir d'une population parfaitement connue, comment doivent se comporter les échantillons que l'on peut en tirer. Conventions de notations : Les paramètres de la population seront désignés par des lettres grecques : moyenne : m ; écart-type : s ; proportion : π Les paramètres d'un échantillon seront désignés par des lettres de notre alphabet : moyenne : x ; écart-type : s ; proportion : p exemple

2. Distribution d'échantillonnage des moyennes Soit une population sur les individus de laquelle on souhaite étudier une variable aléatoire X . Imaginons qu'une fois un effectif n choisi on puisse en extraire tous les échantillons de taille n . Sur l'échantillon n° k , on a été capable de calculer la moyenne . Déf On appelle variable aléatoire moyenne des échantillons de taille n la v.a. .dont les valeurs . des échantillons de taille n . sont les différentes moyennes Déf On appelle distribution d’échantillonnage des moyennes la distribution de l’ensemble des c’est à dire la loi de probabilité de la v.a

*EAS : échantillonnage aléatoire simple(avec remise et ordre) échantillonnage exhaustif (sans remise ni ordre) Remarque 1 : dans le cas où N > 20n (échantillon représentant moins du vingtième de la population), on peut dire que le coefficient

vaut approximativement 1 et donc ne pas le citer.

Remarque 2 : issue du Théorème "central limit" Lorsque N tend vers l'infini (en pratique : à partir d'une très grande population), la loi de probabilité ..est normale, et ce, quelle que soit la loi de probabilité de X . de

3. Distribution d'échantillonnage des proportions Soit une population sur les individus de laquelle on étudie la présence d'un caractère A. Nombre d'individus présentant A : a ; effectif total de la population : N . Déf La proportion d'individus présentant le caractère A dans la population est le nombre π=a/N Dans un échantillon de taille n , cette proportion peut être mesurée et se notera p . Déf On appelle variable aléatoire proportion la v.a. P listant les valeurs p relevées sur l'ensemble des échantillons de taille n . Soit la v.a. Y donnant pour chaque échantillon de taille n le nombre d'individus présentant le caractère A. La loi de Y est la loi binomiale de paramètres n et p . B (n , p ) Rappels : moyenne et variance de Y , E(Y ) = np et V(Y ) = np (1 - p) De plus : P = Y /n Conséquence P a pour moyenne p et pour variance p (1 - p )/n

II.

ESTIMATION

L’estimation d’un paramètre d’une population est une valeur calculée sur un échantillon et censée être "proche" du paramètre estimé.

Exemple

Remarque : La connaissance d'une estimation ponctuelle ne donne aucune information sur la précision avec laquelle on a estimé le paramètre de la population.

III.

Estimation de par intervalle de confiance

L'intervalle de confiance a été créé pour répondre au problème posé dans la remarque ci-dessus. Par exemple, autour d'une moyenne trouvée sur un échantillon, on construira un intervalle "qui aura 95 % de chances" de contenir la moyenne de la population. La méthode de construction de cet intervalle dépendra de la connaissance ou non de . Déf

On appelle seuil de risque , a , la probabilité que l'intervalle de confiance ne contienne pas . En général, on s'intéresse à α = 5 % ou α = 1 %. On appelle niveau de confiance la probabilité que l'intervalle de confiance contienne . Il vaut donc 1 - α. En général, on s'intéresse à 1 - α = 95 % ou 1 - α = 99 %.

Principe :

1. Intervalle de confiance dans le cas où est connu

On rappelle que suit la loi

Ainsi la variable aléatoire

suit la loi normale N(0 ;1)

u étant obtenue par lecture de la table de la loi normale inverse en fonction de la valeur de α.

Par exemple si α=5%, u=1.96

2. Intervalle de confiance dans le cas où est inconnu A partir d'une population qu'on veut connaître mieux en y prélevant un échantillon, il est évident que son écart-type est rarement connu par avance…

Outre la moyenne de l'échantillon, on aura aussi recours à son écart type. La variable aléatoire

est distribuée suivant la loi de Student à n - 1 d.d.l.(degré de liberté)

En effet, T étant construite sur deux variables aléatoires, la loi normale n'est plus adaptée pour la décrire. On utilisera ici la table de la loi de Student, qui s'apparente à la loi N (0 , 1), mais dont la distribution est légèrement différente, en fonction du nombre de degrés de liberté. On trouvera dans le formulaire une table de valeurs de la loi de Student.

remarque : dans le cas d'échantillons très grands, on retrouve les valeurs de la loi normale centrée réduite. (les valeurs de T tendent vers celles de U lorsque n tend vers l'infini) On retiendra que lorsque n > 100, on pourra utiliser la loi N(0 , 1) à la place de la loi de Student....


Similar Free PDFs