Biostat 1 - Notes de cours 1 PDF

Title Biostat 1 - Notes de cours 1
Course outils statistiques
Institution Université Paris-Est Créteil Val de Marne
Pages 9
File Size 352.7 KB
File Type PDF
Total Downloads 55
Total Views 144

Summary

CH1 stat 2020...


Description

10 septembre 2020

COLLECTE DES DONNÉES 1.  DÉFINIR RIGOUREUSEMENT DANS LA PLANIFICATION       

Hypothèse, Population statistique, Dispositif d’échantillonnage ou expérimental, Stratégie d’échantillonnage ou d’allocation des traitements, Effectif de l’échantillon, Observations et mesures, Traitement des données.

2. FORMULATION DE L’HYPOTH4SE Objectif= répondre à une question On formule à priori une hypothèse H0 et son alternative H1. L’analyse statistique basée sur les données permettra de rejeter ou non l’hypothèse H0. Exemples : Y a-t-il un lien entre la couleur des pétales et leur forme ?

 

H0 : « il n’y a pas de lien » H1 : « il y a un lien »

Pour y répondre, on fera une enquête (collecte d’informations de manière organisée) sur des fleurs dans un champ.

L’apport d’azote améliore-t-il la croissance des plantes ?

 

H0 : « il n’y a pas d’effet (les plantes avec azote ne poussent pas mieux que celles sans) » H1 : « il y a un effet positif (les plantes avec azote poussent mieux que celles sans »

Pour y répondre, on fera une expérience en semant (en pot ou sur des parcelles au champ) des plantes avec et sans ajout d’azote.

Attention : H0 n’est pas forcément l’hypothèse que l’on croit vraie. Elle est choisie sur d’autres critères.

3. SÉLÉCTION DE LA POPULATION Objectif= délimiter l’enquête ou l’expérience   

Individu statistique= unité de base (humain, animal, plante, groupe de personnes, entreprise, appareil, électeur…) Population= ensemble des individus sur lesquels porte l’étude ou la prévision (généralement difficile à étudier dans sa totalité) Échantillon= ensemble des individus effectivement étudiés et représentés par l’échantillonnage

4. DÉFINITION DES VARIABLES A. Variable qualitative vs variable quantitative Chaque étude fait intervenir plusieurs variables, qui peuvent être collectées, manipulées, observées, mesurées… Elles peuvent être de deux types :  

Variable qualitative (catégorie) Variable quantitative (numérique)

Eux même divisibles en deux sous types :

2

B. Variable qualitative 1. Variable nominale Catégorie que l’on nomme avec un nom, ne contenant pas de notion d’ordre (Exemple : présence ou absence de bactérie, couleur, sexe, groupe sanguin…) 2. Variable ordinale Catégorie naturellement ordonnée (Exemple : Couleur « claire, moyenne, foncée », score de douleur, classe de taille…)

C. Variable quantitative 1. Variable discrète Variable dont on peut énumérer les valeurs (« 0,1, 2,… ») ; elle est typiquement issue d’un comptage. (Exemple : nombre de bactéries présentes, nombre d’individus par espèce, densité d’une population…) 2. Variable continue Variable pouvant prendre toutes les valeurs d’une intervalle finie [ -30 ;30] ou infinie [0,+∞] ; elle est typiquement issue d’une mesure. (Exemple : poids, taille, concentration…)

D. Variable explicative et variable expliquée 1. Variables explicatives (ou facteurs) Variables manipulées par l’expérimentateur (Exemple : administration de traitement ou non, type d’alimentation…) 2. Variables expliquées Variables mesurées ou enregistrées, que l’on cherche à expliquer par les variables explicatives (Exemple : survie, tolérance, croissance…) Une étude porte sur des variables explicatives et les résultats de l’étude (les données) sont les variables expliquées

Exemple : Influence de la concentration en pesticide sur le nombre de pucerons observés dans un champ :

  3

Variable explicative= concentration en pesticides (variable quantitative continue) Variable expliquée= nombre de pucerons (variable quantitative discrète)

5. DISPOSITIF D’ECHANTILLONAGE OU EXPERIMENTAL A. Définir la méthode d’échantillonnage   

Questionnaire (à formuler de manière à ne pas influencer les réponses) Transepts, quadrats (étudier au préalable la cartographie Étudier les conditions, le moment (saison, après un événement, en présence ou non de facteurs influent…)

B. Définir les unités expérimentales 



Quel type, forme, dimension (volume du microsome, nombre de plantes, surface et forme de la parcelle, unités naturelles (pierre, lac…), ou artificielles (quadrat…)) Conditions expérimentales (composition du milieu de culture, lumière, température, humidité…)

Il faut aussi tenir compte des limites spaciales et temporelles.

6. STRATÉGIE D’ÉCHANTILLONNAGE OU D’ALLOCATION DES TRAITEMENTS Objectif = définir oP et quand sont faits les prélèvements, les questionnaires  

Sans biaiser l’étude et en restant objectif En éliminant les effets des facteurs de confusion

Qu’est-ce qu’un échantillonnage ? C’est un tirage aléatoire de n individus dans une population. Quand doit-on faire un échantillonnage ? Lorsque la population ne peut pas être étudiée dans son intégralitéQ. 





Soit la population est de très grande taille (long et onéreux de faire une étude sur tous les individus) (Poids à la naissance des enfants nés en 2017) Soit la population ne peut pas être énumérée dans son entier (Population des SDF) Soit la population est virtuelle (ou hypothétique) (population des malades qui seront traités avec un nouveau traitement dont l’efficacité est étudiée)

En fonction de la problématique on effectue : 



Une enquête = collecte in situ d’informations sur un groupe d’individus  Si elle est exhaustive, c’est un recensement  Si elle est partielle, c’est un sondage Une expérience, afin de tester les effets de certains facteurs (par exemple un traitement)

A. Aléatoire vs systématique 4

L’échantillonnage ou l’allocation des traitements peut se faire de manière

5



Aléatoire = chaque individu a la même probabilitéQ d’être choisi que tous les autres individus de la population Facile à mettre en place mais suppose une population homogène



Systématique = les individus sont choisis de manière régulière dans la population Facile à mettre en place mais suppose une population homogène, et risque de ne pas être représentatif s’il existe un cycle ou une périodicité dans la population

B. Simple, stratifié ou en grappe L’échantillonnage (de même que l’allocation des traitements) peut être :  

Simple = échantillonnage (aléatoire ou systématique) directement dans la population, supposée homogène Stratifié = utilisé si la population est hétérogène ; elle est alors divisée en strates (groupes homogènes d’individus regroupés selon des critères liés à la variable à expliquer) puis un échantillonnage (aléatoire ou systématique) est effectuéQ dans chaque strate

Exemple : Une enquête sur la vie étudiante a étéQ menée auprès de 100 étudiants. L’échantillon a étéQ obtenu en choisissant aléatoirement 25 étudiants respectivement de L1, L2, L3 et M1. -> strate= année d’étude



En grappes = on ne choisit pas des individus mais des grappes (groupes, éventuellement hétérogènes, d’individus) ; l’ensemble des individus d’une même grappe sont sélectionnés dans l’échantillon

Exemple : Une compagnie aérienne décide de mener une enquête de satisfaction auprès de ses clients sur un jour. Pour cela, elle choisit aléatoirement 5 vols de la journée et interroge tous les passagers de ces vols. ->grappe = passagers d’un même vol L’échantillonnage peut se faire en plusieurs étapes. Exemple : Enquête sur la population d’un pays.

 Échantillonnage aléatoire simple de 50 villes françaises,  Au sein de chaque ville, échantillonnage aléatoire simple de 10 quartiers,  Au sein de chaque quartier, échantillonnage aléatoire simple de 20 ménages. Il est également possible de combiner en plusieurs étapes échantillonnages simples, stratifies ou en grappes, ainsi que aléatoires ou systématiques.

C. Échantillons appariés vs non appariés 6

Supposons que nous disposions de deux échantillons de tailles respectives n1 et n2 (nombre d’individus dans chaque échantillon). 

Si ces individus sont associés par paires (un individu du 1er et un individu du 2nd échantillon), on parle d’échantillons appariés. Ceci implique nécessairement que n1 = n2. Il y a alors une dépendance entre ces deux échantillons.

Exemple :

 Mesures effectuées sur les mêmes 20 individus avant et après traitement  Mesures effectuées sur 50 individus avec deux appareils différents  Tension mesurée sur le bras gauche et sur le bras droit de 10 individus



Sinon, on parle d’échantillons non appariés. Les deux échantillons ont étéQ prélevés de manière indépendante l’un de l’autre.

Exemple :

 50 individus étudiés sous traitement, groupe témoin de 30 individus sans traitement  10 prélèvements effectués en terrain sableux, 10 en terrain argileux

Cette différentiation est cruciale pour choisir un test statistique adapté à l’étude de ces échantillons

7. EFFECTIF DE L’ÉCHANTILLON  7

Effectif d’un échantillon = nombre d’individus dans l’échantillon



 

En raison de la grande variabilité# du matériel biologique (d’un individu, d’une saison, d’une année à l’autre), un grand nombre de répétitions d’une même expérience est nécessaire. Toute expérience nécessite de plus un échantillon témoin, qui doit être également choisi au hasard. Il faut éviter tout artefact expérimental.  Injection d’une substance chez une population cible : risque d’effets liés à la manipulation  Translocation d’animaux : effets du transport

Résultats généralisables à l’ensemble de la population si :

 L’effectif est suffisamment important,  L’échantillon est suffisamment représentatif (d’oPU l’importance de la stratégie d’échantillonnage).

8. OBSERVATIONS ET MESURES Objectif = définir un protocole de mesure (comment l’acquérir, quelle est sa précision...) permettant de limiter la variabilité# expérimentale due :

 

Aux conditions expérimentales (dont les variations entrainent un facteur d’aléas) Aux erreurs induites par l’appareil de mesure utilisé.

Cette variabilitéQ expérimentale s’ajoute à la variabilité# biologique qui existe entre les individus et au sein d’un même individu. Exemple : Pour étudier le rendement en bléQ :

 

Compte-t-on le nombre de grains ? Pèse-t-on la récolte de grains ?  Avec quelle précision, quelle balance ?  Poids sec ou poids frais ?

9. TRAITEMENT DES DONNÉES

8

Analogie simpliste :  

La théorie des probabilités part d’un animal et prédit l’empreinte qu’il devrait laisser (principe de déduction), La statistique consiste àU partir d’une empreinte et deviner quel animal l’a produite (principe d’induction).

La statistique est une démarche inductive : on tire d’un cas particulier (l’échantillon) une information générale (sur la population). La population présentant une grande variabilité#, on ne peut conclure avec certitude sur la population à partir des données acquises sur l’échantillon. Il y a un risque d’erreur. Ce

risque

 

9

est

mesurable

grâce

à la

théorie

des

probabilités.

Statistiques descriptives = décrire, résumer, présenter les données de manière simple et accessible (tableaux, graphiques) Statistiques inférentielles = étendre ou généraliser à l’ensemble de la population les conclusions obtenues par la statistique descriptive à partir de l’échantillon observé...


Similar Free PDFs