Facteur de confusion, interactions et analyses multivariées PDF

Title Facteur de confusion, interactions et analyses multivariées
Course Lecture critique d'article
Institution Université de Montpellier
Pages 13
File Size 503.1 KB
File Type PDF
Total Downloads 6
Total Views 129

Summary

Cours de lecture critique d'article...


Description

Facteurs de confusion, interaction et analyses multivariés Table des matières I – Biais de confusion..........................................................................................................1 1 – Définition................................................................................................................................2 2 – Exemple : Infection et décès....................................................................................................2 3 – Résultat et interprétation de l’ajustement...............................................................................4

II – Interaction ou modification d’effet................................................................................5 1 – Suite des résultats et de l’interprétation de l’ajustement de l’exemple précèdent...................5 2 – Définition de l’interaction.......................................................................................................6

III – Neutralisation des facteurs de confusion......................................................................8 1 – Lors de la sélection des sujets..................................................................................................8 2 – Lors de l’analyse......................................................................................................................8 3 – Standardisation.....................................................................................................................12

Objectif :     

Définir ce qu’est un biais de confusion Citer les principaux moyens de contrôle des biais de confusion aux différents temps d’une recherche clinique Expliquer le principe d’une analyse stratifiée, d’un modèle multivarié et d’une standardisation dans la prise en compte de facteur de confusion Identifier le modèle adapté à la nature de la variable d’intérêt et savoir en interpréter le résultat Différencier un biais de confusion et une interaction (effet modulateur)

I – Biais de confusion 1 – Définition Un facteur F joue le rôle de facteur de confusion dans la relation entre l’exposition E et la maladie M si dans la population cible : – F est lié à E – F est lié à M – F n’est pas une conséquence de E Un facteur n’est jamais un facteur de confusion en soit, tout seul mais c’est un facteur de confusion pour une relation particulière. La question du facteur de confusion ne se posera que si on étudie une association précise, en changeant d’association, les facteurs de confusion ne seront plus les mêmes.

L’exemple classique du biais de confusion est la prise en considération de la consommation d’alcool dans le lien entre tabagisme et cancer du poumon. En l’absence de prise en compte du tabagisme, on peut trouver une relation entre l’alcool et le cancer du poumon. On pourrait alors croire que l’alcool agit de façon causale sur le cancer du poumon, alors qu’il s’agit en réalité de l’effet du tabac. En effet, les gens qui boivent sont plus souvent fumeurs que le reste de la population. L’alcool ne cause pas le cancer du poumon, c’est le tabagisme chez les alcooliques qui cause le cancer du poumon. Ici, le tabagisme est lié à l’alcoolisme, et également au cancer du poumon, et n’est pas conséquence de l’alcoolisme, il s’agit donc d’un facteur de confusion.

2 – Exemple : Infection et décès Le rôle propre, sans intervention des facteurs de confusion, de l’infection sur le décès est cherché à travers une étude comparant l’incidence de décès chez les personnes atteintes d’une infection et chez elles indemnes de cette infection. On trouve un OR égal à 5. Ne sachant pas si, dans la population cible, l’évènement observé, ici le décès, est rare (si les patients ont été inclus dans un service de réanimation, la prévalence du décès peut s’élever à 10%) on ne peut pas dire que l’infection multiplie par 5 le risque de décès. Mais cette association est forte donc si l’intervalle de confiance de l’OR ne comprenait pas la valeur 1, on pourrait conclure que cette association est significative, et ce même en l’absence de 2

valeur précise du risque relatif. L’OR brut, ne prenant pas en compte les facteurs de confusion, montre une association forte.

L’âge est un facteur de confusion potentiel car l’âge est un facteur de risque d’infection mais aussi de décès. Comment savoir, dans cet OR égal à 5, quelle est la part réellement liée aux infections et celle liée à l’âge ? Pour répondre à cette question, on peut utiliser différente méthode d’ajustement pour obtenir l’effet propre de l’infection, indépendamment de l’effet de l’âge sur le décès.

Remarque : Ajuster c’est étudier l’effet propre de l’événement sur la maladie indépendamment de l’effet du facteur de confusion. - la stratification ne s’utilise pas beaucoup en pratique pour traiter les facteurs de confusion mais elle est très importante pour permettre de comprendre le fonctionnement d’un modèle multivarié. De plus, la stratification sert à étudier les facteurs d’interaction. Remarque : les facteurs d’interaction ne sont pas des facteurs de confusion et sont utilisés pour faire de la médecine personnalisée. Ils permettront d’individualiser les prises en charge. La stratification consiste à faire des sous-groupes. Ici, on cherche à éliminer l’effet de l’âge sur la relation infection-décès. Ainsi, on va constituer un groupe homogène en termes d’âge. S’il n’y a pas de différence d’âge entre les différentes personnes de ce groupe alors il n’y aura nécessairement pas d’effet de l’âge.

3

3 – Résultat et interprétation de l’ajustement A partir de notre exemple et sur le groupe des jeunes et des vieux, on va aller calculer 2 risques relatifs dans ces 2 strates (qui seront donc des risques relatifs stratifiés). Et comme les groupes sont homogènes sur l’âge, la relation entre l’exposition, l’infection et la maladie, le décès, sera indépendante de l’âge. Le risque relatif ajusté est grossièrement la moyenne entre ces 2 risques relatifs. Remarque : En réalité, la formule statistique est un peu plus complexe qu’une simple moyenne car il faut, entre autres, pondérer avec les effectifs.



Si le RR ajusté = 3 alors que le RR brut = 5 alors une partie de la relation entre l’infection et le décès est expliquée par l’âge. Ce qui revient à dire que : - l’infection n’est pas un facteur de risque. - l’âge est un facteur de confusion Une différence d’au moins 15 ou 20% entre le RR brut et le RR ajusté permet de dire que le changement de risque relatif est significatif et potentiellement expliqué par un bais de confusion. De plus, si l’intervalle de confiance ne contient pas la valeur 1 alors on montre qu’il y a deux facteurs de risque au décès : l’infection et l’âge.



Si le RR ajusté = 1 alors toute l’association entre l’exposition et la maladie est expliqué par le facteur de confusion. – F est un facteur de confusion – E n’est pas un facteur de risque de M (décès) (IC95% contient 1) On peut dire que F est un facteur de confusion mais surtout l’exposition E n’est vraiment pas un facteur de risque puisque l’intervalle de confiance de son RR ajusté contient la valeur 1.



Si RR ajusté = RR brut alors l’association entre l’exposition et la maladie n’est pas due au facteur de confusion. L’âge n’est pas dans cette situation un facteur de confusion. – F n’est pas facteur de confusion – E est facteur de risque de M (décès) (IC95% ne contient pas 1)



Si le RR ajusté > RR brut alors une partie de la relation entre l’exposition et la maladie était masqué par le facteur de confusion. L’âge est aussi un facteur de confusion mais au lieu d’expliquer la relation, il la masque. – F est un facteur de confusion – E est un facteur de risque de M (décès) (si IC95% ne contient pas 1) Le facteur de confusion ne rapproche pas toujours la valeur du RR ajusté à 1. Il peut aussi augmenter sa valeur, il agit dans tous les sens.

4

Question : Pourquoi est-ce qu’on ne calcule pas uniquement le RR ajusté ? Selon l’objectif de l’article : - soit on recherche des nouveaux facteurs de risque dans un objectif purement physiopathologique et mécanistique, il arrive qu’on passe directement par le RR ajusté. On ne présentera que le RR ajusté sans présenter les résultats des facteurs de confusion éventuels mais en mentionnant juste qu’on les a pris en considération. - il arrive cependant que le RR brut ait un intérêt pour la santé publique parce qu’il peut être utilisé non seulement comme facteur explicatif, ce qui aura un intérêt pour les chercheurs fondamentaux pour expliquer les pathologies et trouver des nouvelles cibles thérapeutiques par exemple. Mais il peut aussi être utilisé comme marqueur de risque (ce qui est différent de facteur de risque). Le marqueur de risque permet d’identifier les patients à risque de la maladie peu importe si ce marqueur de risque est ou non une cause de la pathologie. Il permet de repérer les patients s’il est plus facile d’explorer ce marqueur que le facteur de risque. Un exemple un peu théorique est de considérer le tabac comme étant tabou, que sa consommation était très mal vue en société de sorte que les gens refusent de dire s’ils fument ou pas et qu’uniquement les fumeurs mangent des bonbons à la menthe. Il sera alors plus facile de demander si le patient mange des bonbons à la menthe que de l’interroger sur son tabagisme pour définir s’il faut le surveiller sur le plan cardio-vasculaire. On sera parfois amener à choisir la prise en charge non pas en fonction des facteurs de risque démontrés mais en sachant que la caractéristique observée chez le patient est un marqueur de risque. Le marqueur de risque peut aussi servir si le facteur de risque est trop compliqué à explorer. - le dernier intérêt a présenté le RR brut et le RR stratifié est de pouvoir démontrer que F est bien un facteur de confusion. Ce qui permettra dans des études ultérieures de prendre en compte ce facteur de confusion, si on avait un doute.

II – Interaction ou modification d’effet 1 – Suite des résultats et de l’interprétation de l’ajustement de l’exemple précèdent Si dans l’analyse stratifiée, dans nos 2 sous-groupes de sujets jeunes et âgées, dans le cadre de l’association infection - décès, on obtient 2 RR différents alors F est un facteur d’interaction (= facteur modificateur d’effet). Ainsi, il y a un facteur de l’infection sur le décès mais cet effet n’aura pas toujours un RR = 3 puisque sa valeur va se modifier en fonction de celle du facteur d’interaction. Par exemple, si le RR chez les jeunes = 1 et le RR chez les vieux = 7 avec un RR brut = 5 alors l’effet de l’infection sur le décès est différent selon l’âge. L’infection est alors un facteur de risque chez les sujets âgés mais pas chez les jeunes.

5

Remarque : erreur d’interprétation sur la diapo, E est un facteur de risque dans la strate vieux mais n’en est pas un dans la strate jeune (une version corrigée aurait déjà dû être disponible sur moodle…) Les analyses stratifiées sont intéressantes en pratique pour démontrer, par la différence entre les RR des sous-groupes, qu’un facteur est un facteur d’interaction. La mise en évidence de ce facteur d’interaction permet d’individualiser les prises en charge. Pour poursuivre notre exemple, un sujet jeune avec une infection ne nécessitera pas nécessairement une hospitalisation alors que la personne âgée avec une infection sera bien plus à risque de décès. L’interaction peut varier en tous sens. Ainsi, le facteur d’interaction peut être un facteur de risque dans les 2 strates avec une intensité différente, un facteur de risque seulement dans une des 2 strates, ou même un facteur de risque dans une strate et un facteur protecteur dans l’autre. Si la moyenne des 2 RR est égale au RR brut alors le facteur est seulement un facteur d’interaction. Ici, le RR chez les jeunes = 1 et le RR chez les vieux = 7 avec un RR brut = 5 étant donné que les moyenne des 2 RR = 4, le facteur est à la fois un facteur d’interaction et de confusion. Dans les articles, on présente souvent l’analyse brut, univarié et directement l’analyse ajustée sans présenter l’analyse stratifié et sans préciser les facteurs d’interaction trouvés. Les RR stratifiés ne sont présentés que dans le cadre de plan d’analyse particulier dans lequel e été défini à l’avance de faire des analyses stratifiées de porter des conclusions sur les sousgroupes. En effet, toute cette démarche est responsable d’une inflation du risque α, qu’il faut donc prévoir à l’avance (quelques exemples dans les TD de LCA).

2 – Définition de l’interaction L’interaction s’observe dans la relation entre 3 variables. C’est une situation dans laquelle l’influence simultanée de 2 variables, comme l’infection et l’âge, sur une troisième, comme le décès, n’est pas additive. Ce qui revient à dire qu’il y a un effet différent de l’une des variables sur la maladie selon la présence ou l’absence du facteur F et donc que les OR entre E et M sont différents dans chacune des strates de F. Remarque : une autre erreur sur cette diapo, c’est la différence entre E et M et non pas E et F.

6

Ce graphique montre l’interaction entre le tabagisme mesuré en nombre de cigarettes fumées par jour, la prise de contraception oraux (jamais / passée / actuelle) et le risque d’infarctus.  

 

On voit que quand on ne fume pas et quand on n’a jamais pris de contraceptifs oraux, on a un risque en bleu (caché derrière le vert et le rouge). Par rapport à ce risque de base des personnes qui ne sont exposées à aucun facteur de risque, si on prend des contraceptifs oraux, le risque n’est pas modifié ou alors de façon infinitésimale. Sans fumer, le risque associé aux contraceptifs oraux est négligeable. Si on fume plus de 15 cigarettes par jour, le risque d’infarctus est un peu augmenté et vaut environ 3. Mais si on fume plus de 15 cigarettes par jour en prenant des contraceptifs oraux, le risque n’est pas celui des 15 cigarettes par jour additionné à celui de la prise de contraceptifs oraux, mais il est démultiplié. Il y a un effet d’interaction entre la prise de contraceptifs oraux et le tabagisme qui fait que l’effet n’est pas additif mais multiplié même bien plus que par la seule multiplication des 2 risques, ce qui signe la présence d’un facteur d’interaction entre ses 2 facteurs de risque.

L’interaction mise en évidence est pertinente sur le plan statistique lorsque que l’on peut démontrer qu’il y a un facteur d’interaction significatif par un test statistique particulier ayant une p-value significative. Si en plus, cette interaction est pertinente sur le plan clinique et qu’il existe des prises en charge différenciées entre les patients alors on peut poursuivre cette analyse dans les sousgroupes de F, tels que les sous-groupes d’âge, de prise ou non de contraceptifs oraux, de consommation ou non de tabac… En effet, l’analyse globale, moyennée ne donnera pas plus d’information intéressante. Si on sait possible d’individualiser les résultats, autant le faire. Par exemple, si on a un vaccin efficace uniquement chez les hommes et pas chez les femmes, ce qui serait montré par une interaction entre le sexe et le vaccin sur l’incidence de la pathologie, alors il n’y aurait aucun intérêt à présenter les résultats tout sexe confondu.

7

III – Neutralisation des facteurs de confusion 1 – Lors de la sélection des sujets On peut randomiser dans une étude expérimentale, ce qui représente l’unique moyen d’être sûr de ne pas avoir de facteur de confusion lors de l’étude de l’association entre 2 variables. On peut aussi restreindre la population d’étude au risque de provoquer des biais de sélection, ce qui nécessite de discuter de la maitrise des facteurs de confusion par cette manière puisqu’en voulant neutraliser un type de biais, on en introduit un nouveau. On peut apparier sur 1 ou 2, rarement sur 3 facteurs en faisant toujours bien attention au risque de sur-appariement. De plus, cette méthode ne va équilibrer que sur les facteurs sur lesquels on a effectué l’appariement.

2 – Lors de l’analyse Généralement dans les études observationnelles, puisqu’on ne peut pas randomiser, on va continuer, lors de l’analyse statistique, à neutraliser les biais de confusion potentiels. Ce qui s’effectuera en ajustant sur les facteurs de confusion, soit par des analyses stratifiés (méthode de Mantel-Haenszel), soit par des modèles multivariés, soit par la standardisation.

A – L’analyse stratifiée (méthode de Mantel-Haenszel)

Par exemple, on a calculé un OR brut montrant l’association entre bonbon à la menthe et maladie cardio-vasculaire. L’OR brut est égal à 2,33 et significatif (son IC95% ∉ 1). Comme on se doute que le tabac est un facteur de confusion, on va réaliser une analyse stratifiée pour étudier l’association entre bonbon à la menthe et maladie cardio-vasculaire 8

chez les fumeurs et chez les non-fumeurs, donc indépendamment du tabac. L’OR chez les fumeurs = 1,03 et n’est pas significatif (son IC95% ∈ 1) et dans l’autre strate du facteur de confusion potentiel, chez les non-fumeurs, l’OR = 1,02 et qui n’est pas significatif non plus (son IC95% ∈ 1). On applique la formule statistique pour avoir l’OR ajusté à partir des 2 OR stratifiés et on trouve OR ajusté = 1,03 non significatif. L’OR ajusté (1,03) est différent de l’OR brut (2,33). Remarque : On peut parler de différence quand il y a au moins 15 à 20% de différence, car il pourrait y avoir des petites différences liées aux fluctuations d’échantillonnage. On conclut que : - le tabac est bien un facteur de confusion dans la relation entre bonbon à la menthe et maladie cardio-vasculaire - le bonbon à la menthe n’est pas un facteur de risque de maladie cardio-vasculaire puisque l’OR n’est pas significatif. Etant donné que l’OR est proche de 1, on peut ne pas se poser de question quant au manque de puissance. On obtient un OR ajusté sur un facteur de confusion potentiel. Comment traiter plusieurs facteurs de confusion potentiels ?

B – Modèles multivariés Les modèles multivariés correspondent à des analyses stratifiés avec énormément de sousgroupes, on va faire exactement la même chose qu’une analyse stratifiée mais en définissant tous nos sous-groupes à partir de tous nos facteurs de confusion potentiels. Au lieu d’avoir uniquement des fumeurs et des non-fumeurs, on aura par exemple, les fumeurs hommes, les fumeurs femmes, les non-fumeurs hommes, les non-fumeurs femmes voire même les fumeurs hommes diabétiques, les fumeurs hommes non-diabétique…. On va pouvoir des combinaisons de tous les facteurs de confusion potentiels ce qui nous donnera des tas de strates dans lesquelles on calcule des tas d’OR stratifiés pour ensuite faire la « moyenne » de tous ces OR pour avoir l’OR ajusté. On utilise pour cela une fonction mathématique qui va combiner tous nos facteurs d’exposition et nos facteurs de confusion potentiels à ce qu’on est en train d’essayer d’expliquer, donc ici avoir ou non la maladie.

S’il n’y a qu’une seule variable, ce sera un modèle univarié, par exemple on peut essayer d’expliquer la survenue de l’infection au virus de l’hépatite C en fonction de la sévérité de l’accident d’exposition au sang (AES), est-ce qu’on a juste effleuré la peau, piquer jusqu’au sang, jusqu’à l’os… Ce sera un modèle multivarié s’il y a au moins 2 covariables, l’exposition et le (ou les) facteur(s) de confusion potentiel(s). Ce qui correspondra pour cet exemple à expliquer la

9

survenue d’infection au VHC en fonction de la sévérité de l’AES, du dispositif utilisé (aiguille creuse ou pleine), de la charge virale du patient (détectable au non au moment de l’AES)… Dans le modèle univarié, il n’y a pas de prise en compte du facteur de confusion, on ne pourra avoir que des mesures d’association (RR ou OR) brutes (= univariées). Le modèle multivarié permettra d’avoir des mesures d’association multivarié (= ajustées = indépendantes des facteurs de confusion). Le modèle multivarié va permettre d’estimer l’effet propre de chaque facteur E i sur Y indépendamment des autres f...


Similar Free PDFs