Comparaisons de deux proportions appariées : le test de Mac Nemar

comparaison de proportions appariées

 

La comparaison de proportions observées sur deux séries de données indépendantes peut être réalisée par un test z pour proportion ou un test du Chi2.

Néanmoins, il existe des situations dans lesquelles les deux séries comparées ne sont pas indépendantes, mais appariées. Cela arrive par exemple lorsqu’on administre successivement deux médicaments aux mêmes sujets, et que la réponse observée est de type binaire (succès/échec).
Ou encore lorsque l’on fait déguster aux même sujets deux boissons différentes (thé et café par exemple) et qu’on leur demande s’ils l’apprécient (oui / non).

Dans cette situation de non indépendance, mais d’appariement des données, les proportions (de succès pour chacun des traitement, ou de satisfaction pour chacune des boisson, par exemple), doivent être comparées à l’aide du test de Mac Nemar, qui est dérivé du test du Chi2.

1. Situation

Imaginons, par exemple, que selon un plan expérience en cross over deux somnifères (A et B) sont administrés aux 100 mêmes sujets. L’ordre d’administration est déterminé par randomisation. Ainsi, 50 sujets reçoivent le traitement A puis le traitement B, et 50 autres sujets reçoivent le traitement B puis le traitement A. Au final, les 100 sujets reçoivent bien les deux traitements.

Le délai entre les deux prises est tel que l’effet éventuel du premier somnifère a totalement disparu. La réponse au traitement, c’est-à-dire, l’amélioration de l’endormissement est codé de façon binaire : positive ou négative.

Nous souhaitons comparer les proportions de réponses positives des traitements A et B.

Les 100 paires de réponses obtenues pourraient être celles-ci :

data appariées

Elles peuvent également être présentées sous cette forme-là :

 

table de contingence appriée

Ainsi les proportions observées de réponses positives aux traitements A
et B sont :

$$p_A=\frac{45+15}{100}=60\%$$
$$p_B=\frac{45+5}{100}=50\%$$

Le test classique de comparaison de deux proportions (z test ou test du chi2) n’est pas adapté à cette situation de non indépendance, car on peut supposer qu’il existe un lien entre la réponse au somnifère A et au somnifère B chez un même malade.

De plus, le test classique ne prend pas en compte les paires discordantes A+/B- et A-/B+.

Le test statistique adapté à cette situation de comparaison de deux proportions appariées est le test de Mac Nemar.

2. Hypothèses du test de Mac Nemar

Les hypothèses sont :

$$H_0 : \pi_1=\pi_2$$
$$H_1: \pi_1\neq\pi_2$$

ou
$$H_1: \pi_1 > \pi_2$$
ou
$$H_1: \pi_1 < \pi_2$$

 

3. Principe du test de Mac Nemar

Le test de Mac Nemar est justement basé sur les paires discordantes A+/B- et A-/B+. Le principe est de dire que si l’hypothèse nulle est vraie, alors le nombre de paires discordantes A+/B- doit être égal au nombre de paires discordantes A-/B+ , et que ce
nombre doit être égal à la moitié du nombre total de paires discordantes.

En formalisant les données comme ceci :

table mac nemar

 

si l’hypothèse nulle est vraie nous devrions observer :
$$c = b = \frac{(c+b)}{2}$$

Le test de Mac Nemar, qui est un test  dérivé du test du Chi2, revient donc à calculer la somme des écarts au carré entre le nombre de chaque type de paires discordantes et son nombre théorique attendu.

Au final sa statistique est :

$$\chi^2 = \frac{(b-\frac{b+c}{2})^2}{\frac{b+c}{2}}+\frac{(c-\frac{b+c}{2})^2}{\frac{b+c}{2}}$$

Qui se simplifie en :

$$\chi^2 = \frac{(c-b)^2}{c+b}$$

4.Conditions d’application du test de Mac Nemar

Le test de Mac Nemar peut être appliqué si le nombre de paires discordantes  ≥ 10 (Dagnelie P. Inférence statistique à une et à deux dimensions. Statistique théorique et appliquée, Tome 2. Bruxelles : De Boeck et Larcier, 2006).

 

5. Réalisation du test de Mac Nemar avec R

 

Ici, la p value est < 0.05, l’hypothèse nulle d’égalité des proportions est rejetée. De ce fait, on conclut que la proportion de réponses positives au somnifère A est significativement différente (supérieure) de la proportion de réponses positives au somnifère B.

 

Remarque 1: une correction dite de “continuité” peut être appliquée si les conditions de validité ne sont pas parfaitement remplies, en utilisant l’argument correct=TRUE.

Remarque 2: La fonction mcnemar.test ne permet pas de tester l’hypothèse alternative unilatérale. Si besoin, il est nécessaire de passer par la fonction exact2x2(), du package exact2x2.

Remarque 3 : si nous avions comparé les proportions avec un test classique pour échantillon indépendant, aucune différence n’aurait été mise en évidence ! Le test de Mac Nemar est plus puissant que le simple test du Chi2.

 

 

Conclusion

J’espère que cet article, en plus de celui consacré au test de Student apparié, vous aura sensibilisé à l’analyse statistique des données appariées.

Et comme vous avez pu le constater, la comparaison des séries appariées, que cela soit en termes de moyennes, ou de proportions, est très facilement réalisable avec le logiciel R !

Et si cet article vous a plu, n’oubliez pas de le partager 😉

Image par Suxu de Pixabay

Découvrez d’autres articles en lien avec celui-ci 

Partager l'article
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  

6 commentaires

  1. AntoineM Répondre

    Mais je m’interroge…
    Ce test semble se limiter à 2 proportions. Mais que faire si il y a plus, par exemple si chaque patient a testé 3 somnifères ?
    Le chi² aura-t-il un autre équivalent ?

    • Claire Della Vedova Auteur de l’articleRépondre

      Bonjour Antoine,

      dans cette situation, il faut utiliser un glm à effet mixte (GLMM). J’essaierai de faire un article, merci pour la suggestion.
      Bonne continuation

  2. Anne B. Répondre

    Bonjour et merci pour cet article. Si on veut ensuite obtenir l’OR pour une série appariée en plus du test de Mac Nemar, faut-il adapter la fonction twoby2?

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *