Comparaison de deux pourcentages avec le logiciel R

Après le post concernant l’analyse descriptive des variables catégorielles et celui dédié à la visualisation des variables catégorielles, cet article s’intéresse à la comparaison de deux pourcentages, autrement dit à la comparaison statistique des combinaisons de deux
variables catégorielles
.

Le test statistique le plus couramment employé pour comparer deux pourcentages est le test non paramétrique du Khi2 (on peut aussi écrire Chi2). Cet article va donc s’intéresser à ce test en particulier.

Le test du Khi2 dispose de plusieurs variantes, selon que les échantillons sont indépendants ou appariés, et selon que les conditions d’utilisation sont remplies ou non. Nous allons voir tout cela en détail dans la suite.

1. Pourcentages et table de contingence

Le test du Khi2 peut être un peu déroutant au départ car sa statistique n’utilise pas directement les pourcentages que l’on souhaite comparer. La statistique du test du Khi2 repose sur une somme de différences entre des effectifs observés et des effectifs théoriques, et de ce fait, il se base sur une table de contingence.

Par exemple, dans le jeu de données Melanoma du package MASS, si l’on souhaite comparer le pourcentages de femmes ayant un ulcer (37.3%) au pourcentage d’hommes ayant cette affection (54.4%), les données nécesaires à la réaliisation du test du Khi2 ne seront pas directement ces pourcentages, mais la table de contingence suivante :

Absence d’un ulcer Presence d’un ulcer
Female 79 47
Male 36 43

 

2. Echantillons indépendants vs. échantillons appariés.

L’élément la plus important à définir avant de se lancer dans un test du Khi2 est celui de la nature des échantillons sur lesquels ont été estimés les 2 pourcentages à comparer. Est ce qu’il s’agit d’échantillons indépendants ou d’échantillons appariés ?

2.1 Echantilllons indépendants

Des échantillons sont indépendants si les sujets (ou les unités expérimentales) sur lesquels ont été estimés les deux pourcentages sont différents. Pour fixer les idées, on pourrait par exemple imaginer une étude clinique visant à comparer 2 traitements contre la migraine (le Traitement A et le Traitement B). Deux groupes de 50 patients sont constitués aléatoirement : le premier groupe reçoit le traitement A, et le second groupe reçoit le traitement B. La réponse observée est de type binaire : soulagement des douleurs , ou pas de soulagement. Dans ce cas, les patients qui reçoivent le traitement A, et ceux qui reçoivent le traitement B sont différents, les échantillons sont donc indépendants.

Les données des échantillons indépendants peuvent être représentés sous la forme d’une table de contingence classique, comme ceci :

Traitement A Traitement B
soulagé 15 35
pas soulagé 35 15

1.2 Echantilllons appariés

Des échantillons sont appariés si les sujets sur leqsuels ont été estimés les deux pourcentages sont les mêmes.

Imaginons maintenant que ce sont les mêmes sujets qui reçoivent les traitements A et B : les sujets reçoivent le traitement A au cours d’une première période, puis le traitement B au cours d’une seconde période.

Dans cette situation on ne représente pas les résultats selon la même table de contingence que précédemment. On utilise une table de contingence qui permet de faire apparaître le nombre de sujets ayant des réponses identiques sur les deux périodes (toujours soulagés ou jamais soulagés) et des réponse différentes, comme ceci :

 

On fait apparaître ces informations de réponses identiques (on parle de paires concordantes) et différentes (on parles de paires discordantes) parce que c’est intéressant en soi, mais aussi parce que les effectifs des paires discordantes sont utilisées dans la statistique du test de Mac Nemar, qui est le test du Khi2 pour échantillons appariés.

3. Les hypothèses

Quel que soit la variante du test du Khi2 employée, les hypothèses du test sont toujours les suivantes:

En bilatéral :

H0 : p1 = p2
H1 : p1 ≠ p2

En unilatéral :

H0 : p1 = p2

H1 : p1 > p2

ou

H1 : p1 < p2

4. Principe du test du Khi2

4.1 Les effectifs observés

La table de contingence contient les effectifs observés des croisements des 2 modalités des 2 variables étudiées (sexe et ulcer dans l’exemple du jeu de données Melanoma).On note généralement ces effectifs “O” pour “observés.

4.2 Les effectifs théoriques

La statistique du test du Khi2 nécessite de calculer un effectif théorique pour chacun des effectifs observés. Ces effectifs théoriques sont calculés sous l’hypothèse nulle, c’est à dire en faisant l’hypothèse que les pourcentages sont égaux. Ils sont généralement notés E pour “expected”.

Les effectifs théoriques de chaque combinaison (des modalités des variables catégorielles) sont obtenus en multipliant, dans la table de contingence, l’effectif total de la ligne (nb_l) par l’effectif total de la colonne (nb_c) et en divisant par l’effectif total de la table (nb_T) :

Effectifs attendu du Khi2

Le principe du calcul est assez intuitif. Pour l’illustrer, je reprends ici l’exemple de la table de contingence concernant la présence ou l’absence d’un ulcer chez les hommes et les femmes, en modifiant les effectifs de la table de contingence comme ceci :

 

Sous l’hypothèse nulle, les pourcentages d’ulcer chez les hommes et les femmes sont égaux. Cette hypothèse nulle se traduit alors en termes d’effectif. Il s’agit de répartir le nombre total d’ulcer (ici 50) en fonction de la fréquence d’hommes (200/300) et de femmes (100/300) dans l’échantillon étudié.

Au final, les effectifs théoriques de la table de contingence précédente
sont :

 

5. Statistiques et conditions d’application

5.1 Lorsque les échantillons sont indépendants:

Dans ce cas, la statistique du test du Khi2 est :

statistique du khi2 comparaison de 2 pourcentages

Cette statistique suit une distribution à (nb_c-1) * (nb_l-1), soit un degrés de liberté.

Le test du Khi2 peut être employé si tous les effectifs théoriques sont >5.

Si au moins un effectif théorique est <5 alors, le test du Khi2 avec correction de Yates, ou bien le test exact de Fisher doivent être employés.

La correction de Yates consite à soustraire la quantité 0.5 à chaque différence Oi-Ei.

La statistique du test de Fisher est un peu complexe, mais peut être consultée ici.

 

5.2 Lorsque les effectifs sont appariés:

Dans ce cas, c’est le test de Mac Nemar qui doit être employé.

Sa statistique est :

stat du test de mac nemar

En utilisant la notation suivante des paires concordantes et discordantes :

 

Le test de Mac Nemar nécessite que le nombre de paires discordantes soient >10. Dans le cas contraire une correction, dite de de continuité doit être appliquée.

 

6. Synthèse des tests à employer

  • Les échantillons sont indépendants :

  • si tous les Ei ≥ 5 : test du Khi2 avec la fonction chisq.test(TC, correct=FALSE)

  • si au moins un Ei <5 : test du Khi2 avec correction de continuité (correction de Yates) , avec la fonction chisq.test(TC, correct=TRUE) ou test exact de Fisher avec la fonction fisher.test(TC).

  • Les échantillons sont appariés:

  • si le nombre de paires discordantes ≥ 10 : test de Mac Nemar avec la fonction mcnemar.test(TC, correct=FALSE)

  • sinon : test Mac Nemar avec correction de continuité avec la fonction mcnemar.test(TC, correct=TRUE)

 

 

7 Exemples :

7.1 Echantillons indépendants

7.1.1 Test du Khi2

Soit la table de contingence suivante :

 

Ici la pvalue est < 0.05, on conclue donc que le pourcentage d’ulcer chez les femmes est différent que le pourcentage d’ulcer chez les hommes, dans le sens d’un pourcentage plus faible.

Il est possible d’obtenir les effectifs théoriques en utilisant :

 

7.1.2 Test du Khi2 avec correction de continuité

Imaginons que la table de contingence soit celle-ci :

 

On applique le test du Khi2 :

 

Ici, le warning nous indique qu’au moins un des effectifs théorique est <5. La consultation des effectifs théoriques nous montre qu’effectivement une des valeurs est < 5 :

 

Dans ce cas, il suffit alors d’utiliser l’argument correct=TRUE

 

Nous aurions également pu utiliser le test exact de Fisher.

 7.1.3 Le test de Fisher

Pour utiliser le test de Fisher, il suffit d’employer :

 

 

7.2 Echantillons appariés

7.2.1 Test de Mac Nemar

L’exemple ici est tiré de la page d’aide sur la fonction mcnemar.test

 

7.2.1 Test de Mac Nemar avec correction de continuité

Avec la table de contingence suivante:

 

Ici, le nombre de paires discordantes (2+7) est < 10, il faut donc utiliser la correction de continuité :

 

Une dernière chose à noter : bien que les hypothèses puissent être bilatérales, les tests du Khi2 sont toujours unilatéraux.

J’espère que cet article permettra au plus grand nombre d’avoir une meilleure vision des tests à utiliser pour comparer deux pourcentages, et comment les employer sous R.

Si cet article vous a plu, partagez le !

 

Crédits photos : rawpixel

 

Retrouvez ici 3 de mes articles les plus partagés:

Data visualisation des variables catégorielles

Versionnage de vos scripts avec RStudio + Git

Comment retrouver sous R une couleur employée avec Excel ?

Partager l'article
  •  
  •  
  •  
  •  
  •  
    5
    Partages
  • 5
  •  
  •  
  •  
  •  

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *