Site personnel de Joseph Larmarange, docteur en démographie, chargé de recherche à l’IRD, rattaché au CEPED, Centre Population & Développement (UMR 196 • Paris Descartes - INED - IRD), actuellement en accueil à AFRISTAT à Bamako, Mali.
Ce site présente mes recherches, publications, enseignements et participation à des séminaires, ainsi que quelques développements pour SPIP.
 

Stats Intervalle de confiance bilatéral d’une proportion

Le calcul de l’intervalle de confiance d’une proportion est un grand classique en statistiques. Il s’agît même de l’un des premiers intervalles de confiance que les étudiants apprennent à calculer. Cependant, il ne faudrait pas croire que ce soit un exercice si simple. En effet, il existe une multitude de manière de calculer cet intervalle de confiance.

En bonus, une feuille de calcul permettant de calculer facilement ces intervalles de quatre manières différentes.

Le principe général d’un intervalle de confiance consiste à déterminer, à partir de ce qui a été observé dans un sous-échantillon, un intervalle dans lequel la grandeur que l’on étudie, au sein de la population dont est extrait l’échantillon, a de fortes chances de se situer. En l’occurrence, il s’agit de déterminer un intervalle, connaissant la proportion p observée dans l’échantillon, au sein duquel la proportion π réelle de la population étudiée se situe avec une probabilité égale à une valeur fixée à l’avance, usuellement 95 %, et notée 1-α.

Il s’agit donc de rechercher a et b tels que p[aπb]=1-α. α correspond au risque d’erreur que nous acceptons de prendre. Nous pouvons interpréter cet intervalle de confiance par “il y a une probabilité de 1-α pour que π soit compris entre a et b”.

Dans la suite de notre propos, nous nous situerons dans le cadre d’un échantillonnage aléatoire simple issu d’une population infinie. Dans les faits, les populations que nous étudions ne sont pas infinies mais sont suffisamment grandes comparées à la taille de nos échantillons (le plus souvent, il s’agit de populations de plusieurs millions d’individus tandis que nos enquêtes portent sur quelques milliers de personnes au plus) pour que nous puissions considérer qu’il s’agit d’une population infinie. Des corrections sont techniquement possibles. En l’espèce, nous pouvons négliger cet aspect.

Loi Binomiale

Nous noterons n la taille de notre échantillon. Le nombre d’individus observés, parmi les n enquêtés, présentant le caractère étudié est donc égale à np. Ce nombre np suit ce que l’on nomme une loi Binomiale de paramètre n et π. Il s’agit d’une loi discrète et non continue. En effet, np ne peut être qu’un nombre entier. Si 100 personnes ont été enquêtées, 12 ou encore 58 parmi elles peuvent présenter un caractère donné, mais cela ne peut être 12,5 ou 58,3. Le caractère discret de la loi binomiale implique que le calcul d’un intervalle de confiance exact est relativement compliqué et il a amené à de vives discussions parmi les statisticiens sur la manière adéquate de procéder ( [Clopper 1934], [Cassignol 1954], [Dumas 1955], [Vessereau 1978], [Brenner 1990], [Copas 1992]).

Cependant, dès lors que l’échantillon est suffisamment grand, il est possible d’avoir recours au théorème central limite qui permet de simplifier le calcul, p pouvant être alors approximé par une loi Normale.

De plus, dans le cadre d’un tirage aléatoire simple avec remise (ce qui correspond à une population-mère infinie), nous pouvons considérer que la sélection de chaque individu de l’échantillon est indépendante des autres individus sélectionnés. Il en résulte alors que le meilleur estimateur possible de la proportion réelle π est la proportion observée p. D’un point de vue plus formel, p est un estimateur sans biais, efficace et convergent de π et correspond à l’estimateur obtenu par la méthode du maximum de vraisemblance ( [Bouzitat 1990], p. 164, 166, 169 et 175).

Plusieurs méthodes ont été développées pour calculer l’intervalle de confiance d’une proportion. Nous ne présenterons ici que quatre d’entre elles :

  • la méthode standard traditionnelle, nommée méthode asymptotique ou bien encore méthode WALD par VOLLSET ( [Vollset 1993]) et d’autres auteurs à sa suite ;
  • la méthode de score ou méthode WILSON ( [WILSON 1927]), encore appelée méthode de l’ellipse ;
  • la méthode WALD avec correction de continuité ( [Blyth 1983]) ;
  • la méthode de score de WILSON avec correction de continuité ( [Gosh 1979], [Vollset 1993]).

Un calculateur en ligne pour ces quatre méthodes est disponible à l’adresse suivante : http://www.ac-poitiers.fr/math/prof/resso/cali/ic_phrek.html. Ces quatre méthodes sont également disponibles dans la feuille de calcul jointe.

Des méthodes plus complexes ont également été proposées mais elles sont plus difficiles à mettre en œuvre. Par ailleurs, le gain apporté à les utiliser est le plus souvent limité dans le cadre d’un usage courant.

Méthode standard (Wald)

Selon le théorème central limite, la moyenne expérimentale d’une répétition d’expériences identiques converge, quand n augmente, vers une loi Normale. Il en résulte que, pour n suffisamment grand, nous pouvons considérer que p suit une loi Normale de moyenne π et d’écart-type \sqrt{\frac{\pi (1-\pi )}{n}}. Usuellement, on considère que cette approximation est valable pour n supérieur à 30 ( [Jolion 2006], p. III-8). D’autres auteurs préconisent que l’on ait observé au moins 5 succès et 5 échecs : soit np≥5 et n(1-p)≥5 ( [Wonnacott 1990], p. 310).

La différence p-π suit donc une loi Normale de moyenne nulle et de même écart-type. Comme π est inconnue, nous ne connaissons pas la valeur exacte de l’écart-type. Il existe deux possibilités pour l’approximer. On utilise le majorant (c’est-à-dire la plus grande valeur possible) de π(1-π) à savoir ¼. Ou bien, on remplace π par son estimation p pour le calcul de l’écart-type, ce qui est la méthode la plus courante.

Si l’on note z la valeur pour laquelle la fonction de répartition de la loi Normale centrée réduite est égale à 1-α/2, les bornes de l’intervalle de confiance de π sont alors égales à :

p\pm z\sqrt{\frac{p(1-p)}{n}}

Cette méthode est la plus courante. Si elle produit des intervalles de confiance parfaitement centrés autour de la proportion observée, elle peut induire, pour des valeurs de p proches de 0 ou de 1, des intervalles dont une partie est inférieure à 0 ou supérieure à 1. Il est alors nécessaire de tronquer l’intervalle pour supprimer les valeurs aberrantes. Cette approximation n’est donc valable que pour une valeur de p proche de 50%.

Méthode de score (Wilson)

Comme pour la méthode standard, la méthode de score utilise la convergence de la loi Binomiale vers la loi Normale et approxime l’écart type en remplaçant π par p. Cette approche suggère que l’on peut obtenir un intervalle de confiance en prenant en compte les valeurs de π telles que :

 \left|\frac{p-\pi }{\sqrt{\frac{p(1-p)}{n}}} \right|<z

En élevant cette inégalité au carré puis en résolvant l’équation au second degré obtenue, on détermine alors les bornes de l’intervalle de confiance par la formule :

 \frac{2np+z^{2}}{2(n+z^{2})}\pm \frac{z\sqrt{z^{2}+4np(1-p)}}{2(n+z^{2})}

Cet intervalle de confiance n’est plus centré sur p et présente l’avantage de ne pas produire de valeur aberrante (inférieure à 0 ou supérieure à 1).

Pour plus de détails sur la résolution de l’équation, voir le mémoire de Patrick GAGNON ( [Gagnon 2006], p. 12-13).

Correction de continuité

Il s’agit d’une correction, initialement proposée par YATES [Yates 1934], pour tenir compte du passage d’une loi discrète à une loi continue. Chaque nombre entier x sera considéré comme couvrant l’intervalle allant de x-½ à x+½. Cela induit une légère modification des formules pour le calcul des intervalles de confiance. Pour la méthode de WALD on obtient ainsi :

 p\pm \left[z\sqrt{\frac{p(1-p)}{n}}+\frac{1}{2n} \right]

et pour la méthode de WILSON :

 \begin{align*}
B_{-}&=\frac{2np+z^{2}-1-z\sqrt{z^{2}-2-1/n+4p(n(1-p)+1)}}{2(n+z^{2})}\\
B_{+}&=\frac{2np+z^{2}+1+z\sqrt{z^{2}+2-1/n+4p(n(1-p)-1)}}{2(n+z^{2})}
\end{align*}

Choix d’une méthode

Différents auteurs ont comparé l’efficacité de plusieurs méthodes, dont les quatre présentées ici, ainsi que des méthodes de calcul plus complexes ( [Newcombe 1998], [Tobi 2005], [Tsai 2007]). Si la méthode classique doit être évitée parce qu’il s’agit de la moins performante et qu’elle produit des valeurs aberrantes, la méthode WILSON de score avec correction de continuité est recommandée dans la mesure où ses performances sont presque équivalentes à celles de méthodes dites exactes et où son calcul est relativement aisé.

Valeurs courantes de z

Nous avons noté z la valeur pour laquelle la fonction de répartition de la loi Normale centrée réduite est égale à 1-α/2. Le plus souvent, les intervalles de confiance calculés sont les intervalles à 95%, parfois 90% et plus rarement 99%.

Voici les valeurs de z correspondantes pour ces cas les plus fréquents :

  • intervalle de confiance à 90 % : z= 1,64485362695 ≈ 1,645
  • intervalle de confiance à 95 % : z= 1,95996398454 ≈ 1,960
  • intervalle de confiance à 99 % : z= 2,57582930355 ≈ 2,576

Notes :

[Clopper 1934] CLOPPER C. J. et PEARSON E. S., « The Use of Confidence or Fiducial Limits Illustrated in the Case of the Binomial », Biometrika, n°26(4), 1934, pages 404-413.

[Cassignol 1954] CASSIGNOL C., « Note sur la construction d’intervalles de confiance pour la proportion de défectueux d’un lot à partir d’échantillons d’effectifs peu élevés », Revue de statistique appliquée, n°2(3), 1954, pages 43-55. (http://www.numdam.org/item ?id=RSA_1954__2_3_43_0)

[Dumas 1955] DUMAS M., « Choix et détermination pratique d’intervalles de confiance », Revue de statistique appliquée, n°3(3), 1955, pages 85-101. (http://www.numdam.org/item ?id=RSA_1955__3_3_85_0)

[Vessereau 1978] VESSEREAU A., « Sur l’intervalle de confiance d’une proportion logique « classique » et logique « bayesienne » », Revue de statistique appliquée, n°26(2), 1978, pages 5-31. (http://www.numdam.org/item ?id=RSA_1978__26_2_5_0)

[Brenner 1990] BRENNER D. J. et QUAN H., « Exact Confidence Limits for Binomial Proportions-Pearson and Hartley Revisited », The Statistician, n°39(4), 1990, pages 391-397.

[Copas 1992] COPAS J. B., « Exact Confidence Limits for Binomial Proportions-Brenner & Quan Revisited », The Statistician, n°41(5), 1992, pages 569-572.

[Bouzitat 1990] BOUZITAT C., BOUZITAT P. et PAGÈS G., Statistique, Probabilités, Estimation ponctuelle : cours et exercice d’application, Cujas, Paris (FR), 1990, 224 pages.

[Vollset 1993] VOLLSET S. E., « Confidence intervals for a binomial proportion », Statistics in Medicine, n°12(9), 1993, pages 809-824.

[WILSON 1927] WILSON E. B., « Probable inference, the law of succession, and statiscal inference », Journal of the American Statistical Association, n°22, 1927, pages 209-212.

[Blyth 1983] BLYTH C. R. et STILL H. A., « Binomial confidence intervals », Journal of the American Statistical Association, n°78, 1983, pages 108-116.

[Gosh 1979] GOSH B. K., « A comparison of some approximate confidence intervals for the binomial parameter », Journal of the American Statistical Association, n°74, 1979, pages 894-900.

[Jolion 2006] JOLION J.-M., Probabilités et Statistique - Cours de troisième année, Lyon (FR), INSA, Département génie Industriel, 2006, 120 pages. (http://rfv.insa-lyon.fr/ jolion/PS/poly_stat.pdf)

[Wonnacott 1990] WONNACOTT T. H. et WONNACOTT R. J., Statistique : économie - gestion - sciences – médecine, Economica, réimpression de 1995 de la traduction française de 1991 à partir de la quatrième édition américaine de 1990, 1972 pour la première édition originale, Paris (FR), 1990, 920 pages.

[Gagnon 2006] GAGNON P., Intervalles de confiance pour une différence de deux proportions, mémoire pour l’obtention du grade de Maître ès Sciences (M. Sc.), sous la direction de BÉLISLE C., Université de Laval, Faculté des Sciences et de Génie, Québec (CA), 2006, 94 pages. (http://www.theses.ulaval.ca/2006/24060/24060.pdf)

[Yates 1934] YATES F., « Contingency table involving small numbers and the Khi² test », Supplement to the Journal of the Royal Statistical Society, n°1(2), 1934, pages 217-235.

[Newcombe 1998] NEWCOMBE R. G., « Two-sided confidence intervals for the single proportion : comparison of seven methods », Statistics in Medicine, n°17(8), 1998, pages 857-872.

[Tobi 2005] TOBI H., VAN DEN BERG P. B. et DE JONG-VAN DEN BERG L. T., « Small proportions : what to report for confidence intervals ? », Pharmacoepidemiology and drug safety, n°14(4), 2005, pages 239-247.

[Tsai 2007] TSAI W. Y., CHI Y. et CHEN C. M., « Interval estimation of binomial proportion in clinical trials with a two-stage design », Statistics in Medicine, n°27(1), 2007, pages 15-35, DOI : 10.1002/sim.2930.

À propos de cet article

Par Joseph LARMARANGE - Télécharger cet article en PDF
Mis en ligne le 26 novembre 2008 - Dernière mise à jour le 26 novembre 2008
Mots-clés :
, ,
 

Documents joints à l'article

Calcul d’intervalles de confiance d’une proportion
Excel | 83.5 ko | document publié le 24 novembre 2008
Méthodes de Wald et de Wilson, avec et sans correction de continuité (CC)
Calcul d’intervalles de confiance d’une proportion
Feuille de Calcul OOo | 43.5 ko | document publié le 24 novembre 2008
Méthodes de Wald et de Wilson, avec et sans correction de continuité (CC)
 

Commentaires de l'article

 
ismail
Le 28 décembre 2008
Intervalle de confiance bilatéral d’une proportion

salem je trouve ce site tres interressent en ce qui concerne la probat stat en general et les methodes du calcul de l’interval de confance .

merci infiniment.

SMAIL ALGERIE

 
meriem
Le 31 janvier 2009
Intervalle de confiance bilatéral d’une proportion
Merci d’eclairer ces points, je trouve se site tres interessant,mais je ne trouve pas les tests bilaterales ca serai tres interessant de les expliques avec cette maniere. mais tte de meme vous pouvez tjrs donner davantage ! merci bonne continuation meriem algerie
 
Joseph LARMARANGE
Le 4 février 2009
Intervalle de confiance bilatéral d’une proportion

Les tests présentés ici sont tous des tests bilatéraux. Les formules sont différentes pour les tests unilatéraux. Ces derniers sont cependant moins fréquemment utilisés.

Cordialement

 
claude
Le 14 janvier 2009
Intervalle de confiance bilatéral d’une proportion
Je ne peux que vous féliciter pour la clarté, le pratique, la complétude de votre article et l’excellente mise en forme de la page. Si toutes les pages de l’internet pouvaient être ainsi... ! Cordialement
 
ami
Le 12 mars 2009
Intervalle de confiance bilatéral d’une proportion
j’ai pas su comment determiner l’interval de confiance(valeurs usuelles) en biochimie , car j’ai pas pu appliquer ces lois. j’ai 86 temoins normaux (valeur la plus haute:4.1 et valeur la plus basse:1.4), grace à l’excle j’ai pu calculer la moyenne(2.00) ,ecart type(0.4) et l’interval de confiance (0.084) mais je trouve ça pas convaiquant : si la veleur la plus élévée est de 4.1 et la plus basse 1.40 ,elles font pas parties de mon interval de confiance : 1.91 - 2.084
 
papillon0
Le 8 janvier 2010
Intervalle de confiance bilatéral d’une proportion

Bonjour, très intéressant en effet. Pour ma part, je cherche à comprendre comment calculer un intervalel de confiance pour uen différence de proportion. Pour moi il suffisait d’utiliser VAR(f1-f2)= VAR(f1)+VAR(f2) avec var(p1)=p1(1-p1) et var(p2) = p2(1-p2) puis de calculer abs(f1-f2)/racine((p1(1-p1) + p2(1-p2))/(n1+n2))(les 2 pops sont indépendantes).

Cependant quand je fouille a droite ou a gauche, je trouve une formule avec plutôt du genre : p=(n1p1+n2p2)/(n1+n2)

puis je calcule abs(f1-f2)/racine((p(1-p)*(1/n1+1/n2)) et je compare cela a 1.96 (enfin pour un test a 5%)

et moi j’ai du mal à comprendre comment on en arrive à cette formule (j’ai essayé mais sans succès :()).

J’ai forcément loupé un truc quelquepart, j’ai forcément un mauvais raisonnement mais où ??? Si quelqu’un peut m’aider je suis preneur :)

 
Joseph LARMARANGE
Le 12 janvier 2010
Intervalle de confiance bilatéral d’une proportion

Bonjour,

avez-vous consultez ce document : http://www.theses.ulaval.ca/2006/24060/24060.pdf ?

Bien cordialement

 
papillon0
Le 12 janvier 2010
Intervalle de confiance bilatéral d’une proportion
Merci beaucoup je vais explorer cela
 
papillon0
Le 12 janvier 2010
Intervalle de confiance bilatéral d’une proportion

J’ai lu (enfin parcouru plutôt) ton document, il est plus en phase avec l’idée de ce que je m’étais fait. Cependant, je trouve régulièrement une autre écriture de l’intervalle de confiance d’une différence de proportion. comme sur le lien suivant : http://rfv.insa-lyon.fr/ jolion/STAT/node115.html

est ce que tu saurais m’expliquer pourquoi ?

Merci encore une fois :)

 
Joseph LARMARANGE
Le 12 janvier 2010
Intervalle de confiance bilatéral d’une proportion
Ce lien n’est plus valable. N’étant pas mathématicien ni statisticien, je ne suis pas sur de pouvoir savoir d’où vient cette autre écriture.
 
papillon0
Le 12 janvier 2010
Intervalle de confiance bilatéral d’une proportion
C’est fou ça il fonctionnait au moment où je l’ai mis. Dommage, enfin après si vous n’êtes ni statisticien ni mathématicien, je ne vais pas vous embêter avec cela. Peut être connaissez vous des gens experts en ce domaine ?
 
Joseph LARMARANGE
Le 12 janvier 2010
Intervalle de confiance bilatéral d’une proportion

Je viens de comprendre d’où viens le souci. Il y a le caractère ~ dans le lien et comme vous avez simplement taper l’URL sans préciser que c’est un lien, SPIP a transformé ce caractère en espace insécable.

Donc le bon lien est http://rfv.insa-lyon.fr/~jolion/STAT/node115.html.

Concernant le test binomial de comparaison de deux proportions, on trouvera ce lien là http://www.chups.jussieu.fr/polys/b... qui explicite un peu mieux le calcul.

Usuellement, lorsque l’on veut comparer deux proportions, on a plus souvent recours au test exact de Fisher.

Je pense que le lien suivant devrait vous intéresser : http://mistic.heig-vd.ch/taillard/a....

Il porte sur un comparatif de plusieurs techniques de comparaison de deux proportions.

Bien cordialement

 
Didier
Le 13 janvier 2010
Intervalle de confiance bilatéral d’une proportion
Merci pour cette page web très bien réalisée, très bien documentée également.
 
papillon0
Le 14 janvier 2010
Intervalle de confiance bilatéral d’une proportion
Bonjour, merci beaucoup grâce à le premier lien (je n’ai pas encore regardé le second), il m’a permis de comprendre qu’en fait les 2 calculs sont valables, en fait c’est la manière d’estimer les P, P1 ou P2 selon le cas qui diffèrent. Je vais aller explorer le second lien, en tout cas merci beaucoup pour vos réponses et la rapidité de celles-ci.
 

Poster un commentaire

Ce forum est modéré à priori : votre contribution n'apparaîtra qu'après avoir été validée par un administrateur du site.


< /p>



Votre recherche

Dernières brèves

mardi 28 avril 2009
Plugin Refbase
Refbase est une application PHP/MySQL permettant de gérer une base de références bibliographiques (...)
lundi 9 février 2009
Sarkozy et la recherche...
Nous, chercheurs et enseignants-chercheurs, demandons des excuses du Président de la République à (...)
jeudi 22 janvier 2009
Article publié dans Médecines / Sciences
Je signe un article dans le premier numéro de l’année de Médecines Sciences M/S. Plus de détails (...)
lundi 17 novembre 2008
CISMA / ICASA
À l’occasion de la prochaine conférence sur le VIH/Sida et les IST en Afrique, à Dakar début (...)
mercredi 1er octobre 2008
Recrutement IRD
À compter d’aujourd’hui, 1er octobre 2008, je suis recruté à l’IRD en tant que chargé de recherche de (...)
Voir toutes les brèves

Newsletter

Pour être informé des dernières nouveautés du site, modifier votre abonnement ou consulter les archives des messages envoyés...
... suivez ce lien
SPIP 1.9.1 [7502] | BliP 2.3 | XHTML 1.0 | CSS 2.0 | RSS 2.0 | Espace privé
Visiteurs par jour (cumul) : 0 (22650)