Chaire Quételet 2006

Cartographier les données des Enquêtes Démographiques et de Santé à partir des coordonnées des zones d’enquête

Communications

par LARMARANGE Joseph, YARO Seydou, VALLO Roselyne, MSELLATI Philippe, MÉDA Nicolas et FERRY Benoît.

Résumé

Les enquêtes démographiques et de santé (EDS) constituent une source de données standardisées bien connues des démographes. Nombre d’entre elles incorporent depuis longtemps les coordonnées longitude/latitude des zones enquêtées (grappes). Cependant, peu de travaux cartographiques exploitent cette information, principalement en raison d’un problème méthodologique. En effet, le nombre de personnes enquêtées dans une grappe est le plus souvent trop réduit (moins de 40) pour calculer des indicateurs statistiquement significatifs par grappe. D’autre part, les méthodes d’interpolation spatiale classique présupposent une mesure relativement précise du phénomène étudié en chaque point. Notre approche consiste donc à estimer la prévalence d’un phénomène en chaque grappe, à partir des grappes voisines, en ayant recours à des cercles de même effectif, puis à interpoler ces prévalences estimées par krigeage. Il est possible par ailleurs de prendre en compte le milieu de résidence après recodification. Outre l’application de cette approche à la prévalence du VIH du Burkina Faso et du Cameroun, nous présentons les résultats obtenus par simulation d’EDS sur un pays modèle.

Mots-Clés

Méthodologie, Enquête Démographique et de Santé, Interpolation spatiale, Prévalence, Cartographie, Krigeage, Méthode des cercles.

Abstract

Objectif

L’objectif de notre travail consiste à cartographier la prévalence d’un phénomène mesuré dans une EDS et à pouvoir mettre en évidence des différentiels infra-régionaux non visibles par une cartographie classique par région. Ce travail a été réalisé initialement pour mieux appréhender les différentiels spatiaux de la prévalence du VIH. Cependant, la méthode élaborée à cette fin peut s’appliquer à d’autres types d’indicateurs.

Contexte

Les Enquêtes Démographiques et de Santé (EDS) constituent une source de données standardisées en population générale bien connue des démographes. Conduites dans la majorité des pays en développement depuis le milieu des années 80, nombre d’entre elles incorporent depuis longtemps les coordonnées GPS des zones enquêtées (clusters). La collecte des coordonnées GPS des clusters s’est standardisée dans les années 1990 et est aujourd’hui systématique pour toutes les enquêtes récentes.
Cependant, malgré l’utilisation de plus en plus fréquente des Systèmes d’Informations Géographiques (SIG), peu d’études portant sur les EDS ont eu recours à ce type d’information. Le plus souvent, les coordonnées GPS ont été utilisées pour calculer des indicateurs spatiaux (tels qu’une distance à une route ou à une structure de santé), indicateurs réutilisés par la suite dans des analyses univariées ou multivariées.
Les travaux cartographiques réalisés à partir des EDS ont porté, pour la plupart, sur un échelon régional, comme c’est le cas du récent Atlas Tanzanien des Indicateurs sur le VIH/Sida publié en janvier 2006. Cela s’explique en partie pour des raisons méthodologiques. En effet, le nombre de clusters enquêtés dans une EDS se situe généralement entre 400 et 500 et le nombre de personnes enquêtées par clusters est très faible (moins de quarante dans la majorité des cas). Ces effectifs sont trop réduits pour calculer, à partir des questionnaires individuels, des indicateurs statistiquement significatifs par cluster. On ne peut alors appliquer les méthodes d’interpolation spatiale classique (telle que le krigeage ou la pondération par l’inverse de la distance) qui présuppose une mesure précise du phénomène étudié en chaque point connu.

Méthode

Afin de pouvoir appliquer ces méthodes d’interpolation spatiale, nous réestimons la prévalence du phénomène étudié pour chaque cluster en intégrant les points voisins jusqu’à obtenir un effectif suffisant pour calculer une prévalence statistiquement significative. Il s’agit en quelque sorte d’une moyenne mobile spatiale. Ce calcul peut être ensuite affiné en tenant compte du milieu de résidence et en limitant le degré de lissage dans les zones peu denses et donc moins couvertes par les EDS.
Une fois la prévalence réestimée pour chaque cluster, nous utilisons le krigeage pour obtenir des cartes en plages de niveaux. Des indicateurs de précisions, d’intervalles de confiance sont également calculés afin de préciser le domaine de validité des résultats.
L’ensemble des procédures de calcul a été programmé sous la forme d’un package additionnel au logiciel de statistiques libre et gratuit R . Ce package sera disponible gratuitement dans les mois à venir sur internet.

Nous présenterons l’application de cette méthode à la cartographie de la prévalence du VIH à partir des dernières EDS du Burkina Faso (2003) et du Cameroun (2004). Les résultats obtenus ont été discutés dans les deux pays avec les autorités nationales et confrontées avec les autres sources de données existantes disponibles.
Afin de mieux appréhender les limites de cette méthodologie, nous avons par ailleurs appliquée cette méthodologie à un pays virtuel où la distribution spatiale de la prévalence du phénomène étudié était parfaitement connue, puisque construite par nos soins, et où nous y avons simulé la passation d’une EDS afin de créer des résultats d’enquêtes. Il est alors possible de comparer les cartes obtenues avec notre méthodologie à la prévalence du phénomène posée initialement.
Enfin, nous présenterons l’application à d’autres types d’indicateurs (tels que le taux d’analphabétisme ou de mortalité infantile) pour montrer les possibilités offertes par cette méthodologie.

Résultats

Cette méthodologie, si elle ne permet pas de mettre en évidence des variations fines à un niveau local, fournit la répartition générale du phénomène au niveau national, en s’affranchissant du découpage administratif des régions. De plus, les différentiels infra régionaux ainsi que ceux entre milieu urbain et rural sont également révélés, pour les zones suffisamment denses en population. Les cartes complémentaires générées permettent de connaître les zones géographiques où l’interprétation des résultats doit être nuancée.

Originalité du sujet

Cette méthodologie ouvre la voie à de nouveaux champs d’investigation et d’exploitation des données des EDS et permet, en l’absence d’enquête plus précise et de plus grande envergure, de disposer d’une première vision de la distribution spatiale de différents phénomènes à un échelon national.