| Un maillage héxagonal |
|
Un des défauts des représentations par commune tient à l'hétérogénéité ce maillage en France. La taille des communes diffère énormément, par exemple entre l'Aquitaine ou PACA et le Nord de la France. Cela peut avoir des effets gênants : une commune de grande superficie, même peu peuplée, va avoir un effet visuel fort. Plus embêtant : lorsque le calcul fait intervenir la superficie de la commune, comme dans le cas de la densité de population, on peut obtenir de fortes discontinuités entre communes voisines selon que l'on a une commune de petite taille dont tout le territoire est bâti ou une commune qui a une forêt très étendue sur son territoire (Haguenau, Fontainebleau...) et fait donc apparaître une densité particulièrement faible. Pour éviter ce défaut, les données sont cartographiées sur un maillage hexagonal qui présente des caractéristiques visuelles plus intéressantes que le carroyage mais qui entraine des calculs plus complexes. |
| Estimation de densité |
|
Pour calculer la valeur à représenter pour chaque hexagone de ce nouveau maillage, on applique des résultats issus des méthodes d'estimation de densité non paramètrique. L'idée de base de ces techniques est d'estimer, à partir d'un ensemble discret de points de l'espace affectés d'une masse, une fonction continue. La représentation cartographique de cette fonction de densité (plus exactement mesure de Dirac mais on utilisera le terme plus simple de densité) fournit des cartes ayant plusieurs propriétés intéressantes. |
| Quelques résultats de statistique non paramétrique pour l'estimation de densité |
|
Lle principe de l'estimation de densité selon une méthode
non paramétrique est d'estimer une fonction de densité continue,
f(x), à partir d'un échantillon discret X1..Xn supposé
issu de cette loi sans faire d'hypothèses a priori sur l'appartenance
de f à une famille de lois connues. L'estimation ne concerne donc
plus un paramètre dans cette famille de loi, mais directement la
fonction elle-même (d'où le terme de non paramétrique). Outre le choix d'un noyau, l'estimation de densité nécessite
également le choix d'une fenêtre, habituellement notée
h. La statistique non paramétrique donne un certain nombre de résultats et de critères de qualité pour apprécier la qualité de l'estimation de la densité. Il est largement admis (et partiellement démontré) que
le choix de h a plus d'influence que le choix de K. Parmi les noyaux usuels,
l'estimation diffère peu selon que l'on choisisse un noyau gaussien
ou un Biweight ; par contre le choix de la fenêtre h est le plus
important. |
| Recette simplifiée pour une carte "biweight" |
|
| En savoir plus |
|
La méthode de ces cartes est très proches des concepts que présente très bien Claude Grasland pour le projet Hypercarte. La principale différence est dans l'approche plus géographique pour Grasland, plus statistique pour moi, ce qui a surtout des conséquences en terme de vocabulaire... L'autre différence concerne le choix du noyau (ou fonction de voisinage) : je privilégie le noyau Biweight qui est très efficace en terme de rapidité de calcul et est un choix souvent fait en statistique non paramètrique ; Claude Grasland privilégie le voisinage gaussien qui s'appuie sur la loi normale. En terme de représentation cartographique, les deux méthodes sont quasiment équivalentes. D'ici quelque temps (je préfère ne pas trop m'engager), je compte mettre sur le site différents outils que j'utilise et étoffer beaucoup plus cette présentation succinte. |
Dernière modification : 31/05/2002