Variables qualitatives

Les variables qualitatives réfèrent à des informations que l’on appréhende par des modalités.

Pour les variables catégorielles, ces modalités n’ont pas de sens quantitatif et il n’existe aucune relation d’ordre entre elles. Tel est le cas par exemple pour le sexe et la catégorie sociale au niveau individuel, la couleur politique de la mairie au niveau communal, ou le statut de préfecture au niveau des villes. Lorsqu’elle n’a que deux modalités la variable est dite dichotomique.

Les traitements les plus classiques de ce type d’information sont les tris à plat qui consistent à comptabiliser le nombre d’individus par modalité, et les tris croisés qui permettent d’étudier la relation entre deux variables qualitatives (test du chi2). Dans une perspective multivariée, on peut décrire les interrelations entre un ensemble de variables qualitatives à l’aide de méthodes d’analyse des données (analyse des correspondances et classification ascendante hiérarchique avec distance du chi2), ou bien expliquer les différences de modalités entre les individus à partir d’un modèle statistique.

Une variable qualitative catégorielle peut résulter de la transformation d’une variable quantitative en procédant à un découpage en classes. Il existe alors une variable quantitative sous-jacente, mais cette information n’est pas intégrée dans les traitements. Une variable qualitative peut aussi résulter d’un traitement multivarié en amont. Une classification ascendante hiérarchique, qu’elle soit réalisée sur des variables initiales qualitatives ou quantitatives, donne en sortie une typologie dont les différentes classes représentent les modalités d’une variable qualitative.

Pour les variables ordinales, il existe une relation d’ordre entre les modalités, mais la différence entre deux modalités successives n’est pas quantifiable, elle correspond toujours à l’unité. Une variable quantitative peut être transformée en une variable ordinale en attribuant des rangs aux différentes valeurs de la distribution de la variable, par ordre décroissant. La mise en relation entre la variable initiale et la variable transformée renseigne sur l’organisation hiérarchique de la distribution étudiée. L’exemple le plus classique en géographie concerne la représentation rang (en abcisse) – taille (en ordonnée) du nombre d’habitants par villes d’une région ou d’un pays donné.