Indépendamment du type des réponses à croiser (questions fermées ou numériques), les graphes de relation vont nous permettre d'accéder directement à la probabilité d'existence du lien et donc à l'information essentielle : la validation ou non de la relation présumée entre les deux variables croisées.
Apports
Cette méthode est innovante, car pour effectuer un traitement croisé selon les approches traditionnelles, le processus est relativement long depuis les données jusqu’à la connaissance :
il faut tout d’abord identifier le cas dans lequel on se situe parmi les 3 situations possibles (fermée x fermée, fermée x numérique ou numérique x numérique),
déclencher l’analyse statistique correspondante (tri croisé, analyse de variance ou régression)
demander le test de significativité (Chi-deux, Fisher ou autre) et son niveau de probabilité p, afin d’établir si la relation est significative ou non,
identifier les éléments principaux qui vont nous permettre de déterminer comment la relation se traduit dans les faits,
interpréter tous ces résultats et rédiger une conclusion.
Principes
Les graphes de relation sont un outil de « data-mining » ou d’exploration de données en français, dans le sens où ils vont nous permettre d’accéder plus rapidement aux informations essentielles (les relations significatives) contenues dans un vaste ensemble de données.
Pour établir des graphes de relation, il faut sélectionner les questions dont on souhaite analyser les croisements, les disposer sur une feuille de travail et déclencher les analyses bi-variées. Les résultats nous sont immédiatement fournis, indépendamment de la nature des variables, comme le montre la figure ci-après
Paramètres
Les relations sont immédiatement qualifiées grâce à un symbole abrégé qui nous indique par :
- TS : les relations qui très significatives, pour p<1%, sûres à 99% ou plus,
- S : les relations significatives, pour 1%<p<5%, sûres à 95-99%,
- PS : les relations peu significatives, pour 5%<p<15%, sûres seulement à 85-95%,
- NS : les relations non significatives, pour p>15%, sûres à moins de 85%
Dans l’exemple présenté ci-dessus, on peut rapidement conclure que :
- la chaîne la plus regardée est liée aux motivations pour allumer la télévision et à la fréquence d’audience,
- motivations, conditions et fréquence d’audience sont liées très fortement.
Pour réaliser des graphes de relation : le logiciel Sphinx Plus²