La tabulation croisée est une méthode d’analyse quantitative de la relation entre plusieurs variables.
Aussi connue sous le nom de tableaux de contingence ou de tableaux croisés, la tabulation croisée regroupe des variables pour comprendre la corrélation entre différentes variables. Il montre également comment les corrélations changent d’un groupement de variables à un autre. Il est généralement utilisé dans l’analyse statistique pour trouver des modèles, des tendances et des probabilités au sein de données brutes.
Quand vous pouvez utiliser le tableau croisé
Le tableau croisé est généralement effectué sur des données catégorielles – des données qui peuvent être divisées en groupes mutuellement exclusifs.
Un exemple de données catégorielles est la région de vente d’un produit. Typiquement, la région peut être divisée en catégories telles que la zone géographique (nord, sud, nord-est, ouest, etc) ou l’état (Andhra Pradesh, Rajasthan, Bihar, etc). Ce qu’il faut retenir des données catégorielles, c’est qu’un point de données catégorique ne peut pas appartenir à plus d’une catégorie.
Les tableaux croisés sont utilisés pour examiner les relations au sein des données qui peuvent ne pas être facilement apparentes. Les tableaux croisés sont particulièrement utiles pour étudier les études de marché ou les réponses aux enquêtes. Le recoupement de données catégorielles peut être effectué à l’aide d’outils tels que SPSS, SAS et Microsoft Excel.
Un exemple de recoupement
« Aucun autre outil dans Excel ne vous donne la flexibilité et la puissance analytique d’un tableau croisé dynamique. »
Bill Jalen
Une façon simple de faire des tableaux croisés est la fonction de tableau croisé dynamique de Microsoft Excel. Les tableaux croisés dynamiques sont un excellent moyen de rechercher des modèles car ils aident à regrouper facilement des données brutes.
Considérez l’exemple d’ensemble de données ci-dessous dans Excel. Il affiche les détails des transactions commerciales pour quatre catégories de produits. Utilisons cet ensemble de données pour montrer la tabulation croisée en action.
Ces données peuvent être converties au format tableau croisé dynamique en sélectionnant le tableau entier et en insérant un tableau croisé dynamique dans le fichier Excel. Le tableau peut mettre en corrélation différentes variables en ligne, en colonne ou en valeur, soit au format tableau, soit au format graphique.
Utilisons le tableau croisé pour vérifier la relation entre le type de mode de paiement (c’est-à-dire visa, MasterCard, PayPal, etc.) et la catégorie de produit par rapport à la région de vente. Nous pouvons sélectionner ces trois catégories dans le tableau croisé dynamique.
Les résultats apparaissent alors dans un tableau croisé dynamique :
Il est maintenant clair que les ventes les plus élevées ont été faites pour P1 en utilisant la Master Card. Par conséquent, nous pouvons conclure que la méthode de paiement MasterCard et la catégorie de produit P1 est la combinaison la plus rentable.
De même, nous pouvons utiliser la tabulation croisée et trouver la relation entre la catégorie de produit et le type de méthode de paiement en ce qui concerne le nombre de transactions.
Ceci peut être fait en regroupant le mode de paiement, la catégorie de produit et les unités vendues :
Par défaut, le tableau croisé dynamique d’Excel agrège les valeurs sous forme de somme. En additionnant les unités, nous obtiendrons le nombre total d’unités vendues. Puisque nous voulons comparer le nombre de transactions au lieu du nombre d’unités vendues, nous devons changer le paramètre du champ de valeur de Somme à Compte pour les unités.
Les résultats de cette mise en correspondance du tableau croisé dynamique sont les suivants. Il s’agit d’une analyse en tableau croisé de 3 variables – elle analyse la corrélation entre le mode de paiement et la catégorie de paiement en fonction du nombre de transactions.
Pour toutes les régions, nous pouvons observer que la catégorie de produits la plus vendue était P1 et que le plus grand nombre de transactions a été effectué avec Master Card. Nous pouvons également voir le mode de paiement préféré dans chacune des catégories de produits. Par exemple, American Express est la carte préférée pour les produits P2.
Les avantages de la tabulation croisée
Maintenant que nous savons clairement comment utiliser la tabulation croisée, jetons un bref coup d’œil aux avantages de l’utilisation de la tabulation croisée.
Élimine la confusion lors de l’interprétation des données
Les données brutes peuvent être difficiles à interpréter. Même pour les petits ensembles de données, il est trop facile de déduire des résultats erronés en regardant simplement les données. Le tableau croisé offre une méthode simple de regroupement des variables, qui minimise le potentiel de confusion ou d’erreur en fournissant des résultats clairs.
Aide à dériver d’innombrables insights
Comme nous l’avons observé dans notre exemple, le tableau croisé peut nous aider à dériver de grands insights à partir de données brutes. Ces aperçus ne sont pas faciles à voir lorsque les données brutes sont formatées sous forme de tableau. Puisque le tableau croisé cartographie clairement les relations entre les variables catégorielles, les chercheurs peuvent obtenir des aperçus meilleurs et plus profonds – des aperçus qui, autrement, auraient été négligés ou auraient pris beaucoup de temps à décoder à partir de formes plus compliquées d’analyse statistique.
Offre des points de données pour tracer un plan d’action
Le tableau croisé facilite l’interprétation des données, ce qui est bénéfique pour les chercheurs qui ont des connaissances limitées en analyse statistique. Avec le tableau croisé, les gens n’ont pas besoin de programmation statistique pour mettre en corrélation des variables catégorielles. La clarté offerte par le tableau croisé aide les professionnels à évaluer leur travail actuel et à tracer des stratégies futures.
Conclusion
De nombreuses études suggèrent que le tableau croisé est l’une des méthodes les plus privilégiées pour analyser les données des études de marché ou des enquêtes. En fait, Qualtrics estime que l’analyse par tableaux croisés et l’analyse de fréquence à variable unique représentent ensemble plus de 90 % de toutes les analyses d’études. Alors n’hésitez pas à utiliser les tableaux croisés ! Elle est inestimable pour découvrir des relations cachées dans vos données brutes.
Pour voir la tabulation croisée en action, consultez la version vidéo de ce blog.
Photo de Mika Baumeister sur Unsplash
.