Die Kreuztabellierung ist eine Methode zur quantitativen Analyse der Beziehung zwischen mehreren Variablen.
Auch bekannt als Kontingenztabellen oder Kreuztabellen, gruppiert die Kreuztabellierung Variablen, um die Korrelation zwischen verschiedenen Variablen zu verstehen. Sie zeigt auch, wie sich die Korrelationen von einer Variablengruppierung zur anderen ändern. Sie wird in der Regel in der statistischen Analyse verwendet, um Muster, Trends und Wahrscheinlichkeiten in Rohdaten zu finden.
Wann können Sie Kreuztabellen verwenden
Kreuztabellen werden in der Regel mit kategorischen Daten durchgeführt – Daten, die in sich gegenseitig ausschließende Gruppen unterteilt werden können.
Ein Beispiel für kategorische Daten ist die Verkaufsregion für ein Produkt. Typischerweise kann die Region in Kategorien wie geografisches Gebiet (Norden, Süden, Nordosten, Westen usw.) oder Bundesland (Andhra Pradesh, Rajasthan, Bihar usw.) unterteilt werden. Das Wichtigste bei kategorischen Daten ist, dass ein kategorischer Datenpunkt nicht zu mehr als einer Kategorie gehören kann.
Kreuztabellen werden verwendet, um Beziehungen innerhalb der Daten zu untersuchen, die nicht ohne weiteres ersichtlich sind. Die Kreuztabellierung ist besonders nützlich für die Untersuchung von Marktforschungs- oder Umfrageantworten. Kreuztabellierungen von kategorischen Daten können mit Hilfe von Tools wie SPSS, SAS und Microsoft Excel durchgeführt werden.
Ein Beispiel für Kreuztabellierungen
„Kein anderes Tool in Excel bietet Ihnen die Flexibilität und analytische Kraft einer Pivot-Tabelle.“
Bill Jalen
Eine einfache Möglichkeit, Kreuztabellen zu erstellen, ist die Pivot-Tabellen-Funktion von Microsoft Excel. Pivot-Tabellen sind eine großartige Möglichkeit, nach Mustern zu suchen, da sie bei der einfachen Gruppierung von Rohdaten helfen.
Betrachten Sie den folgenden Beispieldatensatz in Excel. Er zeigt Details zu kommerziellen Transaktionen für vier Produktkategorien an. Lassen Sie uns diesen Datensatz verwenden, um die Kreuztabellierung in Aktion zu zeigen.
Diese Daten können in das Pivot-Tabellenformat konvertiert werden, indem die gesamte Tabelle ausgewählt und eine Pivot-Tabelle in die Excel-Datei eingefügt wird. Die Tabelle kann verschiedene Variablen zeilenweise, spaltenweise oder wertmäßig entweder im Tabellen- oder Diagrammformat in Beziehung setzen.
Lassen Sie uns die Kreuztabellierung verwenden, um die Beziehung zwischen der Art der Zahlungsmethode (d.h. Visa, MasterCard, PayPal, usw.) und der Produktkategorie in Bezug auf die Verkaufsregion zu überprüfen. Wir können diese drei Kategorien in der Pivot-Tabelle auswählen.
Dann erscheinen die Ergebnisse in einer Pivot-Tabelle:
Es ist nun klar, dass die höchsten Umsätze für P1 mit der Master Card gemacht wurden. Daher können wir schlussfolgern, dass die Zahlungsmethode MasterCard und die Produktkategorie P1 die profitabelste Kombination ist.
Analog können wir die Kreuztabellierung verwenden und die Beziehung zwischen der Produktkategorie und der Art der Zahlungsmethode in Bezug auf die Anzahl der Transaktionen finden.
Das geht, indem man die Zahlungsmethode, die Produktkategorie und die verkauften Einheiten gruppiert:
Standardmäßig aggregiert die Pivottabelle von Excel die Werte als Summe. Wenn wir die Einheiten summieren, erhalten wir die Gesamtzahl der verkauften Einheiten. Da wir die Anzahl der Transaktionen anstelle der Anzahl der verkauften Einheiten vergleichen möchten, müssen wir die Wertfeldeinstellung von Summe auf Anzahl für Einheiten ändern.
Das Ergebnis dieser Pivot-Tabellen-Zuordnung ist wie unten dargestellt. Dies ist eine Kreuztabellenanalyse von 3 Variablen – sie analysiert die Korrelation zwischen der Zahlungsmethode und der Zahlungskategorie in Abhängigkeit von der Anzahl der Transaktionen.
Für alle Regionen können wir beobachten, dass die meistverkaufte Produktkategorie P1 war und die höchste Anzahl an Transaktionen mit Master Card durchgeführt wurde. Wir können auch die bevorzugte Zahlungsmethode in jeder der Produktkategorien sehen. Zum Beispiel ist American Express die bevorzugte Karte für P2-Produkte.
Die Vorteile der Kreuztabellierung
Nun, da wir uns darüber im Klaren sind, wie die Kreuztabellierung verwendet wird, lassen Sie uns einen kurzen Blick auf die Vorteile der Kreuztabellierung werfen.
Entfernt Verwirrung bei der Interpretation von Daten
Rohdaten können schwierig zu interpretieren sein. Selbst bei kleinen Datensätzen ist es nur allzu leicht, falsche Ergebnisse abzuleiten, wenn man nur die Daten betrachtet. Die Kreuztabellierung bietet eine einfache Methode zur Gruppierung von Variablen, die das Potenzial für Verwirrung oder Fehler minimiert, indem sie klare Ergebnisse liefert.
Hilft bei der Ableitung unzähliger Erkenntnisse
Wie wir in unserem Beispiel beobachtet haben, kann die Kreuztabellierung uns helfen, große Erkenntnisse aus Rohdaten abzuleiten. Diese Erkenntnisse sind nicht einfach zu sehen, wenn die Rohdaten als Tabelle formatiert sind. Da die Kreuztabellierung die Beziehungen zwischen kategorialen Variablen klar abbildet, können Forscher bessere und tiefere Einblicke gewinnen – Einblicke, die sonst übersehen worden wären oder viel Zeit gebraucht hätten, um sie aus komplizierteren Formen der statistischen Analyse zu entschlüsseln.
Bietet Datenpunkte, um einen Handlungsablauf zu entwerfen
Die Kreuztabellierung erleichtert die Interpretation von Daten, was für Forscher von Vorteil ist, die nur begrenzte Kenntnisse der statistischen Analyse haben. Bei der Kreuztabellierung braucht man keine statistische Programmierung, um kategoriale Variablen in Beziehung zu setzen. Die Klarheit, die die Kreuztabellierung bietet, hilft Fachleuten, ihre aktuelle Arbeit zu bewerten und zukünftige Strategien zu entwerfen.
Fazit
Viele Studien legen nahe, dass die Kreuztabellierung eine der bevorzugten Methoden zur Analyse von Marktforschungs- oder Umfragedaten ist. Tatsächlich schätzt Qualtrics, dass die Kreuztabellenanalyse und die Analyse der Häufigkeit einzelner Variablen zusammen mehr als 90 % aller Forschungsanalysen ausmachen. Nutzen Sie also die Kreuztabellierung! Sie ist von unschätzbarem Wert, wenn es darum geht, versteckte Beziehungen in Ihren Rohdaten aufzudecken.
Um Kreuztabellen in Aktion zu sehen, schauen Sie sich die Videoversion dieses Blogs an.
Foto von Mika Baumeister auf Unsplash