Tabulacja krzyżowa jest metodą ilościowej analizy zależności pomiędzy wieloma zmiennymi.
Znana również jako tabele kontyngencji lub tabele krzyżowe, tabulacja krzyżowa grupuje zmienne, aby zrozumieć korelację pomiędzy różnymi zmiennymi. Pokazuje również, jak korelacje zmieniają się z jednego grupowania zmiennych do drugiego. Jest ona zazwyczaj używana w analizie statystycznej do znajdowania wzorców, trendów i prawdopodobieństw w surowych danych.
Kiedy możesz użyć tabel krzyżowych
Tabulacja krzyżowa jest zazwyczaj wykonywana na danych kategorycznych – danych, które mogą być podzielone na wzajemnie wykluczające się grupy.
Przykładem danych kategorycznych jest region sprzedaży produktu. Zazwyczaj region może być podzielony na kategorie takie jak obszar geograficzny (północ, południe, północny wschód, zachód, itp.) lub stan (Andhra Pradesh, Rajasthan, Bihar, itp.). Ważną rzeczą do zapamiętania w przypadku danych kategorycznych jest to, że kategoryczny punkt danych nie może należeć do więcej niż jednej kategorii.
Tabulacje krzyżowe są używane do badania związków w danych, które mogą nie być łatwo widoczne. Tabulacje krzyżowe są szczególnie przydatne przy badaniu rynku lub odpowiedzi na ankiety. Tabulacje krzyżowe danych kategorycznych mogą być wykonywane za pomocą narzędzi takich jak SPSS, SAS i Microsoft Excel.
Przykład tabulacji krzyżowej
„Żadne inne narzędzie w Excelu nie daje takiej elastyczności i mocy analitycznej jak tabela przestawna.”
Bill Jalen
Jednym z prostych sposobów wykonywania tabel krzyżowych jest funkcja tabeli przestawnej programu Microsoft Excel. Tabele przestawne są doskonałym sposobem na wyszukiwanie wzorców, ponieważ pomagają w łatwym grupowaniu surowych danych.
Rozważmy poniższy przykładowy zestaw danych w programie Excel. Pokazuje on szczegóły transakcji handlowych dla czterech kategorii produktów. Użyjmy tego zestawu danych, aby pokazać tabulację krzyżową w akcji.
Dane te można przekonwertować do formatu tabeli przestawnej, wybierając całą tabelę i wstawiając tabelę przestawną do pliku Excela. Tabela może korelować różne zmienne wierszowo, kolumnowo lub wartościowo w formacie tabeli lub wykresu.
Zastosujmy tabulację krzyżową, aby sprawdzić zależność między rodzajem metody płatności (tj. visa, MasterCard, PayPal, itp.) a kategorią produktu w odniesieniu do regionu sprzedaży. Możemy wybrać te trzy kategorie w tabeli przestawnej.
Wtedy wyniki pojawią się w tabeli przestawnej:
Jest teraz jasne, że największa sprzedaż została dokonana dla P1 przy użyciu Master Card. Dlatego możemy stwierdzić, że metoda płatności MasterCard i kategoria produktów P1 jest najbardziej dochodową kombinacją.
Podobnie możemy użyć tabulacji krzyżowej i znaleźć zależność między kategorią produktów i rodzajem metody płatności w odniesieniu do liczby transakcji.
Można to zrobić grupując metodę płatności, kategorię produktu i sprzedane jednostki:
Domyślnie tabela przestawna Excela agreguje wartości jako sumę. Sumując jednostki otrzymamy całkowitą liczbę sprzedanych sztuk. Ponieważ chcemy porównać liczbę transakcji, a nie liczbę sprzedanych jednostek, musimy zmienić ustawienie pola wartości z Suma na Policz dla jednostek.
Wyniki mapowania tabeli przestawnej są takie, jak pokazano poniżej. Jest to analiza tabel krzyżowych dla 3 zmiennych – analizuje korelację pomiędzy metodą płatności a kategorią płatności w zależności od liczby transakcji.
Dla wszystkich regionów możemy zaobserwować, że najwyżej sprzedającą się kategorią produktów była P1, a największa liczba transakcji została dokonana przy użyciu Master Card. Możemy również zaobserwować preferowaną metodę płatności w każdej z kategorii produktów. Na przykład, American Express jest preferowaną kartą dla produktów P2.
Korzyści z tabulacji krzyżowej
Teraz, gdy mamy jasność co do tego, jak używać tabulacji krzyżowej, spójrzmy krótko na korzyści z używania tabulacji krzyżowej.
Eliminuje zamieszanie podczas interpretacji danych
Surowe dane mogą być trudne do interpretacji. Nawet w przypadku małych zbiorów danych, zbyt łatwo jest uzyskać błędne wyniki patrząc tylko na dane. Tabulacja krzyżowa oferuje prostą metodę grupowania zmiennych, która minimalizuje możliwość pomyłki lub błędu poprzez dostarczenie jasnych wyników.
Pomaga w uzyskaniu niezliczonych spostrzeżeń
Jak zaobserwowaliśmy w naszym przykładzie, tabulacja krzyżowa może pomóc nam w uzyskaniu wspaniałych spostrzeżeń z surowych danych. Te spostrzeżenia nie są łatwe do zobaczenia, gdy surowe dane są sformatowane jako tabela. Ponieważ tabulacja krzyżowa wyraźnie mapuje relacje między zmiennymi kategorycznymi, badacze mogą uzyskać lepsze i głębsze spostrzeżenia – spostrzeżenia, które w przeciwnym razie zostałyby przeoczone lub zajęłyby dużo czasu, aby je rozszyfrować za pomocą bardziej skomplikowanych form analizy statystycznej.
Oferuje punkty danych, aby wytyczyć kierunek działania
Tabulacja krzyżowa ułatwia interpretację danych, co jest korzystne dla badaczy, którzy mają ograniczoną wiedzę na temat analizy statystycznej. Dzięki tabulacji krzyżowej ludzie nie potrzebują programowania statystycznego, aby skorelować zmienne kategoryczne. Przejrzystość oferowana przez tabulację krzyżową pomaga profesjonalistom ocenić ich obecną pracę i nakreślić przyszłe strategie.
Wniosek
Wiele badań sugeruje, że tabulacja krzyżowa jest jedną z najbardziej preferowanych metod analizy danych z badań rynkowych lub ankiet. W rzeczywistości Qualtrics szacuje, że analiza tabel krzyżowych i analiza częstotliwości pojedynczych zmiennych stanowią łącznie ponad 90% wszystkich analiz badawczych. Zatem śmiało korzystaj z tabel krzyżowych! Jest ona nieoceniona w odkrywaniu ukrytych zależności w surowych danych.
Aby zobaczyć tabulację krzyżową w akcji, sprawdź wersję wideo tego bloga.
Photo by Mika Baumeister on Unsplash
Więcej informacji na temat analizy krzyżowej można znaleźć na stronie internetowej Qualtrics.