A tabulação cruzada é um método para analisar quantitativamente a relação entre múltiplas variáveis.
Tão conhecido como tabelas de contingência ou tabulações cruzadas, variáveis de grupos de tabulação cruzada para compreender a correlação entre diferentes variáveis. Também mostra como as correlações mudam de um agrupamento de variáveis para outro. É normalmente utilizada na análise estatística para encontrar padrões, tendências e probabilidades dentro de dados brutos.
Quando se pode utilizar a tabulação cruzada
A tabulação cruzada é normalmente realizada em dados categóricos – dados que podem ser divididos em grupos mutuamente exclusivos.
Um exemplo de dados categóricos é a região de vendas de um produto. Tipicamente, a região pode ser dividida em categorias tais como área geográfica (Norte, Sul, Nordeste, Oeste, etc) ou estado (Andhra Pradesh, Rajasthan, Bihar, etc). O importante a lembrar sobre dados categóricos é que um ponto de dados categórico não pode pertencer a mais do que uma categoria.
As tabulações cruzadas são utilizadas para examinar relações dentro de dados que podem não ser facilmente aparentes. A tabulação cruzada é especialmente útil para o estudo de estudos de mercado ou respostas a inquéritos. A tabulação cruzada de dados categóricos pode ser feita com ferramentas como SPSS, SAS, e Microsoft Excel.
Um exemplo de tabulação cruzada
“Nenhuma outra ferramenta no Excel lhe dá a flexibilidade e o poder analítico de uma tabela pivot.”
Bill Jalen
Uma forma simples de fazer tabulações cruzadas é a funcionalidade de tabela pivot do Microsoft Excel. As tabelas pivot são uma óptima forma de procurar padrões, pois ajudam a agrupar facilmente os dados brutos.
Considerar o conjunto de dados de amostra abaixo no Excel. Apresenta detalhes sobre transacções comerciais para quatro categorias de produtos. Vamos usar este conjunto de dados para mostrar tabulação cruzada em acção.

Estes dados podem ser convertidos para o formato de tabela pivot seleccionando a tabela inteira e inserindo uma tabela pivot no ficheiro Excel. A tabela pode correlacionar diferentes variáveis em termos de linha, coluna, ou valor em formato de tabela ou de gráfico.

Vamos utilizar a tabulação cruzada para verificar a relação entre o tipo de método de pagamento (ou seja, visto, MasterCard, PayPal, etc.) e a categoria do produto no que diz respeito à região de vendas. Podemos seleccionar estas três categorias na tabela pivot.

Então os resultados aparecem numa tabela pivot:

É agora claro que as vendas mais altas foram feitas para P1 utilizando Master Card. Portanto, podemos concluir que o método de pagamento MasterCard e a categoria do produto P1 é a combinação mais lucrativa.
Simplesmente, podemos utilizar a tabulação cruzada e encontrar a relação entre a categoria do produto e o tipo de método de pagamento no que diz respeito ao número de transacções.
Isto pode ser feito agrupando o método de pagamento, categoria do produto, e unidades vendidas:

Por defeito, a tabela pivot do Excel agrega valores como uma soma. A soma das unidades dar-nos-á o número total de unidades vendidas. Uma vez que queremos comparar o número de transacções em vez do número de unidades vendidas, precisamos de alterar a Definição do Campo de Valor de Soma para Contagem de Unidades.

Os resultados deste mapeamento da tabela pivot são os que se seguem. Esta é uma análise de tabulação cruzada de 3 variáveis – analisa a correlação entre o método de pagamento e a categoria de pagamento de acordo com o número de transacções.

Para todas as regiões, podemos observar que a categoria de produtos mais vendida foi P1 e que o maior número de transacções foi feito utilizando Master Card. Também podemos ver o método de pagamento preferido em cada uma das categorias de produtos. Por exemplo, American Express é o cartão preferido para produtos P2.
Os benefícios da tabulação cruzada
Agora que estamos claros sobre como usar a tabulação cruzada, vamos dar uma breve olhada aos benefícios de usar a tabulação cruzada.
Elimina a confusão ao interpretar os dados
Dados em bruto podem ser difíceis de interpretar. Mesmo para conjuntos de dados pequenos, é demasiado fácil obter resultados errados apenas olhando para os dados. A tabulação cruzada oferece um método simples de agrupamento de variáveis, que minimiza o potencial de confusão ou erro ao fornecer resultados claros.
Ajuda na obtenção de inúmeros conhecimentos
Como observámos no nosso exemplo, a tabulação cruzada pode ajudar-nos a obter grandes conhecimentos a partir de dados brutos. Estas percepções não são fáceis de ver quando os dados em bruto são formatados como uma tabela. Uma vez que a tabulação cruzada mapeia claramente as relações entre variáveis categóricas, os investigadores podem obter melhores e mais profundas percepções – percepções que de outra forma teriam sido negligenciadas ou teriam demorado muito tempo a descodificar a partir de formas mais complicadas de análise estatística.
Oferece pontos de dados para traçar uma linha de acção
A tabulação cruzada facilita a interpretação dos dados, o que é benéfico para os investigadores que têm conhecimentos limitados de análise estatística. Com a tabulação cruzada, as pessoas não precisam de programação estatística para correlacionar variáveis categóricas. A clareza oferecida pela tabulação cruzada ajuda os profissionais a avaliar o seu trabalho actual e a traçar estratégias futuras.
Conclusão
Muitos estudos sugerem que a tabulação cruzada é um dos métodos mais preferidos para analisar dados de estudos de mercado ou inquéritos. De facto, a Qualtrics estima que a análise de tabulação cruzada e a análise de frequência variável única em conjunto representam mais de 90% de todas as análises de investigação. Por isso, avancem e utilizem a apuramento cruzado! É inestimável para descobrir relações ocultas nos seus dados brutos.
Para ver a tabulação cruzada em acção, consulte a versão em vídeo deste blogue.
P>Foto de Mika Baumeister em Unsplash