La tabulación cruzada es un método para analizar cuantitativamente la relación entre múltiples variables.
También conocida como tablas de contingencia o tabulaciones cruzadas, la tabulación cruzada agrupa variables para entender la correlación entre diferentes variables. También muestra cómo cambian las correlaciones de una agrupación de variables a otra. Suele utilizarse en el análisis estadístico para encontrar patrones, tendencias y probabilidades dentro de los datos brutos.
Cuándo puede utilizar la tabulación cruzada
La tabulación cruzada suele realizarse sobre datos categóricos – datos que pueden dividirse en grupos mutuamente excluyentes.
Un ejemplo de datos categóricos es la región de ventas de un producto. Normalmente, la región puede dividirse en categorías como zona geográfica (Norte, Sur, Noreste, Oeste, etc) o estado (Andhra Pradesh, Rajasthan, Bihar, etc). Lo importante que hay que recordar sobre los datos categóricos es que un punto de datos categóricos no puede pertenecer a más de una categoría.
Las tabulaciones cruzadas se utilizan para examinar las relaciones dentro de los datos que pueden no ser fácilmente evidentes. La tabulación cruzada es especialmente útil para estudiar los estudios de mercado o las respuestas de las encuestas. La tabulación cruzada de datos categóricos puede realizarse con a través de herramientas como SPSS, SAS y Microsoft Excel.
Un ejemplo de tabulación cruzada
«Ninguna otra herramienta de Excel le ofrece la flexibilidad y el poder analítico de una tabla dinámica.»
Bill Jalen
Una forma sencilla de hacer tabulaciones cruzadas es la función de tabla dinámica de Microsoft Excel. Las tablas dinámicas son una gran manera de buscar patrones, ya que ayudan a agrupar fácilmente los datos en bruto.
Considere el siguiente conjunto de datos de muestra en Excel. Muestra detalles sobre las transacciones comerciales de cuatro categorías de productos. Utilicemos este conjunto de datos para mostrar la tabulación cruzada en acción.
Estos datos pueden convertirse a formato de tabla dinámica seleccionando toda la tabla e insertando una tabla dinámica en el archivo de Excel. La tabla puede correlacionar diferentes variables por filas, columnas o valores, ya sea en formato de tabla o de gráfico.
Utilicemos la tabulación cruzada para comprobar la relación entre el tipo de método de pago (es decir, visa, MasterCard, PayPal, etc.) y la categoría de producto con respecto a la región de ventas. Podemos seleccionar estas tres categorías en la tabla dinámica.
Entonces los resultados aparecen en una tabla dinámica:
Ahora está claro que las mayores ventas se hicieron para P1 usando Master Card. Por lo tanto, podemos concluir que el método de pago MasterCard y la categoría de producto P1 es la combinación más rentable.
De forma similar, podemos utilizar la tabulación cruzada y encontrar la relación entre la categoría de producto y el tipo de método de pago con respecto al número de transacciones.
Esto se puede hacer agrupando el método de pago, la categoría de producto y las unidades vendidas:
Por defecto, la tabla dinámica de Excel agrega los valores como una suma. La suma de las unidades nos dará el número total de unidades vendidas. Como queremos comparar el número de transacciones en lugar del número de unidades vendidas, tenemos que cambiar la Configuración del campo de valor de Suma a Recuento de unidades.
Los resultados de esta asignación de la tabla dinámica son los que se muestran a continuación. Se trata de un análisis de tabulación cruzada de 3 variables – analiza la correlación entre el método de pago y la categoría de pago según el número de transacciones.
Para todas las regiones, podemos observar que la categoría de productos más vendida fue la P1 y el mayor número de transacciones se realizó con Master Card. También podemos ver el método de pago preferido en cada una de las categorías de productos. Por ejemplo, American Express es la tarjeta preferida para los productos P2.
Los beneficios de la tabulación cruzada
Ahora que tenemos claro cómo utilizar la tabulación cruzada, echemos un breve vistazo a los beneficios de utilizarla.
Elimina la confusión al interpretar los datos
Los datos en bruto pueden ser difíciles de interpretar. Incluso en el caso de conjuntos de datos pequeños, es demasiado fácil obtener resultados erróneos con sólo mirar los datos. La tabulación cruzada ofrece un método simple de agrupar variables, que minimiza el potencial de confusión o error al proporcionar resultados claros.
Ayuda a derivar innumerables insights
Como observamos en nuestro ejemplo, la tabulación cruzada puede ayudarnos a derivar grandes insights de los datos crudos. Estas ideas no son fáciles de ver cuando los datos en bruto se formatean como una tabla. Dado que la tabulación cruzada traza claramente las relaciones entre las variables categóricas, los investigadores pueden obtener perspectivas mejores y más profundas, perspectivas que, de otro modo, se habrían pasado por alto o habrían tardado mucho tiempo en descifrar a partir de formas más complicadas de análisis estadístico.
Ofrece puntos de datos para trazar un curso de acción
La tabulación cruzada facilita la interpretación de los datos, lo cual es beneficioso para los investigadores que tienen un conocimiento limitado del análisis estadístico. Con la tabulación cruzada, las personas no necesitan programación estadística para correlacionar variables categóricas. La claridad que ofrece la tabulación cruzada ayuda a los profesionales a evaluar su trabajo actual y a trazar estrategias futuras.
Conclusión
Muchos estudios sugieren que la tabulación cruzada es uno de los métodos preferidos para analizar los datos de las investigaciones de mercado o de las encuestas. De hecho, Qualtrics estima que el análisis de tabulación cruzada y el análisis de frecuencia de una sola variable representan conjuntamente más del 90% de todos los análisis de investigación. Así que adelante, utilice la tabulación cruzada. Es inestimable para descubrir relaciones ocultas en sus datos brutos.
Para ver la tabulación cruzada en acción, eche un vistazo a la versión en vídeo de este blog.
Foto de Mika Baumeister en Unsplash