¿Cuál gráfico estadístico usar para mis datos?

Tabla de contenidos

En el presente artículo se muestran los diferentes tipos de gráficos informativos que se utilizan para resumir información de la tabla de frecuencia. También se discutirá las posibles formas que las distribuciones de la data pueden tomar en estos gráficos informativos y su importancia en los posteriores análisis estadísticos.

Gráfico para variables cuantitativas y categoricas
Imagen 1. Gráficos informativos

Imagine una investigación en donde se analiza el continente de donde provienen los jugadores de baloncesto de una competencia de Estados Unidos. La tabla de frecuencia de la imagen 2 es el resultado. Se puede apreciar que 287 jugadores vienen de Norteamérica, 45 de Europa, 36 de América del Sur, 25 de África y 18 de Asia. En la columna 3 de la tabla de frecuencia están los porcentajes relativos. Si se desea presentar está información mediante un gráfico, existen dos formas de realizarlo.

Tabla frecuencia con variable categórica
Imagen 2. Tabla de frecuencia para variable categórica

¿Qué gráfico usar para una variable categórica/cualitativa?

Gráfico de pastel

El gráfico de la imagen 3 es un gráfico de pastel. Las categorías de la variable que se desean resumir se muestran mediante “tajadas” del pastel. En este tipo de gráfico, las tajadas representan los porcentajes de las observaciones en cada categoría. Se puede apreciar que casi tres cuartos de todos los jugadores vienen de Norteamérica.

RUTA EXCEL PARA GRÁFICO DE PASTEL: Insertar/Gráficos/Gráficos 2D/Gráfico circular

Gráfico de pastel para variable categórica
Imagen 3. Gráfico de pastel para variable categórica

Gráfico de barras

Otra forma de resumir la misma data es con un gráfico de barras como se muestra en la imagen 4. Este gráfico muestra claramente la distribución de la data de las diferentes categorías de la variable. La altura de las barras representan el porcentaje de las observaciones en cada categoría.

RUTA ECXEL PARA GRÁFICO DE BARRAS: Insertar/Gráficos/Columna en 2-D/Columna agrupada

Gráfico de barras para variable categórica
Imagen 4. Gráfico de barras para variable categórica

Ventajas y desventajas de gráficos para variable categórica

Los gráficos de pastel y barras tienen ventajas y desventajas. Una ventaja del gráfico de pastel es que se puede apreciar inmediatamente que aproximadamente el 75% de todos los jugadores vienen de Norteamérica. Sin embargo, no podemos percibir esta información tan fácilmente en el gráfico de barras sin hacer antes algunos cálculos. Del otro lado, el número exacto de jugadores de cada categoría no se visualiza en el gráfico de pastel, mientras que en el gráfico de barras se puede ver, por ejemplo, que un poco menos de 50 jugadores vienen de Europa.

Ventajas de gráficos para variable nominal y ordinal
Imagen 5. Ventajas de gráficos para variable categórica

Un gráfico de barras tiene ventajas sobre un gráfico de pastel si el número de categorías en la variable aumenta. Imaginemos, por ejemplo, que ya no deseamos saber de qué continente vienen los jugadores sino de qué país. En la imagen se aprecia cómo se vería el gráfico de pastel con este nuevo escenario. Se vería muy desordenado y no resulta comprensible. Para este caso sería más apropiado hacer un gráfico de barras. En este nuevo gráfico de barras también hay mucha información, sin embargo es más comprensible que el gráfico de pastel.

Ventajas del gráfico de barras para variable nominal u ordinal
Imagen 6. Gráfico para variable cualitativa con muchas categorías

¿Qué gráfico usar para una variable cuantitativa?

Gráfico de puntos

Una posibilidad de resumir información para el caso de variables cuantitativas es mediante un gráfico de puntos. Esta idea es sencilla: imaginemos que poseemos información sobre la altura de 10 jugadores de baloncesto expresado en centímetros. La matriz de datos sería la que se muestra en la imagen 7. Procedemos a dibujar una línea horizontal y etiquetar los posibles valores en intervalos regulares. El siguiente paso es colocar un punto para cada observación sobre su valor en la línea horizontal. Un gráfico de puntos es útil cuando se tiene pocas observaciones, sin embargo, se vuelve desordenado cuando se tiene una muestra grande, por ejemplo, de 100 jugadores.

Gráfico de puntos para variable cuantitativa
Imagen 7. Gráfico de puntos para variable cuantitativa

Histograma

Si se tiene muchas observaciones, los investigadores optan por usar el histograma, el cual se visualiza en la imagen. Un histograma es similar a un gráfico de barras en el sentido que se utiliza barras para representar las frecuencias de los posibles valores de la variable. La diferencia es que en el histograma las barras se tocan, reflejando de esta forma, que los valores de un intervalo de la variable representan una escala continua.

Histograma para variable cuantitativa
Imagen 8. Histograma para variable cuantitativa

Digamos, por instancia, que estamos interesados en el peso corporal de los jugadores. Si tenemos una medición detallada del peso como 96.9 o 83.5 kilos, no tiene sentido dibujar una barra separada para cada valor. En su lugar, construimos intervalos. En la imagen 8 tenemos 10 intervalos de 5 kilos. El primero intervalo va desde 47.5 a 52.5 kilos. La primera etiqueta que se muestra es 50 kilos dado que es el valor que se encuentra en el medio del primer intervalo.

No hay reglas sobre cuántos intervalos crear. Sin embargo, es importante señalar que los intervalos deben tener pesos iguales. En este caso, siempre es 5 kilos. Podemos apreciar casi a la vista que la mayoría de jugadores pesan alrededor de 70 kilos, también podemos ver que un peso menor a 60 kilos o mayor a 90 kilos son casos excepcionales.

Si nos fijamos en la forma del histograma notaremos que tiene una forma particular, tiene la forma de una campana tal como se muestra en la imagen 9. Tiene un pico o cima y es aproximadamente  simétrica. Encontraremos este tipo de distribución a seguido, pero no todos los histogramas tienen esta forma.

Histograma para variable ratio e intervalo
Imagen 9. Histograma para variable cuantitativa – intervalo

Un histograma también puede estar sesgado hacia la derecha o izquierda resultando en un histograma no simétrico donde una parte de la distribución se extiende más que la otra parte.

Una posible variable que tenga sesgo hacia la derecha sería el ingreso anual de los jugadores de baloncesto de la NBA. No habrá muchos jugadores con un ingreso anual bajo comparado con el ingreso anual promedio, sin embargo, habrá algunos jugadores que ganen mucho más que la mayoría, por esta razón habrá una cola derecha más larga como el histograma 2 en la imagen 10.

Un histograma también puede tener 2 picos, tal como se muestra el histograma 4 en la parte inferior derecha de la imagen 10. Imagine un encuentro entre dos equipos de futbol de 6 a 8 de edad. Luego del partido, todos los niños y padres van a un restaurante. Estamos interesados en saber las edades de las personas en el restaurante. El histograma 4 es respecto a la variable edad, tiene 2 picos dado que los presentes en el restaurante son niños entre 6 a 8 años y sus padres, los cuales tendrán entre 30 y 40 años. Tendremos por lo tanto, un pico alrededor de 7 y otro alrededor de 35 años. Este tipo de variable se le conoce como bimodal, mientras que la variable con sólo un pico es unimodal.

Tipos de distribuciones de variables cuantitativas
Imagen 10. Tipos de distribuciones para variable cuantitativa

Importancia de indentificar el tipo de distribución

Aprendizaje: siempre resuma la data mediante gráficos. Si se está trabajando con variables categóricas (nominales u ordinales) es mejor optar por el gráfico de pastel o de barras. En el caso que se analice variables cuantitativas (ratio o intervalo) se debe utilizar el histograma. Es importante identificar la forma de nuestra variable: ¿tiene forma de campana o es asimétrica?, ¿es unimodal o bimodal? Evaluar la forma de la distribución es esencial afectará el método estadístico que se empleará posteriormente.

Deja un comentario