10-graficos-estadisticos-estadistica-descriptiva-3

10 gráficos estadísticos para sacar petróleo de tus datos antes de analizar nada – Estadística descriptiva Parte 3

 

¿Cuántas veces has empezado por buscar en tus apuntes cuál es el test que puedes hacer? ¿Cuántas veces antes de ver cómo son los datos ya quieres aplicar una técnica de análisis? ¡Espera! Utiliza estos 10 gráficos estadísticos y te aseguro que vas a sacar petróleo. Tendrás una información muy interesante antes de analizar tus datos. ¡No los olvides!

Este post es un resumen de los gráficos estadísticos más útiles para visualizar tus datos y ser un poco más feliz. He dividido esta lista en dos grandes grupos.

  1. Los gráficos que trabajan con variables numéricas
  2. Los gráficos que trabajan con variables categóricas

Si no recuerdas la descripción del tipo de variables mira en la sección de píldoras de estadística.

Recuerda que una variable es una observación de fenómenos reales. Pueden ser cuantificadas. Numéricas. Como por ejemplo, la altura, el peso, la edad. O pueden ser nombres, etiquetas… Categóricas. El país, el sexo, fumador o no fumador.

## Variables numéricas

Te voy a compartir los gráficos estadísticos más interesantes para variables que expresan cantidad. Las variables numéricas.

# Histograma

El histograma es la herramienta fundamental de la estadística descriptiva. Resume la variable numérica de un modo sencillo y eficaz. Utiliza las famosas tablas de frecuencias.

Es un diagrama de barras. La altura de las barras es la frecuencia. Y cada barra se sitúa en su debida clase. En este post puedes ver una explicación mucho más profunda de esta herramienta y los conceptos de frecuencia y clase.

Otra de las ventajas del histograma es que te permite entender qué es una función de densidad de probabilidad. Es un concepto mucho más abstracto y muy importante. Si quieres saber más te recomiendo este post.

# Boxplot

Otra de las herramientas por excelencia es el boxplot. Esta herramienta te permite visualizar la variable numérica con medidas de dispersión. Se basa en los cuartiles.

Es una herramienta fantástica para comparar distintos grupos. Distintas variables numéricas. En este post te explico un poco más sobre esta herramienta.

# Diagrama de líneas

El gráfico de líneas es realmente sencillo. Un diagrama de frecuencias es un diagrama de líneas, por ejemplo.

Recuerda que un diagrama de frecuencias es un histograma que en lugar de barras utiliza una línea para unir estas barras entre ellas. La línea roja que ves que recorre las alturas de las barras forma el diagrama de frecuencias.

La peculiaridad que tiene es que trabajas con más de una variable. Estás representando en dos dimensiones:

  1. En el eje vertical ‘Y’ sitúas la variable numérica que quieres visualizar
  2. Y en el eje horizontal ‘X’ sitúas una escala. Me explico: los meses del año, días de la semana, etc… Es una escala de tiempo.

Como te decía, si en el eje ‘X’ pones la escala de tiempo de tu tiempo, crearás un gráfico de líneas en el tiempo. Es conocido con el nombre de serie temporal. Representas tu variable numérica en función del tiempo.

Una de las series temporales más famosas y polémicas del del mundo es Hockey stick graph. Este gráfico demuestra en una sola gráfica el calentamiento global de la tierra. El cambio climático.

Puedes ver la evolución de la temperatura media de la tierra desde el año 1000 hasta el año 2000. La temperatura de hace siglos se ha extraído del estudio de un tipo de árboles milenarios.

Fuente: wikipedia Hockey stick graph

Si pintas frecuencias en función de las clases obtendrás el diagrama de frecuencias del que te estaba hablando. Fácil.

Este tipo de gráficos es fantástico para comparar diferentes variables en un solo gráfico.

# Scatter

El scatter o nube de puntos también es un gráfico de dos variables. El concepto es el mismo que el anterior. Pero en lugar de unir los puntos con una línea, se dejan los puntos o crucecitas.

Este gráfico es muy útil para intuir cómo se relaciona una variable numérica con otra rápidamente. En la regresión lineal es muy usado para intuir correlaciones o relaciones lineales.

Fuente: wikipedia regresión lineal

Si eres curioso y te mola saber qué pasa cuando tienes 3 variables y las quieres relacionar, también puedes hacer un scatter plot en 3 dimensiones. A veces puede ir bien, pero a los seres humanos nos gusta simplificar y utilizar el papel 🙂

 

# Matrix plot

Este gráfico se utiliza para graficar 3 o más variables entre sí. Relaciona una variable con las otras en 2D. Mira este ejemplo y lo verás.

El diagrama de puntos son scatters 2D de parejas de variables. Además el matrixplot tiene la peculiaridad de poner el histograma para ver la distribución de la variable numérica. Podrás visualizar también la distribución de un vistazo.

Es muy útil utilizar este tipo de gráficos cuando tienes varias variables numéricas. Puedes intuir muy rápidamente la relación entre variables.

# Mapa de correlaciones

Añado un gráfico muy interesante. Aún no te he contado que es la correlación. Pero el concepto es simple. Es un numerito que te dice cómo depende una variable de manera lineal.

En este caso la dependencia es lineal y la correlación es alta.

Fuente: wikipedia regresión lineal

Una correlación baja sería este ejemplo.

Resultado de imagen de scatterplot

El mapa de correlaciones nos indica en colorines las variables que están más correlacionadas que las otras.

Cuando el color es más cercano a 1, la correlación es más evidente. Ya explicaré más con detenimiento este concepto en otro post.

# Histograma + densidad de probabilidad

Como te he contado, el histograma nos lleva directamente a ver cómo está distribuida la variable numérica.

Una buena práctica es dibujar la variable numérica con la estimación de la densidad de probabilidad. De esta manera puedes saber como se ve la variable numérica.

Si quieres más detalles aquí puedes ver como se puede estimar la densidad de probabilidad.

## Variables categóricas

Las variable categóricas expresan cualidades o etiquetas. Por ejemplo: el país de procedencia, la calidad del vino (bueno, mal, regular), si es fumador o no fumador, si tiene cardiopatía o no…

Te muestro los gráficos más interesantes de las variables categóricas:

# Diagrama de barras

Uno de los gráficos más interesantes es pintar los grupos basados en categorías en forma de barras. Con este ejemplo lo puedes ver muy claro.

Aquí simplemente estás contando el número de girafas, orangutanes y monos que tienes en el zoo. Los grupos o categorías son tres en este caso.

# Diagrama de sectores

Es igual que el ejemplo anterior. Pero se pinta en forma de pastel. Normalmente se expresa en forma de frecuencia relativa. En proporción. En porcentaje. Es muy típico en política. Los que han votado al PSOE, PP , ERC etc…

# Grafico de cotitaziones

Éste es un gráfico también cualitativo expresado en forma de polígono. Es utilizado para vender los resultados de una manera muy interesante. Compara por ejemplo diferentes productos con sus cualidades. O diferentes tratamientos, si es efectivo, caro, etc.

Se trata de graficar teniendo en cuenta las características de lo que quieras comparar: de los distintos métodos, productos, tratamientos, fármacos. 

 


Y hasta aquí el post sobre los 10 gráficos estadísticos que te pueden ayudar, y mucho, cuando quieras describir los datos. Tanto variables numéricas como variables categóricas.

 

Si quieres más sobre estadística no olvides pasarte por la sección de píldoras de estadística 😉

Acerca del autor

Jordi Olle Sanchez

Autor de ConceptosClaros.com. Ayuda a investigadores apasionados a aplicar estadística y análisis de datos en sus proyectos para catapultar su carrera investigadora y adaptarse a la era de los datos. Accede a los recursos gratuitos para aplicar estadística en tus datos

Interacciones con los lectores

Comentarios

  1. Sergio dice

    Felicitaciones por tu excelente material y simplicidad para explicar conceptos complejos…..Muchas Gracias!!!


Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

  Acepto la política de privacidad

Responsable del fichero: Jordi Ollé Sánchez
Finalidad; envío de mis publicaciones así como correos comerciales.
La Legitimación; es gracias a tu consentimiento.
Destinatarios:Como usuario e interesado te informo que los datos que me facilitas estarán ubicados en los servidores de Webempresa (proveedor de hosting de Conceptos claros) dentro de la UE. Ver política de privacidad de Webempresa
Podrás ejercer Tus Derechos de Acceso, Rectificación, Limitación o Suprimir tus datos enviando un email a jordi @ conceptosclaros.com o ante la Autoridad de Control
Encontrarás más información en política de privacidad
6-tecnicas-Mockup-presentacion

Descubre cómo Analizar tus Datos con éxito y convertirte en Científico de Datos en tu sector