Bienvenido al curso Pro Statistics
Puedes acceder a la versión Premium con tutoriales paso a paso, soporte y asesoramiento
Índice >> Lección 1 >> Lección 2 >> Lección 3 >> Lección 4 >> Lección 5 >> Lección 6 >> Lección 7 >> Lección 8 >> Lección 9 >> Lección 10 >> Lección 11 >> Lección 12 >> Lección 13 >> Tutorial R >> Tutorial Excel >>Tutorial SPSS Errores >> Casos de Éxito >> Opciones para Aprender >> FAQ's >> Lista de Softwares
Explorando casos multivariables
Es la última lección de la etapa de exploración.
En esta lección vas a ver unos cuántos gráficos interesantes para casos multivariables.
Los casos multivariables son casos dónde quieres visualizar 2 o más variables en un solo gráfico.
¡Tranquilo!
Es sencillo.
Esto es lo que vas a ver en la lección de hoy:
- Herramientas gráficas para comparar distribuciones de grupos
- Cómo relacionar variables numéricas: la correlación y el matrixplot
- Otros gráficos multivariables
# Una variable numérica por grupos
En estos casos quieres comparar varias distribuciones con un solo gráfico.
Para ello vas a utilizar el histograma de densidad por colores. En un mismo gráfico
Siguiendo el ejemplo de la tabla de datos Iris.
Puedes visualizar las diferentes variables comparando por grupos de especies. Es decir, visualizas una variable numérica de diferentes grupos (especies)En este caso te he puesto los 4 gráficos correspondientes a las 4 variables numéricas por especies (variable categórica)
Otra manera muy habitual de hacerlo es a base de boxplots. Es un gráfico equivalente a el histograma de densidad pero en ocasiones te puede dar otro punto de vista gráfico.
En la práctica utilizo los dos tipos.
Con estos gráficos puedes intuir si son diferentes los grupos y en qué variables 😉 ¿A qué mola?
Y ya que estamos te pongo el gráfico interactivo a base de boxplots que tengo en unos de los artículos 😉
# Dos o más variables numéricas: la correlación y el matrixplot
Este es un punto interesante.
Porque vas a responder a la pregunta, ¿tienen relación las variables numéricas entre sí?
Esto es precisamente lo que te indica la correlación.
La correlación indica el grado de relación lineal entre dos variables numéricas.
Antes de continuar te he preparado un post sobre la correlación. Te recomiendo que te leas el artículo y sigas después con la lección 😉
Te resumo las herramientas gráficas para explorar las relaciones entre variables numéricas en una tabla.
Dependecia de variables numéricas
En este tabla vas a ver un resumen de cómo visualizar la dependencia de variables numéricas. He utilizado el ejemplo de la tabla de Iris.
Tipo | Ejemplo |
---|---|
Scatterplot 2 variables numéricas Relacionar dos variables entre si con el scatterplot. En este ejemplo las variables petal width y petal length de la base de datos Iris. | |
Matrixplot Más de dos variables numéricas Son scatterplots puestos en forma de matriz. Así se puede relacionar las variables dos a dos en un solo gráfico. | |
Diagrama de correlación Más de dos variables numéricas La correlación se puede dibujar en forma de circulitos. Cuando más grande es el circulito más cercano está la correlación a 1 | |
Diagrama mixto Más de dos variables numéricas En este gráfico visualizas la correlación, el matrixplot, y las distribuciones de las variables. ¡Todo en uno! |
# Más opciones para explorar datos
Hay infinidad de opciones para graficar resultados y explorar variables.
A modo de ejemplo te pongo unos cuántos un poco diferentes.
Para que tengas más ideas:
Otros gráficos
Otros gráficos de casos multivariables que pueden ser interesantes.
Tipo | Ejemplo |
---|---|
Matrixplot por grupos más de 2 variables numéricas Es un matrixplot normal pero pintando los grupos por colores de especies. Es el ejemplo de plantas Iris 😉 ¿A qué queda chulo? | |
Scatter 3D 3 variables numéricas Es un scatter con 3 variables. He puesto el gráfico interactivo para que veas los puntos y puedas moverlo 🙂 pinchando en el gráfico 🙂 | |
Scatter 2D con magnitudes Es otra manera de dibujar tres variables numéricas En este ejemplo Has Rosling nos muestra esperanza de vida vs renta per cápita de todos los países.
Además las dimensiones de los círculos son el número de habitantes por país. ¿Supongo que sabrás cuáles son los más grandes? Y el color es el continente. Es una variable categórica. Es decir 3 variables numéricas y una categórica 😉 |
...
Has finalizado la parte de exploración de datos.
Espero que ahora tengas mucho más estructurado en tu cabeza las diferentes estrategias para visualizar datos y sacar información útil.
En la última parte del curso te mostraré el ABC del análisis. Empezaré por conceptos más que importantes como el intervalo de confianza, y la función de densidad de probabilidad.
Y acabaré presentándote el mapa de técnicas de análisis.
Mi objetivo es que salgas con las ideas claras y estructuradas.
De esta manera puedas construir el inicio para aplicar estadística en tus estudios 🙂
¡A por ello!
...
ACCEDE A LA FORMACIÓN PREMIUM C2
Training Fast Track Analizar Datos desde cero
Curso Analiza tu Estudio