Los gr谩ficos marginales permiten visualizar simult谩neamente la relaci贸n entre dos variables y la distribuci贸n individual de cada una. Esto es especialmente 煤til porque:
Pueden ayudar a detectar patrones y anomal铆as: Mientras el scatterplot muestra c贸mo se relacionan las variables, los gr谩ficos marginales ofrecen m谩s informaci贸n y pueden revelar si alguna variable est谩 sesgada, tiene m煤ltiples picos (multimodal), o contiene valores at铆picos.
- Contextualizar la correlaci贸n: A veces, dos variables pueden parecer relacionadas, pero sus distribuciones pueden indicar heterogeneidad o agrupamientos que un scatterplot solo no mostrar铆a.
- Facilitar la interpretaci贸n: Al ver las distribuciones marginales, los analistas pueden entender mejor el rango y concentraci贸n de datos, mejorando la toma de decisiones basada en los gr谩ficos.
- Presentaci贸n profesional: No hay que desde帽ar el hecho de que a帽adir gr谩ficos marginales en reportes o presentaciones aporta claridad visual y un toque de sofisticaci贸n que puede ser muy valorado en entornos acad茅micos o empresariales.
Librer铆as que vamos a utilizar en este ejemplo.

Creamos un dataset con dos 200 valores para cada variable, x e y. Para ello, utilizamos la funci贸n rnorm de R (con el fin de generar n煤meros aleatorios que siguen una distribuci贸n normal — tambi茅n conocida como distribuci贸n gaussiana o de campana–). Tras esto, con data.frame generamos la tabla de datos.

Para que ve谩is la estructura de datos, con head(datos, 10) podemos ver las 10 primeras observaciones del data frame que acabamos de crear.

Ahora creamos el gr谩fico de dispersi贸n (scatterplot) con el siguiente c贸digo, y lo mostramos. He a帽adido geom_smooth(method = 芦lm禄) para mostrar tambi茅n la l铆nea de tendencia.


Ahora usamos la funci贸n ggMarginal del paquete ggExtras para a帽adir al gr谩fico el densigrama 芦en este caso禄. Existe la posibilidad de a帽adir otros tipos de gr谩ficos marginales, como un histograma, boxplot, gr谩ficos de viol铆n etc.

El gr谩fico resultante ser铆a el siguiente:

鉁忥笍 Relaci贸n entre X e Y (gr谩fico de dispersi贸n / scatterplot)
La variable x sigue una distribuci贸n normal centrada en 10 con una dispersi贸n moderada (sd = standard deviation = 2).
La variable y es generada con media 20, sd 6 y, posteriormente, sumando + x. Por lo tanto, y est谩 correlacionada positivamente con x, pero con bastante variabilidad vertical (por el ruido de sd = 6).
As铆, a medida que x aumenta, y tambi茅n tiende a aumentar. Pero para un mismo valor de x, y puede tener un rango bastante amplio. Esto se observa gr谩ficamente como una nube de puntos inclinada positivamente, pero dispersa.
–
鉁忥笍 Comentario sobre los gr谩ficos marginales
馃煝 Distribuci贸n marginal de x (arriba)
Tiene forma normal (sim茅trica) centrada cerca de 10, con un ligero aplanamiento t铆pico de una muestra de tama帽o 200. La curva es relativamente estrecha, reflejando la baja dispersi贸n (sd = 2). Visualmente se ve una campana bien definida y concentrada.
馃煝 Distribuci贸n marginal de y (a la derecha)
Aunque y est谩 influida por una distribuci贸n normal (media 20, sd 6), al sumar x (media 10), su distribuci贸n se desplaza hacia valores m谩s altos. En la pr谩ctica, y queda centrada aproximadamente alrededor de 30.
La curva es m谩s ancha y m谩s aplanada, ya que la desviaci贸n est谩ndar combinada es considerable.
Puedes ver una mayor dispersi贸n horizontal: la densidad se reparte en un rango m谩s amplio que x.
–
鉁忥笍 Interpretaci贸n general
El gr谩fico completo (dispersi贸n + m谩rgenes) muestra c贸mo x y y est谩n positivamente relacionados, pero con bastante variabilidad.
Los gr谩ficos marginales ayudan a entender:
Que x est谩 mucho m谩s concentrado (menos disperso).
Que y es m谩s difuso, con valores m谩s alejados de la media.