Una introducción al lenguaje de programación
Aprender a crear gráficos a través de la interfaz gráfica de R y a través del paquete ggplot2.
Ya hemos visto como importar, manejar y manipular datos. Pero ahora… ¿Cómo los represento?
Una de las herramientas que nos podría ayudar a embellecer nuestros trabajos son los gráficos contenidos en la biblioteca o librería “ggplot2”
Es una librería que pertenece al tidyverse. Esta librería presenta un nuevo concepto sobre el “data visualization” y como este impacta en la presentación de los datos. Ofrece una mayor cantidad de opciones como etiquetas, escalas, temas con el fin de mejorar la legibilidad.
El concepto clave para entender la lógica de ggplot se encuentra en el siguiente script:
Genera un gráfico con lo aprendido. Podrás usar alguna de las librerías vistas en clase. Tienes 10 minutos.
Resume la distribución de una variable numérica, mostrando los cuartiles, mediana y posibles outliers o valores atípicos.
mi_boxplot<-ggplot(penguins)+
geom_boxplot(mapping = aes(x=penguins$species, y=penguins$flipper_length_mm, fill= penguins$species))+
labs(x= "Especies de pinguinos", y= "Longitud de aleta", title = "Relación entre la longitud de la aleta y pinguinos", subtitle = "Datos reportados para pinguinos")+
theme_minimal()
mi_boxplot
Muestra cambios en los datos a lo largo del tiempo o en una secuencia. Puede ser util para evaluar cambios a lo largo del tiempo.
Muestra la relación entre dos variables numérica. Se utiliza para identificar correlaciones o patrones en los datos.
Permite representar categorías con barras de diferente altura según su frecuencia o valor.
Los histogramas nos permiten representar frecuencias en nuestros datos. También son una forma de aproximación estadística para evaluar la normalidad, por ejemplo.
Prueba a crear alguno de los gráficos que hemos visto con ambos datasets utilizados. Tienes 10 minutos.
Son similares a un histograma, sin embargo se diferencia en la unión de puntos de frecuencia con líneas formando un polígono. Puede ser util para representar la distribución espacial de varias especie por ejemplo.
library(ggplot2)
library(dplyr)
# Datos simulados de especies de escorpiones
set.seed(42)
scorpions <- data.frame(
species = rep(c("Escorpión A", "Escorpión B"), each = 10),
x = c(runif(10, min = 1, max = 5), runif(10, min = 4, max = 8)),
y = c(runif(10, min = 1, max = 5), runif(10, min = 4, max = 8))
)
# Ordenar puntos para formar un polígono convexo
scorpions_hull <- scorpions %>%
group_by(species) %>%
slice(chull(x, y)) # Encuentra el polígono convexo
# Graficar puntos y polígono
ggplot() +
geom_polygon(data = scorpions_hull, aes(x = x, y = y, fill = species, group = species), alpha = 0.3) +
geom_point(data = scorpions, aes(x = x, y = y, color = species), size = 3) +
labs(title = "Espacio ecológico de escorpiones", x = "Eje PCA 1", y = "Eje PCA 2") +
theme_minimal()