Seguimos picando código en R, y avanzando: Esta vez estoy enredado en un proyecto que utiliza el conocido dataset de «STARWARS». Aquí va un avance del trabajo…
Este conjunto de datos contiene información sobre varios personajes de Star Wars, incluyendo características como el nombre, la altura, el peso, el color del cabello, el color de la piel, el género o el planeta de origen, entre otras. Los datos te permiten practicar con funciones de todo tipo, al tiempo que resulta curioso, por la temática.
Utilizando este dataset he preparado una práctica en R que consta de unos 30 ejercicios prácticos. Consultas y búsquedas mediante operadores lógicos, transformación y creación de variables nuevas, limpieza de datos, manejo de los NAs y NaN, uso de funciones como select, filter, group_by, summarise, arrange, mutate y, la creación de gráficos con ggplot, entre otras tantas.
Estas dos imágenes son una pequeña muestra, con un ejemplo concreto: una representación gráfica del Índice de Masa Corporal calculado para los personajes que tienen como origen el planeta de Tatooine. Se calcula a partir de datos de altura (m) y masa (kg) > IMC = peso (kg)/ [altura (m)]2
Este índice es una herramienta ampliamente utilizada para clasificar a las personas en categorías de peso y evaluar el riesgo asociado con el peso corporal en términos de salud… aunque a C3PO o R5-D4 le va a valer de poco lo que le salga…
No todo van a ser longitud de sépalos, pétalos y el dataset de mtcars…
eof