El dataset «data» que hemos preparado para el análisis de los precios de segunda mano del MAZDA MX5 tiene información de coches en venta con fechas de matriculación entre los años 1990 y 2024. Utilizaremos algunas funciones de R para obtener información básica sobre estos vehículos, simplemente a modo de «análisis previo».

Agrupamos los datos por la variable «year» con group_by (año de matriculación) y con summarise creamos y calculamos las nuevas variables uds (número de vehículos), así como precio medio, mínimo y máximo por año, respectivamente. Con mutate creamos la variable «uds%» (porcentaje de unidades / año de matriculación). El resultado lo ofrecemos ordenando de manera descendiente el precio medio por año de matriculación con la función arrange(desc())

Podemos comprobar que la suma de los porcentajes de la variable calculada uds% es correcta (100%) con sum(miata_price_year$uds%)

  • Año de matriculación con mayor número de vehículos en venta = 2019
  • Unidades en venta de ese año 2019 = 21

Realizamos un gráfico para representar la evolución del precio de los vehículos en venta según el año de matriculación. Utilizamos la librería ggplot y las geometrías punto y línea. Con ggsave grabamos la imagen como fichero .jpg en nuestro directorio de trabajo. En el gráfico no se discriminan los diferentes modelos, colores, motorizaciones, u otros datos. Podemos ver que los coches matriculados desde 2015 en adelante alcanzan precios significativamente más elevados.

Calculamos los precios medios, mínimos y máximos de los coches con fecha de matriculación igual y superior a 2015. Tendríamos un total de 106 coches en venta, con un precio mínimo de 14.995 euros y una media de 27.051 euros. El mayor precio sería 43.900 euros.

¿Cuáles serían las características del coche más caro de ese intervalo? Podemos, por ejemplo, calcularlo de la siguiente forma:

¿Y el más económico?

En ambos casos, el modelo de MX5 en venta es un ND (de cuarta generación) de color «rojo soul».

  • El más caro es un vehículo de km 0 en venta por 43.900 euros. Este tiene fecha de matriculación de 2024, cuenta con mayor potencia (184 cv), y tiene un techo de tipo RF (Retractable Fastback). Estaría disponible en León.
  • El más económico es un coche con 72.410 km y con un precio de 19.995 euros, matriculado en el año 2015 y con 160 cv y techo ST (Soft Top). Disponible en Madrid.
  • Ahora mismo solo estamos realizando un análisis exploratorio. No obstante, si fuera objetivo del estudio analizar qué variables están influyendo en los precios de los vehículos en venta, deberíamos tener en cuenta otros factores además de los que estamos mostrando en este caso práctico (año de matriculación, kms, color, tipo de techo…). Sería interesante, por ejemplo, indicar la gama del vehículo, dado que está claro que define las prestaciones y, por tanto, influirá en el precio. Ahora mismo no estamos teniendo en cuenta este dato, pero si lo haremos llegado el momento.

REPRESENTACIÓN GRÁFICA DE LOS PRECIOS EN FUNCIÓN AL AÑO DE MATRICULACIÓN

Ahora representamos con puntos los precios correspondientes a cada coche en venta en función al su año de matriculación, como antes, utilizando la librería ggplot. En este caso, con el fin de crear un gráfico visualmente atractivo, aplicamos un gradiente de color verde/rojo para resaltar los precios más bajos y elevados, respectivamente. En el ejemplo se muestra como se indican las variables representadas en los ejes X, e Y, así como el tamaño (size) y transparencia (alpha) de los puntos.

seguimos próximamente…