{"id":664,"date":"2025-07-29T18:43:49","date_gmt":"2025-07-29T18:43:49","guid":{"rendered":"https:\/\/agustincastro.es\/?p=664"},"modified":"2026-02-05T13:38:38","modified_gmt":"2026-02-05T13:38:38","slug":"analizando-las-diferencias-de-ventas-por-region-con-anova-y-r-donde-se-vende-masparte-i","status":"publish","type":"post","link":"https:\/\/agustincastro.es\/index.php\/2025\/07\/29\/analizando-las-diferencias-de-ventas-por-region-con-anova-y-r-donde-se-vende-masparte-i\/","title":{"rendered":"\ud83d\udcca Analizando las diferencias de ventas por regi\u00f3n con ANOVA en R: \u00bfD\u00f3nde se vende m\u00e1s?"},"content":{"rendered":"\n<p><strong>Data Science &#8211; Supuesto pr\u00e1ctico de programaci\u00f3n en R y aplicaci\u00f3n de ANOVA unifactorial<\/strong><\/p>\n\n\n\n<p>En el mundo actual de los negocios, los datos son uno de los activos m\u00e1s valiosos que tenemos. Pero tener datos no basta: la clave est\u00e1 en saber <strong>interpretarlos correctamente para tomar decisiones informadas<\/strong>. Por eso, en esta sencilla pr\u00e1ctica de introducci\u00f3n voy a mostrar paso a paso c\u00f3mo aplicar una t\u00e9cnica estad\u00edstica fundamental llamada <strong>ANOVA unifactorial<\/strong>, con un ejemplo relacionado con las ventas en distintas regiones.<\/p>\n\n\n\n<p>El objetivo no es solo mostrar la teor\u00eda, sino tambi\u00e9n hacerla accesible y \u00fatil para quienes trabajan con datos en \u00e1reas comerciales y de marketing. A trav\u00e9s de esta pr\u00e1ctica, quiero demostrar c\u00f3mo podemos identificar <strong>si las diferencias que vemos en nuestros n\u00fameros \u2014por ejemplo, las ventas entre distintas zonas geogr\u00e1ficas\u2014 son realmente significativas o si podr\u00edan ser producto del azar<\/strong>. <\/p>\n\n\n\n<p>Adem\u00e1s, iremos desgranando cada paso del proceso: desde la generaci\u00f3n de datos simulados, la comprobaci\u00f3n de supuestos estad\u00edsticos, hasta la interpretaci\u00f3n de los resultados. <strong>La intenci\u00f3n es ofrecer una primera aproximaci\u00f3n a este tipo de an\u00e1lisis, que luego iremos enriqueciendo con casos de mayor complejidad<\/strong>.<\/p>\n\n\n\n<p>Utilizaremos el lenguaje de programaci\u00f3n <strong>R<\/strong>, una herramienta poderosa y muy popular en el mundo del an\u00e1lisis y la ciencia de datos. Veremos c\u00f3mo podemos utilizar R para crear nuestros propios conjuntos de datos, realizar los an\u00e1lisis estad\u00edsticos y generar gr\u00e1ficos que nos ayuden a visualizar los resultados. No se trata solo de hacer n\u00fameros, sino de entender qu\u00e9 significan y c\u00f3mo mostrarlos de forma clara y efectiva.<\/p>\n\n\n\n<p>En definitiva, esta pr\u00e1ctica es una invitaci\u00f3n a entender mejor el poder y los l\u00edmites del an\u00e1lisis estad\u00edstico en el mundo real, y c\u00f3mo, con un poco de conocimiento y las herramientas adecuadas, podemos convertir los datos en decisiones que realmente marcan la diferencia.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" width=\"626\" height=\"417\" data-src=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-14.png\" alt=\"\" class=\"wp-image-678 lazyload\" data-srcset=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-14.png 626w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-14-300x200.png 300w\" data-sizes=\"(max-width: 626px) 100vw, 626px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 626px; --smush-placeholder-aspect-ratio: 626\/417;\" \/><\/figure>\n<\/div>\n\n\n<p>En el mundo de los negocios, tomar decisiones basadas en datos es m\u00e1s importante que nunca. Imagina que una empresa cuenta con varios equipos comerciales distribuidos en distintas regiones: Norte, Centro y Sur. Cada equipo reporta sus ventas mensuales, y la direcci\u00f3n comercial se enfrenta a una pregunta clave:<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><strong>\u00bfLas diferencias en ventas entre regiones son estad\u00edsticamente significativas, o se deben simplemente al azar?<\/strong><\/p>\n<\/blockquote>\n\n\n\n<p>Responder a esta pregunta no es solo una cuesti\u00f3n de curiosidad. Si una regi\u00f3n vende sistem\u00e1ticamente m\u00e1s que otra, podr\u00eda deberse a factores como:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>mejor rendimiento del equipo comercial<\/strong>,<\/li>\n\n\n\n<li><strong>diferencias en el potencial de mercado<\/strong>,<\/li>\n\n\n\n<li><strong>estrategias de ventas m\u00e1s efectivas<\/strong>,<\/li>\n\n\n\n<li><strong>u otros factores operativos o de contexto<\/strong>.<\/li>\n<\/ul>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><img decoding=\"async\" width=\"1024\" height=\"576\" data-src=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-9-1024x576.png\" alt=\"\" class=\"wp-image-670 lazyload\" data-srcset=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-9-1024x576.png 1024w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-9-300x169.png 300w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-9-768x432.png 768w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-9.png 1280w\" data-sizes=\"(max-width: 1024px) 100vw, 1024px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 1024px; --smush-placeholder-aspect-ratio: 1024\/576;\" \/><\/figure>\n<\/div>\n\n\n<p><\/p>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83e\udde9 Cuidado. Lo que parece obvio\u2026 no siempre lo es<\/h3>\n\n\n\n<p>\u2014 <em>\u00abViendo los datos, est\u00e1 claro que en esta zona se vende menos, \u00bfno? Para eso no hace falta hacer estad\u00edstica.\u00bb<\/em><\/p>\n\n\n\n<p>Esa es una frase habitual cuando mostramos un gr\u00e1fico de barras o una tabla de medias. Y tiene sentido: a simple vista, una diferencia de 4.000 o 5.000 euros entre regiones <strong>parece suficiente como para darla por hecha<\/strong>.<\/p>\n\n\n\n<p>Pero aqu\u00ed es donde entra la parte interesante.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83e\udde0 El problema de confiar solo en lo que \u201cparece\u201d<\/h3>\n\n\n\n<p>Cuando trabajamos con datos reales \u2014como ventas mensuales, ingresos por comercial, o rendimiento por zona\u2014 siempre existe una <strong>variabilidad natural<\/strong>. Un mes fuerte, una promoci\u00f3n puntual, un cliente grande que hace un pedido at\u00edpico\u2026 y de pronto, una media se dispara o se desploma.<\/p>\n\n\n\n<p>Entonces surge la pregunta clave:<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><strong>\u00bfEsa diferencia entre regiones es real, o simplemente fruto del azar?<\/strong><\/p>\n<\/blockquote>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83d\udcca Aqu\u00ed es donde utilizar la estad\u00edstica tiene sentido<\/h3>\n\n\n\n<p>El an\u00e1lisis ANOVA (y en concreto el test de Tukey que aplicamos despu\u00e9s) <strong>no solo mira los promedios<\/strong>, sino tambi\u00e9n <strong>cu\u00e1nta variaci\u00f3n hay dentro de cada grupo<\/strong>. Nos ayuda a responder preguntas como:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>\u00bfLa diferencia entre regiones supera lo que podr\u00eda esperarse por casualidad?<\/strong><\/li>\n\n\n\n<li><strong>\u00bfLas ventas del sur est\u00e1n realmente por debajo, o es solo una mala racha?<\/strong><\/li>\n\n\n\n<li><strong>\u00bfTiene sentido intervenir ah\u00ed, o estamos reaccionando a ruido?<\/strong><\/li>\n<\/ul>\n\n\n\n<p>Y nos da una respuesta s\u00f3lida, basada en evidencia, no en intuiciones.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83c\udfaf Porque tomar decisiones cuesta dinero<\/h3>\n\n\n\n<p>Imag\u00ednate tomar acciones basadas en una diferencia \u201cque parec\u00eda grande\u201d:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Redise\u00f1ar el plan comercial de una zona.<\/li>\n\n\n\n<li>Aumentar presupuesto publicitario.<\/li>\n\n\n\n<li>Cambiar responsables regionales.<\/li>\n<\/ul>\n\n\n\n<p>\u00bfY si despu\u00e9s resulta que <strong>no hab\u00eda una diferencia real<\/strong>? La estad\u00edstica no solo nos da confianza, tambi\u00e9n nos ahorra errores caros.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"716\" data-src=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-11-1024x716.png\" alt=\"\" class=\"wp-image-672 lazyload\" data-srcset=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-11-1024x716.png 1024w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-11-300x210.png 300w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-11-768x537.png 768w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-11.png 1062w\" data-sizes=\"(max-width: 1024px) 100vw, 1024px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 1024px; --smush-placeholder-aspect-ratio: 1024\/716;\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83e\udde0 \u00bfQu\u00e9 es ANOVA y para qu\u00e9 sirve en ventas?<\/h3>\n\n\n\n<p><strong>ANOVA (Analysis of Variance)<\/strong> es una t\u00e9cnica que permite comparar <strong>las medias de un mismo indicador entre m\u00e1s de dos grupos<\/strong>. En este caso, el indicador es el <strong>volumen de ventas<\/strong>, y los grupos son las<strong> tres regiones.<\/strong><\/p>\n\n\n\n<p>A diferencia de una simple comparaci\u00f3n por pares (como una t de Student entre las regiones NORTE y CENTRO, etc), ANOVA permite evaluar <strong>todas las regiones al mismo tiempo<\/strong> <strong>y determinar si, globalmente, existen diferencias estad\u00edsticamente significativas<\/strong>.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83d\udcca Otros ejemplos pr\u00e1cticos de uso del ANOVA<\/h3>\n\n\n\n<h4 class=\"wp-block-heading\">1. <strong>Ventas por regi\u00f3n o canal de distribuci\u00f3n<\/strong><\/h4>\n\n\n\n<p class=\"is-style-default\">Comparar si existen diferencias significativas en las ventas medias entre distintas regiones (norte, centro, sur) o entre diferentes canales (online, tienda f\u00edsica, distribuidores).<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">2. <strong>Impacto de campa\u00f1as publicitarias<\/strong><\/h4>\n\n\n\n<p>Evaluar si las ventas medias cambian seg\u00fan el tipo de campa\u00f1a (televisi\u00f3n, redes sociales, email marketing). ANOVA ayuda a saber si una estrategia funciona mejor que otra.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">3. <strong>Satisfacci\u00f3n del cliente por tienda<\/strong><\/h4>\n\n\n\n<p>Analizar si la media de satisfacci\u00f3n de clientes var\u00eda entre varias sucursales de una empresa. Si hay diferencias, podr\u00eda ser necesario revisar la gesti\u00f3n o el servicio en ciertos puntos.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">4. <strong>Comparaci\u00f3n de productividad entre equipos<\/strong><\/h4>\n\n\n\n<p>Estimar si hay diferencias estad\u00edsticamente significativas en la productividad media entre diferentes equipos o departamentos dentro de una empresa.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">5. <strong>Efecto del precio sobre la intenci\u00f3n de compra<\/strong><\/h4>\n\n\n\n<p>Estudiar si diferentes niveles de precio afectan de manera significativa la media de intenci\u00f3n de compra de los consumidores (por ejemplo, precio bajo, medio y alto).<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">6. <strong>Tiempo medio de respuesta entre centros de atenci\u00f3n al cliente<\/strong><\/h4>\n\n\n\n<p>Comparar si los tiempos de respuesta a los clientes var\u00edan significativamente entre varios centros de soporte t\u00e9cnico o call centers.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">7. <strong>Coste medio por proveedor<\/strong><\/h4>\n\n\n\n<p>Determinar si distintos proveedores tienen diferencias significativas en los costes medios de adquisici\u00f3n para una misma materia prima.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">8. <strong>Diferencia en rendimiento por tipo de formaci\u00f3n<\/strong><\/h4>\n\n\n\n<p>Medir si el rendimiento de los empleados (por ejemplo, en una evaluaci\u00f3n interna) cambia seg\u00fan el tipo de formaci\u00f3n recibida (presencial, online, tutor\u00eda personalizada).<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">9. <strong>Engagement por tipo de contenido<\/strong><\/h4>\n\n\n\n<p>Analizar si el tipo de contenido (v\u00eddeo, art\u00edculo, infograf\u00eda) influye en la media de tiempo de permanencia de usuarios en una web o app.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">10. <strong>Eficacia de distintos procesos productivos<\/strong><\/h4>\n\n\n\n<p>Comparar la media de defectos en productos seg\u00fan tres m\u00e9todos de producci\u00f3n diferentes para elegir el m\u00e1s eficiente.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83d\udce6 \u00bfDe d\u00f3nde salen los datos en este supuesto pr\u00e1ctico?<\/h3>\n\n\n\n<p>Para ilustrar este an\u00e1lisis sin depender de datos reales (que a menudo son confidenciales), he creado un <strong>conjunto de datos simulado<\/strong>, representativo de un escenario de ventas plausible.<\/p>\n\n\n\n<p>Usamos la funci\u00f3n <code><strong>rnorm()<\/strong><\/code> de <strong>R<\/strong>, que genera n\u00fameros aleatorios siguiendo una distribuci\u00f3n normal (la t\u00edpica \u201ccurva de campana\u201d), ideal para simular fen\u00f3menos como ventas que fluct\u00faan alrededor de un promedio.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"512\" data-src=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-5-1024x512.png\" alt=\"\" class=\"wp-image-665 lazyload\" data-srcset=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-5-1024x512.png 1024w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-5-300x150.png 300w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-5-768x384.png 768w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-5-1536x768.png 1536w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-5.png 1564w\" data-sizes=\"(max-width: 1024px) 100vw, 1024px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 1024px; --smush-placeholder-aspect-ratio: 1024\/512;\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83e\udde0 \u00bfQu\u00e9 significa esto?<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>20 observaciones por regi\u00f3n<\/strong>, simulando ventas individuales (por ejemplo, por mes o por comercial).<\/li>\n\n\n\n<li><strong>Distintos promedios por zona<\/strong>, para reflejar escenarios de negocio realistas:\n<ul class=\"wp-block-list\">\n<li>La zona <strong>norte<\/strong> tiene una media de ventas m\u00e1s alta.<\/li>\n\n\n\n<li>La <strong>centro<\/strong> est\u00e1 cerca, pero ligeramente por debajo.<\/li>\n\n\n\n<li>La <strong>sur<\/strong> muestra un rendimiento menor.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" width=\"882\" height=\"492\" data-src=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/tabla_ventas.png\" alt=\"\" class=\"wp-image-673 lazyload\" data-srcset=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/tabla_ventas.png 882w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/tabla_ventas-300x167.png 300w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/tabla_ventas-768x428.png 768w\" data-sizes=\"(max-width: 882px) 100vw, 882px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 882px; --smush-placeholder-aspect-ratio: 882\/492;\" \/><\/figure>\n\n\n\n<p>Representando gr\u00e1ficamente mediante boxplot. <\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"1024\" data-src=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/boxplot_ventas-1024x1024.jpg\" alt=\"\" class=\"wp-image-669 lazyload\" data-srcset=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/boxplot_ventas-1024x1024.jpg 1024w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/boxplot_ventas-300x300.jpg 300w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/boxplot_ventas-150x150.jpg 150w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/boxplot_ventas-768x768.jpg 768w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/boxplot_ventas-1536x1536.jpg 1536w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/boxplot_ventas-2048x2048.jpg 2048w\" data-sizes=\"(max-width: 1024px) 100vw, 1024px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 1024px; --smush-placeholder-aspect-ratio: 1024\/1024;\" \/><\/figure>\n\n\n\n<p><strong>Aplicamos un modelo ANOVA unifactorial<\/strong>, utilizando el siguiente c\u00f3digo en R. Igualmente, validamos los supuestos de normalidad y homocedasticidad (explicaci\u00f3n m\u00e1s abajo).<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" width=\"1008\" height=\"894\" data-src=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-7.png\" alt=\"\" class=\"wp-image-667 lazyload\" data-srcset=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-7.png 1008w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-7-300x266.png 300w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-7-768x681.png 768w\" data-sizes=\"(max-width: 1008px) 100vw, 1008px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 1008px; --smush-placeholder-aspect-ratio: 1008\/894;\" \/><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"481\" data-src=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-15-1024x481.png\" alt=\"\" class=\"wp-image-686 lazyload\" data-srcset=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-15-1024x481.png 1024w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-15-300x141.png 300w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-15-768x361.png 768w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-15.png 1346w\" data-sizes=\"(max-width: 1024px) 100vw, 1024px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 1024px; --smush-placeholder-aspect-ratio: 1024\/481;\" \/><\/figure>\n\n\n\n<p>Esto nos permite evaluar si la <strong>regi\u00f3n<\/strong> es un factor que influye de forma significativa en las ventas.<\/p>\n\n\n\n<ol start=\"3\" class=\"wp-block-list\">\n<li><strong>Interpretamos el valor p<\/strong> del ANOVA:\n<ul class=\"wp-block-list\">\n<li>Si <code>p &lt; 0.05<\/code>, podemos decir que <strong>existen diferencias significativas entre las regiones<\/strong>. En este caso, es as\u00ed (se indica donde se ve Pr(>F), con valor 8.01 x 10^-5)<\/li>\n\n\n\n<li>Si <code>p \u2265 0.05<\/code>, no hay evidencia estad\u00edstica suficiente para afirmar que las ventas difieren por regi\u00f3n.<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Dado que encontramos diferencias significativas, aplicamos un <strong>test post-hoc de Tukey<\/strong> para ahondar m\u00e1s y saber <strong>qu\u00e9 regiones son distintas entre s\u00ed<\/strong>.<\/li>\n<\/ol>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"638\" data-src=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-8-1024x638.png\" alt=\"\" class=\"wp-image-668 lazyload\" data-srcset=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-8-1024x638.png 1024w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-8-300x187.png 300w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-8-768x479.png 768w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-8.png 1194w\" data-sizes=\"(max-width: 1024px) 100vw, 1024px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 1024px; --smush-placeholder-aspect-ratio: 1024\/638;\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83e\udde0 \u00bfQu\u00e9 significa este resultado?<\/h3>\n\n\n\n<ol class=\"wp-block-list\">\n<li><strong>CENTRO vs NORTE<\/strong>\n<ul class=\"wp-block-list\">\n<li>La diferencia media es de <strong>\u20131.555\u202f\u20ac<\/strong> (parece que el centro vende menos).<\/li>\n\n\n\n<li>El intervalo de confianza <strong>incluye el cero<\/strong>, por lo que <strong>la diferencia no es estad\u00edsticamente significativa<\/strong>.<\/li>\n\n\n\n<li><code>p adj = 0.137<\/code> &gt; 0.05 \u2192 <strong>no hay evidencia suficiente<\/strong> para afirmar que hay diferencia real entre centro y norte.<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li><strong>SUR vs NORTE<\/strong>\n<ul class=\"wp-block-list\">\n<li>El sur vende de media <strong>5.609\u202f\u20ac menos<\/strong> que el norte.<\/li>\n\n\n\n<li>El intervalo de confianza est\u00e1 completamente <strong>por debajo de 0<\/strong>.<\/li>\n\n\n\n<li><code>p adj &lt; 0.001<\/code> \u2192 <strong>la diferencia es altamente significativa<\/strong>.<\/li>\n\n\n\n<li>\u2705 <strong>Conclusi\u00f3n:<\/strong> El sur rinde significativamente peor que el norte.<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li><strong>SUR vs CENTRO<\/strong>\n<ul class=\"wp-block-list\">\n<li>Diferencia de <strong>\u20134.055\u202f\u20ac<\/strong> (el sur vende menos que el centro).<\/li>\n\n\n\n<li>Tambi\u00e9n significativa (<code>p adj &lt; 0.001<\/code>).<\/li>\n\n\n\n<li>\u2705 <strong>Conclusi\u00f3n:<\/strong> El sur tambi\u00e9n rinde significativamente peor que el centro.<\/li>\n<\/ul>\n<\/li>\n<\/ol>\n\n\n\n<h3 class=\"wp-block-heading\">\u2705 Conclusi\u00f3n global<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Norte vs Centro<\/strong>: diferencias no significativas \u2192 podr\u00edamos considerar que <strong>rinden similarmente<\/strong>.<\/li>\n\n\n\n<li><strong>Sur vs las otras regiones<\/strong>: diferencias significativas \u2192 el sur <strong>vende considerablemente menos<\/strong> que el norte y el centro.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83c\udfaf \u00bfQu\u00e9 se resuelve con este an\u00e1lisis?<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Identificar regiones con rendimientos an\u00f3malos<\/strong> (positivos o negativos).<\/li>\n\n\n\n<li>Tomar decisiones de negocio como:\n<ul class=\"wp-block-list\">\n<li>redistribuir recursos comerciales,<\/li>\n\n\n\n<li>ajustar objetivos por regi\u00f3n,<\/li>\n\n\n\n<li>replicar estrategias exitosas en zonas de bajo rendimiento.<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Ir m\u00e1s all\u00e1 del \u201cpresentimiento\u201d y trabajar con <strong>evidencia estad\u00edstica objetiva<\/strong>.<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">M\u00e1s informaci\u00f3n sobre los supuestos<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">\ud83e\uddea Supuestos que se deben cumplir para utilizar ANOVA<\/h3>\n\n\n\n<p>Cuando usamos una t\u00e9cnica estad\u00edstica como <strong>ANOVA<\/strong> para comparar medias entre grupos (por ejemplo, ventas entre regiones), no podemos aplicarla a ciegas. Esta t\u00e9cnica tiene ciertas <strong>condiciones que deben cumplirse<\/strong> para que sus resultados sean v\u00e1lidos.<\/p>\n\n\n\n<p>Dos de las m\u00e1s importantes son:<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">1\ufe0f\u20e3 Normalidad de los datos \u2014 <em>Test de Shapiro-Wilk<\/em><\/h3>\n\n\n\n<p><strong>Objetivo<\/strong>: Comprobar si los <strong>residuos del modelo ANOVA<\/strong> (es decir, las diferencias entre los valores observados y los promedios de cada grupo) siguen una <strong>distribuci\u00f3n normal<\/strong>.<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Se aplica la prueba <strong>sobre los residuos del modelo<\/strong>, no sobre las variables originales.<\/li>\n\n\n\n<li><strong>Hip\u00f3tesis nula (H\u2080)<\/strong>: Los residuos siguen una distribuci\u00f3n normal.<\/li>\n\n\n\n<li><strong>Hip\u00f3tesis alternativa (H\u2081)<\/strong>: Los residuos no siguen una distribuci\u00f3n normal.<\/li>\n<\/ul>\n\n\n\n<p><strong>Interpretaci\u00f3n<\/strong>:<\/p>\n\n\n\n<p>Si el <strong>p-valor &lt; 0.05<\/strong>, se <strong>rechaza H\u2080<\/strong> \u2192 los residuos no son normales \u2192 el supuesto <strong>no se cumple<\/strong>.<\/p>\n\n\n\n<p>Si el <strong>p-valor &gt; 0.05<\/strong>, <strong>no se rechaza H\u2080<\/strong> \u2192 los residuos pueden considerarse normales \u2192 el supuesto se cumple.<\/p>\n\n\n\n<p><strong>\u00bfQu\u00e9 hacemos si no se cumple?<\/strong> Podemos usar alternativas no param\u00e9tricas como el <strong>test de Kruskal-Wallis<\/strong>, que no requiere normalidad.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">2\ufe0f\u20e3 Igualdad de varianzas \u2014 <em>Test de Bartlett<\/em><\/h3>\n\n\n\n<p><strong>Objetivo<\/strong>: Verificar si los <strong>grupos del ANOVA tienen varianzas iguales<\/strong> (homocedasticidad).<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Se aplica <strong>a los grupos de la variable dependiente<\/strong>, no a los residuos.<\/li>\n\n\n\n<li><strong>Hip\u00f3tesis nula (H\u2080)<\/strong>: Las varianzas entre los grupos son iguales.<\/li>\n\n\n\n<li><strong>Hip\u00f3tesis alternativa (H\u2081)<\/strong>: Las varianzas son distintas.<\/li>\n<\/ul>\n\n\n\n<p><strong>Importante<\/strong>: Esta prueba <strong>asume normalidad<\/strong>, por eso primero se aplica Shapiro-Wilk para asegurarse de que esa condici\u00f3n se cumple.<\/p>\n\n\n\n<p><strong>Interpretaci\u00f3n<\/strong>:<\/p>\n\n\n\n<p>Si el <strong>p-valor &lt; 0.05<\/strong>, se rechaza H\u2080 \u2192 hay desigualdad de varianzas \u2192 el supuesto se viola.<\/p>\n\n\n\n<p>Si el <strong>p-valor &gt; 0.05<\/strong>, no se rechaza H\u2080 \u2192 las varianzas son homog\u00e9neas \u2192 el supuesto se cumple.<\/p>\n\n\n\n<p><strong>\u00bfQu\u00e9 hacemos si no se cumple?<\/strong><br>Si las varianzas son diferentes, podr\u00edamos:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>aplicar una versi\u00f3n robusta del ANOVA (como Welch\u2019s ANOVA),<\/li>\n\n\n\n<li>-transformar los datos,<\/li>\n\n\n\n<li>o usar m\u00e9todos no param\u00e9tricos.<\/li>\n<\/ul>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">C\u00f3digo utilizado en este caso pr\u00e1ctico<\/h2>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"784\" height=\"1024\" data-src=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-12-784x1024.png\" alt=\"\" class=\"wp-image-674 lazyload\" data-srcset=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-12-784x1024.png 784w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-12-230x300.png 230w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-12-768x1003.png 768w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-12-1177x1536.png 1177w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-12-1569x2048.png 1569w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-12-1024x1337.png 1024w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-12.png 1598w\" data-sizes=\"(max-width: 784px) 100vw, 784px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 784px; --smush-placeholder-aspect-ratio: 784\/1024;\" \/><\/figure>\n\n\n\n<p><strong>C\u00f3digo para el gr\u00e1fico de boxplot<\/strong><\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"633\" data-src=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-13-1024x633.png\" alt=\"\" class=\"wp-image-675 lazyload\" data-srcset=\"https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-13-1024x633.png 1024w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-13-300x185.png 300w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-13-768x475.png 768w, https:\/\/agustincastro.es\/wp-content\/uploads\/2025\/07\/image-13.png 1446w\" data-sizes=\"(max-width: 1024px) 100vw, 1024px\" src=\"data:image\/svg+xml;base64,PHN2ZyB3aWR0aD0iMSIgaGVpZ2h0PSIxIiB4bWxucz0iaHR0cDovL3d3dy53My5vcmcvMjAwMC9zdmciPjwvc3ZnPg==\" style=\"--smush-placeholder-width: 1024px; --smush-placeholder-aspect-ratio: 1024\/633;\" \/><\/figure>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Data Science &#8211; Supuesto pr\u00e1ctico de programaci\u00f3n en R y aplicaci\u00f3n de ANOVA unifactorial En el mundo actual de los negocios, los datos son uno de los activos m\u00e1s valiosos que tenemos. Pero tener datos no basta: la clave est\u00e1 en saber interpretarlos correctamente para tomar decisiones informadas. Por eso, en esta sencilla pr\u00e1ctica de [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":669,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[8,7,5],"tags":[],"class_list":["post-664","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-portfolio","category-r","category-tecnica-y-practica"],"_links":{"self":[{"href":"https:\/\/agustincastro.es\/index.php\/wp-json\/wp\/v2\/posts\/664","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/agustincastro.es\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/agustincastro.es\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/agustincastro.es\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/agustincastro.es\/index.php\/wp-json\/wp\/v2\/comments?post=664"}],"version-history":[{"count":13,"href":"https:\/\/agustincastro.es\/index.php\/wp-json\/wp\/v2\/posts\/664\/revisions"}],"predecessor-version":[{"id":694,"href":"https:\/\/agustincastro.es\/index.php\/wp-json\/wp\/v2\/posts\/664\/revisions\/694"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/agustincastro.es\/index.php\/wp-json\/wp\/v2\/media\/669"}],"wp:attachment":[{"href":"https:\/\/agustincastro.es\/index.php\/wp-json\/wp\/v2\/media?parent=664"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/agustincastro.es\/index.php\/wp-json\/wp\/v2\/categories?post=664"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/agustincastro.es\/index.php\/wp-json\/wp\/v2\/tags?post=664"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}