Datos normalizados: ¿Quién ha ganado los Juegos Olímpicos?
Finalizados los juego de Tokyo 2020 podemos volver a abrir el debate de quién, qué país, debe presidir los top rankings de los medalleros.
El mensaje de los medios es claro, y, como cada 4 años, experimentamos una especie de “esto ya lo he vivido». De nuevo el mismo pequeño grupo de países encabeza el medallero: EEUUU, China, Rusia…
Este ranking sigue un criterio claro, el indicador de medida es el volumen de medallas de oro ( sin tener en cuenta el deporte en sí, que está condicionado por variables con valores muy distintos a la vez, y otras variables que veremos a continuación).
En este post no pretendemos entrar a valorar si el volumen absoluto de medallas es es un indicador representativo, “justo” u objetivo, sino que pretendemos plantear la importancia de la normalización y ponderación de los datos teniendo en cuenta más de una variable.
En el aspecto olímpico concretamente podríamos tener en cuenta para este medallero aspectos como:
– Población de cada país participante: es más complicado ganar medallas para 37 millones de polacos que para 1.000 millones de chinos.
– PIB: países con un PIB más elevado tienen acceso a mejores instalaciones de entrenamiento, educación, clubes etc. que países con economías menos prósperas.
– Número de participantes de cada país en los juegos: EEEU envía a 1.000 atletas mientras que Kenia a 90.
Aquí obtendríamos el indicador de “medallas per capita” por ejemplo. Incluso podríamos agrupar por otras variables como género, dividir regiones de países, agrupar países por idioma etc.
Teniendo en cuenta este tipo de variables para construir los medalleros pasaríamos de tener titulares como “ EEUU encabeza el medallero olímpico con 113 medallas totales” a titulares como “ Georgia encabeza el medallero con 0,2 medallas por atleta” .
– EEEU gana 0,1 medallas por cada 10 atletas participantes.
– Georgia gana 2 medallas por cada 10 atletas participantes.
Es decir Georgia gana 20 veces más medallas que EEUU.
Otra variable que podríamos tener en cuenta para normalizar y ponderar los resultados seria el número de medallas disponibles por deporte o categoría.
Por ejemplo, es mucho más importante para un país ganar una medalla en baloncesto (donde solo hay una medalla en juego) que en atletismo o natación donde hay más de 100 medallas en las distintas categorías.
Sin ánimo de seguir calculando medalleros, enlazamos con un ejemplo de normalización de datos y visualización de Alberto Cairo que nos encanta para ejemplificar la importancia de la normalización en la lectura de datos, y sobre todo en cómo comunicarlos.
En este ejemplo de visualización se pretende comparar el peso que representa la destinación de recursos a Defensa de los países de Sudamérica, concretamente los vecinos de Brasil.
Se muestran las variables:
– El presupuesto destinado a Defensa
– Los efectivos (soldados) enviados al Ejército
– La población de cada país
Más allá de comentar que la visualización mediante un mapa no es la mejor manera de representar estos datos, ya que siempre tendrá más protagonismo el país con mayor extensión, en este caso Brasil, y ese no es el objetivo de la visualización, vemos cómo la normalización o no de los datos en función de las variables comentadas anteriormente cambia el orden o el ranking de los países en lo que se refiere a los recursos destinados a Defensa.
Sin normalizar los datos vemos como Brasil encabeza el ranking de las 3 variables en términos absolutos.
Sin embargo, en cuanto normalizamos los datos vemos como es Colombia quien los encabeza en efectivos del Ejército teniendo en cuenta los soldados per cápita (en lugar del valor absoluto de soldados) y es Chile quien los encabeza en función de presupuesto destinado por cápita y por soldado. Dejando así a Brasil en posiciones muy inferiores en el ranking.
Tanto el ejemplo de los resultados en los medalleros olímpicos como la visualización de Defensa en Sudamérica de Alberto Cairo son dos ejemplos claros de cómo la normalización nos ayuda a identificar el potencial de cada uno de los objetos de estudio, en estos ejemplos son los países, pero podrían ser productos, canales de marketing, campañas publicitarias, etc. donde lo importante es demostrar su rendimiento en función de la inversión y el esfuerzo dedicado.
Este mismo debate se vuelve a abrir siempre que nos encontramos frente a resultados electorales, así que no tendremos que esperar a los Juegos Olímpicos de París 2024 para construir nuestros propios rankings de “ ganadores”.
En nuestro siguientes posts explicaremos distintos tipos de normalización de datos y ejemplos prácticos.
¡Seguimos!