Nubelo

martes, 28 de julio de 2015

Como tipificar o normalizar una variable

Una técnica muy interesante
La tipificación es una técnica muy util a la hora de comparar datos de diferentes distribuciones o que estén en unidades de medida distintas...

Hoy vamos a explicar como llevar a cabo una técnica estadística llamada tipificación, normalización o estandarización. El proceso es muy sencillo y de enorme utilidad para comparar distribuciones o variables que estuvieran expresadas en unidades diferentes. Como en otras ocasiones, plantearemos un marco teórico sencillo y un ejemplo práctico con datos de actualidad.


Pero ¿qué es?

La tipificación consiste en aplicar un cálculo sencillo a la variable objeto de estudio, con él, conseguimos que los datos de la distribución normalizada tengan un valor de la media aritmética de 0 y una desviación típica de 1. No está de más recordar las fórmulas de los estadísticos anteriores y además, exponer la que nos ha traído aquí hoy.


Donde X es la media aritmética, delta es la desviación típica, Z es la variable tipificada, xi es el dato a transformar y ni es la frecuencia con que ese dato se repite en la distribución. En caso de utilizar una hoja de cálculo, lo que yo suelo hacer es repetir los datos las veces necesarias y ni sería 1, de esta manera, facilito el cálculo manual.




Pero veamos un ejemplo, en la imagen mostramos los datos del tipo de gravamen del IRPF (en %) para España, del año actual 2015, para dos niveles de Base Imponible, los que  ganan 13.000 euros y 30.000 euros. Las fórmulas a utilizar en cada celda de excel y los datos obtenidos, se exponen, de manera que el lector pueda practicar por su cuenta, también la variable tipificada Z en cada caso. Ahora bien, ¿cómo se interpreta? pues ahí radica la utilidad de esta técnica, si queremos comparar la misma Base Imponible no habría problemas en saber que gravamen es mayor, pero si queremos comparar ambas, la cosa se complica, porque estos son diferentes. 

Pero fíjense en Madrid, las rentas altas tienen una Z mucho mayor y además negativa en ambos casos, por tanto, aunque parece que el tipo de gravamen ha bajado respecto al promedio, lo ha hecho más en los que más ganan. Comparaciones similares se pueden hacer con todas e invito a los lectores a que aporten las suyas.

Para terminar hoy, decir que el valor de Z es positivo si la variable se sitúa por encima del promedio y negativo si lo hace por debajo y su término absoluto indica la dispersión, en relación con la desviación típica. Si el valor de Castilla La Mancha es -1,05, quiere decir que se sitúa por debajo y además, lo hace en 1,05 veces la DT de la distribución. 

En este Blog más conspiranóico hemos utilizado esta técnica para mostrar la supuesta bajada de impuestos en nuestro país, que no parece haber sido tal, esta es una de las utilidades de la economía, desemascarar a los Dictadores Disfrazados, pero no en este espacio. Gracias por venir y estoy a disposición de los lectores para lo que deseen, pueden utilizar los comentarios o el formulario.

Si deseas leer otras entradas anteriores, sigue este enlace, en esta página aparece una entradilla de cada una de ellas para facilitar el acceso a las mismas. Si quieres saber la estructura y temática de nuestros Blog, sigue este enlace, o accede a ellos en la pestaña lateral izquierda.No olvides visitar nuestra política publicitaria aquí; si deseas ponerte en contacto, por favor hazlo desde ESTE BLOG en la pestaña lateral derecha.

No hay comentarios:

Publicar un comentario