Nubelo

miércoles, 15 de enero de 2014

La Regresión Lineal Simple: PIB y Desempleo en España

La Regresión Lineal es un método muy utilizado, para predecir las posibles relaciones entre dos o más variables; su objetivo es averiguar el comportamiento de una respecto a la otra...

Hoy veremos como hacer, de forma sencilla y esperemos que amena, una Regresión Lineal Simple, utilizando dos variables macroeconómicas: el PIB y la Tasa de Desempleo en España; el objetivo será deducir la relación entre ellas predecir como se comportarán. 

Los datos trimestrales los hemos tomado del INE y hemos considerado como variable independiente el PIB y como dependiente, la Tasa de Desempleo, el motivo es que queremos estudiar el comportamiento de la segunda respecto a la primera.

Debemos aclarar que, para crear un modelo completo, se tendrían que utilizar más variables, en la llamada Regresión Lineal Múltiple y habría que hacer un estudio de resíduos. 

En primer lugar, siempre conviene seguir dos pasos previos, uno es obtener los estadísticos descriptivos de la muestra, lo hemos explicado en esta otra entrada, sobre los datos macroeconómicos de los países de la UE. Si vamos a mostrar el diagrama de líneas del PIB y del Desempleo, en la figura que aparece a continuación.



Observamos como ambas variables, parecen comportarse de modo similar, pero en sentido inverso, esto es lógico, ya que para que el desempleo varié, debe hacerlo el PIB y además, cuando uno baja, el PIB, el desempleo sube y a la inversa. Es decir, si crecemos vamos a generar empleo, otra discusión es como crecemos y que empleo generamos...

Una vez tenemos el diagrama, confirmamos la relacion con el llamado Coeficiente de Correlación de Pearson. Su fórmula es, en el numerador, la Covarianza de ambas variables y el denominador, el producto de sus desviaciones típicas. En esta web puedes encontrar toda la información de estos estadísticos. 

En nuestro caso es de -0,8546; un coeficiente próximo a 1 indica una alta correlación y la ausencia de ella si es próximo a 0, el signo nos dice si la relación es directa o inversa, por tanto, vemos que están altamente correlacionadas y que es factible realizar la regresión.

Ahora realizamos el diagrama de dispersión y observamos que tipo de relación existe entre el PIB y la Tasa de Desempleo; vemos si puede ser lineal (línea), exponencial (creciente), polinómica (formas polinómicas) u otros tipos de figuras. En este caso, parece ser lineal y planteamos entonces la ecuación de regresión.



En ella aparece un coeficiente independiente y otro junto a la (x), que es la variable independiente, siendo (y) la dependiente; además aparece un residuo (epsilon) que nos indica la parte que dicho modelo no predice. 

Sería algo parecido a la figura, en la que vemos que puede ser de tipo lineal. En dicha figura también aparece la llamada Ecuación de Regresión, en este caso el término independiente es de 19,33 y la pendiente de la recta (el que acompaña a la x) de -1,3214, es negativo porque ambas variables se mueven de forma inversa, si una aumenta la otra disminuye. Los coeficientes de la ecuación de la recta, se pueden calcular con una Hoja de Cáculo o manualmente, puedes visitar este sitio, donde te lo explican detalladamente. 

Estos parámetros son la esencia de los modelos de regresión y sirven para realizar las predicciones. La pendiente es muy importante, su signo indica una relación directa (+) o inversa (-), pero además, su valor nos dice cuanto aumenta o disminuye una si aumenta o disminuye la otra; el término independiente nos indica el valor de y para x=0; en teoría, en este caso, con un crecimiento de 0 la Tasa de Paro sería de algo más del 19%. 

Por ejemplo, en nuestro caso el valor absoluto es 1,32, es decir, si "x" era el PIB  e "y" el Desempleo, una variación del 1% en el primero, llevaría a una disminución del 1,32% en el segundo, que debe ser esto en lo que se basó De Guindos para afirmar que creciendo así generaríamos empleo en 2014.

El R cuadrado es el Coeficiente de Determinación y se calcula (solo en regresión lineal), elevando al cuadrado el de correlación; nos indica la Bondad del Ajuste y cuanto más próximo a 1, mayor es la capacidad predictiva del modelo. El nuestro es de 0,7305, más que aceptable.


Pero la estadística en economía no lo es todo y la Ley de Okun, nos dice que en realidad, para crear empleo, un país debe crecer, al menos, en un 2% y eso en la España de hoy es harto difícil, aunque el señor Rajoy o De Guindos digan lo contrario. Fíjense que el término independiente (19,33), nos estaría indicando el paro cuando el crecimiento fuera 0, sin embargo, creciendo al 0% se destruye empleo en España.

Ya veremos, pero tomen esta entrada como lo que es, una forma de enseñar regresión, sencilla y aplicada a un caso real. Las cuestiones de si los modelos estadísticos predicen o no y en que medida, son otro asunto... pero ese debate es mejor tenerlo en este otro Blog.

Gracias por venir.

Si deseas leer otras entradas anteriores, sigue este enlace, en esta página aparece una entradilla de cada una de ellas para facilitar el acceso a las mismas. Si quieres saber la estructura y temática de nuestros Blog, sigue este enlace, o accede a ellos en la pestaña lateral izquierda.No olvides visitar nuestra política publicitaria aquí; si deseas ponerte en contacto, por favor hazlo desde ESTE BLOG en la pestaña lateral derecha.