Tema 6. Autocorrelación con Gretl

Autocorrelación: concepto, causas, consecuencias.

Ya sabemos que el modelo de regresión lineal se basa en el cumplimiento de una serie de hipótesis, entre las que destacan las relacionadas con el error, que son:

  • El término error es completamente aleatorio y sigue una distribución normal, de esperanza 0.
  • Homocedasticidad: La varianza del error es constante a lo largo de las observaciones del modelo (Var[εi]=σ2).
  • El término error no esta correlacionado entre los elementos del modelo (COV(Ɛij)=0 ∀i,j).

La autocorrelación es un problema que surge con el incumplimiento de la última de estás hipótesis, la que implica que el error es independiente entre los distintos elementos del modelo.

Definición.-

La Autocorrelación es un problema que presentan los modelos de regresión, cuando el error presenta correlaciones distintas de cero entre los distintos momentos del tiempo o para los distintos individuos.

Sabemos que la matriz de varianzas-covarianzas del error para los distintos items, debe ser una matriz diagonal que contenga la varianza del error en la diagonal principal, siendo está única, es decir:

Var (\epsilon_i, \epsilon_j )=\left(\begin{array}{cccc} \sigma_\epsilon^2 &  0 & \ldots & 0\\ 0 & \sigma_\epsilon^2 & \ldots & 0\\ \vdots & \vdots & \ddots & \vdots\\ 0 & 0 & \ldots &\sigma_\epsilon^2 \end{array} \right)

Si existen correlaciones distintas de cero para los errores en los distintos items, está matriz no será diagonal, ya que tendrá valores distintos de cero fuera de la diagonal principal. Esto supone el incumplimiento de una de las hipótesis básicas del modelo de regresión lineal,  la que indica que el error para los distintos items debe ser completamente independiente, o dicho de otro modo, se debe cumplir que:

COV(\epsilon_i, \epsilon_j ) = 0 \forall i,j

Si esto no se cumple, diremos que el modelo presenta un problema de autocorrelación.

Los problemas de autocorrelación se presentan con mayor frecuencia en series temporales, dónde es común que la variable dependiente tenga cierta relación para los distintos momentos del tiempo y está relación a veces se trasmite al error, por no estar contenida en el modelo. En este caso hablamos de autocorrelación o correlación serial. Si el problema se presentase en datos de corte trasversal hablaríamos de correlación espacial.

La autocorrelación puede estar originada por errores de especificación en el modelo. Este sería el caso anterior sobre las series temporales. Si una serie está correlacionada con sus momentos anteriores, deberíamos incluir estos momentos anteriores como variables explicativas del modelo, ya que si no lo hacemos quedarán reflejados en el error. Cuando esto sucede, la única solución posible es reespecificar el modelo.

Consecuencias de la autocorrelación

El estimador de mínimos cuadrados ordinarios, sigue siendo insegado en presencia de autocorrelación, pero deja de ser eficiente.

Al igual que cuando el modelo presenta problemas de heterocedasticidad, en presencia de autocorrelación  la matriz de varianzas-covarianzas de los estimadores de los parámetros no se puede calcular del mismo modo, ya que no se verifica el teorema de Gauss-Markov. En esta situación los contrastes de significatividad individual y global pierden validez.

Tendiendo en cuenta las correlaciones del error, es posible obtener un estimador para los parámetros del modelo que resulte más eficiente: el estimador de mínimos cuadrados generalizados.

Ejemplo de análisis de autocorrelación.

El archivo Desempleo.gdt contiene datos anuales relacionados con la tasa de desempleo de una determinada región, para el periodo 1981-2017. Las variables que contiene son las siguientes:

  • Tdesempleo: Tasa de desempleo en % de la región.
  • IPC: Índice de precios al consumo de la región.
  • Salario: Salario Bruto anual medio de la región.

Se pretende plantear un modelo de regresión lineal que explique el comportamiento de la tasa de desempleo en la región a partir de las variables disponibles.

La estimación del modelo en Gretl es la siguiente:

Observamos en el contraste de significatividad global, que el modelo planteado es significativo y consigue explicar un 41,11% de la variabilidad de la tasa de desempleo.

Hemos incluido el contraste de normalidad aplicado a los residuos del modelo, en el que podemos observar que, con un p-valor de 0,3082, a nivel de significación 0,05, no tenemos evidencias suficientes para rechazar la normalidad del error.

Los contrastes de significatividad individual muestran que tanto el IPC como la variable Salarios son significativas a la hora de explicar el comportamiento de la tasa de paro.

Si observamos la correlación entre las variables explicativas veremos que es muy alta (r=0,9871) lo que nos indica que podemos tener problemas de multicolinealidad en el modelo.

No obstante, como los contrastes de significatividad individual no parecen estar fallando, seguiremos adelante con nuestro modelo, teniendo en cuenta que las varianzas de los estimadores pueden ser anormalmente grandes y las consecuencias que esto conlleva.

Observando el contraste de White vemos que, a nivel de significación 0,05 no tenemos evidencias suficientes para rechazar la hipótesis nula de homocedasticidad, por lo que descartaremos la existencia de problemas de heterocedasticidad en el modelo.

Pasaremos ahora a analizar la posible presencia de problemas de autocorrelación en el modelo. Para detectar un posible problema de autocorrelación en nuestro modelo, comenzaremos haciendo uso de una serie de métodos gráficos que nos darán una idea del problema, si lo hubiera.

Posteriormente estudiaremos 3 contrastes de hipótesis para la detección de problemas de autocorrelación:

  • El estadístico de Durbin-Watson.
  • El contraste de Breusch-Godfrey.
  • El contraste de Ljung-box.

Métodos gráficos para la detección de problemas de autocorrelación.

Para detectar un posible problema de autocorrelación, podemos observar el gráfico de la serie residuos  buscando un comportamiento cíclico. Para ver este gráfico en Gretl debemos utilizar la siguiente secuencia desde la ventana de estimación del modelo:

Gráficos -> Gráfico de residuos -> Contra el tiempo

Otro método gráfico para la detección de problemas de autocorrelación es la observación de la nube  de puntos entre los residuos y su pasado. Para obtener este gráfico en Gretl debemos primero guardar las variables, residuos y residuos retardados. Se pueden hacer tantos gráficos como retardos se quieran observar.

Para guardar los residuos hacemos desde la ventana del modelo: 

Guardar -> Residuos

Para guardar los residuos retardados generamos una nueva variable a partir de la variable Residuos previamente guardada:

Residuos_ret = Residuos(-1)

Con ambas series podemos desde el menú principal:

Ver -> Gráficos -> Gráfico X-Y (scatter)

Es importante seleccionar la opción “mostrar las variables retardadas” para que nos permita seleccionar las variables retardadas.

El resultado será:

En el gráfico observamos que los puntos se acumulan alrededor de la recta, por lo que tiene sentido pensar que hay relación entre ellos y por tanto un problema de autocorrelación.

Mediante los métodos gráficos intuimos la presencia de un problema de autocorrelación en nuestro modelo para explicar la tasa de desempleo.

Contrastes de hipótesis para la detección de problemas de autocorrelación

Para una mayor seguridad, apoyaremos estás conclusión en 3 contrastes de hipótesis:

  • El estadístico de Durbin-Watson.
  • El contraste de Breusch-Godfrey.
  • El contraste de Ljung-box.

El estadístico de Durbin-Watson

El estadístico de Durbin-Watson es una medida para la detección de posibles problemas de autocorrelación serial de orden 1, es decir, cuando existen problemas de autocorrelación entre el error y el momento o individuo inmediatamente anterior. Gretl incluye el estadístico de Durbin-Watson, en la estimación del modelo, ya que se trata de uno de los métodos más utilizados para la detección de este problema. Aparece al final del todo y se denomina directamente “Durbin-Watson”.

El estadístico de Durbin-Watson contrasta la hipótesis nula de “ausencia de autocorrelación en el modelo”, frente a la alternativa que plantea la existencia problemas de autocorrelación en el modelo, que vienen dados por una correlación serial de orden 1 (AR(1)), es decir:

  H0: Ausencia de autocorrelación.

  H1: Problemas de autocorrelación.

El estadístico de Durbin-Watson se calcula mediante la siguiente expresión:

d=\frac{\sum_{i=2}^n (e_t - e_{t-1})^2}{\sum_{i=1}^ne_t^2}

Este estadístico toma valores cercanos a 2 cuando el modelo no tiene problemas de autocorrelación. Si existe una autocorrelación positiva entre las perturbaciones, el estadístico tendrá un valor cercano a 0, mientras que si la correlación es negativa será próximo a 4:

  • d≈2→ No hay problemas de autocorrelación.
  • d≈0→  Autocorrelación positiva.
  • d≈4→ Autocorrelación negativa.

En nuestro ejemplo el estadístico de Durbin-Watson toma valor 0,8046, por lo que podemos decir que el modelo presenta problemas de autocorrelación positiva entre las perturbaciones, ya que el valor es cercano a 0.

Además del estadístico de Durbin-Watson, Gretl nos ofrece un p-valor para el mismo, a través del menú del modelo:

Contrastes -> Valor p del estadístico de Durbin-Watson

Como vemos, a nivel de significación 0,05 debemos rechazar la hipótesis nula de ausencia de autocorrelación en el modelo, confirmando un problema de autocorrelación.

Problemas del estadístico de Durbin-Watson:

  • Solo permite contrastar si existe autocorrelación con un esquema AR(1), es decir, si el error está correlacionado únicamente con su pasado inmediatamente anterior.
  • No proporciona datos fiables si la muestra tiene un tamaño pequeño.
  • Requiere que el modelo planteado incluya término independiente.
  • Si el modelo incluye algún retardo de la variable endógena como variable explicativa, tampoco se podrá utilizar.

El contraste de Breusch-Godfrey

El contraste de Breusch-Godfrey es un contrate para detectar la presencia de problemas de autocorrelación en el modelo de regresión lineal. Contrasta la hipótesis nula de ausencia de autocorrelación, frente a la alternativa de presencia de esquemas autorregresivos AR(p) o MA(q), es decir:

  • H_0 : \rho_i = 0, \forall i \in (1,r) ≡ Ausencia de autocorrelación.
  • H_1 : AR(r) \ o \ MA(r) ≡ Problemas de autocorrelación.

Como vemos la hipótesis alternativa contempla procesos autorregresivos de orden 1 y superiores y procesos de medias móviles, por lo que este contraste resulta más completo que el estadístico de Durbin-Watson.

El contraste de Breusch-Godfrey , se apoya en un modelo auxiliar que trata de explicar el comportamiento de los residuos a partir de la variables explicativas incluidas en el modelo y del pasado de los residuos.

Si este contraste consigue su objetivo diremos que hay problemas de autocorrelación, ya que implicaría que los residuos están relacionados con su pasado. En este modelo auxiliar se pueden incluir tantos retardos como se deseen contrastar.

El estadístico de Breusch-Godfrey se calcula como el producto entre el tamaño muestral y el coeficiente de determinación del modelo auxiliar y bajo la hipótesis nula sigue una distribución chi-cuadrado con r grados de libertad, es decir,

nR^2 \sim \chi^2(r)

Para realizar el contraste en Gretl debemos usar el siguiente menú de la ventana del modelo:

Contrastes -> Autocorrelación

En el cuadrado de dialogo que aparece debemos indicar r, es decir, el número de retardos que queremos incluir en la regresión auxiliar. En nuestro ejemplo, para 4 retardos obtendremos la siguiente salida:

En nuestro ejemplo, al hacer el contraste de Breusch-godfrey para 4 retardos se obtiene un estadístico de contraste de 17,56 y un p-valor de 0,0015 que permite rechazar la hipótesis nula de ausencia de autocorrelación a nivel de significación 0,05. Concluimos por tanto que este modelo tiene un problema de autocorrelación.

El contraste de Ljung-box

El contraste de Ljung-Box es uno de los más utilizados para detectar esquemas de autocorrelación en el modelo, ya que nos permite determinar de forma precisa el comportamiento de dicha autocorrelación.

Es bastante utilizado también en el análisis de series temporales, justamente por este motivo, porque ayuda a encontrar la mejor forma de modelizar las series.

Al igual que en los anteriores, en el contraste de Ljung-Box la hipótesis nula es la ausencia de autocorrelación, pero la alternativa ahora permite plantear esquemas ARMA(p,q) en los que los elementos autorregresivos y de medias móviles se combinan en una misma ecuación.

Las hipótesis nula y alternativa serán por tanto:

  • H_0 : \rho_i = 0, \forall i \in (1,r) ≡ Ausencia de autocorrelación.
  • H_1 : ARMA(p,q) ≡ Problemas de autocorrelación.

El estadístico de contraste del contraste de Ljung-Box es:

Q=n(n+2) \frac{\sum_{j=1}^k \hat{ \rho}_j^2}{n-j}

Bajo la hipótesis nula de ausencia de autocorrelación en el modelo, el estadístico de Ljung-Box sigue una distribución Chi-cuadrado con r-p-q grados de libertad, donde:

  • r es el número máximo de retardos incluidos en el contraste.
  • p el orden del proceso autorregresivo.
  • q el orden del proceso de medias móviles.

Q \sim \chi^2(r-p-q)

Gretl lo muestra justo debajo del contraste de Breush-Godfrey.

El estadístico de Ljung-Box tiene un valor de 19,05 y un p-valor de 0,000768. A nivel de significación 0,05 debemos por tanto rechazar la hipótesis nula de ausencia de autocorrelación, confirmando la existencia de un problema de autocorrelación en el modelo.

Medidas de corrección de la autocorrelación.

Proponemos tres posibles soluciones a la autocorrelación:

  • Transformar las variables, por ejemplo tomado Logaritmos.
  • Estimar por mínimos cuadrados ponderados.
  • Incluir los retardos de la variable dependiente como regresores del modelo.

Ya sabemos que transformar algunas variables, en ocasiones resuelve problemas de multicolinealidad, heterocesticidad o autocorrelación. En este caso se trataría de ir probando transformaciones que tengan sentido para el conjunto de variables con el que trabajamos (ver capítulo de heterocedasticidad)

Sabemos también que la estimación por mínimos cuadrados ponderados, ponderando con respecto a las variables causantes del problema, nos dará una estimación de la matriz de varianzas y covarianzas de los estimadores  adecuada a una situación de autocorrelación.

Nos centraremos entonces en la inclusión de retardos de la variable dependiente como regresores del modelo.

Medidas de corrección de la autocorrelación: inclusión de retardos de la variable dependiente como regresores del modelo

Al realizar los contrastes de autocorrelación del modelo para la estimación del desempleo, se observa en el modelo auxiliar que el primer retardo de los residuos es el único significativo según el contraste de significatividad individual de las variables:

Nos plantearemos por tanto, que la variable dependiente podría estar relacionada con su primer retardo. Podríamos generar los retardos de la variable dependiente y obtener correlaciones con la variable dependiente para comprobar sí es así.

Vemos que la variable tasa de desempleo tiene una fuerte correlación con su pasado inmediato y, pero también está relacionada con momentos anteriores del tiempo. Para solucionar el problema de autocorrelación podemos incluir distinto número de retardos en el modelo y comparar los modelos obtenidos.

Para incluir los retardos de la variable dependiente en el modelo en el Gretl, debemos pulsar sobre el botón retardos al especificar el modelo e incluir los que queramos:

Vemos en este caso que la variable retardada es significativa a la hora de explicar el comportamiento de la tasa de desempleo. En este caso, el resto de variables han dejado de ser significativas, esto puede deberse a un problema de multicolinealidad. También puede hacer que nos planteemos el estudio de la serie únicamente en función de su pasado. Esto implicaría emplear una modelización distinta al modelo de regresión lineal, el análisis de series temporales.

Si nos planteamos utilizar más retardos como regresores este modelo podemos obtener los siguientes modelos estimados:

Incluyendo hasta 4 retardos, parece que el mejor modelo sería el que incluye los retardos de 1 a 3.

Videos