NOVIEMBRE 2000 -  JOSÉ ANTONIO ORTEGA OSONA

EASYREG: PRÁCTICA GUÍADA No. 1
CONSUMO DE CARNE


Lectura de los datos
Información del fichero
 Análisis Previo
  Transformaciones de los datos
 Estimación
  Interpretación
  Correlaciones de los estimadores
  Análisis de Residuos
 Actividades Adicionales
 1. Consumo de Cerdo
 2. Análisis en tasas de variación
  3. Selección de Variables

Los datos incluidos en el fichero carne.txt corresponden a los precios de la carne de cerdo y de ternera en Estados Unidos y fueron objeto de un estudio clásico de Waugh en 1957. Nos van a permitir estudiar de qué depende la demanda de carne de ternera ilustrando una de las principales ramas de la teoría económica: la teoría de la demanda.

Lectura de los datos: El fichero carne.txt incluye las distintas series temporales en el formato 1 de datos de Easyreg. Para poder introducirlos en el programa se recomienda seguir los siguientes pasos:

El fichero: El fichero incluye información de 10 series temporales durante el período 1925-1941 (17 años). Son las siguientes:
    Fecha: El año
    PrecTernera: Precio de la ternera en centavos de dólar por libra de peso (aprox. medio kilo).
    ConsTernera: Consumo de ternera en libras per cápita.
    PrecCerdo: Precio del cerdo en centavos de dólar por libra de peso.
    ConsCerdo: Consumo de cerdo en libras per cápita.
    IPCAlimentac: Indice de precios de la alimentación, base 1947-49=100.
    IRentaDispPC: Indice de Renta Disponible per cápita, base 1947-49.
    IConsAlimPC: Indice de consumo de alimento per cápita, base 1947-49.
    IRentaRealDPC: Indice de Renta Real Disponible per cápita, base 1947-49.
    IPrecRelatAlim: Precios Relativos de la Alimentación: IPCAlimentac/IPCGeneral

    Para más información sobre la estructura del fichero, ir a  explicación del fichero.

Análisis Previo: Se recomienda familiarizarse con los datos. Para realizar acciones en Easyreg utilizamos el menú principal, Menu. Nos interesan en primer lugar los submenús de Data Analysis, donde se pueden hacer análisis exploratorio de los datos (estadísticos descriptivos: Summary Statistics, Diagramas de dispersión: Multiple Variables > Scatter diagram, matrices de correlaciones: Multiple Variables > Correlation Matrix, gráfico de las series: Time Series > Plot time series). Realice un análisis previo del consumo de ternera en relación con las principales variables explicativas. En particular represente las series de consumo de ternera y de precio de ternera (Plot time series con variables estandarizadas en un mismo gráfico); estudie también el diagrama de dispersión correspondiente (Scatter plot). Asimismo explore la relación entre precios del cerdo y consumo de ternera, y entre renta real disponible y consumo de ternera. Comente los tipos de asociaciones encontrados.
    SOLUCIÓN

    Easyreg crea un subdirectorio Easyreg.dat en el directorio de trabajo donde guarda los datos, las salidas de los comandos, los gráficos, etcétera. En nuestro caso habrá un fichero que se llame c:\Easyreg\carne\Easyreg.dat\output.txt donde se van guardando los resultados. Esta es la salida, por ejemplo, de los estadísticos descriptivos del precio de la carne (Menu > Data Analysis > Summary Statistics)

    PRECTERNERA
    Number of observations: 17
    Number of missing values: 0
    First usable observation: 1 = 1925
    Last usable observation: 17 = 1941
    Minimum: 56.0000
    Maximum: 82.2000
    Mean: 69.0588
    Standard error: 6.7111
    10% quantile: 59.7000
    20% quantile: 59.7000
    30% quantile: 63.4000
    40% quantile: 68.4000
    50% quantile: 70.2000
    60% quantile: 71.0000
    70% quantile: 72.1000
    80% quantile: 73.1000
    90% quantile: 74.2000

    Si seleccionamos más de una variable en el menú correspondiente se obtiene una salida similar para cada variable.

    Conviene mencionar la opción que se nos da en el menú de Summary Statistics, después de seleccionar las variables, de escoger un subconjunto de los datos ("Do you want to use a subset of observations?"). Esta pregunta es muy común en todos los menus de Easyreg. Habitualmente diremos que No con lo que el análisis procederá con todas las observaciones. Si decimos que Sí, Yes, se abre siempre un submenú como el de la figura:

    Mediante las casillas de 1 Down y 1 Up podemos cambiar los límites para abajo y para arriba, tanto el límite inferior como el superior. Las casillas de la derecha permiten escoger el Step: de cuántas en cuántas observaciones cambian los límites. Podemos subirlo o bajarlo uno a uno con Step down o Step up, o multiplicarlo o dividirlo por 10 con Step size × 10 y Step size / 10. Se recomienda familiarizarse con este menú, pues se presenta en muchas ocasiones.

    Un siguiente paso es el análisis gráfico, que en este caso es bastante indicativo. Lo hacemos a través de Menu > Data Analysis > Time Series > Plot Time Series. Seleccionamos PrecTernera y ConsTernera. Vemos que de nuevo se nos da la opción de utilizar una submuestra. Después se nos pide escoger si hacemos el gráfico con las variables estandarizadas (Standardize variables), o sin estandarizar. Si las variables no están medidas en la misma escala, como es nuestro caso, es en general mejor hacer el gráfico en escala estandarizada. También se nos pide si metemos todas las series en el mismo gráfico o cada una en uno. Habitualmente se observan mejor las relaciones con todas en uno, así pues escogemos All charts in one box. También se nos dan varias opciones para el tipo de líneas. Escogemos a nuestro gusto. El gráfico que obtenemos es el siguiente:

    Es interesante observar cómo los gráficos de series temporales en Easyreg son dinámicos en el sentido de que si pasamos el ratón por el gráfico nos indica en el nombre de la ventana a qué observación estamos apuntando. Esto puede ayudar a leer los gráficos. Por ejemplo, en nuestro caso se observa una relación negativa entre las variables: cuando los precios de la ternera son altos, el consumo baja. Así la caída registrada en el precio a partir de 1926 impulso el crecimiento de la demanda. La subida registrada a partir de 1932 hace que caiga algo el consumo pero son las subidas que se inician en 1938 las que mayor efecto tienen. Llega el consumo de ternera de ese modo en 1941 a un mínimo que se corresponde con un máximo de los precios. Obsérvese que al hacer doble click con el ratón en el gráfico se añade automáticamente el identificador del año en el eje de las x. Finalmente, el botón Save this picture graba el gráfico en el directorio Easyreg.dat en formato bmp. Si en algún momento queremos ver los análisis realizados previamente o los gráficos es posible hacerlo directamente desde Easyreg, en el menú Menu > Output > View output text via … Ahí se nos da la opción de escoger el editor de texto con el que vemos el fichero. También puede escogerse Menu > Output > View bitmap files para ver los ficheros de gráficos. En nuestro caso aparecerá únicamente el fichero TSP00001.BMP, que es el fichero que acabamos de grabar. Vemos que Easyreg asigna automáticamente nombres a los ficheros que se componen de tres letras que indican el tipo de gráfico (TSP: Time Series Plot) y de un número que señala el orden de grabación. Para volver a ver el gráfico no hay más que seleccionarlo con doble click en el directorio que se presenta. Exista también la opción de borrar gráficos del disco pulsando el botón Erase Picture File. Con Return to picture menu podemos volver al menú de gráficos desde donde podemos terminar con Cancel. Es posible también reiniciar el fichero de salida, output.txt mediante Menu > Output > Erase output text file.

    El diagrama de dispersión de las series se consigue a partir de Menu > Data Analysis > Multiple Variables > Scatter Diagram. En el menú que aparece se nos pide escoger con doble click primero la variable del eje x (en nuestro caso escogemos PrecTernera) y en segundo lugar la del eje y (ConsTernera). Pulsando en Selection ok, en Continue y en Ok, llegamos finalmente al diagrama de dispersión siguiente:

    Vemos que el gráfico representa no solamente los puntos sino también la recta ajustada por mínimos cuadrados. Con Save Picture grabamos el fichero como hicimos antes. En este caso recibe el prefijo SCD. Volvemos al menú de selección de variable por si queremos seguir haciendo gráficos.

    El diagrama de dispersión nos confirma la relación negativa entre precio y consumo de ternera. Esta relación es la que cabe esperar en base a la ley de la demanda: al aumentar el precio de la ternera, disminuye la demanda. Existe el problema de que el precio, según la teoría económica, no viene determinado tan sólo por la demanda, sino también por la oferta. Afortunadamente, en el caso de la ternera podemos creer que fundamentalmente observamos la demanda y no la oferta puesto que modificar la oferta requiere cierto tiempo como criar más terneras que lleguen a la edad adecuada o importar vacas de crianza. También puede importarse la carne directamente. Esto tendría efectos más rápidos y no permitiría observar la ley de la demanda. Es, por ejemplo, una estrategia que se ha empleado a menudo en España para frenar tendencias inflacionistas en el precio de la carne. Cabe esperar, sin embargo, que en Estados Unidos, un país muy grande y con producción de carne muy competitiva; y en los años de preguerra, en que las restricciones al tráfico internacional eran la norma, estas consideraciones no sean muy importantes. En contextos en que no podamos asumir que lo que observamos es estrictamente demanda y no oferta es necesario emplear técnicas econométricas más avanzadas como son los modelos de ecuaciones simultáneas.

    Los gráficos de series temporales y los diagramas de dispersión del consumo de ternera frente al precio del cerdo, y frente a la renta real disponible se incluyen en la parte superior. Vemos como parece existir una cierta relación positiva entre el precio del cerdo y el consumo de ternera. Cuando el precio del cerdo sube desde un mínimo en 1932 a un máximo en 1935 el consumo de ternera registra un fuerte crecimiento. El diagrama de dispersión pone de manifiesto que la relación no es muy fuerte. En el caso de la renta real disponible parece que exista también una cierta relación positiva: como la renta real, el consumo de ternera alcanza un mínimo hacia 1932-1933 y se crece a partir de ese momento. El diagrama de dispersión reafirma esta cierta relación positiva.

    Estas dos relaciones en principio coinciden con lo que cabría esperar de acuerdo a la ley de la demanda: al aumentar el precio de un bien sustitutivo, como es el cerdo, el consumo se desplaza desde el cerdo hacia la ternera. Esto lleva a una cierta relación positiva. Al aumentar la renta, aumenta el consumo de carne en general: la carne se trata de un bien normal.

    Es importante señalar las limitaciones de este análisis: estamos mirando a las relaciones bivariantes entre las variables. El hecho de que el resto de variables relevantes no permanezcan constantes durante el período de tiempo que analizamos hace que no podamos asegurar si estas relaciones que se observan entre las variables dos a dos se deben al efecto de esas variables o a los cambios simultáneos en el resto de variables. Para poder discernirlo necesitamos analizar de forma simultánea los efectos de todas las variables. Esto es precisamente lo que permite hacer el análisis de regresión múltiple.

    Otra forma de describir las relaciones entre las variables es el cálculo de la matriz de correlaciones entre las variables. En Easyreg las matrices de correlaciones pueden calcularse a partir de Menu > Data Analysis > Multiple Variables > Correlation Matrix. Como en anteriores ocasiones se abren diálogos donde escoger las variables y la submuestra a analizar. El resultado es el siguiente:

    Variables:
    X(1)=ConsTernera
    X(2)=PrecTernera
    X(3)=PrecCerdo
    X(4)=IRentaRealDPC
    First available observation: t = 1(=1925)
    Last available observation: t = 17(=1941)
    = Chosen
    Standard error of X(1) = 4.28017
    Standard error of X(2) = 6.91765
    Standard error of X(3) = 8.07283
    Standard error of X(4) = 8.77647
    Correlation matrix:
    1.00000 -0.75244 0.08341 0.46816
    -0.75244 1.00000 0.32677 -0.64062
    0.08341 0.32677 1.00000 -0.21310
    0.46816 -0.64062 -0.21310 1.00000
    Eigenvalues of the correlation matrix:
    2.30518 1.06394 0.49563 0.13525
    Eigenvectors of the correlation matrix:
    0.53593 0.43670 -0.42273 0.58598
    -0.62200 0.02639 0.26127 0.73767
    -0.20826 0.89736 0.25155 -0.29680
    0.53153 -0.05783 0.83052 0.15610
    Standardized eigenvectors:
    0.86163 0.48664 -0.50899 0.79437
    -1.00000 0.02941 0.31458 1.00000
    -0.33483 1.00000 0.30289 -0.40235
    0.85456 -0.06444 1.00000 0.21161

    Como vemos se obtienen las desviaciones típicas de las variables, la matriz de correlaciones, así como los valores y vectores propios de la matriz de correlaciones. En nuestro caso nos fijamos en las correlaciones del consumo de ternera con las variables explicativas. Efectivamente la correlación con el precio de ternera es negativa y fuerte (- 0.75), la correlación con la renta positiva y de orden medio (0.46), y la del precio del cerdo débil y positiva (0.08). También vemos que existen correlaciones fuertes y negativas entre el precio de la ternera y la renta real (- 0.64). Esto nos reafirma en el comentario anterior de que los análisis bivariantes pueden no ser válidos puesto que las variaciones de las variables explicativas se muestran relacionadas.

    La información respecto a los valores y vectores propios, aunque aún no la sepa utilizar el alumno, puede ser muy útil. Existen medidas de la multicolinealidad (el número de condición) que se basan en los valores propios de la matriz de correlación de los regresores en una regresión multiple. También existen técnicas de resumir la información (reducir el número de variables) donde se emplean tanto los autovalores como los autovectores (Análisis en Componentes Principales).

Transformaciones de los datos: La mayor parte de los estudios de demanda especifican la relación entre las variables utilizando una transformación logarítmica. Esto equivale a suponer una elasticidad constante del consumo frente a los precios o la renta. Para poder estimar dicha ecuación necesitamos crear en nuestro fichero de datos unas nuevas variables que se correspondan con los logaritmos de las series. Para ello utilizamos, dentro del menú principal, el submenú Input > Transform Variables. Están disponibles muchos procedimientos de transformación. En nuestro caso nos limitamos a seleccionar LOG Transformation: x ->ln(x). A continuación tenemos que seleccionar las variables que queremos transformar. Podemos seleccionar el consumo de ternera, los precios de ternera y cerdo, y el índice de renta real per capita (con doble click). Como vemos al seleccionar Selection OK, unas nuevas variables han sido creadas con la extensión LN.
    SOLUCIÓN

    No presenta problemas esta tarea. El menú de transformaciones es muy útil pues a menudo es necesario crear nuevas transformaciones de las variables.

    Una vez que hemos realizado las transformaciones de los datos podemos mirar la lista de variables disponibles en Menu > Input > View the Current Input File.

    Parece ser que varios de los compañeros que utilizaban Easyreg tuvieron problemas a partir de este momento: el programa daba errores y terminaba al intentar continuar. Desconozco los motivos por los que puede ocurrir esto, aunque he informado de ello al autor del programa, Herman Bierens de modo que en futuras versiones pueda ser corregido.

Estimación: El submenú Single Equation Models del menú principal tiene todos los comandos de estimación que nos interesan, en particular Linear Regression Models. Estimamos el modelo
LN(ConsTern)t = b1+b2 LN(PrecTern)t+b3LN(PrecCerdo)t+b4LN(RentaRDPC)+ut
Imprime los resultados de la regresión y analízalos:
 
SOLUCIÓN

Para llegar a la estimación hemos tenido que seleccionar primeramente la variable explicada (LN[ConsTernera]), y luego las variables x (LN[PrecTern], LN[PrecCerdo], LN[IRentaRealDPC]). En ese momento se nos ofrece un nuevo menú en el que se resume la ecuación que se va a estimar. El coeficiente constante se añade de forma automática al modelo: se trata del coeficiente asociado a la variable 1 que se ha añadido al final de la lista de variables. Casi siempre es deseable mantener la constante en el modelo pero si, por algún motivo particular, deseamos quitarla podemos hacerlo pulsando No intercept. También se nos da la opción de meter una tendencia temporal (Time Trend) o revisar la lista de variables (Other X variables). En nuestro caso, damos a continuar. También se nos ofrece la posibilidad de escoger una submuestra, menú que ya conocemos. Continuamos para hacer la regresión con todos los datos. Estos son los resultados del comando.

Model variables:
y = LN[ConsTernera]
x(1) = LN[PrecTernera]
x(2) = LN[PrecCerdo]
x(3) = LN[IRentaRealDPC]
x(4) = 1

Available observations: t = 1(=1925) -> 17(=1941)
= Chosen

OLS estimation results for Y = LN[ConsTernera]
Variables                      OLS estimate     t-value
                                                   s.e.
                                              [p-value]
x(1) = LN[PrecTernera]             -.707636      -4.181
                                             1.6924E-01
                                              [0.00108]
x(2) = LN[PrecCerdo]                .188680       2.039
                                             9.2534E-02
                                              [0.06232]
x(3) = LN[IRentaRealDPC]           -.028179       -.220
                                             1.2827E-01
                                              [0.82952]
x(4) = 1                           6.321660       5.639
                                             1.1211E+00
                                              [0.00008]
The p-values are two-sided: p-value = P(|t(13)|>|t-value|),
where t(13) is t distributed with 13 degrees of freedom.

Standard error of the residuals:         51.385778E-003
Residual sum of squares (RSS):           34.326479E-003
Total sum of squares (TSS):              10.485461E-002
Overall F test: F(3,13):                           8.90
p-value = 0.00181
Significance levels:        10%         5%
Critical values:           2.56       3.41
Conclusions:             reject     reject
R-square:                                      0.672628
Adjusted R-square:                             0.597080
Effective sample size (n):                           17
 

If the model is correctly specified, in the sense that the conditional
expectation of the model error u relative to the X variables and all
lagged dependent (y) variables and lagged X variables equals zero,
then the OLS parameter estimators b(1),...,b(4), minus their true values,
are (asymptotically) jointly normally distributed with zero mean vector
and variance matrix:
  2.86421E-002 -4.35474E-003  1.34190E-002 -1.60275E-001
 -4.35474E-003  8.56256E-003 -5.49216E-004 -1.37307E-002
  1.34190E-002 -5.49216E-004  1.64519E-002 -1.24002E-001
 -1.60275E-001 -1.37307E-002 -1.24002E-001  1.25686E+000

  • Interpretar los coeficientes estimados. ¿Se corresponden con lo esperado por teoría económica?
    1. SOLUCIÓN

      La ecuación estimada podríamos escribirla como:


      El coeficiente constante, 6.321, representa habitualmente el valor esperado cuando las variables explicativas son todas igual a cero. Como en este caso las variables son logarítmicas, son iguales a cero cuando la variable original es igual a 1 luego 6.321 sería el consumo esperado cuando el precio de la ternera y del cerdo es de 1 dólar por libra y el índice de renta real es igual a 1. Vemos que, en este caso, no se trata de una magnitud que tenga interés económico intrínseco.

      El coeficiente del precio de ternera, - 0.7076, es la estimación de la elasticidad precio del consumo de ternera: si se duplica el precio de la ternera el consumo per cápita disminuiría en un 76% cuando el resto de variables explicativas permanecen constantes. Si aumenta el precio en un 10%, disminuiría el consumo en 7.6%. Este coeficiente negativo es el que, como hemos comentado anteriormente que estaría de acuerdo con la ley de la demanda. El estadístico t obtenido como el cociente entre el coeficiente y su desviación típica estimada es - 4.181. Es un valor grande en valor absoluto que me llevaría a rechazar la hipótesis de que el coeficiente sea igual a cero para niveles de significación mayores que a = 0.00108 (el llamado p-valor, p-value). Se trata, por lo tanto, de un coeficiente significativamente distinto de cero o, dicho de otro modo, el precio de ternera es una variable estadísticamente significativa en la explicación del consumo de ternera.

      El coeficiente del precio de cerdo, 0.1886, me indica la elasticidad cruzada de la demanda de ternera frente al precio del cerdo. Al ser una cantidad positiva me indica que se tratan de bienes sustitutivos. Esto está de acuerdo con lo que esperabamos. La estimación indica que un aumento del precio del cerdo en un 10% llevaría, por término medio, a un incremento del 1.88% del consumo de ternera cuando el resto de variables permanecen constantes. Este coeficiente vemos que está relativamente cerca de cero. Un contraste de significatividad como el indicado anteriormente lleva a un estadístico t de 2.039 y un p-valor del 0.06232. Está al borde de la significatividad: un contraste para un nivel de significación del 5% (a =0.05), no podría rechazar que el coeficiente sea igual a cero. Si nuestro nivel de significación es mayor, por ejemplo, del 10%, si que se puede rechazar. El p-valor me indica que rechazo para niveles de significación mayores del 6.232%. El hecho de que la variable pueda no considerarse como significativa no quiere decir que debamos excluirla del modelo. Sabemos que las elasticidades cruzadas suelen ser muy pequeñas puesto que el número de productos sustitutos es grande. No es particularmente preocupante que no se pueda rechazar que la variable sea cero. La precisión de nuestros estimadores es pequeña, como indica la desviación típica del estimador de 0.09. Sabemos que debemos esperar que las elasticidades cruzadas de los sustitutos sean menores que 0.10, luego es normal obtener este resultado. Si queremos una estimación más precisa tendríamos que considerar una muestra mayor, o reforzar nuestro análisis con un análisis microeconómico (observando como cambian los presupuestos familiares al cambiar el precio de la ternera).

      El coeficiente de la renta real, - 0.028, es negativo aunque muy cercano a cero. Se trata de la estimación de la elasticidad renta del consumo de ternera: al aumentar la renta per cápita en un 10% permaneciendo constantes los precios de la ternera y del cerdo, el consumo per cápita de ternera disminuye por término medio un 0.28%. Esto nos llevaría, de acuerdo a la teoría de la demanda, a clasificar la ternera como bien inferior. Esto va en contra de lo esperado a nivel intuitivo: se suele pensar que el consumo de ternera es un bien normal. También difiere del resultado preliminar del análisis exploratorio. La razón más probable es que la aparente relación positiva se puede explicar por los cambios simultáneos en los precios de la ternera. En este caso el coeficiente es realmente cercano a cero (p-valor de 0.82: no se rechaza que el coeficiente sea cero para ninguno de los niveles de significación habituales). En definitiva, nuestro análisis no es concluyente sobre si la ternera es un bien normal, inferior o neutral.

  • A partir de la matriz de varianzas-covarianzas de los estimadores calcular las correlaciones entre las estimaciones de los distintos coeficientes e interpretarlas.

  •  
    SOLUCIÓN
       
      El programa nos da la matriz de varianzas-covarianzas de los estimadores calculada bajo las hipótesis básicas del MLG (como nos recuerda la salida de ordenador). A partir de ella podemos obtener sin problemas las correlaciones entre los estimadores que tienen más fácil interpretación. Recordamos la relación entre las correlaciones y las covarianzas:

      Corr(bi,bj)=Cov(bi,bj)/(Sbi×Sbj)

      En nuestro caso tendremos:

      Corr(b1,b2)=Cov(b1,b2)/(Sb1Sb2)=- 0.004354/(1.121× 0.1692)= - 0.278

      En la tabla siguiente se incluye la matriz de correlaciones-covarianzas calculadas de ese modo: en las posiciones debajo de la diagonal están las correlaciones, en la diagonal las varianzas y por encima de la diagonal las covarianzas. Obviamente a partir de la triangular superior y de la diagonal se puede obtener la diagonal inferior: las correlaciones.

      Corr\Cova PrecTern PrecCerd    RentaReal Const
      PrecTern  0.028642 -0.0043547  0.013419 -0.16028
      PrecCerd -0.27807   0.0085626 -0.000549 -0.01373
      RentaReal 0.61817  -0.046274   0.016452 -0.12400
      Const    -0.84473  -0.13236   -0.86234   1.2569

      El significado de las correlaciones entre estimadores no es más que una estimación de la correlación que tendrían los estimadores si efectuamos muchas regresiones con las mismas variables explicativas (lo que se llama "regresores fijos") y distintas observaciones del término de error. Por ejemplo, la correlación entre la constante y el precio de ternera es muy grande y negativa (- 0.844). Recordamos que el coeficiente de la elasticidad es negativa. Esto señala que no se puede separar con precisión al estimar un coeficiente del otro, y que podríamos aumentar la constante disminuyendo al mismo tiempo el coeficiente del precio de ternera (es decir, haciendo aún más grande y negativo el coeficiente del precio de ternera: aumentando la elasticidad), sin que cambiase apenas el ajuste. Algo parecido ocurre entre la constante y el coeficiente de la renta real. La correlación es alta y negativa (- 0.86). En este caso, como el signo de la renta real es positivo, es viene a decir que no podemos separar un coeficiente de otro y que cuando nos equivocamos sobreestimando la constante, estimamos la elasticidad renta a la baja. En el caso del coeficiente del precio de la ternera y el de la renta real la correlación que existe es positiva: cuanto mayor sea el coeficiente del precio de la ternera (o sea, cuando más pequeña sea la elasticidad, puesto que el coeficiente es negativo), más grande es la elasticidad renta estimada.

      Estas correlaciones elevadas entre los coeficientes pueden contribuir a comprender, por ejemplo, por qué la elasticidad renta estimada es muy cercana a cero cuando el gráfico bivariante señalaba correlación positiva con el consumo de ternera: podríamos explicar el consumo tanto con los precios de la ternera como con la renta. Cuanto más explicamos con los precios de la ternera (mayor es la elasticidad, menor es el coeficiente puesto que es negativo), menor es la estimación de la elasticidad renta: hay correlación positiva entre los estimadores. Recordamos la interpretación en términos de regresión particionada de los coeficientes: mientras que una vez que eliminamos la parte común de información de la renta y del precio de la ternera, el precio de la ternera sigue estando asociado negativamente al consumo, la información de la variable renta no relacionada con los precios apenas permite explicar el consumo. De ahí que la elasticidad renta estimada sea muy baja.
       

  • Después de proporcionarnos las estimaciones Easyreg realiza automáticamente el gráfico de los valores originales, los valores ajustados y los residuos. ¿Cómo son los residuos? ¿en qué años son positivos y en cuáles negativos (a grandes rasgos)? ¿Qué interpretación tiene esto? ¿Cuál de las hipótesis básicas del modelo lineal general es muy posible que no se cumpla en el modelo?

  •  
      SOLUCIÓN

    El gráfico ha sido salvado con el prefijo FIT. Vemos que el ajuste es bastante bueno: los valores ajustados se acercan bastante a los reales. Esto lo refleja asimismo el elevado coeficiente de determinación, R2, del modelo: 0,67, que me indica que el modelo explica 2/3 de la varianza del logaritmo del consumo de ternera.

    Por otro lado se observa que los residuos tienen un comportamiento definido a lo largo del tiempo. Son negativos antes de 1932 y positivos a partir de ese momento. En absoluto se comportan como cabría esperar cuando se cumplen las hipótesis básicas del modelo: es claro que no son independientes entre sí, sino que presentan autocorrelación. Como recordaba la salida de Easyreg, la matriz de varianzas-covarianzas de los estimadores ha sido calculada bajo la hipótesis de ausencia de autocorrelación. El hecho de que esta hipótesis se incumpla quiere decir que esta mál calculada la matriz de varianzas-covarianzas de los estimadores y todos los estadísticos asociados (desviaciones típicas, estadísticos t, …). Asimismo, ya no se cumplen las condiciones del teorema de Gauss-Markov, luego el estimador mínimocuadrático que hemos obtenido no será el estimador de varianza mínima. Sí que sigue siendo un estimador insesgado, pues para probar insesgadez únicamente utilizabamos la hipótesis de esperanza nula del término de error.


    ACTIVIDADES ADICIONALES

    Con estas notas el alumno ya está en disposición de seguir explorando Easyreg por su cuenta. Hemos pasado revista a la mayor parte de los contenidos que nos ofrece el programa cuando tenemos seleccionado el nivel introductorio. Del análisis anterior surgen varias actividades interesantes que se recomienda que realice el alumno por su cuenta.

    1. CONSUMO DE CERDO

      Con la misma base de datos se puede realizar un análisis análogo del consumo de carne de cerdo. Interesa comparar las diversas elasticidades estimadas para los dos tipos de carne. ¿Cuál tiene mayor elasticidad precio? ¿Cuál tiene mayor elasticidad renta? ¿Cuál mayor elasticidad cruzada?.
    2. ANÁLISIS EN TASAS DE VARIACIÓN El problema de la autocorrelación en los residuos complica la interpretación de nuestra estimación, como hemos comentado. Una solución habitual es realizar el análisis en vez de utilizando las variables en logaritmos utilizando las tasas de variación: el porcentaje de crecimiento de la variable de un año a otro. Para calcular la tasa de variación en Easyreg es necesario, al menos temporalmente, cambiar el nivel a un nivel más elevado, por ejemplo: seleccionar el nivel más alto de novicio (Level > Student level > Novice > Choose Novice Level y seleccionar All en la parte inferior. De este modo se añaden las transformaciones de series temporales que nos interesan al menú de tansformaciones.

    Transformamos entonces las variables en Menu > Input > Transform Variables. Escogemos la transformación Time series transformationsque nos ofrece un nuevo menú de transformaciones típicas de series temporales.

    Hay dos métodos de cálculo de las tasas de variación que dan resultados similares:

    Realizamos ahora el análisis de regresión anterior pero utilizando estas variables. Se recomienda volver antes de hacerlo al nivel previo, es decir, seleccionar de nuevo el nivel novicio 3. En otro caso Easyreg hace más preguntas cómo la selección de variables retardadas, que complican el análisis. Se recomienda al alumno fijarse en los siguientes detalles:

    (a) ¿Cuál es ahora la interpretación del coeficiente constante estimado? ¿Es la misma en el caso de los cambios porcentuales y la diferencia del logarítmo?
    (b) ¿Cuáles son los nuevos estimadores de las elasticidades?
    (c) ¿Presentan autocorrelación tan clara los residuos como antes?
    (d) El ajuste medido por el R2 sin duda habrá descendido, pero es que ahora estamos explicando otra variables, la tasa de variación, mucho más volatil e impredecible. Para poder comparar tenemos que fijarnos en la varianza estimado del error, en particular en el caso de la diferencia de los logarítmos. ¿Ha disminuido o aumentado? ¿Cuál sería la cantidad análoga comparable en el modelo en porcentajes?

    3. SELECCIÓN DE VARIABLES
      En nuestro modelo no hemos incluido el consumo de cerdo como determinante del consumo de ternera.

      (a) Pruebe el alumno a incluir el consumo de cerdo en alguna de las regresiones anteriores. ¿Aparece cómo una variable estadísticamente significativa? ¿Cómo cambian el resto de los coeficientes? ¿Cómo cambian los residuos?
      (b) ¿Qué interpretación tienen los coeficientes ahora? ¿Siguen siendo elasticidades precio, cruzadas y renta?

      En este caso, como en otros muchos, es la teoría la que guía la elección de variables explicativas. Según la teoría de la demanda el consumo de ternera y el de cerdo están obviamente relacionados puesto que se elige simultáneamente cuánto se compra de uno y de otro, pero esta asociación no es causal. Es una asociación trivial. Para poder profundizar en el consumo tengo que explicar porqué se compra uno y no otro, y ahí es donde los precios y la renta juegan un papel fundamental. En este caso es la teoría económica la que nos guía en la selección de las variables.   Adelantamos la respuesta al apartado (b): no serían las elasticidades como se definen en teoría económica. Significarían algo así como (por ejemplo, coeficiente del precio de ternera): proporción del aumento en el consumo de ternera a un aumento proporcional en su precio, cuando la renta, el precio y el consumo de cerdo son constantes. Vemos que esto es distinto de la elasticidad. Parte del efecto del aumento del precio de la ternera es modificar el consumo de cerdo y de otros bienes. No tiene sentido teórico, en general, mantener constantes eso consumos. EXPLICACIÓN DEL FICHERO DE DATOS: Fichero carne.txt

    10 -10000
    Fecha
    PrecTernera
    ConsTernera

    IPrecRelatAlim
    1925 59.7 58.6 60.5 65.8 65.8 51.4 90.9 68.5 877

    1941 56.0 60.0 43.9 67.4 52.2 56.3 97.5 89.5 830
    _____________________

    Explicación:

    El fichero carne.txt es un fichero formato 1 de Easyreg, probablemente uno de los más cómodos para utilizar. Vemos que tiene tres partes:

    Primera línea: Número de variables (10) y código de missing value (-10000).

    Líneas 2 a 11: Nombres de las diez variables.

    Líneas 12 al final: Valores de las variables, una línea por observación.

    Si se desea más información sobre cómo leer datos, el propio programa la proporciona: