Download as pdf or txt
Download as pdf or txt
You are on page 1of 7

DATOS DE PANEL

install.packages("foreign")
library(foreign)
# Tomado de la UNIVERSIDAD DE PRINCETON:
Panel <- read.dta("http://dss.princeton.edu/training/Panel101.dta")
View(Panel)
x11()
coplot(y ~ year|country, type="l", data=Panel) # he graficado la variable endogena en funcion
de
# a?o y por individuo, y la data que uso es nombre panel
# sirve para estudiar la heterogeneidad grafica de cada individuo(cada pais)
# el coplot me permite graficar muchos individuos a trav?s del tiempo
#el grafico de arriba solo me dice que tengo 7 individuos
# por lo tanto existe heterogeneidad entre individuos por que no tienen una misma tendencia
# entre los paises
# Lines
# le digo q en y me grafique el a?o por individuo
x11()
coplot(y ~ year|country, type="b", data=Panel) # Points and lines
# Bars at top indicates corresponding graph (i.e. countries)
# from left to right starting on the bottom row
install.packages("car")
library(car)
x11()
scatterplot(y~year|country, boxplots=FALSE, smooth=TRUE, reg.line=FALSE, data=Panel)
library(haven)
Trim_Nov_Dic_Ene18 <- read_sav("C:/Users/PC03/Downloads/593-Modulo76/Trim Nov-Dic-
Ene18.sav")
View(Trim_Nov_Dic_Ene18)

#Ejercicio: Mostrar que la base de datos de panel presenta una


#HETEROGENEIDAD BIEN MARCADA
#hago un analisis de las medias con el comando plotmeans
# nota: para decir que los paises son homogeneos en la grafica se deberia observar
# un misma media, pero sobre todo los minimos y maximos en los intervalos de confianza mas
q la media
#la linea negra tendria que ser paralela al eje x

# Heterogeneidad:
install.packages("gplots")
library(gplots)
plotmeans(y ~ country, main="Heterogeneidad por Departamentos", data=Panel)
x11()
plotmeans(y ~ year, main="Heterogeneidad por Años", data=Panel) #se muestra un analisis de
todos
# los paises agrupados por a?o en el anterior era a?os por cada pais
# ejemplo en 1990 se observa menor importacion en conjunto de todos los paises
#detach("package:gplots") para borrar
#?Qu? pasar?a si no consideramos la Heterogeneidad?
#Ejercicio: Corra un modelo considerando una constante igual para todos los
#individuos (i=A,B,C,D,E,F,G) y comparelo con un modelo donde se
#tiene una constante para cada individuo (i=A,B,C,D,E,F,G) y comente lo que
#pasa con sus variables en ambos modelos.
#Ayuda, primero corra un modelo simple, donde no se considere el panel, es
#decir corra una regresi?n (pooled, agrupado, todos los datos en "y" son sin considerar
#la indivualidad). Luego corra un modelo con una dummy para cada
#individuo (i=A,B,C,D,E,F,G), use el comando factor del R.

modelo1MCO = lm(y~ x1,data = Panel)


modelo1MCO
summary(modelo1MCO)

# La Predicci?n(con estimaci?n dentro de la muestra) con MCO seria:


ypre = modelo1MCO$fitted.values
plot(Panel$x1, Panel$y, pch=19, xlab="x1", ylab="y")
abline(lm(Panel$y~Panel$x1),lwd=3, col="red")

# Los efectos en el PANEL


mod1EFIJOSDummy = lm(y~x1+factor(country)-1,data=Panel)
mod1EFIJOSDummy
summary(mod1EFIJOSDummy)

# Vemos que x1 mejora, porque con EFECTOS FIJOS hemos modelado la HETEROGENEIDAD.
# GRAFICAMOS POR PAISES:
ypreEF=mod1EFIJOSDummy$fitted.values
x11()
scatterplot(ypreEF~Panel$x1|Panel$country, boxplots=FALSE,smooth=FALSE, xlab="x1",
ylab="y Prede")

#Ejercicio 2: Estimar Datos de Panel en R y elegir entre efectos fijos y


#efectos aleatorios
#AYUDA : Test de HAUSMAN
install.packages("plm")
library(plm)
summary(fijo)
#modelo con efectos aleatorios
fijo<- plm(y~x1,data=Panel,index=c("country","year"),model="within")
#modelo whitin:efectos fijos
#como indices tenemos a country corte tranversal que es por individuo y la parte temporal a
"year"
summary(fijo)
?plm
#modelo con efectos aleatorios
aleatorio<- plm(y~x1,data=Panel,index=c("country","year"),model="random")
summary(aleatorio)
#housman
phtest(fijo,aleatorio)

#el p-value es mayor a 5%, no se rechaza la Ho o rechazas la Ha,

#si mi p-value es menor al 5%, entonces se deberia usar efectos fijos


##############

aleatorio<- plm(y~x1,data=Panel,index=c("country","year"),model="random")

summary(aleatorio)

LOGIT MULTIUNOMIAL NO ORDENADO

library(nnet)

# Crear datos de muestra

set.seed(123)

datos_transportes <- data.frame(

Edad = rnorm(200, mean = 30, sd = 5),

Ingresos = rnorm(200, mean = 50000, sd = 10000),

Género = factor(sample(c("Mujer", "Hombre"), size = 200, replace = TRUE)),

Transporte_Elegido = factor(sample(c("Coche", "Autobús", "Bicicleta"), size = 200, replace =


TRUE))

# Verificar la estructura de datos

str(datos_transportes)

# Ajustar un modelo logit multinomial no ordenado

modelo_transportes <- multinom(Transporte_Elegido ~ Edad + Ingresos + Género, data =


datos_transportes)

# Resumen del modelo

summary(modelo_transportes)

INTERPRETACIÓN

Para interpretar los resultados de un modelo logit multinomial no ordenado, es necesario


examinar el resumen del modelo, que proporciona información sobre los coeficientes
estimados, la significancia estadística y la bondad de ajuste del modelo. A continuación,
interpreto los resultados que proporcionaste en el resumen:

```

Call:

multinom(formula = Transporte_Elegido ~ Edad + Ingresos + Género,

data = datos_transportes)

Coefficients:

(Intercept) Edad Ingresos GéneroMujer

Bicicleta -0.1988539 0.019993012 -7.442313e-06 0.1801342

Coche -0.5140991 -0.003843472 7.795089e-06 0.4436791

Std. Errors:

(Intercept) Edad Ingresos GéneroMujer

Bicicleta 0.0002391364 0.01194054 7.757863e-06 0.0001369488

Coche 0.0002195848 0.01099872 7.040549e-06 0.0001351444

Residual Deviance: 435.9684

AIC: 451.9684

```

INTERPRETACIÓN

1. **Coeficientes:** Los coeficientes estimados muestran cómo las variables independientes


(Edad, Ingresos y Género) afectan la probabilidad de elegir una categoría de transporte en
comparación con la categoría de referencia (en este caso, "Autobús"). Las categorías de
transporte son "Bicicleta" y "Coche".

- "Bicicleta":

- El coeficiente del intercepto (-0.1988539) representa el logaritmo de las odds de elegir


"Bicicleta" en lugar de "Autobús" cuando todas las demás variables son cero.

- El coeficiente de "Edad" (0.019993012) indica cómo cambia la logaritmo de las odds de


elegir "Bicicleta" en comparación con "Autobús" por cada unidad adicional de Edad.

- El coeficiente de "Ingresos" (-7.442313e-06) muestra cómo cambia la logaritmo de las odds


de elegir "Bicicleta" en comparación con "Autobús" por cada unidad adicional de Ingresos.
- El coeficiente de "GéneroMujer" (0.1801342) indica cómo cambia la logaritmo de las odds
de elegir "Bicicleta" en comparación con "Autobús" si el género es "Mujer" en lugar de
"Hombre".

- "Coche":

- Los coeficientes para "Coche" siguen un patrón similar, pero representan cómo cambian las
odds de elegir "Coche" en lugar de "Autobús".

4. **AIC (Akaike Information Criterion):** El AIC es un criterio de información que tiene en


cuenta tanto el ajuste del modelo como su complejidad. Un valor de AIC más bajo indica un
modelo mejor. En este caso, el valor es 451.9684.

Las interpretaciones detalladas de los coeficientes implican evaluar cómo cada variable
independiente afecta las probabilidades de elegir "Bicicleta" o "Coche" en comparación con
"Autobús" en función de los valores de esas variables. Los coeficientes positivos o negativos
indican si la probabilidad de elegir una categoría aumenta o disminuye en relación con la
categoría de referencia ("Autobús"). Los valores de los errores estándar proporcionan
información sobre la precisión de estas estimaciones.

LOGIT MULTINOMIAL ORDENADO

install.packages("VGAM")

library(VGAM)

# Crear datos de muestra

set.seed(123)

datos_educacion <- data.frame(

Edad = rnorm(200, mean = 30, sd = 5),

Ingresos = rnorm(200, mean = 50000, sd = 10000),

Educacion = ordered(sample(c("Bachillerato", "Licenciatura", "Maestría"), size = 200, replace =


TRUE))

# Ajustar un modelo logit multinomial ordenado

modelo_educacion <- vglm(Educacion ~ Edad + Ingresos, family = multinomial(refLevel = 1),


data = datos_educacion)

# Resumen del modelo


summary(modelo_educacion)

INTERPRETACIÓN

La interpretación de los coeficientes en un modelo logit multinomial ordenado


implica entender cómo las variables independientes (Edad e Ingresos) afectan la
probabilidad de pertenecer a niveles educativos superiores en comparación con
el nivel de referencia (nivel 1). A continuación, se detalla la interpretación de los
coeficientes:

Nivel 2 de la respuesta (Intercept:1 y Edad:1):

Coeficiente del intercepto ( -0.8358): Este coeficiente representa el logaritmo de


las odds (probabilidades logarítmicas) de pertenecer al nivel 2 de educación
(Licenciatura) en comparación con el nivel 1 (Bachillerato) cuando todas las
demás variables son iguales a cero. Un valor negativo indica que las
probabilidades de estar en el nivel 2 en lugar del nivel 1 son más bajas que el
nivel de referencia.

Coeficiente de Edad (0.0172): Un aumento de una unidad en la variable Edad


aumenta el logaritmo de las odds de pertenecer al nivel 2 en lugar del nivel 1 en
un 1.72%. Esto sugiere que a medida que la Edad aumenta, las probabilidades de
tener un nivel de educación superior también aumentan.

Coeficiente de Ingresos (0.000007508): Un aumento de una unidad en la variable


Ingresos aumenta el logaritmo de las odds de pertenecer al nivel 2 en lugar del
nivel 1 en 0.0007508%. Esto indica que las probabilidades de t ener un nivel de
educación superior aumentan muy ligeramente a medida que los ingresos
aumentan.

Nivel 3 de la respuesta (Intercept:2 y Edad:2):

Coeficiente del intercepto ( -1.955): Este coeficiente representa el logaritmo de


las odds de pertenecer al nive l 3 de educación (Maestría) en comparación con el
nivel 1 (Bachillerato) cuando todas las demás variables son iguales a cero. Un
valor negativo indica que las probabilidades de estar en el nivel 3 en lugar del
nivel 1 son más bajas que el nivel de referenc ia.

Coeficiente de Edad (0.0344): Un aumento de una unidad en la variable Edad


aumenta el logaritmo de las odds de pertenecer al nivel 3 en lugar del nivel 1 en
un 3.44%. Esto sugiere que a medida que la Edad aumenta, las probabilidades de
tener un nivel de educación superior también aumentan.

Coeficiente de Ingresos (0.0000233): Un aumento de una unidad en la variable


Ingresos aumenta el logaritmo de las odds de pertenecer al nivel 3 en lugar del
nivel 1 en 0.00233%. Esto indica que las probabilidades de t ener un nivel de
educación superior aumentan muy ligeramente a medida que los ingresos
aumentan.

En resumen, los coeficientes indican cómo las variables Edad e Ingresos influyen
en la probabilidad de pertenecer a niveles educativos superiores en comparació n
con el nivel de referencia (Bachillerato). Los coeficientes positivos en Edad
sugieren que un aumento en la Edad tiende a aumentar las probabilidades de
niveles educativos superiores. Los coeficientes positivos en Ingresos indican un
efecto similar, pero mucho más pequeño, de los ingresos en el nivel de
educación.

You might also like