Codigos

DATOS DE PANEL
install.packages("foreign")
library(foreign)
# Tomado de la UNIVERSIDAD DE PRINCETON:
Panel <- read.dta("http://dss.princeton.edu/training/Panel101.dta")
View(Panel)
x11()
coplot(y ~ year|country, type="l", data=Panel) # he graficado la variable endogena en funcion
de
# a?o y por individuo, y la data que uso es nombre panel
# sirve para estudiar la heterogeneidad grafica de cada individuo(cada pais)
# el coplot me permite graficar muchos individuos a trav?s del tiempo
#el grafico de arriba solo me dice que tengo 7 individuos
# por lo tanto existe heterogeneidad entre individuos por que no tienen una misma tendencia
# entre los paises
# Lines
# le digo q en y me grafique el a?o por individuo
x11()
coplot(y ~ year|country, type="b", data=Panel) # Points and lines
# Bars at top indicates corresponding graph (i.e. countries)
# from left to right starting on the bottom row
install.packages("car")
library(car)
x11()
scatterplot(y~year|country, boxplots=FALSE, smooth=TRUE, reg.line=FALSE, data=Panel)
library(haven)
Trim_Nov_Dic_Ene18 <- read_sav("C:/Users/PC03/Downloads/593-Modulo76/Trim Nov-Dic-
Ene18.sav")
View(Trim_Nov_Dic_Ene18)
#Ejercicio: Mostrar que la base de datos de panel presenta una

#HETEROGENEIDAD BIEN MARCADA
#hago un analisis de las medias con el comando plotmeans
# nota: para decir que los paises son homogeneos en la grafica se deberia observar
# un misma media, pero sobre todo los minimos y maximos en los intervalos de confianza mas
q la media
#la linea negra tendria que ser paralela al eje x
# Heterogeneidad:
install.packages("gplots")
library(gplots)
plotmeans(y ~ country, main="Heterogeneidad por Departamentos", data=Panel)
x11()
plotmeans(y ~ year, main="Heterogeneidad por Años", data=Panel) #se muestra un analisis de
todos
# los paises agrupados por a?o en el anterior era a?os por cada pais
# ejemplo en 1990 se observa menor importacion en conjunto de todos los paises
#detach("package:gplots") para borrar
#?Qu? pasar?a si no consideramos la Heterogeneidad?
#Ejercicio: Corra un modelo considerando una constante igual para todos los
#individuos (i=A,B,C,D,E,F,G) y comparelo con un modelo donde se
#tiene una constante para cada individuo (i=A,B,C,D,E,F,G) y comente lo que
#pasa con sus variables en ambos modelos.
#Ayuda, primero corra un modelo simple, donde no se considere el panel, es
#decir corra una regresi?n (pooled, agrupado, todos los datos en "y" son sin considerar
#la indivualidad). Luego corra un modelo con una dummy para cada
#individuo (i=A,B,C,D,E,F,G), use el comando factor del R.
modelo1MCO = lm(y~ x1,data = Panel)

modelo1MCO
summary(modelo1MCO)
# La Predicci?n(con estimaci?n dentro de la muestra) con MCO seria:

ypre = modelo1MCO$fitted.values
plot(Panel$x1, Panel$y, pch=19, xlab="x1", ylab="y")
abline(lm(Panel$y~Panel$x1),lwd=3, col="red")
# Los efectos en el PANEL

mod1EFIJOSDummy = lm(y~x1+factor(country)-1,data=Panel)
mod1EFIJOSDummy
summary(mod1EFIJOSDummy)
# Vemos que x1 mejora, porque con EFECTOS FIJOS hemos modelado la HETEROGENEIDAD.
# GRAFICAMOS POR PAISES:
ypreEF=mod1EFIJOSDummy$fitted.values
x11()
scatterplot(ypreEF~Panel$x1|Panel$country, boxplots=FALSE,smooth=FALSE, xlab="x1",
ylab="y Prede")
#Ejercicio 2: Estimar Datos de Panel en R y elegir entre efectos fijos y

#efectos aleatorios
#AYUDA : Test de HAUSMAN
install.packages("plm")
library(plm)
summary(fijo)
#modelo con efectos aleatorios
fijo<- plm(y~x1,data=Panel,index=c("country","year"),model="within")
#modelo whitin:efectos fijos
#como indices tenemos a country corte tranversal que es por individuo y la parte temporal a
"year"
summary(fijo)
?plm
#modelo con efectos aleatorios
aleatorio<- plm(y~x1,data=Panel,index=c("country","year"),model="random")
summary(aleatorio)
#housman
phtest(fijo,aleatorio)
#el p-value es mayor a 5%, no se rechaza la Ho o rechazas la Ha,
#si mi p-value es menor al 5%, entonces se deberia usar efectos fijos

##############
aleatorio<- plm(y~x1,data=Panel,index=c("country","year"),model="random")
summary(aleatorio)
LOGIT MULTIUNOMIAL NO ORDENADO
library(nnet)
# Crear datos de muestra
set.seed(123)
datos_transportes <- data.frame(
Edad = rnorm(200, mean = 30, sd = 5),
Ingresos = rnorm(200, mean = 50000, sd = 10000),
Género = factor(sample(c("Mujer", "Hombre"), size = 200, replace = TRUE)),
Transporte_Elegido = factor(sample(c("Coche", "Autobús", "Bicicleta"), size = 200, replace =

TRUE))
# Verificar la estructura de datos
str(datos_transportes)
# Ajustar un modelo logit multinomial no ordenado
modelo_transportes <- multinom(Transporte_Elegido ~ Edad + Ingresos + Género, data =

datos_transportes)
# Resumen del modelo
summary(modelo_transportes)
INTERPRETACIÓN
Para interpretar los resultados de un modelo logit multinomial no ordenado, es necesario

examinar el resumen del modelo, que proporciona información sobre los coeficientes
estimados, la significancia estadística y la bondad de ajuste del modelo. A continuación,
interpreto los resultados que proporcionaste en el resumen:
```
Call:
multinom(formula = Transporte_Elegido ~ Edad + Ingresos + Género,
data = datos_transportes)
Coefficients:
(Intercept) Edad Ingresos GéneroMujer
Bicicleta -0.1988539 0.019993012 -7.442313e-06 0.1801342
Coche -0.5140991 -0.003843472 7.795089e-06 0.4436791
Std. Errors:
(Intercept) Edad Ingresos GéneroMujer
Bicicleta 0.0002391364 0.01194054 7.757863e-06 0.0001369488
Coche 0.0002195848 0.01099872 7.040549e-06 0.0001351444
Residual Deviance: 435.9684
AIC: 451.9684
```
INTERPRETACIÓN
1. **Coeficientes:** Los coeficientes estimados muestran cómo las variables independientes

(Edad, Ingresos y Género) afectan la probabilidad de elegir una categoría de transporte en
comparación con la categoría de referencia (en este caso, "Autobús"). Las categorías de
transporte son "Bicicleta" y "Coche".
- "Bicicleta":
- El coeficiente del intercepto (-0.1988539) representa el logaritmo de las odds de elegir

"Bicicleta" en lugar de "Autobús" cuando todas las demás variables son cero.
- El coeficiente de "Edad" (0.019993012) indica cómo cambia la logaritmo de las odds de

elegir "Bicicleta" en comparación con "Autobús" por cada unidad adicional de Edad.
- El coeficiente de "Ingresos" (-7.442313e-06) muestra cómo cambia la logaritmo de las odds

de elegir "Bicicleta" en comparación con "Autobús" por cada unidad adicional de Ingresos.
- El coeficiente de "GéneroMujer" (0.1801342) indica cómo cambia la logaritmo de las odds
de elegir "Bicicleta" en comparación con "Autobús" si el género es "Mujer" en lugar de
"Hombre".
- "Coche":
- Los coeficientes para "Coche" siguen un patrón similar, pero representan cómo cambian las
odds de elegir "Coche" en lugar de "Autobús".
4. **AIC (Akaike Information Criterion):** El AIC es un criterio de información que tiene en

cuenta tanto el ajuste del modelo como su complejidad. Un valor de AIC más bajo indica un
modelo mejor. En este caso, el valor es 451.9684.
Las interpretaciones detalladas de los coeficientes implican evaluar cómo cada variable
independiente afecta las probabilidades de elegir "Bicicleta" o "Coche" en comparación con
"Autobús" en función de los valores de esas variables. Los coeficientes positivos o negativos
indican si la probabilidad de elegir una categoría aumenta o disminuye en relación con la
categoría de referencia ("Autobús"). Los valores de los errores estándar proporcionan
información sobre la precisión de estas estimaciones.
LOGIT MULTINOMIAL ORDENADO
install.packages("VGAM")
library(VGAM)
# Crear datos de muestra
set.seed(123)
datos_educacion <- data.frame(
Edad = rnorm(200, mean = 30, sd = 5),
Ingresos = rnorm(200, mean = 50000, sd = 10000),
Educacion = ordered(sample(c("Bachillerato", "Licenciatura", "Maestría"), size = 200, replace =

TRUE))
# Ajustar un modelo logit multinomial ordenado
modelo_educacion <- vglm(Educacion ~ Edad + Ingresos, family = multinomial(refLevel = 1),

data = datos_educacion)
# Resumen del modelo

summary(modelo_educacion)
INTERPRETACIÓN
La interpretación de los coeficientes en un modelo logit multinomial ordenado

implica entender cómo las variables independientes (Edad e Ingresos) afectan la
probabilidad de pertenecer a niveles educativos superiores en comparación con
el nivel de referencia (nivel 1). A continuación, se detalla la interpretación de los
coeficientes:
Nivel 2 de la respuesta (Intercept:1 y Edad:1):
Coeficiente del intercepto ( -0.8358): Este coeficiente representa el logaritmo de

las odds (probabilidades logarítmicas) de pertenecer al nivel 2 de educación
(Licenciatura) en comparación con el nivel 1 (Bachillerato) cuando todas las
demás variables son iguales a cero. Un valor negativo indica que las
probabilidades de estar en el nivel 2 en lugar del nivel 1 son más bajas que el
nivel de referencia.
Coeficiente de Edad (0.0172): Un aumento de una unidad en la variable Edad

aumenta el logaritmo de las odds de pertenecer al nivel 2 en lugar del nivel 1 en
un 1.72%. Esto sugiere que a medida que la Edad aumenta, las probabilidades de
tener un nivel de educación superior también aumentan.
Coeficiente de Ingresos (0.000007508): Un aumento de una unidad en la variable

Ingresos aumenta el logaritmo de las odds de pertenecer al nivel 2 en lugar del
nivel 1 en 0.0007508%. Esto indica que las probabilidades de t ener un nivel de
educación superior aumentan muy ligeramente a medida que los ingresos
aumentan.
Nivel 3 de la respuesta (Intercept:2 y Edad:2):
Coeficiente del intercepto ( -1.955): Este coeficiente representa el logaritmo de

las odds de pertenecer al nive l 3 de educación (Maestría) en comparación con el
nivel 1 (Bachillerato) cuando todas las demás variables son iguales a cero. Un
valor negativo indica que las probabilidades de estar en el nivel 3 en lugar del
nivel 1 son más bajas que el nivel de referenc ia.
Coeficiente de Edad (0.0344): Un aumento de una unidad en la variable Edad

aumenta el logaritmo de las odds de pertenecer al nivel 3 en lugar del nivel 1 en
un 3.44%. Esto sugiere que a medida que la Edad aumenta, las probabilidades de
tener un nivel de educación superior también aumentan.
Coeficiente de Ingresos (0.0000233): Un aumento de una unidad en la variable

Ingresos aumenta el logaritmo de las odds de pertenecer al nivel 3 en lugar del
nivel 1 en 0.00233%. Esto indica que las probabilidades de t ener un nivel de
educación superior aumentan muy ligeramente a medida que los ingresos
aumentan.
En resumen, los coeficientes indican cómo las variables Edad e Ingresos influyen
en la probabilidad de pertenecer a niveles educativos superiores en comparació n
con el nivel de referencia (Bachillerato). Los coeficientes positivos en Edad
sugieren que un aumento en la Edad tiende a aumentar las probabilidades de
niveles educativos superiores. Los coeficientes positivos en Ingresos indican un
efecto similar, pero mucho más pequeño, de los ingresos en el nivel de
educación.

Codigos

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Codigos

Uploaded by

Copyright:

Available Formats

DATOS DE PANEL

#Ejercicio: Mostrar que la base de datos de panel presenta una

modelo1MCO = lm(y~ x1,data = Panel)

# La Predicci?n(con estimaci?n dentro de la muestra) con MCO seria:

# Los efectos en el PANEL

#Ejercicio 2: Estimar Datos de Panel en R y elegir entre efectos fijos y

#el p-value es mayor a 5%, no se rechaza la Ho o rechazas la Ha,

#si mi p-value es menor al 5%, entonces se deberia usar efectos fijos

LOGIT MULTIUNOMIAL NO ORDENADO

# Crear datos de muestra

datos_transportes <- data.frame(

Edad = rnorm(200, mean = 30, sd = 5),

Ingresos = rnorm(200, mean = 50000, sd = 10000),

Género = factor(sample(c("Mujer", "Hombre"), size = 200, replace = TRUE)),

Transporte_Elegido = factor(sample(c("Coche", "Autobús", "Bicicleta"), size = 200, replace =

# Verificar la estructura de datos

# Ajustar un modelo logit multinomial no ordenado

modelo_transportes <- multinom(Transporte_Elegido ~ Edad + Ingresos + Género, data =

# Resumen del modelo

Para interpretar los resultados de un modelo logit multinomial no ordenado, es necesario

multinom(formula = Transporte_Elegido ~ Edad + Ingresos + Género,

(Intercept) Edad Ingresos GéneroMujer

Bicicleta -0.1988539 0.019993012 -7.442313e-06 0.1801342

Coche -0.5140991 -0.003843472 7.795089e-06 0.4436791

(Intercept) Edad Ingresos GéneroMujer

Bicicleta 0.0002391364 0.01194054 7.757863e-06 0.0001369488

Coche 0.0002195848 0.01099872 7.040549e-06 0.0001351444

Residual Deviance: 435.9684

1. **Coeficientes:** Los coeficientes estimados muestran cómo las variables independientes

- El coeficiente del intercepto (-0.1988539) representa el logaritmo de las odds de elegir

- El coeficiente de "Edad" (0.019993012) indica cómo cambia la logaritmo de las odds de

- El coeficiente de "Ingresos" (-7.442313e-06) muestra cómo cambia la logaritmo de las odds

4. **AIC (Akaike Information Criterion):** El AIC es un criterio de información que tiene en

LOGIT MULTINOMIAL ORDENADO

# Crear datos de muestra

datos_educacion <- data.frame(

Edad = rnorm(200, mean = 30, sd = 5),

Ingresos = rnorm(200, mean = 50000, sd = 10000),

Educacion = ordered(sample(c("Bachillerato", "Licenciatura", "Maestría"), size = 200, replace =

# Ajustar un modelo logit multinomial ordenado

modelo_educacion <- vglm(Educacion ~ Edad + Ingresos, family = multinomial(refLevel = 1),

# Resumen del modelo

La interpretación de los coeficientes en un modelo logit multinomial ordenado

Nivel 2 de la respuesta (Intercept:1 y Edad:1):

Coeficiente del intercepto ( -0.8358): Este coeficiente representa el logaritmo de

Coeficiente de Edad (0.0172): Un aumento de una unidad en la variable Edad

Coeficiente de Ingresos (0.000007508): Un aumento de una unidad en la variable

Nivel 3 de la respuesta (Intercept:2 y Edad:2):

Coeficiente del intercepto ( -1.955): Este coeficiente representa el logaritmo de

Coeficiente de Edad (0.0344): Un aumento de una unidad en la variable Edad

Coeficiente de Ingresos (0.0000233): Un aumento de una unidad en la variable

You might also like

1. Coeficientes: Los coeficientes estimados muestran cómo las variables independientes

4. AIC (Akaike Information Criterion): El AIC es un criterio de información que tiene en