Professional Documents
Culture Documents
2020exam Rec Solu
2020exam Rec Solu
Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.
Instruccions: L 'examen consta de 3 exercicis. La puntuació màxima total és de 100 punts. Teniu 2 hores
per resoldre l'examen. Expliqueu sempre les passes que feu. Heu de posar el nom en aquest enunciat i
lliurar-lo juntament amb el vostre examen. Les solucions de l’examen seran publicades en l’aula
global.
ASSET_ESC | GENERE
| Dona Home | Total
-----------------+----------------------+----------
No | 28549 27511 | 56060
Sí | 4753 4310 | 9063
-----------------+----------------------+----------
Total | 33302 31821 | 65123
a) (5 punts) Calcula el percentatge de persones que van patir assetjament escolar en la mostra. Calcula també
un interval de confiança del 95% per al percentatge en la població.
L’estimació puntual és 9063/65123 = 0,13917
b) (10 punts) Calcula ara el percentatge d’assetjament escolar de les dones. Creus que és superior al 14% en
la població? Fes un contrast d’hipòtesis amb un nivell de significació de l’1%.
1
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.
H0 : p = 0,14
Ha : p > 0,14
pˆ − p0 0,1427 − 0,14 0, 0027
=z = = = 1, 433
p0 (1 − p0 ) 0,14(1 − 0,14) 0, 00192
n 33302
Prob( z > 1,433) =0,076 (valor crític és 2,33). Per tant no rebutgem la hipòtesi nul·la.
c) (15 punts) Calcula també el percentatge d’assetjament escolar dels homes. Creus que la proporció
d’assetjament escolar és la mateixa per a homes i dones? O és superior per a les dones? Fes una prova de
significació adient i utilitza un nivell de significació de l’1%.
H 0 : pd − ph = 0
H a : pd − ph > 0
pˆ d − pˆ h 0,1427 − 0,1354 0, 0073
=z = = = 2, 683
1 1 1 1 0, 002713
pˆ c (1 − pˆ c ) + 0,1392 (1 − 0,1392 ) +
nd nh 33302 31821
Valor-p = 0,0037 valor crític: 2,33
Per tant rebutgem la hipòtesi nul·la.
a) (10 punts) La següent taula de contingència mostra les freqüències observades, les freqüències
esperades (a sota, en itàlica) i la contribució a l’estadístic χ2 (tercera fila, itàlica en un altre color) de
cada element de la taula, en la relació entre la variable d’assetjament escolar i l’àrea geogràfica de
residencia de l’individu.
ÀREA GEOGRÀFICA
ASSET-ESC Anglo-sax Northern Western E Mediterranean Latin Amer Post Socialist TOTAL
3003 6157 14646 10144 5730 16504 56184
No 3188,5 6031,8 14831,1 ??? ??? 16648,3
10,8 2,6 2,3 ??? ??? 1,3
701 850 2583 1297 817 2836 9084
Sí 515,5 975,2 2397,9 ??? ??? 2691,7
66,7 16,1 14,3 ??? ??? 7,7
2
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.
Hi ha relació entre l’àrea geogràfica de residència i el fet de patir assetjament escolar? Fes un contrast
(chi-quadrat) d’independència de variables. Quasi tots els càlculs estan ja fets, només has de completar-los.
Troba l’estadístic de contrast. Quina distribució segueix? Amb quants graus de llibertat? Podem rebutjar la
hipòtesi nul·la?
És una chi-quadrat
( Obsi − Espi )
c* f 2
χ =∑
2
= 196,7350 Valor-p = 0,000 (valor crític per a 1% és 15,09 i per a 5% és 11,07)
i =1 Espi
a) (5 punts) Considera aquests 49 països com una mostra aleatòria. Calcula un interval de confiança del
99% per a la mitjana de despesa sanitària de la població (aproxima el valor crític que necessites per
construir l’interval). Interpreta el resultat.
s
� ± t∗
X
√n
3
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.
(el valor crític és exacte. Amb les taules aproximaríem amb el valor per a 50 graus de llibertat, que és
2,678).
Amb una confiança del 99% afirmem que aquest interval conté el vertader valor de la mitjana en la
població.
b)(10 punts) Ara restringim la nostra atenció a 32 països europeus, 12 dels quals havien format part de
l’antiga URSS o de la seva òrbita d’influència (països etiquetats com “Orientals”). Les diferències en la
despesa sanitària per càpita són manifestes en la mostra:
Fes una prova de significació per decidir si l’evidència empírica recolza la idea, a nivell poblacional, que les
despeses sanitàries per càpita dels països de l’Europa Occidental són superior a les dels països de l’Europa
Oriental en més de 2000€. La hipòtesi nul·la és que la diferència no supera els 2000€. Utilitza un nivell de
significació del 5%.
H o : µ1 − µ2 =
2000
H a : µ1 − µ2 > 2000
Estadístic de contrast
(X � 2 )−(μ1 −μ2 )
� 1 −X 2471,921−2000 471,921
t= 𝑡𝑡 = 2 2
= = 1,43362731
329,1797
s2 s2 �1316,903 +509,6775
� 1+ 2 20 12
n1 n2
c) (15 punts) Ampliem l’estudi i ara considerem els països, dividits per continents. Descartem Àfrica i
Oceania ja que el nombre de països disponibles en aquestes dues àrees és insuficient en la mostra. El
nombre total de països considerats és 46.
4
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.
Fes una anàlisi ANOVA per comprovar si l’evidència empírica és consistent o no amb que les mitjanes
poblacionals de la despesa sanitària siguin iguals en totes les àrees. Utilitza un nivell de significació del 2%.
H o : µ=
1 µ=
2 µ=
3 µ4
H a : al menys una és diferent
∑ ( X i1 − X1 ) +∑ ( X i 2 − X 2 ) + + =
2 2
SQdins =
=i 1 =i 1
Aquest estadístic segueix una distribució F amb 3 i 42 graus de llibertat. El valor P és inferior a 0,001 (és 0,0007)
Per tant podem rebutjar la hipòtesi nul·la. Hi ha diferencia entre mitjanes segons àrea geogràfica.
5
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.
Correlacions bivariants
Despesa Despesa Despesa PIB
total pública privada càpita Mitjana Desv. Típica
a) (10 punts) Calcula els coeficients de la recta de regressió. Calcula també el coeficient de determinació de la
regressió.
Per cada 100 euros addicionals de PIB la Despesa augmenta en 10,06 euros.
b)(5 punts) ) Sabent que l’error estàndard del coeficient de regressió del PIB per càpita és 0,0063 fes una prova
de significació per saber si el coeficient és estadísticament diferent de 0. Calcula el valor-p de la prova.
c) (15 punts) Hem afegit una variable explicativa més: la Despesa (sanitària) pública. Els resultats són els
següents:
Call:
lm(formula = Despesa_total ~ Despesa_pública + pib_capita, data = HEALTH_EXP)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.438e+01 1.357e+02 0.474 0.637525
Despesa pública 9.334e-01 7.379e-02 12.649 2.97e-16 ***
pib_capita 2.433e-02 6.721e-03 3.619 0.000758 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
6
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.
> library(faraway)
> vif(mod)
public pib_cap
5.144833 5.144833
Et sembla correcte aquest últim model? Raona la teva resposta utilitzant la informació proporcionada en
l’enunciat.
No, no és correcte. Tot i que el coeficient de determinació és elevat, i que els coeficients de regressió són
conjunta i individualment significativament diferents de o des del punt de vista estadístic, observem que el
coeficient de Pib_cap ha variat molt.
Si ens fixem en la correlació entre Pib_capita i Despesa pública, observem que és molt elevada: 0,898
També observem que els índex d’inflació de variància són tots dos superiors a 5.
Aquests fets ens estan indicant que tenim un problema greu de multicolinealitat. No és una bona idea incloure
la variable Despesa pública en aquesta equació.
------------------------------------------------------------------------------
7
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.
8
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.