Download as pdf or txt
Download as pdf or txt
You are on page 1of 9

Grau en Ciències Empresarials-Management.

Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.

Nom i cognom ....................................................................................................................................

Instruccions: L 'examen consta de 3 exercicis. La puntuació màxima total és de 100 punts. Teniu 2 hores
per resoldre l'examen. Expliqueu sempre les passes que feu. Heu de posar el nom en aquest enunciat i
lliurar-lo juntament amb el vostre examen. Les solucions de l’examen seran publicades en l’aula
global.

Exercici 1. (40 punts)


La taula següent prové de l’enquesta “Second International Self-Reported Delinquency Study, 2005-2007”. Una
de les preguntes de l’enquesta era si la persona havia patit assetjament escolar amb anterioritat. La variable
ASSET_ESC recull les respostes a aquesta pregunta.

ASSET_ESC | GENERE
| Dona Home | Total
-----------------+----------------------+----------
No | 28549 27511 | 56060
Sí | 4753 4310 | 9063
-----------------+----------------------+----------
Total | 33302 31821 | 65123

a) (5 punts) Calcula el percentatge de persones que van patir assetjament escolar en la mostra. Calcula també
un interval de confiança del 95% per al percentatge en la població.
L’estimació puntual és 9063/65123 = 0,13917

L’interval de confiança serà

𝑝𝑝̂ (1 − 𝑝𝑝̂ ) 0,13917 ∗ (1 − 0,13917)


𝑝𝑝̂ ± 𝑧𝑧 ∗ � = 0,13917 ± 1,96� =
𝑛𝑛 65123

0,13917 ± 1,96 ∗ 0,00136= [0,136509091 ; 0,141825752]

b) (10 punts) Calcula ara el percentatge d’assetjament escolar de les dones. Creus que és superior al 14% en
la població? Fes un contrast d’hipòtesis amb un nivell de significació de l’1%.

L’estimació puntual és 4753/33302 = 0,1427

1
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.

H0 : p = 0,14
Ha : p > 0,14
pˆ − p0 0,1427 − 0,14 0, 0027
=z = = = 1, 433
p0 (1 − p0 ) 0,14(1 − 0,14) 0, 00192
n 33302
Prob( z > 1,433) =0,076 (valor crític és 2,33). Per tant no rebutgem la hipòtesi nul·la.

c) (15 punts) Calcula també el percentatge d’assetjament escolar dels homes. Creus que la proporció
d’assetjament escolar és la mateixa per a homes i dones? O és superior per a les dones? Fes una prova de
significació adient i utilitza un nivell de significació de l’1%.

L’estimació puntual per als homes és 4310/31821 = 0,1354

H 0 : pd − ph = 0
H a : pd − ph > 0
pˆ d − pˆ h 0,1427 − 0,1354 0, 0073
=z = = = 2, 683
 1 1  1 1  0, 002713
pˆ c (1 − pˆ c )  +  0,1392 (1 − 0,1392 )  + 
 nd nh   33302 31821 
Valor-p = 0,0037 valor crític: 2,33
Per tant rebutgem la hipòtesi nul·la.

a) (10 punts) La següent taula de contingència mostra les freqüències observades, les freqüències
esperades (a sota, en itàlica) i la contribució a l’estadístic χ2 (tercera fila, itàlica en un altre color) de
cada element de la taula, en la relació entre la variable d’assetjament escolar i l’àrea geogràfica de
residencia de l’individu.

ÀREA GEOGRÀFICA
ASSET-ESC Anglo-sax Northern Western E Mediterranean Latin Amer Post Socialist TOTAL
3003 6157 14646 10144 5730 16504 56184
No 3188,5 6031,8 14831,1 ??? ??? 16648,3
10,8 2,6 2,3 ??? ??? 1,3
701 850 2583 1297 817 2836 9084
Sí 515,5 975,2 2397,9 ??? ??? 2691,7
66,7 16,1 14,3 ??? ??? 7,7

TOTAL 3704 7007 17229 11441 6547 19340 65268

2
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.

Hi ha relació entre l’àrea geogràfica de residència i el fet de patir assetjament escolar? Fes un contrast
(chi-quadrat) d’independència de variables. Quasi tots els càlculs estan ja fets, només has de completar-los.
Troba l’estadístic de contrast. Quina distribució segueix? Amb quants graus de llibertat? Podem rebutjar la
hipòtesi nul·la?

ASSET-ESC Anglo-sax Northern Western E MediterraneanLatin Amer Post Socialist TOTAL


3003 6157 14646 10144 5730 16504 56184
No 3188,5 6031,8 14831,1 9848,6 5635,8 16648,3
10,8 2,6 2,3 8,9 1,6 1,3 27,4
701 850 2583 1297 817 2836 9084
Sí 515,5 975,2 2397,9 1592,4 911,2 2691,7
66,7 16,1 14,3 54,8 9,7 7,7 169,4

TOTAL 3704 7007 17229 11441 6547 19340 65268


196,7

És una chi-quadrat

Els graus de llibertat són (2-1)x(6-1) = 5

( Obsi − Espi )
c* f 2

χ =∑
2
= 196,7350 Valor-p = 0,000 (valor crític per a 1% és 15,09 i per a 5% és 11,07)
i =1 Espi

Rebutgem hipòtesi nul·la. Hi ha relació.

Exercici 2. (30 punts)


Disposem de dades de despesa sanitària anual per càpita (€) de 49 països de la OCDE. La següent taula mostra
un resum de resultats:

Variable | Obs Mitjana Dev. Est. Min Max


-----------+-----------------------------------------------------
Health | 49 3305,854 2046,77 208,77 10586,08

a) (5 punts) Considera aquests 49 països com una mostra aleatòria. Calcula un interval de confiança del
99% per a la mitjana de despesa sanitària de la població (aproxima el valor crític que necessites per
construir l’interval). Interpreta el resultat.

s
� ± t∗
X
√n

3305,854 ±t 99% ∗ (2046,77/√49) = 3305,854±2,682 ∗ (2046,77/√49) = [2521,589 ; 4090,119]

3
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.

(el valor crític és exacte. Amb les taules aproximaríem amb el valor per a 50 graus de llibertat, que és
2,678).

Amb una confiança del 99% afirmem que aquest interval conté el vertader valor de la mitjana en la
població.

> ic.t(3305.854 , 2046.77 ,49,0.99 )


Resultats Valors
1 interval límit esquerra 2521.589038
2 interval límit dreta 4090.118962
3 error estàndard 292.395714
4 valor crític 2.682204
5 marge d'error 784.264962

b)(10 punts) Ara restringim la nostra atenció a 32 països europeus, 12 dels quals havien format part de
l’antiga URSS o de la seva òrbita d’influència (països etiquetats com “Orientals”). Les diferències en la
despesa sanitària per càpita són manifestes en la mostra:

Grup Obs Mitjana Desv. Est.

Occidentals 20 4565,078 1316,903


Orientals 12 2093,157 509,6775

Fes una prova de significació per decidir si l’evidència empírica recolza la idea, a nivell poblacional, que les
despeses sanitàries per càpita dels països de l’Europa Occidental són superior a les dels països de l’Europa
Oriental en més de 2000€. La hipòtesi nul·la és que la diferència no supera els 2000€. Utilitza un nivell de
significació del 5%.

H o : µ1 − µ2 =
2000
H a : µ1 − µ2 > 2000

(1: occidentals, 2: orientals).

Estadístic de contrast
(X � 2 )−(μ1 −μ2 )
� 1 −X 2471,921−2000 471,921
t= 𝑡𝑡 = 2 2
= = 1,43362731
329,1797
s2 s2 �1316,903 +509,6775
� 1+ 2 20 12
n1 n2

El valor d’aquest estadístic de contrast és superior al valor crític del 5% (una


cua) i 11 graus de llibertat, que és 1,79588482 per a la cua dreta. Per tant no
rebutgem la hipòtesi nul·la. El valor-p és 0,08974306.

c) (15 punts) Ampliem l’estudi i ara considerem els països, dividits per continents. Descartem Àfrica i
Oceania ja que el nombre de països disponibles en aquestes dues àrees és insuficient en la mostra. El
nombre total de països considerats és 46.

4
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.

Despesa sanitària er càpita


ÀREA Obs. Mitjana Variància
Europa occidental 20 4565,08 1734233,41
Europa oriental 12 2093,16 259771,12
Amèrica 7 3200,96 12559366,23
Àsia 7 1880,17 2999072,00

Fes una anàlisi ANOVA per comprovar si l’evidència empírica és consistent o no amb que les mitjanes
poblacionals de la despesa sanitària siguin iguals en totes les àrees. Utilitza un nivell de significació del 2%.

H o : µ=
1 µ=
2 µ=
3 µ4
H a : al menys una és diferent

Mitjana mostra = (20*4565,08 + 12*2093,16+7*3200,96+7*1880,17)/46=3304,0726

SQentre= 20(4565,08 -3304,0726) 2+ 12(2093,16-3304,0726)2+7(3200,96-3304,0726)2+7(1880,17-3304,0726)2


=63665391,7
n1 n2

∑ ( X i1 − X1 ) +∑ ( X i 2 − X 2 ) + + =
2 2
SQdins =
=i 1 =i 1

= (n1 − 1) s12 + (n2 − 1) s22 +  =


19(1734233, 41) + 11(259771,12) + 6(12559366, 23) + 6(2999072, 00) =
129158546
Ara
SQentre / (k − 1) 63665391, 7 (4 − 1) 21221797, 2
F = = = 6,9
SQdins / (n − k ) 129158546 / (46 − 4) 3075203, 49

Aquest estadístic segueix una distribució F amb 3 i 42 graus de llibertat. El valor P és inferior a 0,001 (és 0,0007)
Per tant podem rebutjar la hipòtesi nul·la. Hi ha diferencia entre mitjanes segons àrea geogràfica.

Exercici 3. (30 punts)


De què depèn la despesa sanitària anual per càpita? Comprovem que en els 47 països considerats (hem
suprimit dos països amb observacions extremes pel que fa al PIB o la Despesa), la proporció mitjana de despesa
sanitària proveïda pels governs està al voltant del 70% del total de la despesa sanitària. La resta és despesa
voluntària privada (per exemple despesa en mútues de salut). Sembla assenyat pensar que països amb un alt
nivell de vida (mesurat pel PIB per càpita del país) tindran una despesa sanitària (total) més elevada.
Comprovem-ho: utilitza les dades que es mostren a continuació per fer una anàlisi simple de regressió on
Despesa total depèn únicament del PIB per càpita.

5
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.

Correlacions bivariants
Despesa Despesa Despesa PIB
total pública privada càpita Mitjana Desv. Típica

Despesa total 1 Despesa total 3113,417 1764,565


Despesa
pública 0,979 1 PIB càpita 37838,04 16164,18
Despesa
privada 0,735 0,580 1

PIB càpita 0,922 0,898 0,693 1

a) (10 punts) Calcula els coeficients de la recta de regressió. Calcula també el coeficient de determinació de la
regressió.

R2= 0,9222 = 0,8497

b1 = 0,922(1764,565/16164,18) = 0,10063 b0 = 3133,417 – 0,10063(37838,04) = -694,1648

Consum = -694,1648 + 0,10063Renda + residu

Per cada 100 euros addicionals de PIB la Despesa augmenta en 10,06 euros.

b)(5 punts) ) Sabent que l’error estàndard del coeficient de regressió del PIB per càpita és 0,0063 fes una prova
de significació per saber si el coeficient és estadísticament diferent de 0. Calcula el valor-p de la prova.

t= 0,10063/0,0063= 15,95 i valor-p = 0 t-student amb 45 graus de llibertat


És estadísticament significatiu.

c) (15 punts) Hem afegit una variable explicativa més: la Despesa (sanitària) pública. Els resultats són els
següents:

> mod <- lm(TOTAL ~ public + pib_cap, data =HEALTH_EXP)


> summary(mod)

Call:
lm(formula = Despesa_total ~ Despesa_pública + pib_capita, data = HEALTH_EXP)

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.438e+01 1.357e+02 0.474 0.637525
Despesa pública 9.334e-01 7.379e-02 12.649 2.97e-16 ***
pib_capita 2.433e-02 6.721e-03 3.619 0.000758 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

6
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.

Residual standard error: 324.8 on 44 degrees of freedom


Multiple R-squared: 0.9676, Adjusted R-squared: 0.9661
F-statistic: 656.7 on 2 and 44 DF, p-value: < 2.2e-16

> library(faraway)
> vif(mod)
public pib_cap
5.144833 5.144833

Et sembla correcte aquest últim model? Raona la teva resposta utilitzant la informació proporcionada en
l’enunciat.

No, no és correcte. Tot i que el coeficient de determinació és elevat, i que els coeficients de regressió són
conjunta i individualment significativament diferents de o des del punt de vista estadístic, observem que el
coeficient de Pib_cap ha variat molt.
Si ens fixem en la correlació entre Pib_capita i Despesa pública, observem que és molt elevada: 0,898
També observem que els índex d’inflació de variància són tots dos superiors a 5.
Aquests fets ens estan indicant que tenim un problema greu de multicolinealitat. No és una bona idea incloure
la variable Despesa pública en aquesta equació.

------------------------------------------------------------------------------

7
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.

8
Grau en Ciències Empresarials-Management. Curs 2019-20
Examen d'Estadística (segon trimestre). Recuperació.

You might also like