Professional Documents
Culture Documents
Tema3Hoja7 Intervalos Soluciones
Tema3Hoja7 Intervalos Soluciones
Tema3Hoja7 Intervalos Soluciones
x z
,x+z
Exemple 1
Volem fer un estudi del nombre dhores que dormen els estudiants de certa
Universitat.
Definim X= nombre dhores de son diries com la variable a estudiar i sabem que
aquesta es distribueix seguint un model normal de mitjana desconeguda, per per
altres treballs podem considerar que la seva desviaci tpica s coneguda i el seu
valor s 3.
Per estimar aquest valor de caldr triar una mostra; per a tal fi, farem una enquesta
a 25 alumnes triats aleatriament i desprs de preguntar-los el nombre dhores de son
de cadascun el dia de lenquesta, obtenim una mitjana de 7 hores. Aquesta dada la
denotarem per x = 7 i cal distingir que aquest s un parmetre mostral ja que lhem
calculat amb les dades obtingudes en lenquesta dels individus de la mostra.
Hem decidit fer una estimaci mitjanant intervals, treballant amb un nivell de
confiana del 95%.
Per la qual cosa necessitem aplicar la frmula segent, per tractar-se de lestimaci
del parmetre mitjana poblacional coneguda la seva desviaci tpica (=3)
Cal insistir en que aquesta desviaci s un parmetre poblacional que ja el coneixem
per treballs anteriors i no obtingut a partir de les dades de lenquesta de la mostra.
x z
,x+z
Pg 1
Podem observar que coneixem tots els valors a substituir llevat del valor z
calcular-lo comenarem per deduir fcilment el valor de 1
. Per
1 = 0,95 = 0,05
= 0,025 1 = 0,975
2
2
x z
,x+z
3
3
= (5.824 , 8.176 )
7
1
,
96
,
7
1
,
96
=
n
25
25
Podem concloure que amb una probabilitat del 95%, la mitjana del nombre de hores
de son diries dels alumnes de la Universitat est dins daquest interval.
Donat que lamplitud de linterval es 8.176 5.824 = 2,352 hores, lerrada en la nostra
b a 2,352
estimaci es de E =
=
= 1,176
2
2
Si aquesta errada la considerem excessiva, podem comprovar la diferncia si la nostra
mostra augmentara a 30 individus. Suposarem que el valor de la mitjana mostral
hagus estat la mateixa x = 7.
x z
,x+z
3
3
= (5.926 , 8.074 )
= 7 1,96
, 7 + 1,96
n
30
30
Pg 2
1 = 0,9 = 0,1
= 0,05 1
= 0,95
x z
, x+z
3
3
7 1,65
= (6.01 , 7,99)
=
,
7
+
1
,
65
n
25
25
t n 1
S n 1
n
, x+
t n 1
S n 1
Exemple 2
Volem confirmar el funcionament duna mquina envasadora de fruita en almvar ,
per comprovar que la capacitat dels pots envasats de 1 Kg sajusta a letiquetatge i la
normativa. Per portar a terme el treball vam seleccionar 20 pots triats aleatriament i
vam calcular la mitjana aritmtica dels pesos que es x =995g i la seva desviaci tpica
S=5g.
Volem estimar el pes mitj dels pots envasats, per la quals cosa utilitzarem el interval
per a la mitjana poblacional, per desconeguem el valor de la desviaci tpica de la
poblaci.
Tamb cal considerar que el grandria de la mostra, n=20, es inferior a 30 i no podem
estimar aquesta desviaci a partir del valor de la quasidesviaci tpica mostral S n 1 .
n 1
2
S n 1
S
, x + t n1 n1
1
n
n
2
Pg 3
n
S=
n1
20
5 = 5,130
19
1 = 0,99 = 0,01
ja que
= 0,005 1
= 0,995
t n 1 = 0,995 t 19 = 2.861
t n 1
S n 1
n
1 2
(991.718 , 998.282)
, x+
t n 1
S n 1
Aquest interval ens indica que la mquina no est ben ajustada, ja que el valor de
1Kg=1000g no est dintre de linterval. La conclusi que podrem extraure s que la
mitjana del pes dels pots envasats, t un 99% de probabilitat de ser lleugerament
inferior a 1Kg.
Podem comentar que si la mostra fora de 100 pots i els valors de la mitjana i desviaci
tpica coincidiren amb els anteriors, podrem haver aplicat la formula de lapartat
anterior. Ja hem indicat que si la mostra es de grandria igual o major que 30, la
quasidesviaci tpica mostral S n 1 , pot considerar-se una bona estimaci de la
desviaci tpica poblacional .
Aix podem veure que els resultats canviarien un poc. Apliquem-la
Pg 4
x z
,x+z
1
n
2
(993,679 , 996.321)
5,130
5,130
=
= 995 2,576
, 995 + 2,576
n
100
100
Podem veure que els resultats varien una mica per hem arribat a la mateixa
conclusi.
Us convidem a comprovar que en el primer cas i amb una mostra de 20 pots
arribarem a la mateixa conclusi si treballem amb el 95% de nivell de confiana, ja
que al disminuir aquest, linterval disminueix la seva amplitud i els valors de la
mitjana queden encara ms allunyats del valor de 1000g.
En aquest cas, donat que 1- = 0,95, cal consultar a les taules aquest valor de la
variable T de Student , t n 1 = 0, 975 t 19 = 2.093 i amb la resta de les dades conegudes
1
sobt linterval:
t n 1
S n 1
n
1 2
(992.599, 997.401)
, x+
t n 1
S n 1
p(1 p)
p(1 p)
p p z
,p + z
1
1
n
n
2
2
Exemple 3
Per estudiar la proporci de persones interessades en adquirir cert producte nou que
es va llanar al mercat, es fa un estudi passant una enquesta a 100 persones, de les
quals 87 han respost afirmativament. Calculem un interval de confiana per a la
quota de mercat de la poblaci amb un nivell de significaci del 1%, si suposem que
els individus que han donat resposta a lenquesta sn una mostra representativa de
la poblaci.
Entenem que la quota de mercat a estimar s la proporci de individus de la poblaci
p que estaran interessats en adquirir el nou producte, per la qual cosa utilitzarem la
formula anterior.
Per obtenir linterval plantejat hem utilitzat una mostra de grandria n = 100 i a partir
Pg 5
p=
87
= 0,87
100
Com que el plantejament s treballar amb un nivell de significaci del 1%, aix
implica que = 0,01
= 0,005 1
p(1 p)
p(1 p)
0,87 0,13
0,87 0,13
, p+z
= 0,87 2,58
, 0,87 + 2,58
p p z
1
1
n
n
100
100
2
2
(0.783 , 0.958)
Es a dir, amb un nivell de confiana del 99% podem estimar que la proporci de la
poblaci que estar interessada en adquirir el nou producte est entre el 78,3% i el
95,8%.
INTERVAL PER A LA VARINCIA DUNA POBLACI NORMAL
(n 1)S 2
(
n 1)S n2 1
n1
,
2
2 n1
n1
1
2
2
Exemple 4
En aquest cas aprofundirem en lexemple 2 dels apartats anteriors, i farem una
estimaci de la varincia dels pesos de la maquina envasadora de pots de fruita.
Per a tal fi, considerarem els mateixos valors mostrals: el grandria de la mostra n=
20, la mitjana aritmtica dels pesos que es x =995g i la seva desviaci tpica S=5g.
Estimarem un interval per a la varincia 2 amb un nivell de confiana del 95%, per a
la qual cosa utilitzarem la frmula dabans.
Necessitem calcular la quasivarincia de la mostra i la podem obtenir a partir de la
varincia de la mostra:
S n2 1 =
20
n
S2 =
25 = 26,316
19
n1
Pg 6
En aquest cas el nivell de confiana escollit es del 95%, per la qual cosa 1- = 0,95 i
1 = 0,95 = 0,05
aix
= 0,025 1
= 0,975
ser la variable simtrica obtenim dos valors diferents en valor absolut per a cada
probabilitat.
En el nostre cas obtenim
0 , 975
2 19 = 32,8523 i per a
0 , 025
2 19 = 8,90652 si ara
1 n 1
n 1
2
2
Per poder comparar aquest parmetre amb el valor mostral de lenunciat, podem
calcular linterval per estimar la desviaci tpica dels pesos dels pots, tan sols
calculant larrel quadrada dels extrems de linterval anterior.
podrem estimar linterval corresponent als valors del seus quocients. Aquesta
circumstncia ens permetr estimar quin es major i fins a quin punt s significativa la
diferncia o no.
Per el que respecta a la notaci, hem utilitzat el subndex X per als valors mostrals i
poblacionals duna de les poblacions a considerar i el subndex Y per a laltra;
Cal observar que en alguns casos les dades de les dues poblacions, estaran referits a
la mateixa variable a estudiar i volem extraure conclusions de la magnitud de les
diferncies o no en el valor dels parmetres a comparar. Per exemple, si volem
estimar si les qualificacions mitjanes de lassignatura dEstadstica del grup del mat i
del grup de la vesprada sn significativament diferents, podrem denotar per x la
nota mitjana dels alumnes del mat que hem seleccionat aleatriament per a la mostra
i per S 2x la varincia daquestes dades. Denotarem per y i per S 2Y els mateixos
parmetres referits a les qualificacions dels estudiants triats al grup de la vesprada.
Es clar que les dades a treballar corresponen, igualment a la variable Qualificacions
en la assignatura de Estadstica.
En altres casos, voldrem comparar les diferncies en els parmetres de dues variables
amb les dades extretes dels individus duna mateixa poblaci. Per exemple podrem
estudiar si hi ha mes dispersi en les dades de lalada o en les del pes dels neonats
dun hospital. En aquest cas, podrem parlar de la comparaci de varincies de la
variable X que seria el pes i la variable Y que seria lalcada de cada nen.
Si seguim amb el tema de la notaci, mantenim el parallelisme amb els valors de les
mitjanes x , y per a cadascuna de les poblacions i els smbols x2 , Y2 per a denotar
les varincies.
En el cas duna poblaci Bernoulli, denotem per p X , p Y les proporcions obtingudes a
partir dels valors de les mostres i per px , py les proporcions poblacionals a estimar
de les poblacions respectives.
En quant a les notacions dels valors de les variables, totes coincideixen amb els de
lapartat anterior, llevat de la variable F de Snedecor amb n-1 i m-1 graus de llibertat
que denotarem per f (n 1),(m 1 ) . Cal recordar que lordre daquests subndex no es
commutatiu.
La resta daspectes son iguals als tractats a lapartat anterior, i anirem comentant-los
mitjanant els exemples de cada cas.
s important ressaltar en aquests casos que ara estudiem, una certa particularitat a
lhora de interpretar els resultats de linterval trobat i ens referirem amb ms
profunditat en cadascun dels casos; pot ser seria adient fixar-se en el cas del quocient
de varincies per la diferncia amb la resta dels intervals en aquests aspecte.
Pg 8
x y x y z
x2
n
Y2
m
,x y + z
x2
n
Y2
m
Exemple 5
Volem comparar la eficincia de dues empreses de missatgeria internacional, atenent
al temps que tardem en rebre les seves remeses. Sabem que el nmero dhores que
tarden en arribar els enviaments de lempresa A segueix una distribuci normal de la
qual coneixem la seva desviaci tpica de 25 hores, i els de lempresa B tamb segueix
una distribuci normal amb desviaci tpica de 30 hores.
Per estudiar la situaci, anotem en 10 enviaments de lempresa A, un temps mitj de
80 hores, mentre que en la mostra dels 15 enviaments de lempresa B el temps mitj
s de 75 hores.
Estimarem amb un interval al 99% de nivell de confiana, quina empresa t una
mitjana inferior utilitzant la formula que hem presentat anteriorment:
x2 Y2
x2 Y2
x y x y z
,x y + z
+
+
1
1
n
m
n
m
2
2
Pg 9
1 = 0,99 = 0,01
= 0,005 1
= 0,995
x y x y z
x2
Y2
,x y + z
x2
Y2
=
m
625 900
625 900
80 75 2,576
= ( 23.511 , 33.511)
+
+
+
,
80
75
2
,
576
10
15
10
15
En tots els intervals que ens plantegem la diferncia de parmetres cal considerar tres
possibilitats per interpretar la soluci. Considerem que linterval soluci s
x y (a, b )
En els dos casos darrers els valors dels intervals ens donaran una idea aproximada
dels valors al voltant dels quals oscilla la diferncia entre els parmetres.
Pg 10
En el cas del nostre exemple, com el valor 0 est dintre de linterval soluci,
estimarem que la diferncia de 5 hores que hi ha entre les mitjanes mostrals, no es
significativa com per a estimar que el temps mitj dels enviaments s menor en una u
altra empresa, i estimarem que ambdues sn igualment eficaces.
INTERVAL PER A LA DIFERNCIA DE MITJANES DE POBLACIONS
INDEPENDENTS AMB VARIANCES POBLACIONALS DESCONEGUDES
PERO IGUALS.
x y x y
t n+m 2
(n 1)S 2x
+ (m 1)S 2Ym 1
n 1
n+m2
x y+
t n+m 2
1 1
+ ,
n m
(n 1)S 2x
n 1
+ (m 1)S 2Ym 1
n+m2
1 1
+
n m
Exemple 6
Aplicarem aquesta frmula quan no coneixem les varincies poblacionals x2 ni Y2 ,
per podem afirmar que sn iguals. Si no fos el cas, podem fer un interval per estimar
la igualtat entre les dues varincies com es veur un poc ms endavant en aquest
mateix apartat i si la interpretaci ens permet estimar que sn iguals continuarem
calculant aquesta diferncia de mitjanes.
En una mesura de control de qualitat en la fabricaci dunes peces, volem comparar
si dos processos de producci sn equivalents i mantenen en el seu procs els
mateixos estndards de qualitat. Considerarem que les varincies de les dues
poblacions son iguals.
Per a realitzar el nostre treball, agafem unes quantes peces de cada lnia i les
classifiquem amb lajut dun ndex de qualitat que resumeix la informaci de diversos
indicadors. Les dades de les mostres figuren en la segent taula:
Lnea X 10 9 7
12
9 10 6
Lnea Y 12 8 5 11
10 13 7 12 9 8 13
Pg 11
un nivell de confiana del 95%, tenim que 1- = 0,95 i a partir daix el valor de 1
1 = 0,95 = 0,05
= 0,025 1
= 0,975
x y x y
t n+m 2
2
(n 1)S 2x
n 1
+ (m 1)S 2Ym 1
n+m2
x y+
t n+m 2
1 1
+ ,
n m
(n 1)S 2x
n 1
+ (m 1)S 2Ym 1
n+m2
1 1
=
+
n m
9 6,77 + 11 6,39 1
1
7,9 9,75 2,086
,
+
20
10 12
9 6,77 + 11 6,39 1
1
+
20
10 12
= ( 4.138 , 0.438 )
Podem concloure que com el 0 est dintre daquest interval la diferncia entre les
mitjanes no s significativa i que les dues lnies de producci tenen un nivell de
qualitat semblant, la qual cosa podem afirmar amb un nivell de confiana del 95% .
INTERVAL PER A LA DIFERNCIA DE MITJANES DE DUES POBLACIONS
AMB MOSTRES RELACIONADES
Per a aquest cas cal definir prviament la variable D=X-Y i denotarem per SD la seva
desviaci tpica mostral on di=xi-yi . El grandria de les dues mostres necessriament
coincideix i el denotarem per n.
Pg 12
S 2D n 1
S 2D n 1
x y x y t n 1
, x y+ t n 1
1
1
n
n
2
2
Exemple 7
Per millorar el grau de satisfacci dels clients del banc A shan plantejat eliminar la
major part de les comissions que cobraven als seus clients per alguns serveis. Per
avaluar leficcia de dit plantejament, sha passat a 8 clients una enquesta dissenyada
per esbrinar el grau mitj de satisfacci abans i desprs de leliminaci de les
comissions en una escala de 0 a 3. Els resultats es detallen a la taula que presentem a
continuaci
Abans
1,2
1,3
1,5
1,4
1,7
1,9
1,4
1,2
Desprs
1,4
1,7
1,5
1,3
2,1
1,7
1,6
1,2
1,3
1,5 1,4
1,7
1,9
1,4
1,2
1,4
1,7
1,5 1,3
2,1
1,7
1,6
D=XY
-0,2 -0,4
Amb la calculadora, esbrinem els valors segents de les mostres de les variables X, Y
n = 8, x = 1,45, y = 1,6625 i amb les dades de la variable D, calculem S 2Dn1 = 0,0327
Com que treballem amb un nivell de confiana del 95%
1 = 0,95 = 0,05
= 0,025 1
= 0,975
Pg 13
S 2D n 1
S 2D n 1
, x y+ t n 1
x y x y t n 1
=
1
1
n
n
2
2
0,0327
0,0327
1,45 1,6625 2,3646
= ( 0,3637,0,0613 )
,1,45 1,6625 + 2,3646
8
8
Com que els dos valors dels extrems de linterval son negatius podem inferir que
x y < 0 x < y per la qual cosa interpretarem que la mitjana de les
enquestes de satisfacci s ms gran en les que han estat realitzades desprs de la
mesura establerta per satisfer als clients. Podem estimar que la mesura de eliminar
comissions s ha aconseguit els objectius per al que havia estat dissenyada.
INTERVAL PER A LA DIFERNCIA
POBLACIONS BERNOULLI
DE
PROPORCIONS
DE
DUES
p x (1 p x ) p Y (1 p Y )
p x (1 p x ) p Y (1 p Y )
+
+
p x p y p x p y z
, px py + z
1
1
n
m
n
m
2
2
Exemple 8
Realitzant un control de qualitat en la maquinria duna empresa, volem conixer si
les dues mquines que tenim sn igualment eficient, considerant la proporci de
peces defectuoses que ixen de cadascuna delles en el seu procs delaboraci. Per a
portar a terme el nostre treball seleccionem aleatriament una mostra de 200 peces de
la mquina A, de les quals 15 eren defectuoses i 250 peces de la mquina B de les
quals han eixit 16 defectuoses.
Si volem treballar amb un nivell de confiana del 95%, calcularem el interval anterior
amb les dades del nostre problema:
En primer lloc calculem les dades que necessitem de la mostra de la mquina A
n = 200
pX =
15
= 0,075
200
Pg 14
pY =
m = 250
16
= 0,064
250
Com que treballarem amb un nivell de confiana del 95%, podem calcular el valor de
= 0,025 1
= 0,975
p x (1 p x ) p Y (1 p Y )
p x (1 p x ) p Y (1 p Y )
=
+
+
p x p y p x p y z
, px py + z
1
1
n
m
n
m
2
2
0
,
064
+
1
,
96
+
200
250
200
250
( 0.036 , 0.058)
La conclusi que podem extraure daquest interval s que treballant amb un nivell de
confiana del 95%, es que la diferncia entre les proporcions mostrals que hem
obtingut no s significativa, i podem estimar que la proporci de peces defectuoses
en la producci de les dues mquines es la mateixa. Aquesta afirmaci la basem en
que el valor 0 est dintre de linterval, ja que per tractar-se duna diferncia t les
mateixes conclusions que els casos abans treballats de la diferncia de mitjanes.
INTERVAL PER AL QUOCIENT
POBLACIONS NORMALS.
DE
DUES
2
S X2
2X S X
1
, 2
Y2 SY2
f ( n1),( m 1) SY
1
2
n 1
n 1
n 1
n 1
VARIANCES
DE
DUES
f ( n1),( m1)
Exemple 9
Per estudiar aquest interval, prendrem com exemple les dades de lexemple 6, on per
compara les mitjanes de dues poblacions havem utilitzat les dues mostres que
presentem a continuaci. Recordem que en aquell apartat ja vam comentar que es
tractava de dues mostres on necessitaven pressuposar que les dues poblacions tenien
les varincies iguals. Si no ho coneixem a priori per treballs anteriors aquesta
Pg 15
12
9 10 6
Lnea Y 12 8 5 11
10 13 7 12 9 8 13
1 = 0,95 = 0,05
= 0,025 1
= 0,975
= 0,025 i 1
Aix, a les taules o amb un programa estadstic trobem el valor del percentil
f (n 1 ),( m 1 ) = 0 , 975 f 9 ,11 = 3,5879 i per calcular laltre valor farem us de la propietat
1
Pg 16
segent
0 , 025 9 ,11
f (n 1),(m 1 ) =
1
f (m1 ),(n1 )
que
aplicada
al
nostre
cas
seria
1
1
=
=
= 0,255619
3,91207
0 , 975 f 11, 9
6,77
S X2
2X S X
1
1
1
6,77
1
,
,
=
=
2
2
2
Y SY
6,39 3,5879 6,39 0,255619
f ( n 1),( m 1) SY
f ( n 1),( m1)
1
2
2
1
6,77
6,77
,
3,91207 = (0,2953, 4,1447 )
6,39 3,5879 6,39
n 1
n 1
n 1
n 1
Aquests valors dels extrems de linterval ens permeten inferir que les varincies de
les poblacions de les quals provenen les mostres son iguals, es a dir, els diferents
productes de cadascuna de les lnies de fabricaci que comparem, presenten el mateix
comportament respecte a la dispersi dels valors de qualitat respecte a la mitjana de
cadascuna delles.
Aquesta inferncia est basada en el fet que el valor 1 s dintre de linterval calculat,
ja que com que estem comparant les varincies mitjanant la seva ratio o quocient,
els valors dels extrems ens diu que els quocients estan al voltant de la unitat, i
aquesta soluci permet inferir igualtat entre les dues mesures comparades per
divisi.
En general, quan comparem les varincies de dues poblacions mitjanant lexpressi
de linterval que hem mostrat en aquest apartat, podem arribar a tres possibles
resultats dels quals comentem a continuaci la seva interpretaci sempre tenint en
compte que es tracta de lanlisi duns quocients.
2
X
2
Y
(a , b
X2
probabilitat, per la qual cosa podrem estimar que 2 > 1 X2 > Y2
Y
Pg 17
X2
probabilitat, per la qual cosa podrem estimar que 2 < 1 X2 < Y2
Y
En els dos casos darrers els valors dels intervals ens donaran una idea aproximada
dels valors al voltant dels quals oscilla el quocient entre els parmetres.
4- ERRADA i GRANDRIA DE LA MOSTRA
Ja havem comentat a la introducci, que quan fem un treball dinferncia, hi ha tres
factors que determinen la possible soluci. Recordem-los:
Nivell de confiana
Errada de la soluci
Grandria de la mostra
Als exemples que hem treballat al llarg del desenvolupament de tema, hem vist que
el nivell de confiana expressa la probabilitat que la estimaci siga correcta;
Determina els valors que hem trobat a les taules de les funcions de distribuci de les
diferents variables treballades i es costum utilitzar valors que van del 90% al 99% i
quan ms gran lagafem, lamplitud de linterval creix.
Seria desitjable que linterval soluci fora el ms ajustat possible als valors que volem
inferir. Lexpressi que tenim de lerrada s aquesta desviaci del valor central. Aix
ba
direm que lerrada s E =
i per tant, est directament relacionada amb
2
lamplitud de linterval.
El tercer factor a considerar s la grandria de la mostra. Els resultats sn ms
exactes, quan ms gran s aquesta. Aix doncs, podrem plantejar-nos la qesti, a
linrevs per fer un treball que satisfaga les nostres necessitats.
s possible plantejar-nos una situaci aix; considerem el treball de lexemple 1, on ja
vam veure lefecte que comporta un canvi en el nivell de confiana i un canvi a la
grandria de la mostra. Estudiem ara, lerrada en la soluci del plantejament inicial
que tenem amb una mostra de 25 alumnes, treballant amb un nivell de confiana del
95%. El resultat que vam obtenir, considerant = 3 va ser
x z
, x+z
3
3
=
7
1
,
96
,
7
+
1
,
96
= (5.824 , 8.176)
n
25
25
Pg 18
Podem concloure que amb una probabilitat del 95%, la mitjana del nombre de hores
de son diries dels alumnes de la Universitat est dintre daquest interval.
Donat que lamplitud de linterval es 8.176 5.824 = 2,352 hores, lerrada en la nostra
b a 2,352
estimaci es de E =
=
= 1,176
2
2
Si nosaltres volem acotar aquesta errada i que siga de 0,5 hores, podrem esbrinar, a
piori la grandria de la mostra amb el que deguem treballar i aix conixer el
nombre de individus que cal fer lenquesta. Aix,
x+ z
x z
2z
1
1
1
n
n
n
3
ba
2
2
2
=
=z
= 1,96
= 0,5
E=
=
1
2
2
2
n
n
2
1,96 3
= 11,76 n = 11,76 2 = 138,30 ,es a dir,
0,5
amb 139 individus podem extraure linterval amb lerrada que ens havem plantejat.
Don podem allar el valor de n,
n=
Pg 19