Tema3Hoja7 Intervalos Soluciones

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 19

Inferncia: Intervals de confiana

Problemes Intervals de confiana Fulla 7.


INTERVALS DE CONFIANA PER ALS PARMETRES DUNA POBLACI
INTERVAL PER A LA MITJANA DUNA POBLACI NORMAL AMB DESVIACI
TPICA POBLACIONAL CONEGUDA

x z

,x+z

Exemple 1
Volem fer un estudi del nombre dhores que dormen els estudiants de certa
Universitat.
Definim X= nombre dhores de son diries com la variable a estudiar i sabem que
aquesta es distribueix seguint un model normal de mitjana desconeguda, per per
altres treballs podem considerar que la seva desviaci tpica s coneguda i el seu
valor s 3.
Per estimar aquest valor de caldr triar una mostra; per a tal fi, farem una enquesta
a 25 alumnes triats aleatriament i desprs de preguntar-los el nombre dhores de son
de cadascun el dia de lenquesta, obtenim una mitjana de 7 hores. Aquesta dada la
denotarem per x = 7 i cal distingir que aquest s un parmetre mostral ja que lhem
calculat amb les dades obtingudes en lenquesta dels individus de la mostra.
Hem decidit fer una estimaci mitjanant intervals, treballant amb un nivell de
confiana del 95%.
Per la qual cosa necessitem aplicar la frmula segent, per tractar-se de lestimaci
del parmetre mitjana poblacional coneguda la seva desviaci tpica (=3)
Cal insistir en que aquesta desviaci s un parmetre poblacional que ja el coneixem
per treballs anteriors i no obtingut a partir de les dades de lenquesta de la mostra.

x z

,x+z

Pg 1

Inferncia: Intervals de confiana

Podem observar que coneixem tots els valors a substituir llevat del valor z
calcular-lo comenarem per deduir fcilment el valor de 1

. Per

ja que com hem dit


2
abans, 1- s el nivell de confiana que establim a priori per fer el treball

1 = 0,95 = 0,05

= 0,025 1 = 0,975
2
2

i en la taula de la distribuci acumulada de la variable normal tipificada, busquem el


valor de la variable x tal que P(Z x) = 0.975 . s en realitat, el valor dun percentil,
que podem obtenir de la taula de la funci de distribuci de la variable normal
tipificada. Aquest valor es x = 1.96 per la qual cosa, utilitzant la notaci en aquest
tema z =1,96 o tamb z 0, 975 =1,96
1

I ara, substituirem tots el valors en la formula per obtenir linterval

x z

,x+z

3
3
= (5.824 , 8.176 )

7
1
,
96
,
7
1
,
96
=

n
25
25

Podem concloure que amb una probabilitat del 95%, la mitjana del nombre de hores
de son diries dels alumnes de la Universitat est dins daquest interval.
Donat que lamplitud de linterval es 8.176 5.824 = 2,352 hores, lerrada en la nostra
b a 2,352
estimaci es de E =
=
= 1,176
2
2
Si aquesta errada la considerem excessiva, podem comprovar la diferncia si la nostra
mostra augmentara a 30 individus. Suposarem que el valor de la mitjana mostral
hagus estat la mateixa x = 7.

x z

,x+z

3
3
= (5.926 , 8.074 )
= 7 1,96
, 7 + 1,96

n
30
30

Tamb podem observar lefecte que es produeix en lamplitud de linterval si


rebaixem el nivell de confiana al 90% per exemple, i mantenim la grandria de la
mostra en n=25 per contrastar lefecte daquest darrer canvi.
En aquests cas caldr tornar a buscar a les taules el valor de z

Pg 2

Inferncia: Intervals de confiana

1 = 0,9 = 0,1

= 0,05 1

= 0,95

Aix buscarem a la taula de la distribuci acumulada de la variable normal tipificada


aquesta probabilitat i obtenim z = 1,65, la qual cosa ens dona linterval:
1

x z

, x+z

3
3
7 1,65
= (6.01 , 7,99)
=
,
7
+
1
,
65
n
25
25

Com es pot observar aquest interval es ms menut i la resposta es ms ajustada, per


les conclusions han perdut nivell de confiana.
NOTA
Si la grandria de la mostra n es major o igual a 30, podem utilitzar la frmula
daquest apartat, considerant que la desviaci tpica poblacional , encara que fos
desconeguda, coincideix amb el valor de la quasidesviaci tpica de la mostra Sn-1.
INTERVAL PER A LA MITJANA DUNA POBLACI NORMAL AMB DESVIACI
TPICA POBLACIONAL DESCONEGUDA

t n 1

S n 1
n

, x+

t n 1

S n 1

Exemple 2
Volem confirmar el funcionament duna mquina envasadora de fruita en almvar ,
per comprovar que la capacitat dels pots envasats de 1 Kg sajusta a letiquetatge i la
normativa. Per portar a terme el treball vam seleccionar 20 pots triats aleatriament i
vam calcular la mitjana aritmtica dels pesos que es x =995g i la seva desviaci tpica
S=5g.
Volem estimar el pes mitj dels pots envasats, per la quals cosa utilitzarem el interval
per a la mitjana poblacional, per desconeguem el valor de la desviaci tpica de la
poblaci.
Tamb cal considerar que el grandria de la mostra, n=20, es inferior a 30 i no podem
estimar aquesta desviaci a partir del valor de la quasidesviaci tpica mostral S n 1 .

n 1
2

S n 1
S
, x + t n1 n1
1
n
n
2

Pg 3

Inferncia: Intervals de confiana

Treballarem amb 99% de nivell de confiana en les nostres estimacions.


Com podem veure, cal calcular la quasidesviaci tpica S n 1 , a partir del valor que
coneguem de S= 5 i n=20.
S n 1 =

n
S=
n1

20
5 = 5,130
19

Tamb cal esbrinar el valor de

t n 1 a la taula de la variable T de Student o amb lajut

dalgun programa. En primer lloc, calcularem el valor de 1

1 = 0,99 = 0,01

ja que

= 0,005 1

= 0,995

i en la taula de la distribuci acumulada de la variable T de Student amb 19 graus de


llibertat, busquem el valor de la variable x tal que P(t 19 x) = 0.995 . Aquest valor es
x = 2,861 per la qual cosa, utilitzant la notaci en aquest tema

t n 1 = 0,995 t 19 = 2.861

I substitum aquests valors en la frmula per obtenir:

t n 1

S n 1

n
1 2
(991.718 , 998.282)

, x+

t n 1

S n 1

= 995 2,861 5,130 , 995 + 2,861 5,130 =


n
20
20

Aquest interval ens indica que la mquina no est ben ajustada, ja que el valor de
1Kg=1000g no est dintre de linterval. La conclusi que podrem extraure s que la
mitjana del pes dels pots envasats, t un 99% de probabilitat de ser lleugerament
inferior a 1Kg.
Podem comentar que si la mostra fora de 100 pots i els valors de la mitjana i desviaci
tpica coincidiren amb els anteriors, podrem haver aplicat la formula de lapartat
anterior. Ja hem indicat que si la mostra es de grandria igual o major que 30, la
quasidesviaci tpica mostral S n 1 , pot considerar-se una bona estimaci de la
desviaci tpica poblacional .
Aix podem veure que els resultats canviarien un poc. Apliquem-la

Pg 4

Inferncia: Intervals de confiana

x z

,x+z

1
n
2

(993,679 , 996.321)

5,130
5,130
=
= 995 2,576
, 995 + 2,576

n
100
100

Podem veure que els resultats varien una mica per hem arribat a la mateixa
conclusi.
Us convidem a comprovar que en el primer cas i amb una mostra de 20 pots
arribarem a la mateixa conclusi si treballem amb el 95% de nivell de confiana, ja
que al disminuir aquest, linterval disminueix la seva amplitud i els valors de la
mitjana queden encara ms allunyats del valor de 1000g.
En aquest cas, donat que 1- = 0,95, cal consultar a les taules aquest valor de la
variable T de Student , t n 1 = 0, 975 t 19 = 2.093 i amb la resta de les dades conegudes
1

sobt linterval:

t n 1

S n 1

n
1 2
(992.599, 997.401)

, x+

t n 1

S n 1

= 995 2,093 5,130 , 995 + 2,093 5,130 =


n
20
20

per la qual cosa la nostra conclusi no canvia.


INTERVAL PER A LA PROPORCI DUNA POBLACI BERNOULLI

p(1 p)
p(1 p)
p p z
,p + z

1
1
n
n
2
2

Exemple 3
Per estudiar la proporci de persones interessades en adquirir cert producte nou que
es va llanar al mercat, es fa un estudi passant una enquesta a 100 persones, de les
quals 87 han respost afirmativament. Calculem un interval de confiana per a la
quota de mercat de la poblaci amb un nivell de significaci del 1%, si suposem que
els individus que han donat resposta a lenquesta sn una mostra representativa de
la poblaci.
Entenem que la quota de mercat a estimar s la proporci de individus de la poblaci
p que estaran interessats en adquirir el nou producte, per la qual cosa utilitzarem la
formula anterior.
Per obtenir linterval plantejat hem utilitzat una mostra de grandria n = 100 i a partir
Pg 5

Inferncia: Intervals de confiana

de les seves respostes, podem calcular la proporci en la mostra

p=

87
= 0,87
100

Com que el plantejament s treballar amb un nivell de significaci del 1%, aix
implica que = 0,01

= 0,995 per la qual cosa caldr


2
2
obtenir de la taula de la distribuci acumulada de la normal tipificada el valor
z = 2,58 que substituirem a la frmula anterior:
1

= 0,005 1

p(1 p)
p(1 p)
0,87 0,13
0,87 0,13
, p+z
= 0,87 2,58
, 0,87 + 2,58
p p z

1
1
n
n
100
100
2
2


(0.783 , 0.958)

Es a dir, amb un nivell de confiana del 99% podem estimar que la proporci de la
poblaci que estar interessada en adquirir el nou producte est entre el 78,3% i el
95,8%.
INTERVAL PER A LA VARINCIA DUNA POBLACI NORMAL

(n 1)S 2
(
n 1)S n2 1
n1


,
2

2 n1

n1
1

2
2

Exemple 4
En aquest cas aprofundirem en lexemple 2 dels apartats anteriors, i farem una
estimaci de la varincia dels pesos de la maquina envasadora de pots de fruita.
Per a tal fi, considerarem els mateixos valors mostrals: el grandria de la mostra n=
20, la mitjana aritmtica dels pesos que es x =995g i la seva desviaci tpica S=5g.
Estimarem un interval per a la varincia 2 amb un nivell de confiana del 95%, per a
la qual cosa utilitzarem la frmula dabans.
Necessitem calcular la quasivarincia de la mostra i la podem obtenir a partir de la
varincia de la mostra:

S n2 1 =

20
n
S2 =
25 = 26,316
19
n1

Pg 6

Inferncia: Intervals de confiana

En aquest cas el nivell de confiana escollit es del 95%, per la qual cosa 1- = 0,95 i

1 = 0,95 = 0,05

aix

= 0,025 1

= 0,975

i en la taula de la distribuci acumulada de la variable Chi-quadrat amb 19 graus de


llibertat, busquem els valors de 2 n 1 = 0,975 2 19 i de 2 n 1 = 0,025 2 19 ja que al no
1

ser la variable simtrica obtenim dos valors diferents en valor absolut per a cada
probabilitat.
En el nostre cas obtenim

0 , 975

2 19 = 32,8523 i per a

0 , 025

2 19 = 8,90652 si ara

substitum tots aquests valors en la formula de linterval obtenim

(n 1)S 2 (n 1)S 2 19 26,316 19 26,316


n 1
n 1
,
,

= (15.220 , 56.139 )
=
2
2
,
,
32
8523
8
90652

1 n 1

n 1
2
2

Per poder comparar aquest parmetre amb el valor mostral de lenunciat, podem
calcular linterval per estimar la desviaci tpica dels pesos dels pots, tan sols
calculant larrel quadrada dels extrems de linterval anterior.

15.220 , 56.139 = (3.901 , 7.492)


Aix podem estimar amb un nivell de confiana del 95% que la desviaci tpica dels
pesos envasats en la mquina te un valor que est dintre del darrer interval que hem
trobat.
INTERVALS DE CONFIANA PER ALS PARMETRES DE DUES POBLACIONS
Fins ara, hem abordat estimacions dels parmetres duna poblaci i hem pogut
calcular intervals dintre dels quals es troba el valor del parmetre a estimar (mitjana,
proporci, varincia) amb una probabilitat que anomenem nivell de confiana i que
pren valors, generalment, per damunt del 90%.
En aquest apartat, anem a comparar els parmetres de dues poblacions; per a portar
a terme el treball, necessitem les dades de dues mostres diferents, extretes cadascuna
de les respectives poblacions, ja que volem inferir conclusions al respecte dels valors
dels seus parmetres poblacionals.
Cal detallar que en aquestos casos no podrem estimar els valors dels parmetres de
les poblacions, si ms be podem comparar-los i concloure quin dels dos s major i en
quina mesura. Es a dir, podrem comparar-los i estimar el interval en el que es mouen
els valors de la seva diferncia, i en els cas concret de la comparaci de varincies,
Pg 7

Inferncia: Intervals de confiana

podrem estimar linterval corresponent als valors del seus quocients. Aquesta
circumstncia ens permetr estimar quin es major i fins a quin punt s significativa la
diferncia o no.
Per el que respecta a la notaci, hem utilitzat el subndex X per als valors mostrals i
poblacionals duna de les poblacions a considerar i el subndex Y per a laltra;
Cal observar que en alguns casos les dades de les dues poblacions, estaran referits a
la mateixa variable a estudiar i volem extraure conclusions de la magnitud de les
diferncies o no en el valor dels parmetres a comparar. Per exemple, si volem
estimar si les qualificacions mitjanes de lassignatura dEstadstica del grup del mat i
del grup de la vesprada sn significativament diferents, podrem denotar per x la
nota mitjana dels alumnes del mat que hem seleccionat aleatriament per a la mostra
i per S 2x la varincia daquestes dades. Denotarem per y i per S 2Y els mateixos
parmetres referits a les qualificacions dels estudiants triats al grup de la vesprada.
Es clar que les dades a treballar corresponen, igualment a la variable Qualificacions
en la assignatura de Estadstica.
En altres casos, voldrem comparar les diferncies en els parmetres de dues variables
amb les dades extretes dels individus duna mateixa poblaci. Per exemple podrem
estudiar si hi ha mes dispersi en les dades de lalada o en les del pes dels neonats
dun hospital. En aquest cas, podrem parlar de la comparaci de varincies de la
variable X que seria el pes i la variable Y que seria lalcada de cada nen.
Si seguim amb el tema de la notaci, mantenim el parallelisme amb els valors de les
mitjanes x , y per a cadascuna de les poblacions i els smbols x2 , Y2 per a denotar
les varincies.
En el cas duna poblaci Bernoulli, denotem per p X , p Y les proporcions obtingudes a
partir dels valors de les mostres i per px , py les proporcions poblacionals a estimar
de les poblacions respectives.
En quant a les notacions dels valors de les variables, totes coincideixen amb els de
lapartat anterior, llevat de la variable F de Snedecor amb n-1 i m-1 graus de llibertat
que denotarem per f (n 1),(m 1 ) . Cal recordar que lordre daquests subndex no es
commutatiu.
La resta daspectes son iguals als tractats a lapartat anterior, i anirem comentant-los
mitjanant els exemples de cada cas.
s important ressaltar en aquests casos que ara estudiem, una certa particularitat a
lhora de interpretar els resultats de linterval trobat i ens referirem amb ms
profunditat en cadascun dels casos; pot ser seria adient fixar-se en el cas del quocient
de varincies per la diferncia amb la resta dels intervals en aquests aspecte.
Pg 8

Inferncia: Intervals de confiana

INTERVALS PER A LA DIFERNCIA DE MITJANES


Per comentar, abordarem el cas de la diferencia de mitjanes i caldr saber si estem
amb el cas de mostres independents de dues poblacions (alumnes de dos grups
diferents, treballadors de dos seccions diferents, homes versus dones per estudiar
algun comportament lligat o no amb el gnere, etc.) o si es tracta de mostres
relacionades o aparellades (si estudiem el desgast en la roda dreta i esquerra dun
vehicle, la duraci dun material de sola dun calcer esportiu per al qual sha
dissenyat un model, proporcionant a cada individu, una sabata de cada peu amb
cada material, les mesures de la pressi arterial preses en cada malalt abans i desprs
de seguir un tractament farmacolgic, etc.)
En el primer cas, amb les mostres independents, no s necessari que el grandria de
les dues mostres coincideixca, per en el cas de les mostres aparellades, es obvi que el
nombre de les dues mostres s el mateix, ja que a cada individu, li anotem un par
dobservacions que ens permetr definir una nova variable a treballar, D, que
calcularem amb la diferncia de les dues observacions de cada element del qual
obtenim les dades, aix di = xi - yi .
INTERVAL PER A LA DIFERNCIA DE MITJANES DE POBLACIONS
INDEPENDENTS AMB VARIANCES POBLACIONALS CONEGUDES

x y x y z

x2
n

Y2
m

,x y + z

x2
n

Y2
m

Exemple 5
Volem comparar la eficincia de dues empreses de missatgeria internacional, atenent
al temps que tardem en rebre les seves remeses. Sabem que el nmero dhores que
tarden en arribar els enviaments de lempresa A segueix una distribuci normal de la
qual coneixem la seva desviaci tpica de 25 hores, i els de lempresa B tamb segueix
una distribuci normal amb desviaci tpica de 30 hores.
Per estudiar la situaci, anotem en 10 enviaments de lempresa A, un temps mitj de
80 hores, mentre que en la mostra dels 15 enviaments de lempresa B el temps mitj
s de 75 hores.
Estimarem amb un interval al 99% de nivell de confiana, quina empresa t una
mitjana inferior utilitzant la formula que hem presentat anteriorment:

x2 Y2
x2 Y2

x y x y z
,x y + z
+
+

1
1
n
m
n
m
2
2

Pg 9

Inferncia: Intervals de confiana

Per a la poblaci A, podem anotar el parmetre de la poblaci x2 = 252=625, i amb les


dades de la mostra n=10, x =80
Per a la poblaci B, podem anotar el parmetre de la poblaci Y2 = 302=900, i amb les
dades de la mostra m=15, y =75
Com que treballem amb un nivell de confiana del 99%, podrem calcular 1- = 0,99 i

calcularem el valor de 1 ja que


2

1 = 0,99 = 0,01

= 0,005 1

= 0,995

i en la taula de la distribuci acumulada de la variable normal tipificada, busquem el


valor de la variable x tal que P(Z x) = 0.995 . Aquest valor es x = 2,57583 per la qual
cosa, utilitzant la notaci en aquest tema z = z 0, 995 = 2,57583
1

Substitum aquestes dades en la formula i obtenim:

x y x y z

x2

Y2

,x y + z

x2

Y2

=
m

625 900
625 900
80 75 2,576
= ( 23.511 , 33.511)
+

+
+
,
80
75
2
,
576

10
15
10
15

En tots els intervals que ens plantegem la diferncia de parmetres cal considerar tres
possibilitats per interpretar la soluci. Considerem que linterval soluci s
x y (a, b )

Si 0 (a, b ) , interpretarem que la diferncia entre els parmetres no es


significativa i podrem estimar que x y

Si a > 0, i b > 0 , interpretarem que la diferncia es positiva en una alta


probabilitat, per la qual cosa podrem estimar que x y > 0 x > y

Si a < 0, i b < 0 , interpretarem que la diferncia es negativa en una alta


probabilitat, per la qual cosa podrem estimar que x y < 0 x < y

En els dos casos darrers els valors dels intervals ens donaran una idea aproximada
dels valors al voltant dels quals oscilla la diferncia entre els parmetres.

Pg 10

Inferncia: Intervals de confiana

En el cas del nostre exemple, com el valor 0 est dintre de linterval soluci,
estimarem que la diferncia de 5 hores que hi ha entre les mitjanes mostrals, no es
significativa com per a estimar que el temps mitj dels enviaments s menor en una u
altra empresa, i estimarem que ambdues sn igualment eficaces.
INTERVAL PER A LA DIFERNCIA DE MITJANES DE POBLACIONS
INDEPENDENTS AMB VARIANCES POBLACIONALS DESCONEGUDES
PERO IGUALS.

x y x y

t n+m 2

(n 1)S 2x

+ (m 1)S 2Ym 1

n 1

n+m2

x y+

t n+m 2

1 1
+ ,
n m

(n 1)S 2x

n 1

+ (m 1)S 2Ym 1

n+m2

1 1
+
n m

Exemple 6
Aplicarem aquesta frmula quan no coneixem les varincies poblacionals x2 ni Y2 ,
per podem afirmar que sn iguals. Si no fos el cas, podem fer un interval per estimar
la igualtat entre les dues varincies com es veur un poc ms endavant en aquest
mateix apartat i si la interpretaci ens permet estimar que sn iguals continuarem
calculant aquesta diferncia de mitjanes.
En una mesura de control de qualitat en la fabricaci dunes peces, volem comparar
si dos processos de producci sn equivalents i mantenen en el seu procs els
mateixos estndards de qualitat. Considerarem que les varincies de les dues
poblacions son iguals.
Per a realitzar el nostre treball, agafem unes quantes peces de cada lnia i les
classifiquem amb lajut dun ndex de qualitat que resumeix la informaci de diversos
indicadors. Les dades de les mostres figuren en la segent taula:
Lnea X 10 9 7

12

9 10 6

Lnea Y 12 8 5 11

10 13 7 12 9 8 13

Amb aquesta informaci volem estimar mitjanant un interval de confiana si la


qualitat mitjana s la mateixa en els dos processos de fabricaci. Treballarem amb un
nivell de confiana del 95%
Per portar a terme els clculs, identificarem els valors dels parmetres de cadascuna
de les mostres, ja que com diu lenunciat suposarem que x2 = Y2 .

Pg 11

Inferncia: Intervals de confiana

De la mostra de la poblaci X, anotarem n = 10, x =7,9 , S 2xn1 = 6,77


De la mostra de la poblaci Y, anotarem m = 12, y = 9,75 , S 2Yn 1 = 6,39
En les taules podrem buscar la dada que ens falta

t n + m 2 i com que treballem amb

un nivell de confiana del 95%, tenim que 1- = 0,95 i a partir daix el valor de 1

1 = 0,95 = 0,05

= 0,025 1

= 0,975

Aix, cal calcular en les taules de la distribuci acumulada de la variable T de Student


amb 20 graus de llibertat, el valor de la variable

t n + m 2 = 0, 975 t 20 = 2,086 i ara

substitum aquests valors en la frmula

x y x y

t n+m 2
2

(n 1)S 2x

n 1

+ (m 1)S 2Ym 1

n+m2
x y+

t n+m 2

1 1
+ ,
n m

(n 1)S 2x

n 1

+ (m 1)S 2Ym 1

n+m2

1 1
=
+
n m

9 6,77 + 11 6,39 1
1
7,9 9,75 2,086
,
+
20
10 12

7,9 9,75 + 2,086

9 6,77 + 11 6,39 1
1
+
20
10 12

= ( 4.138 , 0.438 )

Podem concloure que com el 0 est dintre daquest interval la diferncia entre les
mitjanes no s significativa i que les dues lnies de producci tenen un nivell de
qualitat semblant, la qual cosa podem afirmar amb un nivell de confiana del 95% .
INTERVAL PER A LA DIFERNCIA DE MITJANES DE DUES POBLACIONS
AMB MOSTRES RELACIONADES
Per a aquest cas cal definir prviament la variable D=X-Y i denotarem per SD la seva
desviaci tpica mostral on di=xi-yi . El grandria de les dues mostres necessriament
coincideix i el denotarem per n.
Pg 12

Inferncia: Intervals de confiana

S 2D n 1
S 2D n 1

x y x y t n 1
, x y+ t n 1
1
1

n
n
2
2

Exemple 7
Per millorar el grau de satisfacci dels clients del banc A shan plantejat eliminar la
major part de les comissions que cobraven als seus clients per alguns serveis. Per
avaluar leficcia de dit plantejament, sha passat a 8 clients una enquesta dissenyada
per esbrinar el grau mitj de satisfacci abans i desprs de leliminaci de les
comissions en una escala de 0 a 3. Els resultats es detallen a la taula que presentem a
continuaci

Abans

1,2

1,3

1,5

1,4

1,7

1,9

1,4

1,2

Desprs

1,4

1,7

1,5

1,3

2,1

1,7

1,6

Calculem un interval de confiana al 95% per veure si ha donat resultat la mesura


adoptada pel banc.
A tal fi necessitem calcular els valors de la variable D=X-Y, restant els valors
emparellats tal i com es veu a la segent taula:

X= valors abans de la mesura

1,2

1,3

1,5 1,4

1,7

1,9

1,4

1,2

Y= valors desprs de la mesura

1,4

1,7

1,5 1,3

2,1

1,7

1,6

D=XY

-0,2 -0,4

0,1 -0,3 -0,2 -0,3 -0,4

Amb la calculadora, esbrinem els valors segents de les mostres de les variables X, Y
n = 8, x = 1,45, y = 1,6625 i amb les dades de la variable D, calculem S 2Dn1 = 0,0327
Com que treballem amb un nivell de confiana del 95%

1 = 0,95 = 0,05

= 0,025 1

= 0,975

Pg 13

Inferncia: Intervals de confiana

Aix, cal calcular en les taules de la distribuci acumulada de la variable T de Student


t n 1 = 0 , 975 t 7 = 2.3646 . Amb la resta de les dades conegudes substitum aquests
1

valors i sobt linterval:

S 2D n 1
S 2D n 1

, x y+ t n 1
x y x y t n 1
=
1
1
n
n

2
2

0,0327
0,0327
1,45 1,6625 2,3646
= ( 0,3637,0,0613 )
,1,45 1,6625 + 2,3646

8
8

Com que els dos valors dels extrems de linterval son negatius podem inferir que
x y < 0 x < y per la qual cosa interpretarem que la mitjana de les
enquestes de satisfacci s ms gran en les que han estat realitzades desprs de la
mesura establerta per satisfer als clients. Podem estimar que la mesura de eliminar
comissions s ha aconseguit els objectius per al que havia estat dissenyada.
INTERVAL PER A LA DIFERNCIA
POBLACIONS BERNOULLI

DE

PROPORCIONS

DE

DUES

p x (1 p x ) p Y (1 p Y )
p x (1 p x ) p Y (1 p Y )

+
+
p x p y p x p y z
, px py + z

1
1
n
m
n
m
2
2

Exemple 8
Realitzant un control de qualitat en la maquinria duna empresa, volem conixer si
les dues mquines que tenim sn igualment eficient, considerant la proporci de
peces defectuoses que ixen de cadascuna delles en el seu procs delaboraci. Per a
portar a terme el nostre treball seleccionem aleatriament una mostra de 200 peces de
la mquina A, de les quals 15 eren defectuoses i 250 peces de la mquina B de les
quals han eixit 16 defectuoses.
Si volem treballar amb un nivell de confiana del 95%, calcularem el interval anterior
amb les dades del nostre problema:
En primer lloc calculem les dades que necessitem de la mostra de la mquina A
n = 200

pX =

15
= 0,075
200

i les dades de la mostra de la mquina B

Pg 14

Inferncia: Intervals de confiana

pY =

m = 250

16
= 0,064
250

Com que treballarem amb un nivell de confiana del 95%, podem calcular el valor de

ja que 1 = 0,95 = 0,05

= 0,025 1

= 0,975

i en la taula de la distribuci acumulada de la variable normal tipificada, busquem el


valor de la variable x tal que P(Z x) = 0.975 . Aquest valor es x = 1.96 per la qual
cosa z = 1,96.
1

Substitum aquestes dades a la frmula de linterval i obtenim:

p x (1 p x ) p Y (1 p Y )
p x (1 p x ) p Y (1 p Y )
=
+
+
p x p y p x p y z
, px py + z

1
1
n
m
n
m
2
2

0,075 0,925 0,064 0,936


0,075 0,925 0,064 0,936
0,075 0,064 1,96
=
+
,
0
,
075

0
,
064
+
1
,
96
+

200
250
200
250

( 0.036 , 0.058)

La conclusi que podem extraure daquest interval s que treballant amb un nivell de
confiana del 95%, es que la diferncia entre les proporcions mostrals que hem
obtingut no s significativa, i podem estimar que la proporci de peces defectuoses
en la producci de les dues mquines es la mateixa. Aquesta afirmaci la basem en
que el valor 0 est dintre de linterval, ja que per tractar-se duna diferncia t les
mateixes conclusions que els casos abans treballats de la diferncia de mitjanes.
INTERVAL PER AL QUOCIENT
POBLACIONS NORMALS.

DE

DUES

2
S X2
2X S X
1

, 2
Y2 SY2
f ( n1),( m 1) SY
1

2
n 1

n 1

n 1

n 1

VARIANCES

DE

DUES

f ( n1),( m1)

Exemple 9
Per estudiar aquest interval, prendrem com exemple les dades de lexemple 6, on per
compara les mitjanes de dues poblacions havem utilitzat les dues mostres que
presentem a continuaci. Recordem que en aquell apartat ja vam comentar que es
tractava de dues mostres on necessitaven pressuposar que les dues poblacions tenien
les varincies iguals. Si no ho coneixem a priori per treballs anteriors aquesta
Pg 15

Inferncia: Intervals de confiana

circumstncia, caldr comenar per fer el treball que presentem a continuaci en


aquest apartat i en el cas que la inferncia ens permeta estimar que sn iguals,
podrem portar a terme el treball que ja van fer al exemple 6.
Recordem que es tractava de unes quantes peces agafades de dues lnies de
producci i estaven classificades amb lajut dun ndex de qualitat que resumeix la
informaci de diversos indicadors. Les dades de les mostres figuren en la segent
taula:
Lnea X 10 9 7

12

9 10 6

Lnea Y 12 8 5 11

10 13 7 12 9 8 13

Amb aquesta informaci volem estimar mitjanant un interval de confiana si la


variabilitat en la qualitat de les dues lnies de producci s la mateixa. Entenem per
variabilitat el valor de les varincies que s la mesura de dispersi que utilitzarem
com a indicador de la dispersi, en tant que volem comprovar si els indicadors de
qualitat permeten comprovar que estan igualment propers a la seva mitjana en els
dos processos.
Per portar a terme els clculs, identificarem els valors dels parmetres de cadascuna
de les mostres,
De la mostra de la poblaci X, anotarem n = 10, x =7,9 , S 2xn1 = 6,77
De la mostra de la poblaci Y, anotarem m = 12, y = 9,75 , S 2Yn 1 = 6,39
Treballarem amb un nivell de confiana del 95%, per la qual cosa 1- = 0,95 i aix

1 = 0,95 = 0,05

= 0,025 1

= 0,975

Cal buscar en la taula de la distribuci acumulada de la variable F de Snedecor, els

= 0,025 i 1

= 0,975 . Cal comentar que si


2
2
utilitzem taules cal trobar el primer valor en funci del segon que podrem trobar a les
taules que solen publicar-se, aplicant una propietat de la funci de distribuci
daquesta variable F de Snedecor.

percentils que corresponen al valors de

Aix, a les taules o amb un programa estadstic trobem el valor del percentil
f (n 1 ),( m 1 ) = 0 , 975 f 9 ,11 = 3,5879 i per calcular laltre valor farem us de la propietat
1

Pg 16

Inferncia: Intervals de confiana

segent

0 , 025 9 ,11

f (n 1),(m 1 ) =
1

f (m1 ),(n1 )

que

aplicada

al

nostre

cas

seria

1
1
=
=
= 0,255619
3,91207
0 , 975 f 11, 9

Si substitum tots aquests valors a la expressi de linterval obtindrem com a resultat

6,77
S X2
2X S X
1
1
1
6,77
1

,
,
=

=
2
2
2
Y SY
6,39 3,5879 6,39 0,255619

f ( n 1),( m 1) SY
f ( n 1),( m1)
1

2
2
1
6,77
6,77

,
3,91207 = (0,2953, 4,1447 )
6,39 3,5879 6,39

n 1

n 1

n 1

n 1

Aquests valors dels extrems de linterval ens permeten inferir que les varincies de
les poblacions de les quals provenen les mostres son iguals, es a dir, els diferents
productes de cadascuna de les lnies de fabricaci que comparem, presenten el mateix
comportament respecte a la dispersi dels valors de qualitat respecte a la mitjana de
cadascuna delles.
Aquesta inferncia est basada en el fet que el valor 1 s dintre de linterval calculat,
ja que com que estem comparant les varincies mitjanant la seva ratio o quocient,
els valors dels extrems ens diu que els quocients estan al voltant de la unitat, i
aquesta soluci permet inferir igualtat entre les dues mesures comparades per
divisi.
En general, quan comparem les varincies de dues poblacions mitjanant lexpressi
de linterval que hem mostrat en aquest apartat, podem arribar a tres possibles
resultats dels quals comentem a continuaci la seva interpretaci sempre tenint en
compte que es tracta de lanlisi duns quocients.

Si considerem que linterval soluci s

2
X
2
Y

(a , b

Si 1 (a, b ) , interpretarem que la diferncia entre els parmetres no es


significativa i podrem estimar que X2 Y2

Si a > 1, i b > 1 , interpretarem que el quocient es major que 1 en una alta

X2
probabilitat, per la qual cosa podrem estimar que 2 > 1 X2 > Y2
Y
Pg 17

Inferncia: Intervals de confiana

Si a < 1, i b < 1 , interpretarem que el quocient es menor que 1 en una alta

X2
probabilitat, per la qual cosa podrem estimar que 2 < 1 X2 < Y2
Y
En els dos casos darrers els valors dels intervals ens donaran una idea aproximada
dels valors al voltant dels quals oscilla el quocient entre els parmetres.
4- ERRADA i GRANDRIA DE LA MOSTRA
Ja havem comentat a la introducci, que quan fem un treball dinferncia, hi ha tres
factors que determinen la possible soluci. Recordem-los:

Nivell de confiana

Errada de la soluci

Grandria de la mostra

Als exemples que hem treballat al llarg del desenvolupament de tema, hem vist que
el nivell de confiana expressa la probabilitat que la estimaci siga correcta;
Determina els valors que hem trobat a les taules de les funcions de distribuci de les
diferents variables treballades i es costum utilitzar valors que van del 90% al 99% i
quan ms gran lagafem, lamplitud de linterval creix.
Seria desitjable que linterval soluci fora el ms ajustat possible als valors que volem
inferir. Lexpressi que tenim de lerrada s aquesta desviaci del valor central. Aix
ba
direm que lerrada s E =
i per tant, est directament relacionada amb
2
lamplitud de linterval.
El tercer factor a considerar s la grandria de la mostra. Els resultats sn ms
exactes, quan ms gran s aquesta. Aix doncs, podrem plantejar-nos la qesti, a
linrevs per fer un treball que satisfaga les nostres necessitats.
s possible plantejar-nos una situaci aix; considerem el treball de lexemple 1, on ja
vam veure lefecte que comporta un canvi en el nivell de confiana i un canvi a la
grandria de la mostra. Estudiem ara, lerrada en la soluci del plantejament inicial
que tenem amb una mostra de 25 alumnes, treballant amb un nivell de confiana del
95%. El resultat que vam obtenir, considerant = 3 va ser

x z

, x+z

3
3

=
7

1
,
96
,
7
+
1
,
96

= (5.824 , 8.176)
n
25
25

Pg 18

Inferncia: Intervals de confiana

Podem concloure que amb una probabilitat del 95%, la mitjana del nombre de hores
de son diries dels alumnes de la Universitat est dintre daquest interval.
Donat que lamplitud de linterval es 8.176 5.824 = 2,352 hores, lerrada en la nostra
b a 2,352
estimaci es de E =
=
= 1,176
2
2
Si nosaltres volem acotar aquesta errada i que siga de 0,5 hores, podrem esbrinar, a
piori la grandria de la mostra amb el que deguem treballar i aix conixer el
nombre de individus que cal fer lenquesta. Aix,

x+ z
x z
2z

1
1
1
n
n

n
3
ba
2
2
2
=
=z
= 1,96
= 0,5
E=
=

1
2
2
2
n
n
2

1,96 3
= 11,76 n = 11,76 2 = 138,30 ,es a dir,
0,5
amb 139 individus podem extraure linterval amb lerrada que ens havem plantejat.
Don podem allar el valor de n,

n=

Pg 19

You might also like