Tema 3. Mostratge - v2

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 18

Grau de Psicologia Metodologia de les Ciències del Comportament I

Metodologia de les Ciències del Comportament I


Tema 3. Mostratge

Joan Carles Martori (martori@uvic.cat)


Grau de Psicologia Metodologia de les Ciències del Comportament I

No és permesa la reproducció total o parcial


d'aquests apunts, ni el tractament informàtic, ni la
transmissió per cap forma o per qualsevol mitjà,
sigui electrònic, mecànic, fotocòpia, registre o
altres mètodes, sense el permís previ i per escrit
dels titulars del Copyright.

Drets reservats © 2019 Joan Carles Martori,


Universitat de Vic

Sagrada Família, 7
08500 Vic (Barcelona)

2
Grau de Psicologia Metodologia de les Ciències del Comportament I

Sumari
1 INTRODUCCIÓ I CONCEPTE 4

2 MITJANA MOSTRAL 6

3 VARIÀNCIA MOSTRAL 9

4 VARIÀNCIA MOSTRAL CORREGIDA 10

5 PROPORCIÓ MOSTRAL 11

6 TEOREMA CENTRAL DEL LÍMIT 13

7 COM CALCULAR LA MIDA D’UNA MOSTRA 14

6 PROBLEMES 16

7 SOLUCIONS 18

3
Grau de Psicologia Metodologia de les Ciències del Comportament I

1 INTRODUCCIÓ I CONCEPTE

Població estadística : és un conjunt finit o infinit d’elements que poden ser observats, mesurats o
registrats amb relació a alguna característica d’interès per l’investigador.

Mostra: qualsevol subconjunt de la població.

Exemple:

Els alumnes d’un determinat curs de primària poden constituir una població estadística i l’investigador
pot estar interessat en una/es característiques dels alumnes, per exemple: qualificacions, alçada,...

La teoria de la probabilitat mitjançant l’estudi de les v.a. permet caracteritzar una població estadística
associant a la variable que la representa una llei de probabilitat

Ex: els resultats d’un determinat test es distribueixen segons una llei normal de paràmetres  = 120 i σ2
= 64 Quin és el percentatge d’individus amb puntuacions inferiors a 130 punts ?

P ( X < 130 ) = P ( Z < 1,25 ) = 0,8944

El 89,44% dels individus han obtingut menys de 130 punts o expressat d’una altra manera, si escollim
una puntuació a l’atzar existeix la probabilitat, 0,8944, que aquesta puntuació sigui inferior a 130 punts.

Un altre tipus de pregunta seria: si escollim tres puntuacions a l’atzar, quina és la probabilitat que el
puntuació mitjana sigui inferior a 125 punts ?

Resposta: Siguin x1 , x2 , x3 les tres observacions. Donat que aquestes variables s’escullen d’una
població normal, es distribuiran cada una d’elles normalment i amb els mateixos paràmetres
poblacionals, és a dir:

X1 N (, 2 ) ; X2 N (, 2 ) ; X3 N (, 2 )

Amb  = 120 i σ2 = 64

Podem definir la puntuació mitjana com:

Y=
1
3
(x1 + x2 + x3 )

E(Y ) = E  (x1 + x 2 + x 3 ) = E (x1 ) + E (x 2 ) + E (x 3 ) = (120 + 120 + 120 ) = 120


1  1 1
3  3 3

Var (Y ) =Var  (x1 + x 2 + x 3 ) = Var (x1 ) +Var (x 2 ) +Var (x 3 )


1  1
3  9
Grau de Psicologia Metodologia de les Ciències del Comportament I

=
1
(64 + 64 + 64 ) = 64
9 3

La distribució de la variable Y ( puntuació mitjana) ve donada per una distribució: Y N (120, 64/3 )

P ( Y<125) = P (Z <1,08) = 0,8599

En el mostratge l’investigador està interessat per alguna qüestió relativa a la informació d’un conjunt
d’observacions aleatòries d’una determinada població estadística.

Així donada una població que depèn d’una llei de probabilitat, coneguda o no, que a la vegada depèn
d’un o més paràmetres, coneguts o no, es defineix una mostra aleatòria o simplement mostra com un
conjunt d’observacions aleatòries, independents realitzades sobre una població.

(x1, x2 , x3 ...., xn )

sent n la mida de la mostra i xi els elements mostrals.

D’aquesta manera si la població X té una distribució normal de mitjana  i variància 2 , aleshores cada
element mostral és tal que:

x1 N (, 2 ) ; x2 N (, 2 ) .......; xn N (, 2 )

i donat que les observacions son independents:

f ( x1, x 2, ...., x n ) = f (x1 ). f (x 2 )....... f (x n )

la funció de densitat conjunta serà igual al producte de les seves funcions marginals.

Definició d’estadístic: és qualsevol funció dels elements d’una mostra aleatòria. Els més estudiats són:

▪ Mitjana mostral ( x )
▪ Variància mostral ( S2 )
▪ Variància mostral corregida ( S*2)
▪ Proporció mostral (  )

5
Grau de Psicologia Metodologia de les Ciències del Comportament I

2 Mitjana Mostral

Sigui una determinada població estadística caracteritzada pel comportament d’una v.a. X amb E (X) = 
i Var (X) = 2 . Sigui (x1 , x2,, ...xn ) una mostra aleatòria de tamany n.

Sabem que E(xi) =  i Var (xi) = 2 per tot i = 1, 2, ...n i, que cada xi té la mateixa distribució de
probabilitat.

Podem definir a partir de les observacions mostrals la mitjana mostral:

x 1 + x 2 + ... + x n
x=
n

Consideracions d’aquesta variable:

1. És una v.a. perquè és una funció de variables aleatòries.


2. Per v.a. contínues, la distribució de probabilitat de la mitjana mostral no serà coneguda a no ser
que:

▪ La població d’origen sigui normal, el qual implicaria que cada xi també ho seria i donat que la
mitjana mostral és una combinació lineal de v.a. normals també es comporta normalment.
▪ La mostra sigui lo suficientment gran, aleshores pel Teorema Central del Límit, la distribució
de la mitjana mostral tendeix a aproximar-se a una llei normal.

Excepte aquests dos casos, la mitjana mostral serà desconeguda però, la major part de situacions en
que es treballa queden coberts per aquests 2 casos.

Característiques de la mitjana mostral

▪ La mitjana mostral té una esperança matemàtica que és precisament la mitjana poblacional:

E ( x ) = E  (x1 + x 2 + ... + x n ) = E (x1 ) + E (x 2 ) + ... + E (x n ) =  +  + ... +   = .n  = 


1  1 1 1
n  n n n

▪ La variància de la mitjana mostral és la variància poblacional (σ2 ) dividida pel tamany de la


mostra (n):

6
Grau de Psicologia Metodologia de les Ciències del Comportament I

Var ( x ) =Var  (x1 + x 2 + ... + x n ) = 2 Var (x1 ) +Var (x 2 ) + ... +Var (x n )


1  1
n  n

=
n
1 2
2

 +  2 + ... +  2 =
1 2
n2
.n =
2
n

Per tant: x  ( , 2/n ). Per il·lustrar aquestes característiques anem a veure’n un exemple:

Sigui una població amb la següent llei de probabilitat,

Xi 1 2 3

P(xi) 0,4 0,5 0,1

Primer calcularem l’esperança i la variància de X, després calcularem l’esperança i la variància de la


mitjana mostral si la mida de la mostra és 2, seguint el que acabem d’exposar. Per últim comprovarem
aquest darrer resultat construint la distribució de la mitjana mostral i calculant la seva esperança i la
seva variància.

E(x) = μ = 1·0,4 + 2·0,5 + 3·0,1 = 1,7

V(x) = σ2 = E(x2) – [E(x)]2 =0,41

E ( x ) =  = 1,7
0,41
V (x ) = = 0,205
2
Les mostres de mida 2 són

(1,1) (1,2) (1,3) (2,1) (2,2) (2,3) (3,1) (3,2) (3,3) amb probabilitat (0,16) (0,20) (0,04) (0,20) (0,25) (0,05)
(0,04) (0,05) (0,01) respectivament.

Si la mostra és (1,1) la mitjana mostral és 1, per tant la probabilitat que la mitjana mostral sigui 1 és la
mateixa que surti la mostra (1,1), així la funció de probabilitat de la mitjana mostral és:

x 1 1,5 2 2,5 3

P(x ) 0,16 0,40 0,33 0,1 0,01

Ara podem comprovar que:


7
Grau de Psicologia Metodologia de les Ciències del Comportament I

E ( x ) = 1 · 0,16 + 1,5 ·0,40 + ... + 3 ·0,01 = 1,7


V ( x ) = 12 ·0,16 + 1,5 2 ·0,40 + ... + 3 2 ·0,01 − 1,7 2 = 0,205

8
Grau de Psicologia Metodologia de les Ciències del Comportament I

3 VARIÀNCIA MOSTRAL

De la mateixa manera que per una mostra de tamany n hem definit la variable mitjana mostral, també
per la mateixa mostra podem definir la variable variància mostral, mitjançant:

 (x i − x )
1 n
S2 =
n i =1

La variable S2 també és una v.a. per ser funció dels elements mostrals.

Característiques de la variància mostral

▪ L’esperança de la variància mostral és:

( )
E S2 =
n −1 2
n
.

▪ La variància de la variància mostral és:

2.(n − 1) 4
( )
Var S 2 = .
n2

9
Grau de Psicologia Metodologia de les Ciències del Comportament I

4 VARIÀNCIA MOSTRAL CORREGIDA

De la mateixa manera que per una mostra de tamany n hem definit la variable mitjana mostral, també
per la mateixa mostra podem definir la variable variància mostral corregida, mitjançant:

 (x i − x )
1 n
S *2 =
n − 1 i =1

La variable S*2 també és una v.a. per ser funció dels elements mostrals.

Característiques de la variància mostral corregida

▪ L’esperança de la variància mostral corregida és:

( )
E S*2 =  2

▪ La variància de la variància mostral corregida és:

(
Var S * 2 = ) 2
. 4
n −1

▪ Es compleix l’anomenat Teorema de Fisher: que ens afirma que quan la població X segueix una
distribució normal, coneixem la distribució de probabilitat de S2 o S*2 a través de la distribució
Chi-quadrat amb n-1 graus de llibertat, és a dir:

n −1
Si X  N ( , σ2 )  S * 2   n2−1
 2

n
De fet es pot aproximar per S * 2 ~  n2−1
 2

10
Grau de Psicologia Metodologia de les Ciències del Comportament I

5 PROPORCIÓ MOSTRAL

Considerem una determinada població caracteritzada pel fet que els seus elements estan en una
proporció  de verificar una determinada característica. Per exemple, si es considera el conjunt
d’estudiants que s’han presentat a una determinada prova- són el 65% del total-,  = 0,65. Podem definir
la v.a. X que pren el valor 1 si un estudiant pertany a la primera categoria i el valor 0 si pertany a la
segona. La llei de probabilitat d’aquesta població queda definida per:

P( X = x) = (0,65)x . (1-0,65)1-x
P( X = x) = x. (1-  ) 1-x

Per x = 1 , P(X = 1) = 

Per x = 0, P(X= 0) = 1- 

E(X) =  = 

Var (X) = σ2 =  - 2 =  (1- )

Sigui (x1, x2 , x3 ...., xn ) una mostra de mida n. Creem una nova variable: S = x1 + x2 + x3 + ....+ xn ), que
és la suma d’elements mostrals que compleixen la característica.

E(S) = E (x1 + x2 + x3 + ....+ xn ) = E(x1) + E(x2) + E(x3) +...+ E(xn) =  +  +  +...+ = n

Var(S) = Var (x1 + x2 + x3 + ....+ xn ) = Var(x1) + Var(x2) + Var(x3) +...+ Var(xn) =  (1- ) +

 (1- ) +  (1- )+ ... + (1- ) = n (1- )

Definim la proporció mostral o freqüència relativa com el nombre d’elements de la mostra que
compleixen la característica dividit per la mida de la mostra, és a dir:

S
f=
n

Aleshores:

11
Grau de Psicologia Metodologia de les Ciències del Comportament I

E (S )  .n
E (f ) = = =
n n

Var(S) .n(1 − ) (1 − )


Var(f ) = = =
2 2 n
n n

  (1 −  ) 
Quan n →  ( n > 30 ) : f  N   , 
 n 

12
Grau de Psicologia Metodologia de les Ciències del Comportament I

6 TEOREMA CENTRAL DEL LÍMIT

Teorema (Distribució de les Mitjanes Mostrals): Sigui X una v.a. qualsevol de mitjana  i desviació
típica  , aleshores:

1. Si considerem totes les mostres aleatòries possibles, cadascuna d’elles de mida n, es

verificarà que  x =  y  x =  .
n

2. A més, si X segueix una distribució normal, X també serà normal.

Teorema Central del Límit: Sigui X una v.a. qualsevol de mitjana  i desviació típica  aleshores:

Si la mida mostral n és “suficientment gran” (en la pràctica sol valer n>30), la distribució
de les mitjanes mostrals s’aproxima a la d’una normal,.:

  
X  N   , 
 n

La importància del TCL radica en que sigui quina sigui la distribució de la població original (v.a. X),
tal com la mida de les mostres ( n ) augmenta, la distribució de les mitjanes es va aproximant a la
d’una normal (de la que coneixem moltes propietats).

Suma mostral : Sn = x1+ x 2 + ... + x n

Si la mida mostral n és “suficientment gran” (en la pràctica sol valer n>30), la distribució
de la suma mostral s’aproxima a la d’una normal,.:

(
Sn  N n., n. 2 )

13
Grau de Psicologia Metodologia de les Ciències del Comportament I

7 COM CALCULAR LA MIDA D’UNA MOSTRA

Per estimar mitjanes i mides de població  100.000

z2σ 2N
n= 2
e N + z2σ 2
Z = interval de confiança per la mitjana mostral
El valor de Z s’obté de les taules de la normal.
e = error màxim permès per la mitjana mostral
Error que l’investigador està disposat admetre entre els valors obtinguts de la mostra i els
valors reals poblacionals.
2 = variància de la població
N = mida de la població

Exemple: Es vol estudiar les actituds respecte al tabaquisme entre les dones de 25 a 65 anys de
la ciutat de Vic. Per això s’ha fet una enquesta telefònica. Si a Vic viuen 11000 dones entre 25 i
65 anys, quantes entrevistes necessitem para obtenir resultats amb un grau de confiança del
95% y un error del +5%, i la desviació típica mostral es de 0,5.

n = (1,96)2 x (0,5)2 x 11.000 / (0,052 x 11.000) + (1,962 x 0,52) = 371,2

Para estimar mitjanes i per mides de població >100.000

z2σ 2
n= 2
e
Exemple: Si es vol fer un estudi per tota Catalunya, quantes enquestes s’ha de fer si hi ha
1.300.000 dones. En aquest cas, la n és superior a 100.000, per tant utilitzarem fórmula.

n = (1,96)2 x (0,5)2 / 0,052 = 384,16

Quan la variable principal és dicotòmica, per estimar una proporció i per mides de
població < 100.000, utilitzarem:

z2  p  q  N
n= 2
e ( N −1 ) + z2  p  q

14
Grau de Psicologia Metodologia de les Ciències del Comportament I

Normalment p=q=0.5
. p= probabilitat que és doni un fet / q= probabilitat que no es doni. En el cas en que es
desconeix la proporció, utilitzarem p=q=0.5.

Exemple: Calcular la mida d’una mostra sobre una població de 54.000 individus, fer un error
màxim del +5% amb un grau de confiança del 95,5%. En aquest exemple coneixem que les
proporcions existents de la variable “fumador” són 60% fumadors – 40% no fumadors.

n = 22 x 0,60 x 0,40 x 54000 / (0,052 x 53999) + (22 x 0,60 x 0,40) = 381,3

Variable dicotòmica. Per estimar una proporció i per mides de


població > 100.000

z2  p  q
n=
e2
Normalment p=q=0.5

Exemple: Estudiar el número de entrevistes en una població superior a 100.000 habitants sobre
el consum de tabac, si son o no fumadors. Coneixem que la proporció de fumadors és del 10% i
de no fumadors del 90%. Resultats obtinguts amb un grau de confiança del 95,5% i un error del
+5%

n = 22 x 0,10 x 0,90 / 0,052 = 144

15
Grau de Psicologia Metodologia de les Ciències del Comportament I

6 PROBLEMES

1. Una població és caracteritzada per una variable aleatòria normal de mitjana 50 i variància 100.
Traiem una mostra de dimensió 25. Calculeu:

a) La probabilitat que la variable mitjana mostral sigui menor que 60.

b) P(48 < X < 51)

2. Una població és caracteritzada per una variable aleatòria normal de mitjana 25 i variància 25.
Traiem una mostra de dimensió 25. Calculeu el percentatge de variables mitjanes mostrals més
grans que 26.

3. De la mateixa població anterior, traiem una mostra de dimensió 100. Calculeu el percentatge de
variables mitjanes mostrals superiors a 26.

4. L’import d’una teràpia, el qual varia segons cada cas, té una mitjana de 400 euros per persona i una
desviació típica de 100. Si 169 persones han abonat el seu import, quina és la probabilitat que
haguem ingressat més de 70000 €?

5. Una unitat hospitalària prepara un medicació experimental per a malalts esquizofrènics. Aquesta
medicació és voluntària i necessita la conformitat del pacient degut a alguns afectes secundaris no
desitjats. Tenint en compte l'experiència d’altres unitats, sap que el 5% dels malalts es presenten
voluntaris per fer aquest assaig clínic. Si aquest any la unitat disposa de 20 lots de medicació
experimental i efectua l'oferta a 300 pacients, calculeu:

a) Probabilitat que aquests pacients no adquireixin la totalitat dels 20 lots.

b) Probabilitat que la unitat hospitalària no pugui atendre totes les demandes d'aquests pacients.

6. Considerem una v.a. X ~ N(5, 0.01), si traiem mostres de dimensió 16, calculeu:

a) P(5 < X < 5.2)

7. Considerem una població representada per una v.a. X~N(,100), calculeu la probabilitat que la
mitjana mostral superi almenys a la mitjana poblacional en 0,2, suposant mostres de dimensió 100.

16
Grau de Psicologia Metodologia de les Ciències del Comportament I

8. En un test psicomètric el percentatge d’errors és del 20%. Quina és la probabilitat que en una
mostra de 200 tests s'observin més de 30 errors?

9. En una partida de parxís llancem un dau 64 vegades, quina és la probabilitat que la puntuació
mitjana de les tirades estigui entre 3 i 4?.

10. Suposem que traiem una mostra d'una població uniforme, X~U(0,2). Trobeu la probabilitat que la
mitjana mostral estigui entre 0,8 i 1,1 si la dimensió de la mostra és 48.

11. En un petit hospital la despesa farmacèutica té una mitjana de 1.510 € amb una desviació típica de
104 €. És raonable especular que en 64 dies, la despesa farmacèutica es mourà entre 95.000 i
100.000 €?

12. La puntuació en una prova té una distribució de mitjana 15 punts i desviació típica 4 punts. Si
s’escullen 200 persones a l'atzar per fer la prova, quina és la probabilitat que la puntuació mitjana
superi els 16 punts?

17
Grau de Psicologia Metodologia de les Ciències del Comportament I

7 SOLUCIONS

1. a) 1 b) 0,5328.

2. 15,87%

3. 2,275%

4. 0,03288

5. a) 0,90658 b) 0,09342

6. a) 0,5

7. 0,42074

8. 0,96164

9. 0,980716

10. 0,8768

11. Sí perquè la probabilitat és 0,97552

12. 0,0002001

18

You might also like