Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 6

T3.

pdf

Anónimo

Análisis de Datos

2º Grado en Psicología

Facultad de Psicología
Universidad Autónoma de Barcelona
Reservados todos los derechos.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
T3 - Inferència estadística (I): estimació de paràmetres Anàlisi de dades
1. Introducció
1. 1. Conceptes
 Població  conjunt global que presenta una determinada característica. *Paràmetres.
 Mostra  subconjunt d’unitats d’observació de la població seleccionat segons un criteri definit i establert. *Estadístics.
 Predicció  permet fer conclusions sobre els estadístics d’una mostra extreta d’una determinada població, a partir del coneixement
dels paràmetres d’aquesta població. *De paràmetres a estadístics.
 Inferència  intenta fer conclusions sobre els paràmetres d’una població, a partir de la informació continguda en els estadístics d’una
mostra procedent d’aquesta població. *De estadístics a paràmetres.
o Estimació de paràmetres (p.e: mitjana en una població)
o Contrast d’hipòtesis (establir una hipòtesi i sotmetre-la a proves respecte la població)
 Paràmetre  qualsevol índex (proporció, mitjana, variància, ...) calculat amb les dades d’una població.
 Estadístics  valor desconegut d’un paràmetre de la població (proporció, mitjana, variància...) estimat a partir d’una mostra
mitjançant una funció dels valors observats. S’utilitzen per fer inferències, estimacions o contrasts, amb respecte a paràmetres
poblacionals desconeguts, aspectes que es tractaran al llarg dels temes.

 Fixada la població, s’extreuen infinites mostres de


mida n i en cadascuna es calcularà l’estadístic
corresponent (mitjana, variància ,etc).
 Si es representa gràficament l’estadístic, s’obté una
distribució de freqüències de l’estadístic d’interès (ara
representades en mostres) obtingut en extraure
aleatòriament i amb reposició infinites mostres de
mida n d’una població coneguda.

1. 2. Símbols dels paràmetres i estadístics


Paràmetre (població) Estadístic (mostra)
Mida de la mostra N n
Mitjana μ 𝑥̅
Desviació estàndard 𝜎 s
Variància 𝜎2 s2
Proporció π p

2. Distribució mostral d’un estadístic


 Definida una població de què coneixem els seus paràmetres extraiem infinites mostres de mida n extretes aleatòriament.
 La llei Binomial modelitza la distribució mostral.

2.1. De les proporcions i les mitjanes


 Distribució mostral de les proporcions  representa la distribució de freqüències de l’estadístic proporció (p i) observat en totes les
mostres possibles de mida n, extretes a l’atzar d’una població amb proporció π. La distribució mostral de les proporcions segueix
exactament el model de la llei Binomial: pi ~ B(n, π):

E(p) = π ; V(p) = σ2 = π · (1 - π) ; EE(p) = σ = √π · (1 - π)


p n p n

 Distribució mostral de les mitjanes  representa la distribució de freqüències de l’estadístic mitjana (x̅) observat en totes les mostres
possibles de mida n, extretes a l’atzar d’una població amb mitjana μ i variància σ2.
 L’error estàndard (EE) és la DE però de
22 la distribució mostral.
E(x̅) = μ ; V(x̅) = σ2 = σ
x̅ = nσ; EE(x̅ ) = σ =x̅ √σ n√n

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Francesca Anàlisi de T3 - inferència estadística (I): estimació de

2.2. Mida de la mostra i error de mostreig


 Per tractar-se de mostres a l’atzar, els estadístics observats tenen valors propers al paràmetre. Tanmateix, l’error aleatori propi del
mostreig fa que algunes mostres presentin estadístics allunyats del paràmetre.
 En augmentar la mida n de les mostres decreix la variabilitat dels estadístics al voltant del paràmetre. En augmentar n la distribució
mostral és més simètrica i s’aproxima a la forma de campana pròpia de la llei Normal.

2.3. Teorema central del límit


 La distribució de probabilitat de la distribució mostral segueix el model de la llei Normal si:
o La distribució de la variable X en la població segueix una llei Normal.
 Sota determinades condicions, la mitjana de la distribució mostral coincideix amb la de la població.

3. Intervals de predicció (IP)


 Predir el valor de l’estadístic d’una mostra de mida n sabent els paràmetres de la població de la qual s’ha extret aleatòriament la
mostra.
 Interval de predicció  1 ─ α (habitualment α = 0.05)
 Quan més estret sigui l’interval més precisió i informació aportarà, però tindrà més probabilitat d’error (el risc α serà gran).

3.1. Interval de predicció de les mitjanes


 Si la variable X, en la població segueix el model de la llei Normal, o les mostres són grans (n ≥ 30), l’interval de predicció de les
mitjanes
es defineix com 

√σ2
IP (1 ─ α) x̅ = x̅ ∈ μ ± zα/2 · n

*Primer s’avaluen les condicions d’aplicació (la variable en qüestió segueix una llei Normal en la població o bé la mostra és gran: n ≥
30), i després es calcula l’interval de predicció de les mitjanes.
 Exemple  la distribució de les puntuacions d’una prova de adaptació social (AS) en una població de delinqüents juvenils segueix
una llei Normal de mitjana 60 punts (μ = 60) i variància 9 punts2 (σ2 = 9). Calcular entre quins límits es trobaran el 95% central de
les puntuacions mitjanes en “adaptació social” observades en mostres a l’atzar de 25 subjectes.
o Avaluació de la condició d’aplicació (validesa de l’aproximació Normal) 
 En la població origen de les mostres (delinqüents juvenils) la variable “adaptació social” (AS) segueix una llei Normal de
mitjana
μ = 60 i variància σ2 = 9.
 Per tant es pot acceptar la normalitat de la distribució mostral de les mitjanes  AS ~ N(60, 3).
o Calcular l’error estàndard (EEx̅ ) 
2
 EE = =√ = 0.6 punts
x̅ σ
√n 259

o Fixar el risc α i determinar el valor zα/2 corresponent 


 α = 0.05
 𝛼/2 = 0.025
 zα/2 = 1.96
o Calcular el desviament e 
 𝑒 = zα/2 · EEx̅ = 1.96 · 0.6 = 1.1760 𝑝𝑢𝑛𝑡𝑠
o Calcular els límits de l’interval 

 IP (1─ α) = x̅ ∈ μ ± z
α/2 ·
 IP (0.95) = x̅ ∈ 60 ± 1.96 · 0.6  IP (0.95) = x̅ ∈ 60 ± 1.1760  60 + 1.1760 =

61.176 (61.18) i 60 – 1.1760 = 58.824 (58.82)
o Conclusió  IP(0.95) = de 58.82 fins 61.18 punts. Es pot expressar 
 Amb un risc del 5%, en mostres aleatòries de 25 subjectes extretes d’una població de delinqüents juvenils, les mitjanes de les
puntuacions de la prova d’adaptació social es trobaran en l’interval de 58.82 punts a 61.18 punts.
 El 95% de les mitjanes observades en mostres aleatòries de 25 subjectes extretes d’una població de delinqüents juvenils es
troben entre 58.82 punts i 61.18 punts.
 El 95% central de las puntuacions mitjanes en adaptació social es troben entre 58.82 punts i 61.18 punts.

3.2. Interval de predicció de les proporcions


 Si es satisfà la condició de mostres grans (n · π i n · (1−π) ≥ 5) , la distribució mostral de proporcions, que segueix exactament un
π · (1 ─ π)
model binomial, pot aproximar-se a una llei Normal de mitjana π i , és a dir 
n
variància

π · (1 ─ π)
IP (1 ─ α) p= p ∈ π ± zα/2 · √
n

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Francesca Anàlisi de T3 - inferència estadística (I): estimació de

 En cas de mostres petites (n · π i n · (1−π) < 5), l’interval de predicció de les proporcions s’ha de construir a partir de la distribució
Binomial.
*Primer s’avaluen les condicions d’aplicació (n · π i n · (1−π) < 5), i després es calcula l’interval de predicció de les proporcions.
 Exemple  en una determinada població, la prevalença del fracàs escolar es del 15% (π = 0.15). Predir, amb un risc del 5%, entre
quins límits es trobaran les proporcions de fracàs escolar observades en mostres aleatòries de 50 subjectes extretes d’aquesta població.
o Avaluació de la condició d’aplicació (validesa de l’aproximació Normal) 
 n · π i n · (1−π) ≥ 5  50 · 0.15 = 7.5 >5 i 50 · 0.85 = 42.5 > 5 (les mostres són grans).
 Per tant, la distribució mostral de les proporcions, que modelitza de manera exacta la llei binomial, pot ser aproximada per
0.15 · 0.85
una distribució Normal de mitjana π = 0.15 i variància σ2 = = 0.0026.
p
o Calcular l’error estàndard (EE𝑝)  50

 π · (1 ─ π) 0.15 · (1 ─ 0.15) 0.15 ·


= √0.0026 = 0.0505
0.85 =
EE p
√ =√ =√
n 50 50

o Fixar el risc α i determinar el valor zα/2 corresponent 


 α = 0.05
 𝛼/2 = 0.025
 zα/2 = 1.96
o Calcular el desviament e 
 𝑒 = zα/2 · EE𝑝 = 1.96 · 0.0505 = 0.0990 𝑝𝑢𝑛𝑡𝑠
o Calcular els límits de l’interval 
 IP (1─ α) = 𝑝 ∈ π ± z · √π · (1 ─ π)  IP (0.95) = 𝑝 ∈ 0.15 ± 1.96 · 0.0505  IP (0.95) = 𝑝 ∈ 0.15 ± 0.0990 
𝑖 α/2 𝑖 𝑖
n
0.15 + 0.0990 = 0.249 (0.25) i 0.15 – 0.0990 = 0.051 (0.05)
o Conclusió  IP(0.95) = de 0.05 fins 0.25 punts. Es pot expressar 
 L’interval 0.05 a 0.25 té una probabilitat de 0.95 de contenir les proporcions de fracàs escolar observades en mostres
aleatòries de 50 subjectes extretes a l’atzar d’una població on la proporció de fracàs escolar és de 0.15.
 Amb un risc del 5%, el percentatge de subjectes amb fracàs escolar en mostres de 50 aleatòries de subjectes es troba entre el
5% i el 25%.

4. Intervals de confiança (IC)


 És un interval calculat a partir de les dades d’una mostra per un mètode que té una probabilitat (1 ─ α) de produir un interval que
contingui el veritable valor del paràmetre.

4.1. Interval de confiança de les mitjanes


 Dues formules segons si es coneix la variància poblacional o no 
o Si es coneix (poc freqüent) 
σ
IP (1 ─ α)𝜇 = 𝑥̅ ± zα/2 ·

o Si no es coneix (és el cas més freqüent) 
 Distribució t de Student-Fischer  t(gl, α/2)  s
o gl = n – 1 IP (1 ─ α)μ = x̅ ± t (gl, α/2) ·
o 𝛼/2 (𝛼 = risc) √n
o Es busca a la taula de distribució t, el valor que correspon al
grau de llibertat calculat i al 𝛼/2.
P.e: mostra de 10 persones amb un risc de 5% (és el més
habitual) 
*gl = 10 – 1 = 9
*𝛼/2 = 0.05/2 = 0.025
*Es busca a la taula de distribució t, el valor que correspon
al gl = 9 i 0.025 (𝑡(9, 0.025) = -2.2622
*En aquest cas, t(gl, α/2) = ─ 2.2622

*Primer s’avaluen les condicions d’aplicació (la distribució mostral de les mitjanes segueix el model de la llei Normal o bé la mostra és
gran: n ≥ 30) i després es calcula l’interval de confiança de les mitjanes.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Francesca Anàlisi de T3 - inferència estadística (I): estimació de

 Exemple  en una mostra aleatòria de 100 persones (n = 100) extreta de la població catalana la distribució de puntuacions de la
variable “discriminació visual” presenta una mitjana de 25 punts (x̅ = 25) i una desviació estàndard de 15 (s = 15). Estimar la
mitjana de discriminació visual en la població origen de la mostra (𝛼 =0.05).
o Avaluació de les condicions d’aplicació 
 La distribució mostral de mitjanes segueix una llei Normal donat que la mostra és gran (n=100).
o S’aplica la segona formula donat ques
no es coneix la variància poblacional 
 IP (1 ─ α) = x̅ ± t ·
μ (gl, α/2) √n
o t(gl, α/2) 
 gl = n – 1 = 100 – 1 = 99
 α/2 = 0.05/2 = 0.025
 t(gl, α/2) = t(99, 0.025) = 1.984
 Per a una confiança del 0.95 i 99 gl, el valor t de Student-Fisher és: t(99, 0.025) = 1.984
s 15
o IP (1 ─ α) = x̅ ± t ·  IP (0.96) = 25 ± 1.984 · = 25 ± 2.976
μ (gl, α/2) √100
μ √n

 IP (0.96)μ = 25 + 2.976 = 27.98


 IP (0.96)μ = 25 ─ 2.976 = 22.02
o Conclusió 
 Amb una confiança del 95%, la mitjana de discriminació visual a la població origen de la mostra es troba entre 22.02 punts i
27.98 punts.

4.2. Interval de confiança de les proporcions


*Primer es calcula l’interval de confiança de les proporcions i després s’avaluen les condicions d’aplicació (n · π1 ; n · π2 ; n · (1 ─ π1) ;
n · (1 – π2) ≥ 5).
p) IP (1 ─ α)π = p ± zα/2 p· √
· (1 ─
 Exemple  en una mostra aleatòria de 97 universitaris (n = 97), 40 practiquenn exercici i 27 fan dieta. Estimar la proporció de persones
que en la població d’universitaris practiquen exercici.
o Es calcula la proporció d’universitaris de la mostra que practiquen exercici 
40
 p = = 0.41
97
o Fixar el risc α i determinar el valor zα/2 corresponent 
 α = 0.05
 𝛼/2 = 0.025
 zα/2 = 1.96
0.41
o IP (1 ─ α)π p · (1 ─ p)
=p± z ·√  IP (0.95)

0.41 · (1 ─ 0.41) ± 0.0882
π= 0.41 ± 1.96 ·
n 97

=
 IP (1 ─ α)π = 0.41 + 0.0882 = 0.4982
 IP (1 ─ α)π = 0.41 ─ 0.0882 = 0.3218
o Conclusió 
 Amb una confiança del 95%, en la població d’universitaris entre un 32% i un 50% dels subjectes practiquen exercici
habitualment.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.

You might also like