Professional Documents
Culture Documents
Tema 4
Tema 4
Tema 4
• Vegem ara en què consisteix aquest model. Suposem que tenim dos factors, A i B, tots
dos aleatoris, amb r rèpliques. Posem
amb i = 1, . . . , a, j = 1, . . . , b, k = 1, . . . , r ,
αi , i = 1, . . . , a són v.a.i.i.d. N (µα , σα2 ),
βj , j = 1, . . . , b són v.a.i.i.d. N (µβ , σβ2 ),
2
(αβ)ij , i = 1, . . . , a, j = 1, . . . , b són v.a.i.i.d. N (µαβ , σαβ ),
εijk són les variables d’error del model (v.a.i.i.d. N (0, σ 2 )),
i totes les variables són independents entre sı́. Noteu que els nous paràmetres del model
són les mitjanes i les variàncies de les variables que surten al model: µα , µβ , µαβ , σα2 , σβ2 , σαβ
2
2
iσ .
Les variables resposta en el model d’efectes aleatoris no tenen les mateixes propietats
distribucionals que en el model d’efectes fixos. Si els factors són fixos, Yijk segueix una
llei normal amb mitjana αi +βj +(αβ)ij i variància comuna σ 2 . Si els factors són aleatoris,
aleshores Yijk tenen totes la mateixa llei normal de mitjana
E[Yijk ] = µα + µβ + µαβ
i variància
V ar[Yijk ] = σα2 + σβ2 + σαβ
2
+ σ2 .
Són les quatres variàncies d’aquesta última expressió les que contenen la informació sobre
les poblacions dels factors aleatoris, perquè els efectes principals i la interacció entre
factors tenen una llei amb la mateixa esperança. Per tant, en contrast amb el cas d’efectes
fixos, els factors aleatoris contribueixen a la variabilitat global observable a la variable
resposta, i no a diferències entre les mitjanes de cada nivell i factor.
91
Les hipòtesis a contrastar seran les següents:
H0A : σα2 = 0 ⇔ αi = µα , ∀i = 1, . . . , a
H0B : σβ2 = 0 ⇔ βj = µβ , ∀j = 1, . . . , b
H0AB : σαβ
2
= 0 , µαβ = 0 ⇔ (αβ)ij = 0 , ∀i = 1, . . . , a, j = 1, . . . , b
• Exemple:
S’ha mesurat el color de pell en set persones durant tres setmanes, en un estudi relacionat
amb productes cosmètics, i s’ha obtingut la taula següent:
Observeu que no són els participants concrets el que interessa al fabricant, sinó la població
de tots els possibles compradors del producte. Modelitzant els efectes sobre els partic-
ipants com una variable aleatòria normal, la variància de la distribució mesura la vari-
abilitat dels mesuraments del color que és atribuı̈ble als diferents tipus de pell entre els
possibles usuaris.
L’efecte dels canvis setmana a setmana es pot modelar també com un efecte aleatori. Les
condicions de l’entorn, higiene, exposició al sol, etc, que poden afectar a les mesures del
color no són controlables, cada individu no té la mateixa mesura en diferents setmanes
de l’estudi. Modelitzant el factor setmana com una variable aleatòria, la seva variància
mesura la contribució de la variació d’una setmana a una altra en la variabilitat total de
les mesures de color.
Si, a més, es creu que els efectes setmanals difereixen aleatòriament de participant a
participant, és adequat introduir les interaccions.
• Sumes de quadrats i taula ANOVA:
Les sumes de quadrats es calculen igual que pel model d’efectes fixos, i també els graus
de llibertat i els quadrats mitjans. El que canvia és el càlcul dels estadı́stics F . El motiu
és que ara l’esperança dels quadrats mitjans ha canviat. Concretament, es té que:
2
E M STA = σ 2 + br σα2 + r σαβ + µ2αβ
E M STB = σ 2 + ar σβ2 + r σαβ
2
+ µ2αβ
E M STAB = σ 2 + r σαβ 2
+ µ2αβ
(compareu amb el valor d’aquestes esperances pel cas del model d’efectes fixos). El que
no canvia és que
92
E M SE = σ 2 .
Per tant, els estadı́stics F que van bé ara per tal de testar les hipòtesis plantejades són:
M STA A
2 2 2
FA = ja que sota H0 tenim E M STA = E M STAB = σ + r σαβ + µαβ
M STAB
M STB
FB = ja que sota H0B tenim E M STB = E M STAB = σ 2 + r σαβ
2
+ µ2αβ
M STAB
M STAB
FAB = ja que sota H0AB tenim E M STAB = E M SE = σ 2
M SE
a−1, (a−1)(b−1)
Rebutjar H0A si fA > F1−α
b−1, (a−1)(b−1)
Rebutjar H0B si fB > F1−α
(a−1)(b−1), ab(r−1)
Rebutjar H0AB si fAB > F1−α
• El model d’efectes mixtes. De vegades pot passar que, al mateix model, un dels
factors sigui d’efectes fixos i l’altre d’efectes aleatoris. Aquest model s’anomena d’efectes
mixtes i, pensant que el factor A és el fix i el factor B l’aleatori, és:
amb i = 1, . . . , a, j = 1, . . . , b, k = 1, . . . , r ,
αi , i = 1, . . . , a paràmetres del model,
βj , j = 1, . . . , b són v.a.i.i.d. N (µβ , σβ2 ),
2
(αβ)ij , i = 1, . . . , a, j = 1, . . . , b són v.a.i.i.d. N (µαβ , σαβ ),
εijk són les variables d’error del model (v.a.i.i.d. N (0, σ 2 )),
i totes les variables són independents entre sı́. Els paràmetres d’aquest model són:
α1 , . . . , αa , µβ , µαβ , σβ2 , σαβ
2
i σ2.
Les hipòtesis a contrastar són ara:
H0A : α1 = · · · = αa
H0B : σβ2 = 0 ⇔ βj = µβ , ∀j = 1, . . . , b
H0AB : σαβ
2
= 0 , µαβ = 0 ⇔ (αβ)ij = 0 , ∀i = 1, . . . , a, j = 1, . . . , b
93
Pa
2(αi − ᾱ· )2 2
E M STA = σ + br i=1 + r σαβ + µ2αβ
a−1
2 2 2
E M STB = σ + ar σβ + r σαβ + µ2αβ
E M STAB = σ 2 + r σαβ
2
+ µ2αβ
E M SE = σ 2
M STA A
2 2 2
FA = ja que sota H0 tenim E M STA = E M STAB = σ + r σαβ + µαβ
M STAB
M STB
FB = ja que sota H0B tenim E M STB = E M STAB = σ 2 + r σαβ
2
+ µ2αβ
M STAB
M STAB AB
2
FAB = ja que sota H0 tenim E M STAB = E M SE = σ
M SE
i la manera de testar les hipòtesis plantejades, fixat un nivell de significació α, consisteix
en
a−1, (a−1)(b−1)
Rebutjar H0A si fA > F1−α
b−1, (a−1)(b−1)
Rebutjar H0B si fB > F1−α
(a−1)(b−1), ab(r−1)
Rebutjar H0AB si fAB > F1−α
b
X
(αβ)ij = 0 ∀i = 1, . . . , a
j=1
(condició que es compleix en moltes situacions pràctiques, el que fa que aquest model sigui
tant utilitzat). Les hipòtesis a contrastar són les mateixes però canvien les esperances
dels quadrats mitjans, que seran:
Pa
2(αi − ᾱ· )2 ar 2
E M STA = σ + br i=1 + σαβ + µ2αβ
a−1 a−1
2 2
E M STB = σ + ar σβ
ra
E M STAB = σ 2 + 2
σαβ + µ2αβ
a−1
(compareu amb el valor d’aquestes esperances amb els de tots els models anteriors). Els
estadı́stics F seran, doncs,
94
M STA
FA = ja que sota H0A tenim E M STA = E M STAB = σ 2 + r σαβ
2
+ µ2αβ
M STAB
M STB
FB = ja que sota H0B tenim E M STB = E M SE = σ 2
M SE
M STAB
FAB = ja que sota H0AB tenim E M STAB = E M SE = σ 2
M SE
a−1, (a−1)(b−1)
Rebutjar H0A si fA > F1−α
b−1, ab(r−1)
Rebutjar H0B si fB > F1−α
(a−1)(b−1), ab(r−1)
Rebutjar H0AB si fAB > F1−α
PER RECORDAR...
95
4.2 El disseny factorial de tres factors
El que hem vist per a dos factors es pot estendre al cas de tenir, en general, m factors,
cadascú amb cert nombre de nivells. Denotarem els factors per A, B, C, D, . . . (i el seu
nombre de nivells per a, b, c, d, . . . respectivament). El disseny és factorial si es proven
(en cada rèplica completa del disseny) totes les combinacions de nivells de tots els factors.
Suposarem, a més, que fem r rèpliques del disseny complet, de manera que el nombre
total d’observacions serà n = r × a × b × c × d · · · . Suposem en primer lloc, com en el
cas de dos factors, que r > 1.
Només considerarem el cas que tots els efectes són fixos (els efectes aleatoris es compliquen
molt per a més de dos factors). Com a exemple veurem el disseny factorial de 3 factors
(“complet”, és a dir, amb interacció, i “equilibrat”, en el sentit que el nombre de rèpliques
és el mateix per a cada tractament o combinació de nivells dels factors). Tenim, doncs,
tres factors, A, B i C, amb nombre de nivells respectius a, b i c, amb r rèpliques (i el
nombre total d’observacions, n = r × a × b × c).
El model és:
H0A : α1 = · · · = αa
H0B : β1 = · · · = βb
H0C : γ1 = · · · = γc
H0AB : (αβ)ij = 0 , ∀i = 1, · · · , a , ∀j = 1, · · · , b
H0AC : (αγ)ik = 0 , ∀i = 1, · · · , a , ∀k = 1, · · · , c
H0BC : (βγ)jk = 0 , ∀j = 1, · · · , b , ∀k = 1, · · · , c
H0ABC : (αβγ)ijk = 0 , ∀i = 1, · · · , a , ∀j = 1, · · · , b , ∀k = 1, . . . , c
i, per tal de fer-ho, construirem la taula ANOVA d’aquest disseny, després de descom-
pondre la suma total de quadrats, com a mesura de la variabilitat total de les dades,
aixı́:
a X
X b X
c X
r
2
2
S = Yijk` − Ȳ····
i=1 j=1 k=1 `=1
on les sumes de quadrats associades als factors, a les interaccions entre dos dels factors
(de segon ordre), a la interacció entre tots tres factors (de tercer ordre) i a l’error són,
respectivament,
96
a
X a
X
2
SSTA = bcr (Ȳi··· − Ȳ···· ) = bcr (Ȳi··· )2 − n(Ȳ···· )2
i=1 i=1
X b Xb
SSTB = acr (Ȳ·j·· − Ȳ···· )2 = acr (Ȳ·j·· )2 − n(Ȳ···· )2
j=1 j=1
Xc Xc
SSTC = abr (Ȳ··k· − Ȳ···· )2 = abr (Ȳ··k· )2 − n(Ȳ···· )2
k=1 k=1
a
XX b
SSTAB = cr (Ȳij·· − Ȳi··· − Ȳ·j·· + Ȳ···· )2
i=1 j=1
a X
X b
= cr (Ȳij·· )2 − n(Ȳ···· )2 − SSTA − SSTB
i=1 j=1
Xa X c
SSTAC = br (Y i·k· − Ȳi··· − Ȳ··k· + Ȳ···· )2
i=1 k=1
Xa X c
= br (Ȳi·k· )2 − n(Ȳ···· )2 − SSTA − SSTC
i=1 k=1
X b Xc
SSTBC = ar (Ȳ·jk· − Ȳ·j·· − Ȳ··k· + Ȳ···· )2
j=1 k=1
b X
X c
= ar (Ȳ·jk· )2 − n(Ȳ···· )2 − SSTB − SSTC
j=1 k=1
a X
X b X
c
SSTABC = r (Ȳijk· − Ȳij·· − Ȳi·k· − Ȳ·jk· + Ȳi··· + Ȳ·j·· + Ȳ··k· − Ȳ···· )2
i=1 j=1 k=1
a X
X b X
c
= r (Ȳijk· )2 − n(Ȳ···· )2 − SSTA − SSTB − SSTC − SSTAB − SSTAC − SSTBC
i=1 j=1 k=1
X b X
a X r
c X
SSE = (Ȳijkl − Ȳijk· )2
i=1 j=1 k=1 `=1
97
i la taula ANOVA:
sstA
A a−1 sstA mstA = a−1
fA
sstB
B b−1 sstB mstB = b−1
fB
s2C
C c−1 mstC msC = c−1
fC
sstAB
AB (a − 1)(b − 1) sstAB mstAB = (a−1)(b−1)
fAB
mstAC
AC (a − 1)(c − 1) mstAC msAC = (a−1)(c−1)
fAC
mstBC
BC (b − 1)(c − 1) mstBC msBC = (b−1)(c−1)
fBC
mstABC
ABC (a − 1)(b − 1)(c − 1) mstABC msABC = (a−1)(b−1)(c−1)
fABC
sse
Error abc(r − 1) sse mse = abc(r−1)
Total abcr
|{z} −1 S2
=n
on les lletres en minúscula fan referència a les realitzacions dels estadı́stics que porten la
msi
mateixa lletra en majúscula. En particular, fi és la realització de l’estadı́stic Fi = mse ,
per a i = A, B, C, AB, AC, BC, ABC, i els graus de llibertat residuals s’obtenen restant
98
• Exemple:
99
Totals A × B (yij·· )
B
A 25 30
10 -5 1
12 4 16
14 22 37
Totals A × C (yi·k· )
C
A 200 250
10 -5 1
12 6 14
14 25 34
La taula ANOVA per a les dades del problema és:
Font de Suma de Graus de Quadrats F
variació quadrats llibertat mitjans
A 252.750 2 126.375 178.412a
B 45.375 1 45.375 64.059a
C 22.042 1 22.042 31.118a
AB 5.250 2 2.625 3.706b
AC 0.583 2 0.292 0.412
BC 1.042 1 1.042 1.471
ABC 1.083 2 0.542 0.765
Error 8.500 12 0.708
Total 336.625 23
(a indica que el valor f és significatiu a l’1 per cent, és a dir, agafant α = 0.01, i b que
ho és al 10 per cent, és a dir, amb α = 0.10)
Es veu que els 3 factors afecten la variable resposta. A més existeix una petita interacció
entre A i B. Com a material per a ajudar-nos en la interpretació pràctica dels resultats
dibuixem les següents gràfiques:
Gràfiques d’efectes principals: es dibuixa la resposta mitjana marginal per als nivells dels
3 factors. Es veu que tots 3 presenten efecte “positiu”, ja que en augmentar el nivell,
augmenta la resposta.
Gràfica de la interacció (entre A i B): mostra una lleugera interacció.
Com que el que es desitja és que la variable resposta (desviació mitjana respecte al valor
objectiu d’ompliment) sigui propera a 0, s’escull: nivell de B baix (25 psi), nivell de C
baix (200 apm), i nivell A també baix.
100
101
102
PER RECORDAR...
103
4.3 Els dissenys 2k
El disseny factorial 2k és un disseny factorial en el que tots els (k) factors tenen el mateix
nombre de nivells, 2, que es denoten per “−” i per “+”. El nombre total d’observacions
en cada rèplica completa del disseny 2k és, precisament, 2k , d’on li ve el nom.
Aquests dissenys s’utilitzen molt. Són particularment útils en els “experiments d’escrutini”,
amb els que es vol “detectar” els factors que influeixen la variable resposta sota estudi.
Per a fer-ho es consideren molts factors però només a 2 nivells cadascú. Un cop iden-
tificats els factors que sı́ influeixen la variable resposta, es realitza un altre experiment,
considerant ara aquests factors però amb més de dos nivells cadascun, per tal d’“afinar”
més en les conclusions de l’experiment.
• El disseny 22 .
Considerarem en primer lloc l’estudi del disseny 22 , de dos factors, diguem A i B, a dos
nivells cadascú (que denotem per “−” i “+”). Farem r rèpliques completes del disseny i,
en total, tindrem n = 2 × 2 × r = 4 × r observacions.
En realitat, aquest disseny ja l’hem fet a la secció 3.2. N’és un cas particular, ja que ara
considerem que a = b = 2. Perquè ho fem, doncs? Perquè el fet que els dos factors tinguin
només dos nivells cadascú fa que els càlculs necessaris per a obtenir la taula ANOVA es
puguin fer de manera molt més fàcil que si se segueix la metodologia general (de la secció
3.2). A més, és prou senzill, pel fet d’agafar només dos factors, com per a poder introduir
tot una sèrie d’idees que després es generalitzaran a més factors.
Veiem, doncs, en què consisteix el disseny 22 .
? En primer lloc veiem la forma “normal” del disseny, que és una matriu que ens indica
les condicions experimentals (o tractaments), i que és molt fàcil de construir. Tindrem
22 = 4 condicions experimentals, la forma estàndard de les quals (o “normal”) és:
A B y AB
1 − − (1) +
2 + − a −
3 − + b −
4 + + ab +
104
? Un cop tinguem recollides les dades estimarem els efectes principals, que són els efectes
dels factors A i B. Denotarem la estimació de l’efecte principal d’un factor per la mateixa
lletra que fem servir per referir-nos al factor. Aixı́,
1
A = ȳA+ − ȳA− = (ab + a) − (b + (1))
2r
1
B = ȳB+ − ȳB− = (ab + b) − (a + (1))
2r
ja que l’efecte d’un factor és el canvi mitjà que es produeix en la variable resposta degut
a un canvi de nivell en el factor, passant de nivell “−” a nivell “+”.
Aquı́ ȳA+ denota la mitjana de les observacions obtingudes amb nivell “+” del factor A.
Hi ha un total de 2 × r observacions que s’hagin obtingut amb nivell “+” del factor A i
la seva suma és ab + a; per tant,
1
ȳA+ = ab + a
2r
Anàlogament,
1 1 1
ȳA− = b + (1) , ȳB+ = ab + b i ȳB− = a + (1)
2r 2r 2r
i d’aquı́ la expressió obtinguda per als efectes principals.
Noteu que l’efecte de cada factor es calcula agafant els valors de la columna “y” sumant
o restant segons indiqui el signe de la columna del factor, i dividint per 2 × r, que és el
nombre total d’observacions amb cada signe (la meitat de 22 r). Gràcies al signes podem
calcular, doncs, molt fàcilment els efectes principals.
Encara que aquest cas és molt senzill, es fa servir la representació gràfica de la figura
següent de la manera en que es calculen els efectes principals dels factors:
B+ b ab
B− a
(1)
A− A+
105
? També podrem estimar la interacció de segon ordre (és a dir, la interacció entre els dos
factors), de la següent manera:
11
AB = diferència de l’efecte de passar A de “−” a “+” quan B és a “+”,
r 2
menys el mateix quan B és a “−” =
1 1
(ab − b) − (a − (1)) = (ab + (1)) − (a + b)
2r 2r
(aquesta última manera d’expressar l’efecte de la interacció entre A i B, que denotem per
AB, és per resaltar que es calcula com es feia amb l’efecte dels factors principals, però
amb els signes de la columna “AB”, que precisament per a això l’havı́em construı̈t).
2 2 2 2
SSTA = 2 r ȳA+ − ȳ + ȳA− − ȳ = r ȳA+ − ȳA− = r efecte d’A = r A2 .
Anàlogament,
SSTB = r B 2
SSTAB = r (AB)2
A més, com en el cas del disseny factorial de dos factors en general (amb qualsevol nombre
de nivells per factor), tenim que la suma de quadrats de l’error és
La taula ANOVA és la mateixa que pel cas del disseny factorial de dos factors en general,
però les sumes de quadrats es calculen com acabem de veure, que és més senzill:
r
sstB
B b−1=1 sstB = r B 2 sstB fB = sse
r
2 sstAB
AB (a − 1)(b − 1) = 1 sstAB = r (AB) sstAB fAB =
sse
r
sse
Error ab(r − 1) = 4 (r − 1) sse 4 (r−1)
Total n − 1 = 4r − 1 s2
106
La decisió sobre les hipòtesis que es plantegen es fa de la manera habitual:
1,4 (r−1)
Es rebutja H0A : no hi ha efecte del factor A, si fA > F1−α
1,4 (r−1)
Es rebutja H0B : no hi ha efecte del factor B, si fB > F1−α
1,4 (r−1)
Es rebutja H0AB : no hi ha efecte de la interacció AB, si fAB > F1−α
• Exemple de disseny 22 .
Rèplica
Tractament I II III Total (y)
A baixa, B baixa (−, −) 28 25 27 80=(1)
A alta, B baixa (+, −) 36 32 32 100=a
A baixa, B alta (−, +) 18 19 23 60=b
A alta, B alta (+, +) 31 30 29 30=ab
Calculem en primer lloc els efectes, per tal de poder calcular amb facilitat les sumes de
quadrats i fer la taula ANOVA:
1
A = 2×3
(ab + a − b − (1)) = 8.33
1
B = 2×3
(ab + b − a − (1)) = −5.00
1
AB = 2×3
(ab + (1) − a − b) = 1.67
107
Alto (2 sacos) + b=60(18+19+23) ab=90(31+30+29)
Cantidad de catalizador B
1,8
Com que F1−α = 5.32 amb α = 0.05, resulta que els dos factors tenen efectes significatius,
però no en té la seva interacció. Per tant, si no hi ha interacció però sı́ efecte dels dos
factors, aquests s’han de posar en els nivells que permetin optimitzar la variable resposta.
Com que l’efecte del factor A és positiu, interessa posar-lo al nivell “−” i com que l’efecte
del factor B és negatiu, interessa posar-lo al nivell “+”.
Conclusió: la concentració del reactiu i la quantitat de catalitzador no interaccionen,
però tots dos influeixen en la temperatura de reacció. Per tal de minimitzar-la interessa
fer servir un 15 % de reactiu i 2 unitats de catalitzador.
• El disseny 23 .
Considerem ara l’estudi del disseny 23 , de tres factors, diguem A, B i C, a dos nivells
cadascú (que denotem per “−” i “+”). Farem r rèpliques completes del disseny i, en
total, tindrem n = 2 × 2 × 2 × r = 8 × r observacions.
En realitat, aquest disseny també l’hem fet ja, a la secció 3.8. N’és un cas particular, ja
que ara considerem que a = b = c = 2. Ho fem, com en el cas del disseny 22 , perquè el
fet que els tres factors tinguin només dos nivells cadascú fa que els càlculs necessaris per
a obtenir la taula ANOVA es puguin fer de manera molt més fàcil que si se segueix la
metodologia general (de la secció 3.8).
? En primer lloc veiem la forma “normal” del disseny que, com en el cas del disseny 22 ,
és una matriu que ens indica les condicions experimentals (o tractaments), i que és molt
fàcil de construir. Tindrem ara 23 = 8 condicions experimentals, la forma estàndard de
les quals (o “normal”) és:
108
A B C y AB AC BC ABC
1 - - - (1) + + + -
2 + - - a - - + +
3 - + - b - + - +
4 + + - ab + - - -
5 - - + c + - - +
6 + - + ac - + - -
7 - + + bc - - + -
8 + + + abc + + + +
Fent servir totes les columnes de signes podem calcular fàcilment els efectes principals
dels factors, les interaccions de segon ordre (entre dos dels factors) i la interacció de tercer
ordre (dels tres factors alhora):
1
A = ȳA+ − ȳA− = (abc + ac + ab + a − bc − c − b − (1))
4r
1
B = ȳB+ − ȳB− = (abc + bc + ab + b − ac − c − a − (1))
4r
1
C = ȳC+ − ȳC− = (abc + ac + bc + c − ab − a − b − (1))
4r
(aquı́ ȳA+ , per exemple, és la mitjana de totes les observacions obtingudes amb el factor
A a nivell “+”, etc.)
1
AB = ((1) + ab + c + abc − a − b − ac − bc)
4r
1
AC = ((1) + b + ac + abc − a − ab − c − bc)
4r
1
BC = ((1) + a + bc + abc − b − c − ac − bc)
4r
109
1
ABC = (a + b + c + abc − (1) − ab − ac − bc)
4r
bc abc
Alto + c
ac
Factor C
b Alto +
ab
Factor B
Bajo − (1)
a Bajo −
Noteu que la interacció AB, per exemple, és un mig de la diferència entre l’efecte mitjà
del factor A quan el factor B es troba a nivell “+” i quan es troba a nivell “−”, és a dir,
Un cop calculats els efectes (tant els principals com els de les interaccions), es calculen
les sumes de quadrats amb la següent fórmula:
(en particular, per k = 3, que és el cas que ens ocupa ara, tindrem que la suma de
quadrats d’un efecte és (efecte)2 2 r ).
Justificació de la fórmula: Per exemple, si l’efecte és l’efecte principal del factor A (els
altres es farien de manera anàloga), tindrı́em, fent servir la definició de la suma de
quadrats associada a un factor, que
SA2 = r 2k−1 (ȳA+ − ȳ)2 + (ȳA− − ȳ)2 ,
ȳA+ +ȳA−
Resulta que ȳ = 2
i, per tant, substituint a la expressió que tenı́em per a SA2 ,
tindrem que
110
ȳA+ − ȳA− 2 ȳA− − ȳA+ 2
SA2 = r 2k−1 ( ) +( ) = r 2k−2 (ȳA+ − ȳA− )2 = (efecte)2 2k−2 r
2 2
Veiem ara com queda la taula ANOVA pel disseny 23 amb r rèpliques:
mstA
A sstA = A2 2 r 1 mstA = sstA fA = mse
mstB
B sstB = B 2 2 r 1 mstB = sstB fB = mse
msC
C sstC = C 2 2 r 1 mstC = sstC fC = mse
mstAB
AB sstAB = (AB)2 2 r 1 mstAB = sstAB fAB = mse
mstAC
AC sstAC = (AC)2 2 r 1 msAC = mstAC fAC = mse
mstBC
AC sstBC = (BC)2 2 r 1 msBC = mstBC fBC = mse
mstABC
ABC sstABC = (ABC)2 2 r 1 msABC = mstABC fABC = mse
sse
Error sse n−1−7=n−8 mse = n−8
Total s2 n−1
amb
sse = s2 − sstA − sstB − sstC − sstAB − sstAC − sstBC − sstABC
la suma de quadrats residuals.
Nota: Com sempre, si sabem que alguna de les interaccions no pot donar-se, afegirı́em
la seva suma de quadrats i els seus graus de llibertat (que són 1) a la suma de quadrats i
els graus de llibertat, respectivament, residuals. En particular, això s’ha de poder fer, al
menys amb la interacció de tercer ordre (ABC) en el cas que tinguem només una rèplica
del disseny (r = 1), ja que si no els graus de llibertat residuals són 0 i no podem estimar
l’error.
• Exemple de disseny 23 .
Un enginyer intenta millorar la duració d’una eina de metall que es fa servir per tallar cert
tipus de material (es tracta, doncs, de maximitzar la variable resposta, que és la duració
de l’eina). Per tal de fer-ho, realitza un experiment 23 , és a dir, considera 3 factors: el
factor A, que és la velocitat de tall de l’eina, amb a = 2 nivells; el factor B, que és la
111
duresa del metall del qual s’ha construı̈t l’eina, amb b = 2 nivells, i el factor C, que és
l’angle de tall, també a dos c = 2 nivells. S’han fet dues rèpliques (r = 2) i, per tant, es
tenen n = 23 2 = 16 observacions, que apareixen a la següent taula, juntament amb la
seva suma per tractament o condició experimental (que forma la columna “y):
Per tal de contestar aquestes preguntes, el primer que hem de fer és construir la taula
ANOVA del disseny i, per a fer-ho, calculem primer els efectes dels factors i de les inte-
raccions, a partir de les columnes de signes:
A B C AB AC BC ABC
- - - + + + -
+ - - - - + +
- + - - + - +
+ + - + - - -
- - + + - - +
+ - + - + - -
- + + - - + -
+ + + + + + +
1
A = (811 + 783 + 1024 + 760 − 532 − 702 − 893 − 1105) = 18.25
8
1
B = (811 + 1105 + 1024 + 702 − 532 − 760 − 893 − 783) = 84.25
8
1
C = (811 + 1105 + 783 + 893 − 532 − 1024 − 702 − 760) = 71.75
8
112
1
AB = (532 + 1024 + 893 + 811 − 760 − 702 − 783 − 1105) = −11.25
8
1
AC = (532 + 702 + 783 + 811 − 760 − 1024 − 893 − 1105) = −119.25
8
1
BC = (532 + 760 + 1105 + 811 − 702 − 1024 − 893 − 783) = −24.25
8
1
ABC = (760 + 702 + 893 + 811 − 532 − 1024 − 783 − 1105) = −34.75
8
(6610)2
on s2 s’ha calculat com s2 = 2865344 − 16
i sse com s2 − sstA − · · · − mstABC .
Si mirem a la taula de la distribució F , amb 1 i 8 graus de llibertat, amb α = 0.05 obtenim
1,8 1,8
que F1−α = 5.32 i si agafem α = 0.01, llavors F1−α = 3.46. En totes dues situacions ens
surt que hi ha efecte significatiu dels factors B i C i de la interacció AC, i no de la resta.
Per tant, la resposta a la qüestió a) és: afecten els factors B i C. A més, el factor A
interacciona amb el C i, per això, també ha de ser tingut en compte.
Per contestar a la qüestió b) hem de tenir en compte que com que el factor B no inter-
acciona amb cap dels altres i el seu efecte és positiu, de cara a maximitzar la variable
resposta, hem de posar B a nivell “+”. Per veure a quin nivell hem de posar els altres
dos factors, com que aquests sı́ que interaccionen entre sı́, hem de fer la gràfica de les
interaccions.
Amb ella veiem que, dels quatre punts, el que fa màxima la resposta és A a nivell “−” i
C a nivell “+”. Per tant, la resposta a la qüestió b) és:
A− , B+ , C+
A− , C+
que no depèn del factor B, ja que no hi ha interacció entre B i cap dels altres dos factors.
113
1000
999
A−
900
892
A+
800
797
700
617
600
− + C
• Un exemple de disseny 24 .
A partir dels dissenys 22 i 23 que hem tractat, ja es veu com s’estudiaria un disseny 2k ,
amb k qualsevol nombre de factors. Com que és llarg d’escriure en general, veurem per
acabar un exemple concret de disseny 24 , és a dir, un disseny factorial amb k = 4 factors,
A, B, C i D, a dos nivells cadascú (que denotem per “−” i “+”). Farem r = 1 rèplica
completa del disseny en aquest cas i, en total, tindrem n = 24 = 16 observacions.
114
Factor
Tractament A B C D y
1 - - - - (1)= 45
2 + - - - a = 71
3 - + - - b = 48
4 + + - - ab = 65
5 - - + - c = 68
6 + - + - ac = 60
7 - + + - bc = 80
8 + + + - abc = 65
9 - - - + d = 43
10 + - - + ad = 100
11 - + - + bd = 45
12 + + - + abd = 104
13 - - + + cd = 75
14 + - + + acd = 86
15 - + + + bcd = 70
16 + + + + abcd = 96
Començarem
per calcular els efectes (tant els efectes principals dels
4 factors, com les
4 4
2
= 6 interaccions de segon ordre entre parelles de factors, les 3 = 4 interaccions de
tercer ordre entre tres dels factors i la interacció de quart ordre entre els 4 factors), a
partir de les columnes de signes, que es troben de la manera obvia, a partir del que hem
vist,
Els efectes són els de la següent taula, ordenats de més gran a més petit, i al costat posem
les seves sumes de quadrats, tenint en compte que
1 1
efecte = k−1
··· − ··· = ··· − ···
r2 8
115
on els primers punts suspensius són els r 2k−1 valors de la columna “y” que tenen signe
“+” a la columna de signes de l’efecte, i els segons punts suspensius són els que tenen
signe “−”. A més,
Per tal de fer la taula ANOVA necessitem també calcular la suma de quadrats total:
s2 == 5730.9375 .
Amb r = 1 rèplica no podem estimar l’error i, per tant, la metodologia ANOVA que hem
desenvolupat no es pot fer servir. Afortunadament, però, se sap que els quatre factors
no poden interaccionar alhora (és a dir, que no hi ha interacció ABCD, cosa que sembla
raonable tenint en compte el valor tan baix, en valor absolut, obtingut per a aquesta
interacció). Llavors, “passem” la interacció ABCD a l’error (per tant, sse = s2ABCD ,
amb 1 grau de llibertat) i la taula ANOVA ens queda aixı́:
116
Font Variació Suma Quadrats g.l. Quad. Mitj. F
1,1
Mirant a la taula de la F , resulta que F1−0.05 = 161.4 i, per tant, són significatius els
efectes:
A i AC
1,1
Si agafem α = 0.10, llavors F1−0.10 = 39.86 i resulten significatius
A, C, D, AC i AD
L’efecte dels factors A, C i D és positiu en els tres casos. Quant a les interaccions, hem
de fer els gràfics per a AC i per a AD.
Llavors, la variable resposta es maximitza quan els factors A i D es troben a nivell “+”
i el factor C es troba a nivell “−”. El factor B no afecta ni interacciona amb els altres,
aixı́ que es pot posar al nivell que més ens convingui per altres criteris (que no siguin la
optimalitat de la variable resposta, com ara reducció de costos, etc.).
Veiem que amb un nivell baix del factor C (que és el que l’enginyer desitjava) hem
aconseguit optimitzar la variable resposta, gràcies a que hem “jugat” adequadament amb
els altres factors i al disseny factorial.
117
Rapidez de filtración promedio(gal/h) Rapidez de filtración promedio(gal/h)
40
50
60
70
90
80
40
50
60
70
90
80
−
−
Interacción AC
118
C=−
Interacción AD
A
C=+
+
D=+
D=−
PER RECORDAR...
1
• El càlcul dels efectes com efecte = · · · − · · ·
r 2k−1
on els primers punts suspensius són els r 2k−1 valors de la columna “y” que tenen
signe “+” a la columna de signes de l’efecte, i els segons punts suspensius són els que
• A partir de les sumes de quadrats es fan la taula ANOVA i els tests F com sempre.
• Si r = 1 es necessita saber que alguna interacció (d’ordre alt) no existeix per passar
119