Crisafa Pr.6

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 11

Cristiana Fata

Mariel Antón
3r Biologia
18/11/2022

Pràctica 6: Anàlisi de la covariància (ANCOVA )

Tasca 1: Planteja un model ANCOVA en el qual s’estudie la longitud del cap de les
truites en funció dels altres 3 factors (sense interacció) contemplats en la base de
dades. De quin tipus es cada factor inclòs al model?
Tenen totes les covariables que has considerat un efecte significatiu?
Dona l’expressió de la recta de regressió que correspondria a cadascun dels grups
de truites considerats en el model ANCOVA.

Primer de tot, cal descriure la mostra: Es pot observar que hi han 120 rèpliques i 4 variables.
Aquestes variables són:
- Cabeza: variable resposta (Y), longitud en mil·límetres del cap de cadascuna de les truites.

- Lago: variable tipus de llac (factor) amb valors Kootenay i Wilson. Es tracta d’un factor fix.

- Sexo: variable sexe (factor) amb valors Macho (mascle) i Hembra (femella). Es tracta d’un
factor fix.

- Total: variable numèrica, longitud en mil·límetres total de cadascuna de les truites.

Es planteja un model ANCOVA degut a que hi han tant variables numèriques (Total) com variables
categòriques (Lago i Sexo). A més, la variable categòrica Sexo té dos possibles opcions (Macho i
Hembra).

Primer de tot, cal ajustar un model lineal per tal de veure l’efecte de cadascuna de les covariables.
El nostre model lineal és: Cabeza=Lago+Sexo+Total, per tant, realitzarem un model de regressió
lineal per obtindre aquestes dades:
Estadístics→ ajustar models→ model lineal

1
Com es pot observar en aquesta eixida, per a cada un dels factors, el p-valor és menor que 0’05. Per
tant, podem afirmar que aquestes variables tenen efecte significatiu sobre la mida del cap.
Mirem també la taula corresponent al model ANOVA, la qual és igual que l’ANCOVA:
anova(LinearModel.1)

En aquesta eixida, podem veure també que els p-valor són molt menors que 0,05 i d’aquesta manera,
tenim evidència que les variables Lago, Sexo i Total tenen efecte significatiu sobre la mida del cap.

Ara bé, les rectes de regressió per a cada un dels factors (que s’obtenen a partir de l’output generat a
partir del model de regressió lineal) són les següents:
- Mascles Wilson:
Cap= -5,4896+4,2003+0,2521X

- Femelles Wilson:
Cap= -5,4896-3,5807+4,2003+0,2521X

- Mascles Kootenay:
Cap= -5,4896+0,2521X

- Femelles Kootenay:
Cap= -5,48-3,58+0,25X

2
Tasca 2: Partint del model anterior, planteja’t diversos models alternatius en els
quals inclogues, per a cadascun d’ells, la interacció entre dos de les covariables del
model anterior. Consideres oportú incloure al teu model cap de les interaccions que
has considerat? Interpreta els resultats d’aquest model i dona l’expressió de les
rectes de regressió que correspondrien als diferents grups de truites per a aquest
model ANCOVA.
En aquest cas, el que fariem és generar manualment els models lineals incloent una interacció en
cada cas:

1. Interacció Lago:Sexo.

Com es pot observar, el p-valor resultant de la interacció és major que 0,05. Per aquest motiu,
podem afirmar que aquesta interacció no té efecte significatiu sobre la variable resposta.
Per tant, no caldria incloure aquesta interacció al nostre model. És a dir, l’efecte del lloc sobre el sexe
no afecta la mida del cap dels peixos.
En conclusió, ens quedem amb el model anterior i més simple (sense interacció).

2. Interacció Lago:Total

Si observem el p-valor d’aquesta interacció, veiem que tampoc té efecte significatiu sobre la variable
resposta (ja que, el p-valor és major que 0,05). Per tant, no inclouriem tampoc aquesta interacció al
nostre model.

3. Interacció Sexo:Total

3
Si observem el p-valor de la interacció, es pot observar que és menor que 0,05 (0,001174). Per tant,
hi ha evidència de que aquesta interacció sí que té efecte significatiu sobre la variable resposta.
És a dir, l’efecte de la variable numèrica sobre el sexe conseqüentment té efecte sobre la mida del
cap dels peixos.
Per tant, afegirem la interacció Sexo:Total al nostre model ja que, és la única interacció que té efecte
significatiu sobre la variable resposta.

Amb aquest nou model considerat (Cabeza=Lago+Sexo+Total+ Sexo:Total), les rectes de regressió
són:
- Mascles Wilson:
Cap= -7.85+3.94+0.25X

- Femelles Wilson:
Cap= -7.85+3.94+2.13 + (0.25-0.018)X

- Mascles Kootenay:
Cap= -7.85+0.25X

- Femelles Kootenay:
Cabeza= -7.85+3.94+ (0.25-0.018)X

Tasca 3: Per al model que t’haja semblat més oportú en la Tasca 2, torna a executar
aquest model però canviant l’ordre de les covariables en la sintaxi. Duu a terme
sengles anàlisis ANOVA per valorar la rellevància de les covariables en tots dos
models. Obtens que les variables són igualment significatives en canviar l’ordre?
Valora, alternativament, l’ús de la funció drop1 per a avaluar la rellevància de les
variables dels teus models. Obtens per a drop1 els mateixos valors
de rellevància, independentment de l’ordre de les variables? Trobes relació entre les
rellevàncies obtingudes mitjançant drop1 i les reportades pel model lineal
corresponent? Atesos al aquestos resultats, elimina, si escau, les covariables que al
model. Quin és el model final?

El model considerat és: Cabeza=Lago+Sexo+Total+Sexo:Total

4
Al realitzar un canvi en l’ordre de les covariables hem obtès:

1. Cabeza ~ Sexo +Lago +Total +Sexo:Total

ANOVA:

2. Cabeza ~ Total+ Sexo +Lago +Sexo:Total

ANOVA:

5
3. Cabeza ~ Total+Lago+Sexo +Sexo:Total

ANOVA:

4. Cabeza ~ Lago+Total+Sexo +Sexo:Total

6
ANOVA:

5. Cabeza ~Sexo+Total+Lago +Sexo:Total

ANOVA:

Al realitzar un ANOVA de comparació amb el model original de la Tasca 1 i el nou que hem
considerat en la Tasca 2 obtenim la següent eixida:

Per a aquest cas, cal considerar el següent contrast d’hipòtesis:


H0 : Els dos models tenen el mateix poder explicatiu
HA : Les variables addicionals del Model 2 contenen informació rellevant.

7
Si observem l’eixida, podem veure que el p-valor és menor que 0,05.
Per tant, rebutgem la hipòtesi nul·la i per tant, tenim evidència per afirmar que la interacció
Sexo:Total sí que ens aporta informació rellevant i d’aquesta manera, podem deixar la interacció al
nostre model.
D’altra banda, segons s’observa, al canviar l’ordre de les variables, açò no afecta la significativitat de
cada covariable al model (no afecta als p-valor).

Finalment, cal dir que com es tracta d’un model no balancejat, sí que podem considerar l’ús del
drop1. Ja que, aquest s’utilitza en dissenys no balancejats perquè l’ordre en que afegim les variables
en el model sí que afecta. Per tant, per tal de poder ajustar cada factor (sense haver de fer-ho
manualment), utilitzem drop 1.

drop1(ModelLineal, .~., test="F")


1. Cabeza ~ Sexo +Lago +Total +Sexo:Total

2. Cabeza ~ Total+ Sexo +Lago +Sexo:Total

3. Cabeza ~ Total+Lago+Sexo +Sexo:Total

8
4. Cabeza ~ Lago+Total+Sexo +Sexo:Total

5. Cabeza ~Sexo+Total+Lago +Sexo:Total

Es pot observar en les diverses eixides, que amb el drop1, l’ordre de les covariables en aquest cas
tampoc afecta el p-valor i per tant, tampoc té efecte sobre la significativitat de les variables.
A més, es pot veure que la significativitat no canvia respecte al model lineal.

Tasca 4: Considerem ara que l’estudi dut a terme no haguera tingut particular interés
a estudiar les diferències entre aquests dos llacs concrets sinó, respecte d’aquest
factor, simplement quantificar i tindre en compte la variabilitat que pogueren introduir
els llacs sobre les dades. Modifica el model que hages decidit a la tasca anterior per
a dur a terme l’anàlisi estadística oportuna més convenient en aquesta nova
situació. Quina variància trobaríem en aquest cas entre llacs? Quin seria el seu
coeficient de correlació intraclase? Consideres que la variabilitat de l’efecte llac és
significativament diferent de 0? Com canviaria la interpretació de l’intercept d’aquest
model respecte al que has ajustat a la Tasca 3?

En aquest cas, com hem de considerar la covaribale Lago com a variable aleatòria, hem de realitzar
un ranova per a aquest factor.
Per tant, el nostre model serà: Cabeza ~Sexo+Total+(1|Lago) +Sexo:Total

9
En aquesta eixida corresponent al ranova, podem veure que al considerar Lago com a factor aleatori,
no canvia el fet de que siga significatiu. És a dir, l’efecte de cada llac sobre la variable resposta és
significatiu.

Ara bé, per tal de veure la variància d’aquest factor aleatori ens fixem en la següent eixida:

Com podem veure, en la part corresponent als efectes aleatoris (Random Effects), la variància
corresponent al factor Lago (d’efecte aleatori), és 7.239.

El coeficient de correlació intraclasse en aquest cas sería:

p= 7.239/ (7.239+17.743) = 0.289


És a dir, el model explica aproximadament un 30% de la variabilitat.

D’altra banda, considerem que la variabilitat de l’efecte llac sí que és significativament diferent de 0.
Ja que, el p-valor del ranova és menor que 0.05. Per tant, podem considerar que aquesta variable sí
és significativa.

Finalment, respecte a l’intercept de la Tasca 3, aquest sí que canvia degut a que considerem el factor
Lago com aleatori i abans com a fix.

10
11

You might also like