Práctica 4regressió Lineal Múltiple Amb Interacció

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 16

PRÁCTICA 4REGRESSIÓ LINEAL MÚLTIPLE AMB INTERACCIÓ.

Exemple estudi en endocrinologia


Estudiar l’efecte del suplement d’estrògens per disminuir la pèrdua de massa òssia en
dones post menopàusiques.

Es va realitzar un estudi randomitzat amb dos grups de dones:

1. Crema d’estrògens
2. Placebo crema d’estrògens

Les dones es van visitar cada tres mesos durant dos anys i també es va estudiar el
consum de vitamina D.

Pèrdua òssia es va calcular per cada dona i s’expressa respecte el percentatge de


massa òssia inicial.

Utilitza les dades perdua_ossia_sense_interaccio.dat

● VARIABLE DEPENENT: Pèrdua de massa òssea


● Factors confusors i interacció
● Ajudar a fixar la idea que en tot processos hem de descriure la variable
resposta, després l’estadística bibariant amb diferents variables i finalment el
model de regressió múltiple per concloure amb un únic error de alfa el més
petit possible.
1. ¿La pèrdua de massa òssia ha estat diferent en funció del grup d’estudi? S, ja que
en estrògens la pèrdua es menys 2 i la del placebo es menys 12.
a. Descriu cada grup d’estudi en funció si té crema d’estrògens o no.

Quan treballem amb txt- importem dades que no estan en Rcmdr i els hem de
importar.
Si ens equivoquem en el decimal quan anem a fer qualsevol anàlisi, qualsevol dada
serà qualitativa, factor.
Variable 1: pèrdua de massa osea
Variable 2: quantitat de vitamina que prenen
Variable 3: si prenen estrògens o placebo

Com apareixen amb etiquetes ja sabem que les variables son factors, si en R no les
tenim definides com a factor, el R no podrà treballar com si fós qualitativa.

Variable d’estudi: pèrdua de massa òssea � l’hem de descriure:

ESTADISTICOS- RESUMENES NUMÉRICOS (variable pèrdua) - RESUM PER GRUPS


MEDIA:
Estrògens: -2 (hem perdut 2 unitats)
Placebo: -12
Podem pensar que l’estrògen està funcionant. Hem de mirar si son simètriques o no,
mirem la n = 25 es < de 30, necessitem que aquestes variables siguin normals. A
primera vista la media i la mitjana dels estrògens son molt semblants, això ens indica
que poden ser simètriques. Per part del placebo, també s’asemblen, per tant, poden
ser simètriques. Per asegurarnos, podem fer una gràfica:

GRÀFICA- DIAGRAMA DE CAIXA- (Variable pèrdua) – Per grups

Podem veure que e el grup de placebo que hi han més pèrdues (-14) que en el de
estrògens (-2). També per la línia del mitj que es la mediana i els diferents quartils que
es des de la línia del mitj fins la paret del quadrat, en els estrògens es més semblant
que no en els de placebo.

b. Compara els grups (t-student que no sabem fer)

Per poder concloure que si que es vritat que cada grup hi ha diferent pèrdua de massa
osea depenent del tractament. Aquestes diferencies son suficientment gran com per
una mostra de 25 afrimar que si que es vritat. Per poder afirmar-ho fem DIFERENCIA
ESTADÍSTICA i calcular la probabilitat d’error quan afirmem això.
- Variable quantitativa: pèrdua
- Variable qualitativa: tractament
Per poder comparar-ho fem una comparació de medias ja que son dos grups
independents = T-student amb dades independents.

Fem estadística paramètrica, per tant, estem dient que necessitem comparar els dos
paràmetres de la distribució que volem estudiar (paràmetres: media i variància), hem
de comparar-los, si sabem que la comparació de medias depèn del test q estudies si les
medias son iguals o distintes, primer hem de fer un test de homogeneidad.

TEST DE HOMOGENEIDAD DE VARIANZAS- ESTADÍSTICOS- VARIANZAS- F FISHER


(quan la variable qualitativa té dos categories, en el nostre cas, té la categoria pèrdues
i vitamina d.)

Opcions: bilateral ja que ens dona igual si es més gran una o més gran l’altre.
Confiança al 95%

La estimació de la ratió de variàncies dona 1,2 = valor pròxima 1 i p value (Ho:


variàncies son iguals, Hi: variàncies alternatives), només acceptarem Hi quan els valors
siguin < 0,05. En el nostre cas p value= 0,53 i per tant acceptem Ho = homogeneïtat de
variàncies.
Dins de l’interval de variància de probabilitat (0.56-2,97), entra el 1 i per tant que les
variables siguin iguals. Si la p fosi 0,05 no entraria el 1 a l’interval ja que les variables
no podrien ser mai iguals, en aquest cas al acceptar la Ho, entra el 1 ja que hi ha
probabilitats que les variables siguin iguals.

Per comparar la media:


ESTADISTICOS- MEDIAS- TEST T PARA MUESTRAS INDEPENDIENTES (poblacions tratar
i sense tratar).
Opcions: lo mateix que abans, si no tenim evidencies que una sigui mes gran que
l’altre, posem BILATERAL. 95% � ja que en materials i mètodes hem dit que
treballaríem amb un risc alfa del 0,05. Suposem variàncies iguals ja que ho hem mirat
abans i hem accepta HO per tant si.

T Student: 0,038� valor més alt que 0


Diferencia entre dos medias. Hipòtesis nul·la= 0/ hipòtesis alternativa = diferent a 0.
P value � 2,2 x 10^-16� acceptem Hi, hi ha diferència entre els dos grups.
Descriptiva� Media per estrògens : -2,85 Media de pèrdua per placebo = -12.36 , la
media entre aquests dos podríem restar els 2 valors.
Però la estimació per interval per diferenciar les dos medias que ens quantifica la
diferencia entre grup tractat i no tractat ens diu que hi ha una diferència entre (9,09-
9,99) unitats de Calci.

Si volem presentar una gràfica: GRÀFICA- GRÀFICA DE LAS MEDIAS- ens donarà les
estimacions de les medias per intervals. I ens donarà les estimacions per medias.

La Media per l’estimació per els


estrògens i per el placebo, per
tant el valor d’estrògens no es pot
observar dintre del placebo i a la
inversa.
2. ¿Existeix relació entre la pèrdua de massa òssia i
vitamina D?

Variable quantitativa: pèrdua de massa òssia i vitamina D.


Existeix associació probabilística entre 2 variables
quantitatives� CÀCLUL DE COEFICIENT LINEAL DE
PEARSON.
1- Veure si les variables son lineals
GRÁFICAS- DE DISPERSION- (x: vitamina D, y:
pèrdua de massa)
Podem veure que estan alineades, com som paral·lels
podem pensar que NO hi ha interacció entre Vitamina D i
el tractament.

Està relació hem de mirar si es significativament diferent o igual a 0- COEFICIENT


LINEAL DE PEARSON � VOLEM QUE ENS DIGUI SI LA R es diferent a 0.

ESTADISTICO- RESUMENES- TEST DE CORRELACIO-

Segons Pearson veiem que no hi ha relació perquè la Ho: existeix relació / Hi: no
existeix relació.
La p value= 0,41 per tant confirmem que no hi ha relació.
Les diferències que observem son degudes al tractament, NO a la vitamina D, com
pot haver-hi confusió, la vitamina D podríem pensar que pot afectar al funcionament
del tractament, això ho pregunta en el seguent apartat.
3. Esta relacionat la pèrdua de massa òssia amb el grup de tractament
y el consum de vitamina D .

Ens demana si realment la inclusió de la vitamina d al model pot cambiar la


importància del tractament.
Fins ara hem fet probabilística bivalent, en el apartat 1 ens ha donat que es
significativa (Tractament) i no significativa (vitamina D).
Però com tenim una recerca bibliogràfica en el que si que existeix relació amb la
vitamina d podria passar que estigués covariant amb altres coses i ens donés aquest
valor. Per tant ho fem amb un model multivariable.

MODELOS (canviant fonamentalment en que influïm la estimació de la variable baix el


model i incloem el error, que es important la variància del error entre les variàncies
que ens intenten explicar ens dirà si aquestes variables ens estan donant informació
significativa o no).
ESTADISTICOS- AJUSTE DE MODELOS- MODELO LINEAL ( ja podem introduir variable
qualitatives (tractament) mentre que en la regressió lineal totes les variables han de
ser quantitatives.

Variable depenent: pèrdua de massa òssia.


Variable explicativa: factor (Tractament) +
vitamina d.

Podem veure que, la vitamina D si que es significativa cosa que abans no ho era, abans
el valor del tractament era un valor de 9-10 i ara està per sobre de 10. Reflexionar el
concepte de confusió, el que ens està dient aquesta informació es que per un costat es
que els residus esperem que siguin 0, volem que les diferencies entre els valors
observats i esperats per sobre i per baix de la recta de regressió se completen i siguin
0, construint així la recta. Podem veure que la mediana coincideix amb la media da
0,02, per tant anem bé.
Coeficient= y=a + b 1 x1+b2x2
A: intercept: -9.99 es distint de 0 (ho: initercept val 0, Hi: intercept distint de 0), com
el p value es inferior a 0,05 acceptem la Hi, per tant la recta de regressió no passa per
l’ordenada d’origen sinó que passa per -9.99.
Efecte grup per placebo: -10 per veure si es significatiu� (h0:-10 igual a 0, Hi: -10
distint de 0), com la p value es petita de 0,05 acceptem Hi i per tant el grup placebo no
es distint a 0 i existeix efecte tractament.
Efecte vitamina D: 0,49 (ho: igual a 0, hi : distint a 0) p value més petit a 0,05 per tant
acceptem que no val 0 i si que existeix EFECTE de la vitamina D.

Aquest 0,49 es la pendent, per cada unitat de vitamina D que incrementem en la


ingesta pugem 0,49 de calci.

R quadrat: 0,99
R quadrat ajustat: 0,99
Per tant veiem que aquest model està explicant el 0,99 d’aquest model.
També amb F estadístic que explica (Ho: el model no explica les variables o hi: el
model si que explica les variables) podem veure que p value es inferior a 0,05 per
tant, el model SI que explica variabilitat.
4. Existeix una interacció entre el grup de tractament i el consum de vitamina D?
Interpreta el resultat.

La pregunta la interpretem com: L’efecte de vitamina D es diferent per la gent que


pren tractament que per la que no? Això seria la interacció

La confusió: canvia el paràmetre de la primera variable quan introduíem la segona, en


el nostre cas, quan introduïm la primera esta un valor entre (9-9,9)

I quan
afegim la
variable
vitamina D el
valor puja a 10.

Interacció vol dir si la vitamina D funciona de diferent maneta en el grup placebo i


tractat.
En aquest model fem primer introduir el concepte INTERCCIÓ.
ESTADISTICOS- MODELOS- MODELOS LINEAL- afegim als factors + vitamina D + grup
* vitamina D. � aquest model es un model d’interacció

Si existeix interacció podrem treballar amb les dades.


Podem veure que NO ha canviar gairebé
res, i aquesta interacció (GRUP T
PLACEBO I VITAMINA D) NO ES
SIGNIFICATIVA JA que la p value= 0,16.
Per tant, acceptem Ho i no hi ha
interacció. Per tant per aquest model
tornaria a com ho havíem fet abans i
trauria la suma (grup * placebo)

Per tant, aquest es el nostre model:

Per tant, el que hem de fer amb aquest model es calcular les estimacions per interval
dels paràmetres i mirar si el model es compleix o no les normes d’aplicació.

MODELOS- SELECCIO DE MODELOS- ACCEPTEM MODEL


Modelo 1=3� modelo 2 variables
Modelo 2� interacció

Una vegada acceptem anem a MODELOS- INTERVALS DE CONFIANÇA


Obtenim les estimacions puntuals i les
estimacions per interval, com volem
mirar la magnitud de l’efecte de lo que
estem treballant hem de fer l’estimació
per interval de 2 paràmetres.

Com sabem si el meu modelo es OK o no OK


MODELOS – GRÁFICAS- GRÁFICAS BÁSICAS DE DIAGNÓSTICO
CONSOLA:
Els residus son normals? Veiem que el
QQ son bastant normals, tenim 2
aulayers en el cas 31 i 40 però com en
principi només son 2 de 25 les deixem.
Aparentment hi ha NORMALITAT.

Existeix homesticitat = les variàncies son


iguals? � ho mirem en els gràfics de
l’esquerra, com son dos grups tractats i
no tractats, excepte els aulayers, veiem
que els grups si que presenten
homoesticitat ja que el núvol de punts es
igual per els dos grups.
Això ens determina si el model funciona
o NO funciona.

AMB AIXÒ ACABEM L’ANÀLISI DEL MODEL LINEAL SENSE INTERACCIÓ, si tornem a R
ens està dient que les persones que estan tractades, tindran 10 unitats menys de
pèrdua i la vitamina D , les incrementarà 0,49 per cada unitat que han pres sobre el
valor més baix.

Aquestes dues dades son independents, si jo prenc vitamina d teòricament


incremento 0,49 per cada unitat que prenc, si a més prenc placebo tindria 10 unitats
menys de pèrdua. Això ho podem veure en la gràfica de dispersió.
Gràfica- dispersió – Vitamina D i placebo.

Independentment si prens o no tractament la pendent de l’increment de falta de


pèrdua de massa ossa es igual en els dos grups, hi ha una diferència constant
independentment del que estiguis prenen de vitamina d la diferencia entre tractats i
no tractats� AIXÒ SERIA MODEL DE REGRESIÓ LINEAL MÚLTIPLE SENSE INTERACCIÓ:

Descrivim la variable depenent i mirem l’associació amb les variables independents i a


partir d’aquí construïm un model- Una vegada que acceptem el model, mirem si es
compleixen els criteris d’aplicació.
No discutim les descriptives, sinó que discutim els anàlisis multivariants.

FINS AQUI PART 1: SENSE INTERACCIÓ

PART 2: AMB INTERACCIÓ: nova base de dades.

Hauríem de veure que passa quan hi ha interacció, veiem que el últim paràmetre que
hem introduït, es significatiu.

DATOS- IMPORTAR DATOS (data set interacció) . Mateixa base de dades que abans
però ara si que existeix interacció entre vitamina D i tractament.
Hauríem de fer lo mateix que hem fet abans, però com ja ho hem fet podem anar
directament a l’objectiu que es: si de debò existeix interacció entre vitamina D i
tractament.
Això ho podem fer gràficament entre la relació de pèrdua de massa òssia, cosnum de
vitamina D i tractaments.

GRÀFIQUES- DAIGRAMA DE DISPERSIÓN (y: pèrdua massa osea/ x: vitamina D) i per


grups (tractament)

Veiem que el nou gràfic ha canviat, el núvol


de punts per el grup tractat i per el grup
placebo NO son paral·leles, tenen diferents
pendents, si tomem com a base la pendent
dels placebos, a la pendent del tractament
haurem de donar-li un plus: pendent
major� interacció en el grup no tractat per cada unitat de vitamina D, creixes un poc, i
per el grup tractat per cada unitat de vitamina D, creixes molt més, es a dir, hi ha un
efecte tractament i efecte vitamina D diferent en els diferents grups de tractats i no
tractats, per cada vitamina D que tu prens la quantitat de Ca que tu fixes es major en el
grup de tractats.
PER VEURE SI ES SIGNIFICATIVA: PART DE MODELITZACIÓ ESTADÍSTICA: generem un
model de interacció per veure si es significativa.

ESTADISTICOS- AJUSTE DE MODELOS- MODELOS LINEALES (ja que es qualitativa) -


PERDIDA DE MASA OSEA EN FUNCIO DEL TRACTAMENT =( grup + vitamina D + en
funció de la interacció (grup * vitamina D) � la interacció la fem multiplicant,
generalment la interacció es fa entre una variable quantitativa i una qualitativa es a dir
que un dels dos valors de la variable qualitativa, fa que la pendent entre les dos
variables quantitatives siguin distintes, perquè es difícil interpretar la interacció entre
dos variables quantitatives.

Podem veure que de nou els errors hi ha simetria i que estan centrats en el 0 ja que la
mediana es 0,00 per tant esperem que la mediana sigui 0 i que la variable sigui
SIMÈTRICA.
Intercept: -20
Grup: 0.14
Vitamina d: 0,8
Placebo : -0.50
En principi la pendent 0,80 es la pendent entre pèrdua de massa i vitamina D
(quantitatives), però aquesta pendent es només en el grup tractats.

Però el grup no tractat la interacció ha de treure 50 unitats ja que la pendent seria 30,
tenim menys pendent, el efecte de la vitamina D es potencia molt més en el grups
tractats.

Coeficient de determinació: 0,99


Ajustat: 0,99

Per validar el model, i veure que es compleix el model daplicacio:


MODELOS- INTERVALOS DE CONFIANZA-

MODELOS- GRÁFICAS- GRAFICAS BASICAS DE DIAGNOSTICO


Existeix normalitat? Si
Existeix homecedesticidad? El
núvol de punts es igual de ample
en els dos costats per tant, si.
Recordem que la
homoscedasticitat es la variança i
la variança es la heterogeneïtat de
les observacions i una manera de
graficar les estimacions o la
variabilitat de les estimacions, es
veure les estimacions respecte la
media i que la recta de regressió
es el valor esperat per cada valor.

Per tant, seria possible i acceptem


el model amb interacció.
Si necessitéssim una gràfica faríem
:

GRÁFICAS- DISPERSIÓN- per grups- opcions (línia de mínims quadrats)

Aquí podem
veure les rectes
de regressió
dibuixades.

FINS AQUI ES TOT EL QUE NECESSITEM SABER PER TREBALLAR AMB REGRESSIONS
MÚLTIPLES.
CONLCUINT LA PRÀCTICA D’AVUI:
Tots els anàlisis estadístics tenen els mateix processos
(Descripció de la variable depenent = resultat) (mirar la relació de la variable resultat
amb totes les dades explicatives� estadístiques bibariant = correlacions lineals, chi
quadrat, t Student o anàlisi de la variància de un factor i acte seguit un model lineal
perquè estem treballant amb uns estudis en el que la variable depenent es
quantitativa i normal i de forma explicativa tenim variables qualitatives i quantitatives.
Variables quantitatives es transformen en variables turbis que si hi ha mes de dos
categories necessitem més d’una dubi??? Apunts.

Una vegada que tenim ajustat el model, mirem les condicions d’aplicació i les
estimacions per interval� MODELOS

Finalment podem fer una gràfica� aquesta gràfica representarà el nostre resultat, en el
nostre cas com tenim tres variables, podem fer una recta de regressió amb les
variables quantitatives per cada grup que genera la qualitativa, i aquí veurem si hi ha o
no interacció.

CONCEPTES IMPORTANTS- CLOZEETSSS


CONFUSIO: deguda a la multi correlació de variables
INTERACCIO : una variable pot condicionar la relació de l’altre variable
Les dos variables son dependents, una correlaciona la variable depenent de l’altre.

You might also like