Professional Documents
Culture Documents
Statistika, Primer
Statistika, Primer
Grafičkim uvidom (histogram i Q-Q plot), kao i K-S i Shapiro-Wilk statističkim testovima
uviđam da nijedan od parametara od interesa nema normalnu raspodelu, ali svakako sam
posle radio samo logističku regresiju za koju normalna raspodela nije ni potrebna.
Logistička regresija:
- Da li sniženi limfociti koreliraju sa lošijim kliničkim ishodom
(komplikacije):
Budući da od podataka imamo nezavisnu varijablu koja je kontinuirana i zavisnu
varijablu koja je dihotomna (ima komplikacije - 1, nema - 0), urađena je binarna logistička
regresija kako bi se uočila eventualna povezanost između ove dve varijable. Za ovu analizu
nije potrebno da vrednosti nezavisne varijable budu normalno raspoređene, ali je bitno da ne
postoje ekstremne vrednosti (outliers), te sam vrednosti par pacijenata čije su vrednosti
limfocita bile 3-4 puta više od standardne devijacije zamenio srednjim vrednostima, a
pacijenta pod rednim brojem 115 sam potpuno isključio, meni je ono delovalo kao neka
greška u unosu podataka iskreno. Takođe sam logaritmovao podatke za limfmin jer onda
bolje odgovaraju ovom modelu logističke regresije.
Exp(B) (adjusted odds ratio) je manji od 1.0, a confidence interval je isto manji od 1.0
što ukazuje da su povećane vrednosti nezavisne varijable (minimalan broj limfocita) u
korelaciji sa blažom kliničkom slikom (u bazi navedeno kao odsustvo komplikacija).
Ja ideju nemam šta se od ovih brojeva piše u radu jer ovo nije klasična korelaciona
analiza, pa da samo napišemo koeficijent. Moramo to da proverimo.
Isti testovi kao za limfocite, model logističke regresije još bolje fituje na ove podatke
za LDH, bukvalno prelepo.
Exp(B) (adjusted odds ratio) je veći od 1.0, a confidence interval je isto veći od 1.0
što ukazuje da su povećane vrednosti nezavisne varijable (LDHmax) u korelaciji sa
težom kliničkom slikom (u bazi navedeno kao prisustvo neke od komplikacija). Dakle
obrnuta logika u odnosu na limfocite jer je kod njih manji broj bio povezan sa težom
slikom, a ovde je veći broj povezan sa težom slikom. Isto ne znam šta od ovoga
treba da se piše u radu. 27,5% je procenjen uticaj nezavisne varijable na promenu
zavisne.
- Da li visoke vrednosti IL-6 koreliraju sa lošijim kliničkim
ishodom (komplikacije):
Da bi model bolje fitovao na podatke, pored izbacivanja jednog pacijenta sa velikom
ekstremnom vrednošću sam takođe transformisao podatke logaritmovanjem, nakon
čega se pokazalo da model bolje fituje nego pre logaritmovanja.
Povećane vrednosti IL-6 jesu povezane sa lošijim kliničkim ishodom, oko 10% je
procenjen uticaj nezavisne varijable na menjanje zavisne.
Korelacija:
- Da li sniženi limfociti koreliraju sa lošijim kliničkim ishodom
(stadijum bolesti):
Budući da se radi korelacija između kontinuirane i ordinalne varijable, prvo sam
konvertovao kontinuiranu varijablu (limfocitimin) u ordinalnu varijablu od tri nivoa
(zato što je i u ovom uzorku pacijenata bolest gradirana u tri nivoa, bez obzira što
postoji i nula, mi u uzorku nemamo nulu).
Logistička regresija:
- Da li sniženi limfociti koreliraju sa lošijim kliničkim ishodom
(smrt/preživljavanje):
Radio sam sa potpuno istim podacima kao u prethodnoj logističkoj regresiji sa
limfocita (ono prvo kad sam gledao u odnosu na komplikacije), samo sam sada limfocite
logaritmovao jer model onda bolje odgovara podacima.
Iz ovoga se zaključuje da su niži limfociti povezani sa većim šansama za letalni ishod.
Ovaj model odlično odgovara podacima. Nisam ih logaritmovao. Procenjeni uticaj nezavisne
varijable na zavisnu je oko 20%. Ovo ukazuje na to da su smanjeni limfociti bili povezani sa
većom šansom za primenu kiseoničke terapije.
- Da li su visoke vrednosti LDHmax bile povezane sa
većom primenom oksigenoterapije
Ista priča kao u prethodnom primeru. Postoji umerena pozitina korelacija između
maksimalnih izmerenih vrednosti LDH i nivoa kiseoničke potpore.
- Da li su vrednosti CRPmax u korelaciji sa većim stepenom
kiseoničke potpore
Postoji slaba pozitina korelacija između maksimalnih izmerenih vrednosti LDH i nivoa
kiseoničke potpore.
Ovaj model odgovara podacima. Logaritmovao sam ih. Procenjeni uticaj nezavisne varijable
na zavisnu je oko 22%. Ovo ukazuje na to da su više vrednosti LDHmax povećavale šansu
za primenu biološke terapije.
Deskriptivna statistika:
Pol nije korelisao sa učestalošću komorbiditeta.
Budući da distribucija nije normalna, rađen je Mann-Whitney U neparametarski test
za upoređivanje srednjih vrednosti između dva uzorka. Postoji statistički značajna
razlika u srednjim vrednostima minimalnih izmerenih vrednosti limfocita između
grupe pacijenata koji su se oporavili i koji su preminuli (SV(oporavljeni) = 104,55;
SV(preminuli) = 51,92; p < 0,05).
Isto sve pišeš kao za prethodni primer, samo je sada CRPmax. Srednje vrednosti
čitaš sa grafikona (Mean Rank), a p vrednost čitaš iz ove tabele na dnu (Asymptotic
Sig.).
*Nemoj da te zbune na grafiku ovi visoki stubići tamo gde je srednja vrednost
zapravo niža nego u drugoj grupi, zato što ti stubići samo predstavljaju frekvenciju
ispitanika sa tom određenom vrednošću. A pošto ih se opravilo 179, a umrlo samo
19, logično da je veća frekvencija pacijenata sa nekom vrednošću tamo gde ih prosto
ima više. Dakle ti samo gledaš srednju vrednost (Mean Rank) i gledaš da li je
statistički značajna razlika (Asymptotic Sig.). U ovom slučaju reci da jeste statistički
značajna, a p = 0,05.
Ovde nije statistički značjna razlika (p > 0,05)!!
Ubićeš me za ovu tabelu, ali ovako je išlo najbrže. Dakle samo čitaš srednje vrednosti ispod
ove druge kolone (Mean) i prepisuješ ih u svoju tabelu. Standardne devijacije su odmah
kolona pored. Ovo je bilo za stepen kiseoničke potpore, gde je 0 bez potpore, a 3 je
neinvazivna ventilacija.
Ovde je rađen Levene test za ispitivanje homogenosti varijansi između grupa pacijenata
grupisanih na osnovu stepena kiseoničke potpore (tipO2 u bazi). Budući da samo za
CRPmax on nije bio značajan, to znači da su njihove varijanse značajno različite, što krši
preduslov za primenu ANOVA testa za poređenje više od dve srednje vrednosti, tako da je
ANOVA rađena samo za CRPmax (p < 0,05), a za ostale parametre su rađeni parametarski
testovi (Welch i Brown-Forsythe)
Ovo je rađeno u odnosu na primenu mehaničke ventilacije. P vrednosti su svuda manje od
0,05, a srednje vrednosti su ti ispisane iznad grafikona distribucije.
Ovo je rađeno u odnosu na primenu kiseonika. Sve isto radiš kao u primeru iznad. Svuda su
statistički značajno različite srednje vrednosti.
Ovo je rađeno u odnosu na biološku terapiju. Sve isto radiš kao u primeru iznad. Svuda su
statistički značajno različite srednje vrednosti, osim kod D dimera, gde je p = 0,848.
Ovo je rađeno u odnosu na stadijum bolesti. Srednje vrednosti prepisuješ iz mean kolone.
Ovde je rađen Levene test za ispitivanje homogenosti varijansi između grupa pacijenata
grupisanih na osnovu stadijuma bolesti. Rezultati ovog testa za svaki parametar znače da su
njihove varijanse značajno različite, što krši preduslov za primenu ANOVA testa za
poređenje više od dve srednje vrednosti, tako da su rađeni parametarski testovi za
poređenje srednjih vrednosti (Welch i Brown-Forsythe). Pošto oni zahtevaju da za svaki
parametar zbir vrednosti u sklopu te grupe bude veći od 1, a pošto je samo jednja
pacijentkinja bila sa 0 stadijumom bolesti, ja sam nju uklonio.
IL-6 max i D dimer max nemaju statistički značajno različite srednje vrednosti među različitim
kliničkim stadijumima, dok ostali parametri imaju (p vrednost čitaš iz Sig. kolone).
Za D dimer nike značajna razlika.
U odnosu na ishod:
Za leukocite ne može t-test, već Mann-Whitney U test jer varijanse nisu iste među grupama.
Nema statistički značajne razlike (p = 0.238).
Za trombocite može t-test zato što su varijanse približno iste. Ima statistički značajne razlike
(p < 0.02)
U odnosu na MV:
Ove gledaj samo za trombcite (t-test). Nema statistički značajne razlike (p = 0,073).
Varijanse nisu bile iste, tako da je rađen neparametarski Mann-Whitney U test. Postoji
statistički značajna razlika za trombocite (p = 0,022), dok to nije slučaj za leukocite
(p=0,109).
DODATO: