Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 28

Anna Islamiyati

SOAL-JAWAB
ANALISIS DATA KATEGORIK

SOAL

1) Bedakan antara Variabel Respon (Y) dan Variabel Penjelas (X), dari

data berikut:

a. Sikap terhadap aborsi atas permintaan (mendukung,

menentang); gender (laki-laki, perempuan).

b. Penyakit jantung (ya, tidak); tingkat kolesterol.

c. Ras (putih, kulit putih); gender (laki-laki, perempuan); memilih

untuk presiden (republik, demokrat, lain); pendapatan.

d. Rumah Sakit (A, B); pengobatan (T1, T2); hasil pasien (bertahan

hidup, mati).

2) Apa skala pengukuran yang paling tepat untuk varibel berikut?

a. Partai politik afiliasi (Demokrat, Republik, lainnya).

b. Tingkat tertinggi diperoleh (none, SMA, sarjana, master, doktor)

c. Kondisi pasien (baik, adil, serius, kritis).

d. Pasien bertahan hidup (dalam jumlah bulan).

e. Lokasi perhotelan di mana data yang dikumpulkan (london,

Boston, Rochester).

3) Kategorikan data berikut, berdasarkan kelompok:

Interval IPK Kategori

> 3,50 Sangat Tinggi (4)


3 – 3,5 Tinggi (3)
2,75 – 2,99 Sedang (2)
2,5 - 2,74 Rendah (1)
< 2,5 Sangat Rendah (0)

Page 1 of 28
Anna Islamiyati

Data

Nama Mahasiswa IPK

Andi Fitriah 2,67


Andi Eka 3,6
Bintang Eka Putra 3,2
Bambang 3,1
Fatmawati 3
Gunawan Cahyo 2,3
Karina 3,3
Kristanti 2,4
Sahriyanti 2,75
Susi A 3,12
St. Indahwati 3,35

4) Seorang ahli epidemiologi ingin melihat resiko pemaparan silikon

terhadap kejadian silikosis. Sebanyak 100 pekerja yang terpapar

debu silikon dan sebanyak 200 pekerja di bagian administrasi

yang tidak terpapar debu silikon diikuti selama 5 tahun hasilnya

adalah sebagai berikut.

MULAI KEJADIAN SILIKOSIS


PENELITIAN YAD + -
JUMLAH

PEMAPARAN + 50 50 100
SILIKON - 5 195 200
JUMLAH 55 245 300

Sesudah 5 tahun dari 100 responden yang terpapar silikon

sebanyak 50 responden menderita silikosis, sedangkan sebanyak

200 responden yang tidak terpapar silikon, sebanyak 5 orang

Page 2 of 28
Anna Islamiyati

menderita silikosis. Hitungkah Resiko Relatif (RR) dari data

tersebut.

5) Pengujian independensi antara faktor jenis kelamin dengan jam

kerja di suatu pabrik.

Kategori pria wanita Total

Kurang dari 25 jam/minggu 2 3 5


25 sampai 50 jam/minggu 7 6 13
Lebih dari 50 jam/minggu 5 7 12
Total 14 16 Total Obs= 30

Ujilah hubungan/kaitan antara jenis kelamin dengan jam kerja,

pada pengujian kebebasan variabel dengan taraf uji 5%.

6) Seorang ahli epidemiologi meneliti hubugan antara pemaparan

gelombang elektromagnetik di masa lalu terhadap kejadian

leukemia saat ini. Ia menggunakan rancangan kasus kontrol.

Sebanyak 100 penderita leukemia dengan 100 kontrol sebaya dan

mempunyai pengalaman pemaparan yang sama di masa lalu

diteliti. Hasilnya adalah sebagai berikut.

Data Pemaparan gelombang elektromagnetik

MULAI KEJADIAN PEMAPARAN


PENELITIAN YANG LALU GELOMBANG
JUMLAH
ELEKTROMAGNETIK
+ -

+ 70 30 100
a B
LEUKEMIA
- 10 90 100
c D
JUMLAH 80 120 300

Hitunglah odds ratio data tersebut.

Page 3 of 28
Anna Islamiyati

7) Data tentang klasifikasi penyakit kanker

Data Klasifikasi Penyakit Kanker dan Umur Untuk 100 data


Umur (x)

Penyakit (y) 55 (1) < 55 (0) Total

Ada 21 22 43

Tidak Ada 6 51 57

Total 27 73 100

Hitunglah odds ratio !

10) Untuk sampel multinomial bahwa statistika saling bebas untuk dua

kategori respon, tunjukkanbahwa estimator ML dari𝜋𝑖𝑗 is 𝜋̂𝑖𝑗 = 𝑛𝑖 +

𝑛+𝑗 /𝑛2 !

11) Data yang dilaporkan cornfield (1962). Sample dari penduduk laki-

laki dari fragmingham.massachusetts.di umur 40 – 59.

Diklasifikasikan dalam beberapa factor, berdasarkan tekanan

darahnya selama enam tahun periode. Mereka mengklasifikasikan

apakah terdapat penyakit jantung koroner, sebagai variable

respon. Diperoleh statistic likelihood ratio adalah 𝐺 2 = 30.02

dengan df = 7. Berarti terdapat hubungan kuat antara tekanan

darah dan penyakit jantung.

Page 4 of 28
Anna Islamiyati

Tekanan darah Penyakit jantung


Persent Absent
<117 3 (5.2) 153 (150.8)
117-126 17 (10.6) 235(241.4)
127-136 12(15.1) 272(268.9)
137-146 16(18.1) 255(252.9)
147-156 12(11.6) 127(127.4)
157-166 8(8.9) 77(76.1)
167-186 16(14.2) 83(84.8)
>186 8(8.4) 35(34.6)

Carilah hasil estimator ML pada sampel tersebut!

13) Interpretasi hasil dari data Kematian Kumbang berikut.

Dosis xi Banyaknya Serangga Banyaknya Mati


(log10 CS2 mgl-1 ni ri
1.6907 59 6
1.7242 60 13
1.7552 62 18
1.7842 56 28
1.8113 63 52
1.8369 59 53
1.8610 62 61
1.8839 60 60

Gambar Plot Antara Dosis (xi) dengan Proporsi Kumbang Yang Mati
(ri/ni)

1.0
0.9
0.8
0.7
0.6
C4

0.5
0.4
0.3
0.2
0.1
0.0
1.7 1.8 1.9
C1

Page 5 of 28
Anna Islamiyati

Tabel Model Dugaan Logistik Linier Untuk Data Kematian Kumbang

Taksir Hasil Hasil Hasil Hasil


an ke-1 ke-2 ke-4 ke-10
Awal
b1 0 - - - -
37.849 53.851 60.700 60.717
b2 0 21.334 30.382 34.261 34.270
Pengamatan Nilai Dugaan
r1 6 29.5 8.508 4.544 3.460 3.458
r2 13 30.0 15.369 11.254 9.845 9.842
r3 18 31.0 24.810 23.059 22.454 22.451
r4 28 28.0 30.983 32.946 33.896 33.898
r5 52 31.5 43.361 48.197 50.092 50.096
r6 53 29.5 46.739 51.704 53.288 53.291
r7 61 31.0 53.593 58.060 59.220 59.222
r8 60 30.0 54.732 58.036 58.742 58.743

26.802 15.061
[ (b)] 1    D= 11.23
15.061 8.469 

14) Tabel Nilai sisa untuk kecocokan model logit bagi penyakit liver.

Interpretasi hasilnya!

Blood Sample Observed Fitted Residual


Pressure Size Heart
Disease Indep. Linear Indep. Linear
Model Logit Model Logit
<117 156 3 10.8 5.2 -2.46 -0.98
117-126 252 17 17.4 10.6 -0.11 2.01
127-126 284 12 19.7 15.1 -1.79 -0.81
137-146 271 16 18.8 18.1 -0.66 -0.51
147-156 139 12 9.6 11.6 0.80 0.12
157-166 85 8 5.9 8.9 0.90 -0.30
167-186 99 16 6.9 14.2 3.62 0.51
>186 43 8 3.0 8.4 3.02 -0.14

.15)Misalkan Y 0,1 adalah peubah acak dengan fungsi peluang

P Y  1   . Hitung ekspektasi dan variansi dari Y !

Page 6 of 28
Anna Islamiyati

16) Diketahui bahwa ˆ memaksimumkan fungsi L    . Misalakan   


0

adalah nilai awal. Dengan menggunakan misalkan 


0
  dekat

dengan ˆ . Misalkan     
0 0
  
0= L ' ˆ  L '     ˆ     L ''  0 .

Selesaikan persamaan ini untuk memperoleh perkiraan untuk 


1
 
pada ˆ

17) Misalkan 𝛽 (𝑡) adalah perkiraan nilai t untuk 𝛽̂ , t=0,1,2,…. Buktikan

bahwa persamaan selanjutnya adalah

𝛽 (𝑡+1) = 𝛽 (𝑡) −
𝐿′ (𝛽(𝑡) )
𝐿′′ (𝛽(𝑡) )
       
L ' ˆ  L '   0  ˆ    0 L ''  0  ....

18) Berikut ini diamati tentang ada tidaknya suatu penyakit, katakanlah

penyakit kanker, dengan variabel penjelasnya adalah umur, dimana

untuk kelompok umur lebih dari atau sama dengan 55 tahun diberi

kode 0 dan untuk kurang dari 55 tahun diberi kode .

Data Tentang Klasfikasi Penyakit Kanker dan Umur Untuk 100 data

Umur (x)

Penyakit 55 (1) < 55 (0) Total


(y)
Ada 21 22 43

Tidak 6 51 57
Ada
Total 27 73 100

19) Carilah interval kepercayaan pada di nomor 18) dengan hasil

Perhitungan Pendugaan Model Regresi Logistik

Page 7 of 28
Anna Islamiyati

Variabel Penaksir Galat Koefisien 


Koefisen Baku /Galat
Baku

Umur 2.094 0.529 3.96 8.1

Konstanta -0.841 0.255 -3.30

20) Misalkan dalam studi tentang timbulnya suatu penyakit kanker,

dimana variabel SUKU dibagi ke dalam 4 kategori, dalam hal ini 4

suku-suku yang di Indonesia, dan hasilnya ditunjukkan dalam Tabel

berikut.

Data Tentang Timbulnya Penyakit Kanker Pada 4 Suku

Suku Asal

Status Sunda Jawa Batak Lainnya Total


Penyakit

Ada 5 20 15 10 50

Tidak ada 20 10 10 10 50

Total 25 30 25 20 100

Odds Rasio

SK 95%

ln()

Carilah odds ratio dengan menggunakan suku Sunda sebagai

kelompok kontrol.

Page 8 of 28
Anna Islamiyati

21) Buatlah variabel rancangan untuk data di nomor 20, yaitu suku

Sunda sebagai kontrol.

22) Penggunaan setiap program regresi logistik dengan variabel

rancangan yang mempunyai kode seperti yang tunjukkan berikut

ini:

Hasil Pendugaan Model Regresi Logistik Untuk Data

Taksiran Galat

Variabel Koefisien Baku Koef./SE 

SUKU(1) 2.079 0.633 3.29 8.0

SUKU(2) 1.792 0.646 2.78 6.0

SUKU(3) 1.386 0.671 2.07 4.0

Konstanta -1.386 0.500 -2.77

Buatlah perbandingan hasil koefisien taksiran dengan hasil nomor

20 dengan hasil tersebut di atas!

23) Berdasarkan data rata-rata kematian pada tahun 1987 di Amerika

Serikat, sebuah lembaga melaporkan bahwa peluang seorang bayi

yang baru lahir untuk menjadi korban pembunuhan adalah 0,0263

untuk bayi laki-laki bukan kulit putih dan 0,0049 untuk bayi laki-

laki kulit putih, 0,0072 untuk bayi perempuan bukan kulit putih

dan 0,0023 untuk bayi perempuan berkulit putih.

Page 9 of 28
Anna Islamiyati

a. Hitung odd ratio berdasarkan ras dan kemungkinan menjadi

korban pembunuhan jika diketahui gendernya.

b. Asumsikan setengah jumlah bayi yang lahir untuk tiap gender di

setiap ras. Temukan odd ratio marginal antara ras dan peluang

untuk menjadi korban pembunuhan.

 
24) Misalkan  ij memenuhi log linear model untuk keindependenan.

  a 
Tunjukkan bahwa aY  bY  log  
  b 

25) Tabel berikut berisi daftar nilai hasil pencocokan untuk beberapa

model. Dalam simbol, D adalah ras terdakwa, V adalah ras korban

dan P adalah vonis hukuman mati. Misalkan mˆ 


ijk menunjukkan

nilai yang cocok pada tingkat I dari ras terdakwa, tingkat j dari ras

korban, dan k tingkat vonis hukuman mati. Carilah nilai mˆ 


ijk

masing-masing model yang cocok.

26) Carilah taksiran odds rasio untuk hubungan marginal dan parsial

untuk model yang tercantum pada nomor 25.

27) Jelaskan maksud nilai-nilai yang terdapat pada tabel berikut.

Page 10 of 28
Anna Islamiyati

Tabel Pengujian Kesesuaian Pemodelan Loglinear berdasarkan


Keputusan Hukuman Mati (P), Pihak Terdakwa (D), dan Pihak Korban
(V)

Model G2 df P-Value

( D, V, P ) 137.93 4 0.000

( VP, D ) 131.68 3 0.000

( DP, V ) 137.71 3 0.000

( DV, P) 8.13 3 0.043

( DP, VP) 131.46 2 0.000

(DP, DV) 7.91 2 0.019

(VP, DV) 1.88 2 0.390

(DP, VP, DV) 0.70 1 0.402

(DVP) 0 0 -

Sumber: Data dari Radelet (1981).

28) Modelkan data di bawah dengan log linear :

Partai (B)
Jenis Kelamin (A) Total
Buruh konservatif
Laki 222 115 337
Perempuan 240 185 425
Total 462 300 762

29) Carilah likelihood rationya (G2) untuk data nomor 28.

30) Ujilah apakah jenis kelamin dan partai saling bebas untuk data

nomor 28.

Page 11 of 28
Anna Islamiyati

SOLUSI

1) Identifikasi Variabel :

a. Y : Sikap mendukung terhadap permintaan aborsi

X : gender

(Pengaruh gender terhadap permintaan aborsi)

b. Y : Penyakit jantung

X : Tingkat kolesterol

(Pengaruh tingkat kolesterol terhadap penyakit jantung)

c. Y : Memilih untuk presiden

X : Ras, Gender, dan Pendapatan

(Pengaruh Ras, Gender, dan Pendapatan terhadap pemilihan

presiden)

d. Y : Hasil pasien

X : Rumah sakit dan pengobatan

(Pengaruh jenis rumah sakit dan pengobatan terhadap hasil

pasien

2) Skala pengukuran

a. Partai politik afiliasi : data kategorik (0, 1, 2)

b. Pendidikan : data kategorik

c. Kondisi pasien : data kategorik

d. Lama pasien bertahan hidup : data kuantitatif

e. Lokasi perhotelan : data kategorik

Page 12 of 28
Anna Islamiyati

3) Data

Nama Mahasiswa IPK Kategori

Andi Fitriah 2,67 1


Andi Eka 3,6 4
Bintang Eka Putra 3,2 3
Bambang 3,1 3
Fatmawati 3 3
Gunawan Cahyo 2,3 0
Karina 3,3 3
Kristanti 2,4 0
Sahriyanti 2,75 2
Susi A 3,12 3
St. Indahwati 3,35 3

4) Karena penelitian di atas menggunakan rancangan cohort, maka

untuk setiap kelompok dapat dihitung Incidence Rate (IR).

Untuk kelompok terpapar, IR = 50/100 = 0,5

Untuk kelompok tak terpapar, IR = 5/200 = 0,025

Maka RR adalah = 0,5/0,025 = 20

Artinya resiko responden yang terpapar debu silikon untuk

terkena silikosis adalah 20 kali lebih besar dari pada responden

yang tidak terpapar debu silikon.

5) Ukuran Tabel Kontingensi di atas adalah = 3x2 (3 baris dan 2

kolom), berarti db (derajat kebebasannya) = (3-1)(2-1) = 2 x 1 = 2

H0: gender dan jam kerja saling bebas

H1: gender dan jam kerja tidak saling bebas

Nilai 𝛼=5% = 0.05

Nilai tabel 𝜒 2 db = 2 ;𝛼 = 0.05 ; 𝜒 2 tabel = 5.99147

Page 13 of 28
Anna Islamiyati

Daerah penolakan H0 jika 𝜒 2 ℎ𝑖𝑡𝑢𝑛𝑔 > 𝜒 2 𝑡𝑎𝑏𝑒𝑙

Perhitungan 𝜒 2

(𝑡𝑜𝑡𝑎𝑙 𝑏𝑎𝑟𝑖𝑠 𝑘𝑒 𝑖)𝑥(𝑡𝑜𝑡𝑎𝑙 𝑘𝑜𝑙𝑜𝑚 𝑘𝑒 𝑗)


𝑓𝑟𝑒𝑘𝑢𝑒𝑛𝑠𝑖 ℎ𝑎𝑟𝑎𝑝𝑎𝑛 𝑠𝑒𝑙 𝑘𝑒 𝑖𝑗 =
𝑡𝑜𝑡𝑎𝑙 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑠𝑖

Frekuensi harapan untuk:

5 ×14
 Pria,<25 jam = = 2.33
30

12×14
 Pria,>50 jam = 30
= 5.60

13 ×14
 Pria,25-50 jam = = 6.07
30

5 ×16
 Wanita,<25 jam = = 2.67
30

12×16
 wanita,>50 jam = 30
6.40

13×16
 Pria,25-50 jam = = 6.93
30

Hasil nilai ekspektasi (e)

pria wanita Total


Kurang dari 25 jam/minggu 2 3 (2.67) 5
(2.33)
25 sampai 50 jam/minggu 7 6 (6.93) 13
(6.07)
Lebih dari 50 jam/minggu 5 7 (6.40) 12
(5.60)
Total 14 16 Total Obs= 30

Tabel perhitungan nilai observasi dan ekspektasi

Page 14 of 28
Anna Islamiyati

Kesimpulan

 𝜒 2 ℎ𝑖𝑡𝑢𝑛𝑔 = 0.4755 < 𝜒 2 𝑡𝑎𝑏𝑒𝑙 = 5.99147

 𝜒 2 ℎ𝑖𝑡𝑢𝑛𝑔 ada di daerah penerimaan H0

H0 diterima, berarti jenis kelamin dan jam kerja saling bebas

atau tidak ada hubungan.

6) Untuk mengetahui resiko pemaparan terhadap kejadian leukemia

digunakan ODDS RATIO (OR) :

𝑎𝑑 70 ∗ 90 6300
𝑂𝑅 = = = = 21
𝑏𝑐 30 ∗ 10 300

Odds ratio merupakan taksiran resiko relative. Jadi adanya

pemaparan gelombang elektromagnetik di masa lalu mempunyai

resiko 21 kali lebih besar daripada tanpa pemaparan gelombang

elektromagnetik untuk terjadinya leukemia.

7) odds rasio yaitu:

21 / 6
   811
.
22 / 51

Page 15 of 28
Anna Islamiyati

8) Diperoleh statistic likelihood ratio adalah 𝐺 2 = 30.02 dengan df =

7. Berarti terdapat hubungan kuat antara tekanan darah dan

penyakit jantung.

Tekanan darah Penyakit jantung


Persent Absent
<117 3 (5.2) 153 (150.8)
117-126 17 (10.6) 235(241.4)
127-136 12(15.1) 272(268.9)
137-146 16(18.1) 255(252.9)
147-156 12(11.6) 127(127.4)
157-166 8(8.9) 77(76.1)
167-186 16(14.2) 83(84.8)
>186 8(8.4) 35(34.6)

Untuk model jenuh tanpa memperhatikan pemilihan batas untuk

𝛽𝑖 dan hasil dari { +𝛽1 } adalah sama. Hasil estimator ML pada

sampel logit adalah:

3
𝛼̂ + 𝛽̂ = log ( ) = −3,93
153

Log kemungkinannya adalah:

N
  ni  
L   ri (  1   2 x )  ni log(1   1   2 x )  log  
i 1   ri  

dan skor terhadap 1 dan 2 adalah:

L   e   x  
  ri  ni      ri  ni  i 
1 2

U1 
 1   1  e   x  
1 2

dan

Page 16 of 28
Anna Islamiyati

L   e   x  
  ri xi  ni xi      xi ri  ni  i 
1 2

U2 
 2   1  e   x   1 2

Dengan demikian, matriks informasinya adalah:

 ni  i 1   i  ni xi  1 1   i  
  
ni xi  1 1   i  ni xi  1 1   i 
2

Penaksir kemungkinan maksimum diperoleh dengan jalan

menjawab secara iterasi persamaan berikut:

( m1) b ( m)  ( m1) b ( m1)  U ( m1)

dimana m menunjukkan aproksimasi ke-m dan b = [b1 b2]T adalah

vektor dari penaksir. Dengan nilai awal b1( 0)  b20  0 , maka hasil

dari proses perhitungan penaksir kemungkinan maksimum secara

iterasi ini ditunjukkan dalam Tabel bersama-sama dengan

frekuensi taksiran ri  ni  i , matriks varians-kovarians [(b)]-1 dan

statistik rasio log kemungkinan.

9) Galat baku dari penaksir b1 = -60.72 dan b2 = 34.27 masing-masing

adalah (26.802)1/2 = 5.18 dan (8.469)1/2 = 2.91. Di bawah hipotesis

H0 bahwa model regresi logistik mampu menggambarkan data

yang diperoleh, maka D mempunyai pendekatan distribusi  26 ,

karena terdapat N = 8 kelompok dosis dan p = 2 parameter. Akan

tetapi apabila kita bandingkan dengan Tabel Distribusi Chi-

Kuadrat, maka akan diperoleh 2 sebesar 12.59 pada derajat

kepercayaan 5% dan derajat bebas 6. Hal ini berarti bahwa model

Page 17 of 28
Anna Islamiyati

regresi logistik yang diperoleh tidak cukup baik untuk

menggambarkan data kematian kumbang tersebut.

10) Data pada Table menunjukkan besarnya sisa dari model adalah

besar dan menunjukkan peningkatan tren. Tren ini akan hilang

ketika kita menambahkan efek linear dan hanya kategori ke 2 yang

menunjukkan hasil yang kurang bagus. Kita bisa menyimpulkan

bahwa sisa memiliki distribusi asimtot standar normal, dengan

menggunakan analog dari hasil taksiran atau proyeksi matriks

dalam analisis regresi.

11) Hkjhkhk

12) Gkjghkjhk

13) Hjgjhkjhk

14) Data menggambarkan bahwa terdapat 21 subyek untuk nilai (x = 1,

y = 1), 22 untuk (x = 0, y = 1), 6 untuk (x = 0, y = 0), dan 51 untuk

(x = 0, y = 0). Sehingga, perhitungan fungsi kemungkinan yang

untuk data tersebut adalah:

L() = (1)21  [1 – (1)]6  (0)22  [1 – (0)]51

Penggunaan program regresi logistik untuk menentukan nilai-nilai

dari 0 dan 1 yang akan memaksimumkan kemungkinan itu akan

menghasilkan koefisien taksiran dan galat bakunya.

15) Besaran  merupakan penaksir kemungkinan maksimum dari odds

rasio,  = e2.904 = 8.1. Odds rasio dapat secara langsung

menghitungnya melalui:

Page 18 of 28
Anna Islamiyati

21 / 6
   811
.
22 / 51

dan  = ln[(21/6)/(22/51)] = 2.094. Alasan untuk hal ini adalah

untuk menekankan bahwa regresi logistik pada kenyataannya

merupakan peristiwa regresi di dalam kasus yang sesederhana

mungkin. Dengan kenyataanya bahwa data dapat diformulasikan

ke dalam bentuk tabel kontingensi yang akan memberikan kepada

kita suatu dasar dari interpretasi koefisien taksiran itu adalah

sebagai odds rasio. Sedangkan interval kepercayaan 95% untuk

data di atas adalah: exp(2.094  1.96  0.0529) = (2.9; 22.9).

16) Data Tentang Timbulnya Penyakit Kanker Pada 4 Suku

Suku Asal

Status Sunda Jawa Batak Lainnya Total


Penyakit

Ada 5 20 15 10 50

Tidak ada 20 10 10 10 50

Total 25 30 25 20 100

Odds Rasio 1.0 8.0 6.0 4.0

SK 95% (2.3;27.6) (1.7;21.3 (1.1;14.9)

ln() 0.0 2.08 1.79 1.39

Odds rasio diberikan untuk masing-masing kelompok umur,

dengan menggunakan suku Sunda sebagai kelompok kontrol atau

kelompok pembanding. Sebagai contoh, misalnya odds rasio untuk

Page 19 of 28
Anna Islamiyati

suku Batak adalah (1520)/(510) = 6.0. Sedangkan logaritma odds

rasio diberikan dalam baris terakhir pada tabel tersebut

17) Spesifikasi Variabel Rancangan Untuk SUKU Dengan Menggunakan

Suku Sunda Sebagai Kelompok Kontrol

Suku Variabel Rancangan

(Kode) D1 D2 D3

Sunda (1) 0 0 0

Jawa (2) 1 0 0

Batak (3) 0 1 0

Lainnya (4) 0 0 1

18) Perbandingan koefisien taksiran sebelumnya menunjukkan bahwa

ln[  (Jawa, Sunda)] =  11 = 2.079, ln[  (Batak, Sunda)] =  12 = 1.792,

dan ln[  (Lainnya, Sunda)] =  13 = 1.386. Perhitungan dari

perbedaan logit dapat ditunjukkan melalui variabel rancangan

tersebut. Untuk membandingkan antara suku Jawa dan Sunda

adalah sebagai berikut:

ln[  (Jawa,Sunda)] = g (Jawa) – g (Sunda)

= [  0 +  11  (D1 = 1) +  12  (D2 = 0) +  13  (D3 = 0)]

– [  0 +  11  (D1 = 0) +  12  (D2 = 0) +  13  (D3 = 0)] = ̂ 11

Page 20 of 28
Anna Islamiyati

Perhitungan untuk perbandingan lainnya akan memberikan hasil

yang sama antara koefisien taksiran dengan log odds yang dihitung

dari data. Batas kepercayaan untuk odd rasio dapat diperoleh

melalui penggunaan pendekatan yang sama seperti yang digunakan

pada bagian sebelumnya untuk variabel dikotomus. Pertama,

dimulai dengan menentukan batas kepercayaan untuk log odds

(koefisien regresi logistik), kemudian hitung dalam bentuk

eksponen untuk limit tersebut sehingga diperoleh batas untuk odds

rasio yang secara umum dinyatakan dalam bentuk selang

kepercayaan 100(1 – )%.

 ij  z1-/2  SE(  ij) atau exp[  ij  z1-/2  SE(  ij)]

Metode pengkodean variabel rancangan yang menggunakan

kelompok kontrol banyak sekali digunakan dalam berbagai bidan

penelitian. Alasan utama dari banyaknya penggunaan metode ini

adalah adanya penaksiran resiko pada kelompok “terpapar”

(exposed group) relatif terhadap kelompok “kontrol” atau “tidak

terpapar” (unexposed group).

19) Gjgkjhk

20) Hhgjhj

ni  n j  n k
21) Misalnya, untuk model (D, V, P), mˆ ijk  =
n2

(160x214x36)/(326)2 = 11,60. Nilai yang cocok untuk model

merupakan model (VP, DP) dan (VP, DP, DV), dimana adalah hamper

sama dengan data yang diamati.

Page 21 of 28
Anna Islamiyati

Nilai yang tepat untuk data hukuman mati

Model
Death
Terdakwa Korban ( D, V, P ) ( P, DV ) ( VP, DV) ( DP, VP, DV ) ( DVP
Penalty
)
White White Yes 11,60 16,68 21,17 18,67 19
No 93,43 134,32 129,83 132,33 132

Black Yes 6, 07 0,99 0,48 0,33 0


No 48,90 8,01 8,52 8,67 9

Black White Yes 12,03 6,96 8,83 11,33 11


No 96,94 56,04 54,17 51,67 52

Black Yes 6,30 11,37 5,52 5,67 6


No 50,73 91,63 97,48 97,33 97

G2 137,9 8,1 1,9 0,7 0


df 4 3 2 1 0
P- Value 0,00 0,04 0,39 0,40 -

Death Penalty = Hukuman Mati

22) Perhatikan Tabel Kesimpulan. Misalnya, entri 1.0 untuk hubungan

parsial untuk model (VP, DP) adalah nilai umum dari odds ratio

bersyarat D – P dari m  
ˆ ijk pada tingkat dua dari V, yaitu:

21.17x 54.17 0.48 x 97.48


1.0  
129.83x 8.83 8.52x 5.52

Entri 1.64 untuk hubungan marginal D – P pada model yang sama

adalah table odds ratio dari D–P, yaitu:

1.65 
 21.17  0.48 54.17  97.48
129.83  8.52  8.83+ 5.52 

Tabel Kesimpulan dari taksiran odds rasio

Partial Association Marginal Association


Model
D-P V-P D-V D-P V-P D-V

Page 22 of 28
Anna Islamiyati

( D, V, P ) 1,0 1,0 1,0 1,0 1,0 1,0


( P, DV ) 1,0 1,0 27,4 1,0 1,0 27,4
( VP, DV ) 1,0 2,9 27,4 1,65 2,9 27,4
( DP, VP, DV ) 0,6 3,7 28,7 1,2 2,9 27,4
( DVP ) * Level 1 0,68   1,2 2,9 27,4
( 0,67) (2,80 ) ( 22,04 ) ( 1, 18) ( 2, 71 ) ( 25, 99 )

Level 2 0 3,42 27,36


( 0,79) ( 3,29 ) ( 25,90 )

Nilai di dalam kurung untuk model ( DVP ) diperoleh setelah


penambahan 0,5 untuk setiap cell.

Odds rasio untuk data yang diamati adalah yang dilaporkan

untuk (DVP), dimana mˆ ijk  nijk . Untuk model itu, entri mˆ 121  0

menyebabkan beberapa odds rasio parsial yang sama dengan 0 atau ∞.

Sehingga, untuk model (DVP) diketahui bahwa odds rasio diperoleh

setelah menambahkan 0.5 untuk setiap jumlah sel.

Untuk setiap model dalam tabel, odds rasio diperkirakan

menggambarkan keterkaitan antara hubungan marjinal dan parsial

dijelaskan oleh kondisi collapsibility, misalnya:

(D, V, P)

Semua odds rasio parsial yang sama dengan 1.0 dan pasti akan

selalu sama dengan odds rasio marjinal, karena kondisi collapsibility

terpenuhi.

(P, DV)

Hanya D – V odds rasio yang tidak sama dengan 1.0 maka semua

odds rasio parsial pasti tidak akan selalu sama dengan odds rasio

marjinal. Karena {nijk} merupaka statistic cukuo yang minimal untuk

Page 23 of 28
Anna Islamiyati

ˆ ij   nijk . Dengan demikian, marjinal odds rasio D – V


semua model m

 
ˆ ijk seperti untuk data yang diamati.
adalah sama untuk m

(VP, DV)

Hanya odds rasio partial D – P yang sama dengan 1.0, V – P dan

odds ratio parsial D – V pasti akan sama dengan odds rasio marjinal.

Hal ini tidak tepat untuk parsial dan marjinal odds ratios D – P, karena

V tidak bebas pada P atau D. Odds rasio marjinal dari V– P dan D – V

adalah sama untuk mˆ  pada


ijk data yang diamati, karena semua

mˆ ijk  nijk dan mˆ  jk  n jk .

(DP, VP, DV)

Semua variabel yang bepasangan adalah variable tidak bebas.

Tidak ada odds rasio yang sama dengan 1.0, dan tidak satupun dari

variable tersebut yang perlu sama dengan odds rasio marginal yang

terkait. Taksiran odds rasio marjinal sama dengan data yang diamati,

ˆ i  k  ni  k , dan mˆ  jk  n jk .
ˆ ij   nij  , m
karena semua m

(DVP)

Karena model ini memungkinkan interaksi tiga-faktor, dua odds

rasio parsial untuk sepasang variabel yang ada tidak lagi sama.

Variabel tersebut dekat (setelah 0,5 ditambahkan ke sel masing-

masing), bagaimanapun ada indikasi yang menunjukkan mengapa

model (DV, VP, DV) cocok.

Page 24 of 28
Anna Islamiyati

23) Tabel menunjukkan statistic rasio likelihood dan nilai P untuk

menguji kebaikan keputusan dari beberapa jenis pemodelan. Nilai-

nilai odds rasio diperkirakan berguna untuk menerjemahkan

hubungan antara variabel. Misalnya, pertimbangkan model (DV,

VP, DV), yang cocok tetapi memberikan smoothing dari data. Odds

rasio D – P berarti bahwa kemungkinan estimasi vonis hukuman

mati "ya" adalah (a) 1.2 kali lebih tinggi untuk seorang tersangka

berkulit putih, (b) 0.6 kali lebih tinggi untuk tersangka berkulit

hitam, dalam setiap tingkat ras korban. Untuk df G2 yang lebih

besar akan memberikan nilai P yang lebih kecil dan akan mewakili

pengujian yang kurang baik. Hasil mengindikasikan pemodelan

(D,V,P),(VP,D),(DP,V), dan (VP,DP) yang kurang sesuai dengan data.

Bentuk umum dari pemodelan ini yaitu dengan mengindahkan

hubungan antara D dan V. Hal ini memiliki hubungan yang penting

antara pihak terdakwa dan pihak korban. Dari keempat pemodelan

yang belum terisi, hanya (VP,DV) dan (VP,DP,DV) yang dapat

memenuhi pengujian formal dengan tingkat signifikansi 0.05. Pada

pemodelan (VP,DP,DV), semua pasangan variabel bersifat

dependen, akan tetapi tanpa adanya hubungan antara ketiga

factor. Berdasarkan pemodelan yang lebih sederhana (VP,DV),

keputusan hukuman mati yang diajukan bersifat independen bagi

pihak terdakwa oleh pihak korban.

24) Model log linear :


𝐴𝐵
𝑣𝑖𝑗 = 𝜇 + 𝜆𝑖𝑗 (𝑖 = 1,2 ; 𝑗 = 1,2)

Keterangan:

Page 25 of 28
Anna Islamiyati

𝑣𝑖𝑗 = logaritma natural dari peluang sel (i,j)

𝜇 = rataan umum

𝜆𝑖𝐴 = kontribusi jenis kelamin

𝜆𝑗𝐵 = kontribusi partai

𝐴𝐵
𝜆𝑖𝑗 = interaksi (menunjukkan bebas tidaknya A dan B dalam
membentuk𝑃𝑖𝑗 )

Ln 𝑛𝑖𝑗

Partai
Jenis Kelamin
buruh Konservatif
Laki 5.4 4.74
Perempuan 5.48 5.22

5.4 + 4.74 − 5.48 − 5.22


𝜆̂1𝐴 = = −0.14 → 𝜆̂2𝐴 = 0.14
4
5.4 − 4.74 + 5.48 − 5.22
𝜆̂1𝐵 = = 0.23 → 𝜆̂𝐵2 = −0.23
4

𝐴8 5.4 − 4.74 − 5.48 + 5.22 𝐴𝐵


𝜆̂11 = = 0.1 → 𝜆̂12 = −0.1
4
𝐴𝐵
𝜆̂21 = −0.1
𝐴𝐵
𝜆̂22 = 0.1

𝜇 = 5.21

𝑣̂11 = 𝜇̂ + 𝜆̂1𝐴 + 𝜆̂1𝐵 + 𝜆̂11


𝐴𝐵

5.40 = 5.21 − 0.14 + 0.23 + 0.1

𝑣̂21 = 𝜇̂ + 𝜆̂2𝐴 + 𝜆̂1𝐵 + 𝜆̂21


𝐴𝐵

5.48 = 5.21 + 0.14 + 0.23 − 0.1

25) Dengan criteria pembandingan nisbah kemungkinan (likelihood


ratio).

𝑛𝑖𝑗
𝐺 2 = 2 ∑ 𝑛𝑖𝑗 𝑙𝑛 ( )
𝑒𝑖𝑗

=2[2.22(5.40-5.32)+…+185(5.22-5.12)]

Page 26 of 28
Anna Islamiyati

=0.6
2
𝑋(1)0.05 = 3.841

26) Jika diinginkan menilai bebas/ tidaknya A dan B , maka kita


𝐴𝐵
menguji 𝜆̂𝑖𝑗
Hipotesis:

𝐻0 = A dan B bebas (𝑃𝑖𝑗 = 𝑃𝑖 𝑃𝑗 , ∀𝑖𝑗 )

Kalau 𝐻0 benar maka :

(1) 𝑣𝑖𝑗 = 𝜇 + 𝜆𝑖𝐴 + 𝜆𝑗𝐵 (𝑖 = 1,2 ; 𝑗 = 1,2)


(2) Frekuensi harapan sel (i,j) adalah
𝑒𝑖𝑗 = (𝑃𝑖 𝑃𝑗 ) ∗ 𝑓
𝑛𝑖 𝑛𝑗
=
𝑛

Sehingga apabila 𝐻0 benar maka isi sel (i,j) :

Tabel (a) 𝑒𝑖𝑗 Hubungan Partai dengan Jenis Kelamin A dan B bebas

Partai
Jenis Kelamin
Buruh Konservatif
Laki 204.32 132.68
Perempuan 257.68 167.32

Tabel (b) ln 𝑒𝑖𝑗 Hubungan Partai dengan Jenis Kelamin A dan B


bebas

Partai
Jenis Kelamin
Buruh Konservatif
Laki 5.32 4.89
Perempuan 5.55 5.12

5.32 + 4.89 − 5.55 − 5.12


𝜆̂1𝐴 = = −0.116 → 0.116
4
5.32 − 4.89 + 5.55 − 5.12
𝜆̂1𝐵 = = 0.216 → −0.216
4
5.32 + 4.89 + 5.55 + 5.12
𝜇= = 5.22
4

Page 27 of 28
Anna Islamiyati

𝐴𝐵
Evaluasi 𝜆̂𝑖𝑗 dilakukan dengan cara membandingkan model

𝑣𝑖𝑗 = 𝜇 + 𝜆𝑖𝐴 + 𝜆𝑗𝐵 + 𝜆𝑖𝑗


𝐴𝐵
dengan model 𝑣𝑖𝑗 = 𝜇 + 𝜆𝑖𝐴 + 𝜆𝑗𝐵

Dengan criteria pembandingan nisbah kemungkinan (likelihood


ratio). G2 = 0,6 < 3,841, artinya model cocok, sehingga menolak
H0 yang menyatakan bahwa A dan B bebas, karena penghapusan
𝜆̂𝑖𝐴𝐵 dalam model 𝑣𝑖𝑗 = 𝜇 + 𝜆𝑖𝐴 + 𝜆𝑗𝐵 + 𝜆𝑖𝑗
𝐴𝐵
signifikan menurunkan
kecocokan model. Sehingga, pemilihan partai berkaitan dengan
jenis kelamin

Page 28 of 28

You might also like