Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 54

Overview of

Biostatistics

MELISSA ADIATMAN
ANTON RAHARDJO
IWANY AMALIYAH
DIAH AYU MAHARANI
Department of Dental Public Health and Preventive Dentistry
Why You Should Study Statistics?

 Without knowledge of statistics, you are lost


Reading scientific articles
Understanding oral health data
 It’s on the test (compulsory for your
semester)
Content of this presentation:

 Variables
 Statistics: definitions and kind of statistics
 Measures of central tendency
 Measures of variability
 Data Input exercise
I: Variables
Karakteristik yang berubah dari satu
subjek ke subjek lain

 Independent versus dependent variables


 Levels of measurement (skala pengukuran)
 Paired versus unpaired
 Kinds of statistics
Independent vs dependent variables

Karakteristik yang Karakteristik yang


menentukan nilai nilainya ditentukan
variabel terikat oleh variabel bebas
Levels of Measurement
 The kind of statistic that is appropriate depends
on how the dependent variable has been
measured
 Levels of measurement:
 Categorical
 Nominal (dikotom dan polikotom) sederajat

 Ordinal  bertingkat

 Numerical
 Interval  tidak memiliki nilai nol alami (suhu)

 Ratio  memiliki nilai nol alami (TB, BB)


Levels of Measurement
 CONTOH:
Nama variabel “tinggi badan”
Definisi operasional: jarak antara ujung tumit
kaki dan puncak kepala
Nilai: 155, 156, 157, 158, 159, ... (dalam cm)
Alat ukur : meteran tinggi badan
 SKALA?
Paired versus Un-paired
(berpasangan dan tidak berpasangan)
 Berpasangan (paired)
Data yang sama yang diperoleh dari individu
yang sama atau dianggap sama
 Tidak berpasangan (un-paired)
Data yang diperoleh dari individu yang berbeda
tanpa proses matching
II. What Are Statistics?

 Methods for organizing, analyzing, and


interpreting numerical data
 Descriptive statistics: Organize and summarize
data
 Inferential statistics: Used to make an inference,
on the basis of data, about the (non)existence of a
relationship between the independent and
dependent variables
Kinds of Statistics

 When data are measured at the categorical


or ordinal level, nonparametric statistical tests
are appropriate.
 Unfortunately, time prohibits much discussion of
this important class of statistics.
 When data are interval or ratio, parametric
tests are usually the correct choice
(depending on the assumptions required by
the test).
Definisi:
Karakteristik yang beragam

Contoh:
Nama variabel “tinggi badan”
Definisi operasional: jarak antara ujung tumit kaki dan puncak kepala
Nilai: 155, 156, 157, 158, 159, ... (dalam cm)
Alat ukur : meteran tingi badan

Jenis variabel:
Menurut skala pengukuran (Nominal, Ordinal, Interval, Rasio)
Menurut sifatnya (Kategorik, Numerik)
Jenis Variabel Menurut Skala Pengukuran

RASIO= ada tingkatan, jarak, kelipatan


contoh: berat badan, tinggi badan

INTERVAL= ada tingkatan, ada jarak, tdk ada kelipatan


contoh: suhu

ORDINAL= ada tingkatan, tdk diketahui jarak


contoh: stadium penyakit, pangkat

NOMINAL= tdk ada tingkatan


contoh: pria/wanita, golongan darah
Jenis Variabel Menurut Sifatnya

• Kategorik (kualitatif)
Definisi: hasil pengkategorian/penjumlahan suatu data
Cirinya : isinya berbentuk kata-kata
Contoh : jenis kelamin (pria/wanita), pekerjan (PNS/Swasta)
Pd umumya berisi variabel yang berskala nominal dan ordinal

• Numerik (kuantitatif)
Definisi: variabel hasil pengukuran atau penghitungan
Ciri : isinya berbentuk angka-angka
Contoh : tinggi badan (150cm,165cm,dst), jumlah anak: 1,2,3,dst…
Pd umumya berisi variabel yang berskala interval dan rasio
Data numerik diubah ke dlm data katagorik dg cara
pengelompokkan/pemgklasifikasian.
Misalnya berat badan data riilnya merupakan data
numerik, namun bila dikelompokkan menjadi kurus
(<50kg), sedang (50-60kg) dan gemuk (>60kg) maka jensis
variabelnya sudah berubah menjadi kategorik
Tampilan di Komputer (Excel/SPSS)
Age
numerik

Religion
Catagoric Age Religion Gender Age1
Coding: 1=Islam,2=Kristen,3=Katolik
18 2 1 1
Gender 34 3 1 3
Catagoric 23 1 2 2
Coding: 1=Male, 2=Female 34 1 1 3

Age1
Catagorik
Coding: 1= <20th (teen), 2= 20-30 th
(adult), 3= >30 th (elderly)
Parametrik  Distribusi data populasi yang diuji
normal / berbentuk simetris, menggunakan
perbandingan mean sbg acuan, biasanya utk data
interval dan rasio

Non Parametrik  Distribusi data populasinya


tidak normal atau tidak diketahui distribusinya,
sampel sedikit, biasanya data mentah tidak
digunakan tp menggunakan sistem perengkingan
dari nilai terendah hingga tertinggi, menggunakan
median sebagai acuan, biasanya utk data nominal
dan ordinal
Jenis Analisis Data:

• Univariat (1 variabel) :
deskripsi masing-2 variabel
METODE : Peringkasan Data (Ukuran Tengah)
Ukuran Penyebaran (Ukuran Variasi)

• Bivariat (2 variabel)
• Multivariat (banyak variabel)
Analisis Data
Memberi makna data, memberi arti data, memperoleh gambaran masing-
masing variabel

Contoh: hasil survei di Bogor didapatkan rata-rata berat bayi sebesar 2100g.

Analisisnya: masih banyak bayi di Bogor dalam kondisi berat badan rendah.

Hasil Analisis data akan maksimal, bila menguasai:


- Statistik
- Substansi dari data yg dianalisis
- Paket program statistik komputer
Central Tendancy (nilai tengah)
• Mean  distribusi normal
• Median  skewed distribution
• Mode

Measure of Variability (variasi data)


• range & variance & standard deviation 
distribusi normal
• Interquartile range (IQR)  bila sebaran
datanya ada outliers
Peringkasan Data : Numerik

Mean (rerata) kadar Hb:


(10+11+12+13+14)
-------------------------- = 12 mg/dl
5
Hb=10 Hb=11 Hb=12
Median (nilai tengah) =12 mg/dl

Modus (paling sering) = tdk ada


Hb=13 Hb=14

Kelemahan nilai mean : terpengaruh data ekstrim (outliers)


Keuntungan nilai median: tidak terpengaruh adanya data ekstrim
Standar Deviasi: Ukuran Sebaran/keragaman data Numerik
Lebak rerata Hb = 12 mg/dl = Cianjur rerata Hb = 12 mg/dl

Hb=10 Hb=11 Hb=12

Hb=12 Hb=12 Hb=12

Hb=13 Hb=14

Hb=12 Hb=12

Kedua Kabupaten memiliki rerata yang sama namun di Lebak kadar Hb lebih
beragam
Std. Deviasi Hb bumil di Lebak = 1,58 mg/dl
Std. Deviasi Hb bumil di Cianjur = 0,0 mg/dl
Ukuran variasi data Katagorik
: Proporsi / persentase

= Bumil tidak sehat


= Bumil sehat

Proporsi bumil sehat: 6/10 = 0,6 = 60%


Normalitas Data
Kenormalan data adalah salah satu syarat
untuk dapat menggunakan uji statistik
parametrik.
Apa sajakah yang menjadi acuannya?

• grafik histogram dan kurva normal


• skewness (kemiringan) dan standar errornya
• uji kolmogorov smirnov dan saphiro wilk
Distribusi data normal/ simetris / bell-shaped
mean = median = modus (hampir sama)

95% observasi diharapkan jatuh diantara dua


standar deviasi dari mean?
ESTIMASI
Perkiraan kondisi/karakteristik populasi melalui data sampel

Mis: hasil survei sampel 150 bayi di Depok didapatkan rerata


berat badan bayi 2100 g

Untuk seluruh Depok berapa rata-rata nya ? -> estimasi

Misal hasil Estimasi Interval didapatkan hasil : 95 % CI (2000g


; 2300g)
Berarti Gambaran kondisi bayi di Depok, sbb:

95 % dipercaya bahwa rata-rata berat badan bayi di wilayah


Depok adalah berada diantara 2000g s/d 2300g
Distribusi data miring ke kiri (ekor di kiri / negatif)

Mean < Median ≤ Modus


Distribusi data miring ke kanan (ekor di kanan / positif)
Mean > Median ≥ Modus Mean
10
11
10
12
9
10
60
Kelemahan Mean :
terpengaruh data ekstrim (outliers)
 dpt digunakan pd data berdistribusi normal

Keuntungan nilai median:


tidak terpengaruh adanya data ekstrim
(outliers)
Pada distribusi yg miring (tidak normal) nilai
Median selalu terletak antara nilai Modus &
Mean
• Jika distribusi data normal:
digunakan mean sbg pemusatan &
Standar Deviasi sbg ukuran penyebaran

• Jika distribusi data tidak normal:


digunakan median sbg pemusatan &
min-max sbg ukuran penyebaran
Kurtosis
- Tinggi-rendah/runcing-datar dari kurva normal
- Densitas data

Distribusi Normal
Kurtosis = 0

Leptokurtotic = runcing
Kurtosis > 0

Platykurtotic = rendah-datar
Kurtosis < 0
Tampilan Utama SPSS (Data View)
Tampilan Utama SPSS (Variabel View)
Skenario
Suatu penelitian dilakukan untuk menganalisa
apakah ada perbedaan proporsi antara subjek
yang merokok dan adanya penyakit periodontal.

Kemudian dilakukan uji klinis dengan


menggunakan pasta gigi untuk mengurangi
halitosis subjek-subjek tersebut. Untuk itu
dilakukan pengukuran sebelum dan sesudah
perlakuan.
Entry Variabel View
Entry
Data
View
Analisis Variabel Katagorik
Analisis Variabel Katagorik
Output
SPSS

Note : Ouput spss tdk dapat langsung dilaporkan, harus dibuat tabel
Penyajian Hasil Deskriptif
Analisis
Variabel
Numerik
Output
SPSS
Explore utk deskriptif
CI (estimasi interval) & Normalitas
Output Explore

Untuk jumlah sampel: >50 < 50


Bila Sig (p) > 0.05 berarti distribusi Normal
Penyajian Deskriptif Data

Interpretasi:
Terjadi Penurunan nilai rerata Halitosis sesudah
perlakuan
Contoh penyajian Grafik
• Variabel kategorik (prosentasi/proporsi)  diagfram Pie
• Mendeskripsikan perubahan yang terkait dengan waktu
(before and after)  line
Recoding Data
Recoding dengan SPSS

You might also like