BAB01

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 9

Pengenalan kepada

Statistik

.1

Apakah Statistik?

Perkataan statistik mempunyai berbagai makna di dalam budaya kita.


Websters Third New International Dictionary memberikan definasi statistik yang
komprenhensif sebagai sains yang berurusan dengan pungutan, analisis, tafsiran
dan persembahan data numerik. Dari sudut pandangan ini, statistik akan kita
bincangkan di dalam kursus ini. Statistik juga merupakan satu cabang
matematik, dan banyak daripada sains statistik berdasarkan kepada pemikiran
matematik, dan terbitannya.
Banyak daripada bidang-bidang akademik,
termasuk perniagaan, menawarkan kursus statistik di dalam disiplinnya. Walau
bagaimanapun, statistik telah menjadi satu bidang pengajian di dalam bidangnya.
Manusia kerapkali menggunakan perkataan statistik dengan merujuk
kepada kumpulan data. Sebagai contoh, mereka mungkin berkata mereka
memungut statistik dari operasi perniagaan mereka. Apa yang mereka rujukkan
adalah mengukur kenyataan dan angka. Pilihan model kereta dan lain-lain juga
menggunakan perkataan statistik untuk merujuk kepada kematian.
Pernyataan statistik adalah digunakan sekurang-kurangnya di dalam dua
cara yang penting. Pertama, statistik boleh merupakan pengukuran perihalan
yang dikira daripada sampel dan digunakan untuk membuat penerangan terhadap
populasi. Penggunaan ini akan dicincangkan kemudian. Kedua, statistik
merupakan taburan yang digunakan di dalam analisis data. Sebagai contoh,
penyelidik menggunakan taburan t untuk menganalisis data yang akan merujuk
kepada statistik-t di dalam menganalisis data.
Berikut merupakan beberapa penggunaan yang biasa bagi perkataan statistik:
a.
b.
c.
d.
e.
f.

Sains yang memungut, menganalisis, mentafsir dan


mempersembahkan data.
Cabang metematik
Kursus pengajian
Kenyataan dan angka
Pengukuran yang diambil dari sampel
Jenis taburan yang digunakan untuk menganalisis data.

Pengenalan Kepada Statistik

.2

Statistik Perihalan dan Pentaabiran

Kajian statistik boleh disusun di dalam berbagai-bagai cara. Salah satu


daripada cara ialah membahagikan statistik kepada dua cabang: Statistik
perihalan dan statistik pentaabiran. Untuk memahami perbezaan di antara
statistik perihalan dan pentaabiran, definasi populasi dan sampel adalah amat
berguna. Populasi didefinasikan sebagai pungutan manusia, objek, atau item
yang diminati. Populasi secara meluas menerangkan kategori seperti semua
kenderaan, atau boleh menerangkan secara terperinci sebagai semua kereta
Proton yang dikeluarkan pada tahun 2000. Populasi boleh juga sebagai
kumpulan manusia, seperti semua pelajar di FEP, UPM, atau boleh jadi set
objek, seperti semua TV yang dikeluarkan oleh Sony di Petaling Jaya. Apabila
penyelidik memungut data dari seluruh populasi bagi sesuatu ukuran yang
diminati, ia dipanggil sebagai bancian. Semua orang biasa dengan bancian
isirumah Malaysia yang dijalankan oleh Jabatan Perangkaan Malaysia. Ia
dilakukan 10 tahun sekali untuk mengukur taraf kehidupan semua rakyat di
Malaysia.
Sampel adalah bahagian daripada keseluruhan, jika ia diambil dengan
sempurna, ia mewakili keseluruhan. Untuk beberapa sebab yang tertentu,
penyelidik biasanya lebih gemar untuk menggunakan sampel berbanding dengan
populasi. Sebagai contoh, di dalam menjalankan ujikaji kawalan kualiti untuk
mementukan purata tempoh hayat mentol lampu, pengilang mentol lampu
mungkin mengambil sampel rawak hanya 75 biji mentol lampu sahaja di dalam
proses pengeluarannya.
Disebabkan oleh batasan masa dan kewangan,
pengurusan sumber manusia mungkin hanya mengambil sampel rawak pekerja
berbanding menggunakan bancian untuk mengukur moral pekerja.
Jika penyelidik menggunakan data yang diambil keatas kumpulan untuk
menerangkan atau membuat kesimpulan terhadap kumpulan yang sama, statistik
tersebut dipanggil statistik perihalan. Sebagai contoh, jika saorang pensyarah
mengeluarkan statistik untuk meringkaskan keputusan peperiksaan kelas dan
menggunakan statistik tersebut untuk membuat kesimpulan hanya keatas kelas
tersebut, statistik tersebut adalah perihalan. Pensyarah boleh menggunakan
statistik tersebut untuk membincangkan purata kelas, bercakap mengenai jeda
markah kelas, atau mempersembahkan lain-lain pengukuran data untuk kelas
berdasarkan keatas ujian.
Satu jenis lain statistik dipanggil sebagai statistik pentaabiran (inferen
statistics). Jika penyelidik memungut data daripada sampel dan menggunakan
statistik tersebut untuk membuat kesimpulan terhadap populasi dimana sampel
2

Pengenalan Kepada Statistik

tersebut diambil, statistik tersebut adalah statistik pentaabiran. Data yang


dipungut adalah digunakan untuk mentaabir sesuatu berkaitan kumpulan yang
besar. Statistik pentaabiran kadangkala dipanggil sebagai statistik induktif.
Ukuran perihalan bagi populasi dipanggil sebagai parameter. Parameter
biasanya ditandakan menggunakan huruf Greek. Contoh-contoh parameter
adalah purata populasi (), varian populasi (2), dan sisihan piawai populasi.
Ukuran perihalan bagi sampel dipanggil statistik dan biasanya ditandakan dengan
huruf roman. Contoh statistik adalah purata sampel ( X ), varian sampel (S2) dan
sisihan piawai sampel (S).

Perbezaan di antara parameter dan statistik adalah penting hanya di


dalam penggunaan statistik pentaabiran. Ahli statistik biasanya mahu
untuk menganggar nilai parameter atau menjalankan ujian terhadap
parameter. Walau bagaimanapun, pengiraan parameter biasanya sama ada
tidak mungkin atau tidak boleh laksana disebabkan oleh jumlah masa dan
wang yang diperlukan untuk membuat bancian. Di dalam kes tersebut,
ahli-ahli statistik akan mengambil sampel rawak daripada populasi,
mengira statistik keatas sampel dan membuat pentaabiran dengan
menganggar nilai parameter. Asas bagi statistik pentaabiran adalah
kebolehannya untuk membuat keputusan berkaitan parameter tanpa
melakukan bancian lengkap terhadap populasi.
Pentaabiran berkaitan parameter adalah dibuat di bawah
ketakpastian. Melainkan parameter adalah dikira secara terus daripada
populasi, ahli-ahli statistik tidak mengetahui secara pasti sama ada
penganggaran atau pentaabiran yang dibuat daripada sampel adalah benar
atau tidak. Di dalam usaha untuk menganggar paras keyakinan di dalam
proses menghasilkan keputusan, ahli-ahli statistik menggunakan
pernyataan kebarangkalian.

.3

Taraf Pengukuran Data

Berjuta-juta data dipungut di dalam perniagaan setiap hari. Semua data


tersebut sepatutnya tidak dianalisis dengan cara yang sama secara statistik
disebabkan entiti yang diwakili oleh data tersebut adalah berebza. Oleh sebab
itu, ahli-ahli statistik perlu untuk mengetahui taraf pengukuran data yang diwakili
oleh data tersebut.

Pengenalan Kepada Statistik

Penggunaan biasa nombor boleh digambarkan oleh nombor 2 dan 10,


yang boleh mewakili berat dua jenis barangan, pemeringkatan (rating) yang
diterima keatas ujian pelanggan oleh dua jenis barangan, atau nombor jersi bola
sepak. Walaupun 10 kg adalah lima kali ganda 2 kg, tetapi nombor 10 pada jersi
penyerang bola sepak bukanlah lima kali ganda nombor 2 pada jersi pertahanan.
Melakukan purata bagi berat barangan adalah menasabah tetapi membuat purata
pada nombor jersi pemain bola sepak tidak memberikan apa-apa makna. Analisis
data yang bersesuaian adalah bergantung kepada taraf pengukuran data yang
dikutip.
Phenomena yang diwakili oleh nombor menentukan taraf pengukuran
data. Empat jenis taraf pengukuran data yang biasa adalah seperti berikut:
a.
b.
c.
d.

1.3.1

Nominal
Ordinal
Interval
Kadar

Taraf Nominal
Pengukuran data yang paling rendah adalah taraf nominal. Nombor
mewakili data taraf nominal boleh digunakan hanya untuk pengelasan
dan kategori. Nombor pengenalan kakitangan adalah sebagai contoh
data nominal. Nombor yang digunakan hanyalah untuk membezakan
kakitangan dan bukanlah untuk memberikan pernyataan nilai terhadap
mereka. Banyak soalan-soalan demografi di dalam survei adalah data
nominal disebabkan soalan yang digunakan hanyalah untuk pengelasan
sahaja. Contoh soalan seperti tersebut adalah:
Manakah klasifikasi pekerjaan yang terbaik menerangkan
bidang kerja anda?
A.
B.
C.
D.
E.
F.

Pendidik
Pekerjaan binaan
Pekerja Perkilangan
Penguam
Doktor
Lain-lain

Oleh yang demikian, untuk tujuan pengiraan, pendidik ditandakan


sebagai 1, pekerjaan binaan sebagai 2, pekerja perkilangan sebagai 3, dan

Pengenalan Kepada Statistik

seterusnya. Nombor hanyalah digunakan untuk mengkelaskan pekerja


sahaja. Nombor 1 bukan menandakan pengkelasan tertinggi. Ia hanya
bertujuan untuk membezakan di antara pendidik (1) dan doktor (5).
Lain-lain data demografi seperti bangsa, jantina, tempat tinggal dan lainlain merupakan data bertaraf nominal.

1.3.2

Taraf Ordinal
Pengukuran data bertaraf ordinal adalah lebih tinggi daripada nominal.
Disamping itu, data ordinal boleh digunakan untuk memeringkatkan atau
menyusun objek. Sebagai contoh, dengan menggunakan data ordinal,
penyelia boleh menilai tiga orang pekerja dengan memeringkatkan
produktiviti mereka dengan nombor 1 hingga 3. Penyelia boleh
mengenalpasti, satu pekerja amat produktif, saorang pekerja kurang
produktif dan saorang lagi tidak produktif menggunakan data ordinal.
Walau bagaimanapun, penyelia tidak boleh menggunakan data ordinal
untuk membuktikan interval di antara dua orang pekerja yang
diperingkatkan sebagai 1 dan 2 atau pekerja diperingkat 2 dan 3 adalah
sama. Iaitu, ia tidak boleh menyatakan bahawa perbezaan di antara
oekerja diperingkat 1, 2 dan 3 adalah sama. Dengan data ordinal, jarak
yang diwakili oleh nombor yang berturutan adalah tidak selalunya sama.

Beberapa soalan soal-selidik jenis skala Likert yang selalu


digunakan oleh penyelidik adalah jenis ordinal. Berikut adalah
contoh skala tersebut:
Kualiti perkhidmatan yang diberi oleh Bank di Malaysia adalah baik.
Amat
Bersetuju
1

Tidak
Pasti
3

Bersetuju
2

Tidak Bersetuju
4

Amat tidak
Bersetuju
5

Apabila soalan survei ini dikodkan kedalam komputer, hanya


nombor 1 hingga 5 sahaja yang dimasukkan bukannya keterangannya.
Secara maya semua orang bersetuju bahawa 5 lebih tinggi daripada 4 di
dalam skala ini dan pemeringkatan tindakbalas adalah mungkin. Walau
bagaimanapun kebanyakan responden tidak mempertimbangkan

Pengenalan Kepada Statistik

perbezaan di antara Amat Tidak Bersetuju, Tidak Bersetuju, Tidak Pasti,


Bersetuju dan Amat Bersetuju adalah sama.

Sebagai contoh lain, dana pelaburan sebagai pelaburan


yang diperingkatkan di dalam sebutan risiko dengan menggunakan
ukuran risiko biasa, risiko kewangan dan risiko kadar faedah. Tiga
ukuran ini adalah digunakan kepada pelaburan dengan
memeringkatkannya sebagai mempunyai risiko yang tinggi,
sederhana dan rendah. Katakan risiko tinggi ditandakan sebagai 3,
sederhana risiko sebagai 2 dan tidak berisiko sebagai 1. Jika dana
tersebut dilabelkan sebagai 3 berbanding 2, ia mempunyai risiko
yang lebih dan seterusnya. Walau bagaimanapun, perbezaan risiko
di antara kategori 1,2 dan 3 tidak semestinya sama. Oleh itu,
pengukuran risiko ini hanyalah taraf pengukuran ordinal.
Disebabkan oleh data nominal dan ordinal biasanya
diterbitkan daripada pengukuran
seperti soalan demografi,
kategori manusia atau objek, atau pemeringkatan sesuatu item, data
nominal dan ordinal adalah data bukan metrik atau kadangkala
dipanggil sebagai data kualitatif.
1.3.3

Taraf Interval
Pengukuran data interval adalah taraf data yang tertinggi sedikit.
Pengukuran interval mempunyai semua kandungan data taraf
ordinal, tetapi jarak di antara nombor berturutan mempunyai
makna dan data selalunya adalah numerik. Jarak adalah diwakili
oleh perbezaan di antara nombor berturutan adalah sama. Contoh
pengukuran interval adalah nombor suhu Farenheit, suhu boleh
diperingkatkan, jumlah kepanasan di antara bacaan berturutan,
seperti 21o, 22o dan 23o.
Disamping itu, dengan paras data interval, titik sifar
hanyalah konvension atau keselesaan dan bukan semula jadi atau
tetap pada titik sifar. Oleh itu, sifar hanyalah titik lain di atas skala
dan tidak bermakna ia tidak ujud di dalam fenomena. Sebagai
contoh, 0o F bukanlan suhu terendah yang mungkin. Contoh lain
data taraf interval adalah peratus perubahan di dalam pekerjaan,
peratus pulangan keatas pelaburan dan perubahan di dalam harga
saham.

Pengenalan Kepada Statistik

Dengan data taraf interval, transformasi unit dari satu


pengukuran kepada yang lain melibatkan pendharaban dengan
faktor tertentu, , dan menambah dengan faktor lain, , oleh itu Y
= + X. Sebagai contoh, untuk mengubah suhu Calcius kepada
suhu Farenheit melibatkan perhubungan
F 32

1.3.4

9
C
5

Taraf Kadar
Ukuran taraf kadar adalah taraf pengukuran data yang tertinggi. Data
kadar mempunyai kandungan yang sama sebagaimana data interval,
tetapi data perkadaran mempunyai nilai mutlak sifar dan kadar bagi dua
nombor adalah bermakna. Notasi nilai mutlak sifar bermakna nilai sifar
adalah tetap dan oleh itu ujud nilai sifar di dalam data yang mewakili
ketidakhadiran ciri-ciri yang dikaji. Nilai sifar tidak boleh secara
arbitrari diletakkan disebabkan ia mewakili titik tetap. Definasi ini
membolehkan statistik mengujudkan kadar dengan data.
Contoh data kadar adalah tinggi, berat, jumlah jualan dan
sebagainya. Dengan data kadar, penyelidik boleh menyatakan 180 kg
adalah lebih berat daripada 90 kg atau sebaliknya, dan membuat kadar
180:90.
Disebabkan oleh data taraf interval dan kadar biasanya
diperolehi daripada alatan yang biasanya digunakan di dalam proses
pengeluaran dan proses kejuruteraan, di dalam ujian piawai kebangsaan,
atau tatacara perakaunan piawai, ianya dipanggil data matrik dan
kadangkala dirujukkan sebagai data kuantitatif.

1.4 Perbandingan Empat Taraf data


Rajah 1.1 menunjukkan perhubungan potensi penggunaan di antara empat taraf
pengukuran data. Empat persegi yang tertinggi menandakan setiap kategori
paras data boleh dianalisis dengan sebarang teknik yang digunakan keatas taraf
data yang terendah, tetapi sebagai tambahan, boleh dianalisis menggunakan
sebarang teknik statistik yang boleh digunakan terhadap lain-lain tiga jenis data
ditambah dengan yang lain.

Pengenalan Kepada Statistik

Data nominal adalah data yang amat terhad di dalam jenis analisis
staistik yang boleh digunakan dengan mereka. Data ordinal membolehkan
penyelidik untuk melakukan sebarang analisis yang boleh dilakukan
dengan data nominal ditambah dengan yang lain. Melalui data kadar, ahliahli statistik berkebolehan untuk membuat perbandingan pendharaban dan
bersesuaian melakukan sebarang analisis yang boleh dilakukan oleh data
nominal, ordinal atau interval. Sesetengah teknik statistik memerlukan
data kadar dan tidak boleh digunakan untuk menganalisis lain-lain taraf
data.
Teknik statistik boleh digunakan di dalam dua kategori statistik
parametrik dan statistik tidak berparametrik. Statistik parametrik memerlukan
data interval atau kadar. Jika data adalah nominal atau ordinal, statistik tidak
berparameter mesti digunakan.
Statistik tidak berparameter juga boleh
digunakan statistik tidak berparameter juga boleh digunakan untuk menganalisis
data interval dan kadar.

Rajah 1.1
Potensi Penggunaan Berbagai Jenis Data

Kadar
Interval
Ordinal
Nominal

Pengenalan Kepada Statistik

You might also like