Isl 16

You might also like

Download as doc, pdf, or txt
Download as doc, pdf, or txt
You are on page 1of 17

Isl m 16

Statistik
3.1 Ukuran Kecenderungan Memusat

Satu jenis pengukuran yang digunakan untuk memerihalkan set data adalah ukuran kecenderungan memusat. Pengukuran kecenderungan memusat menghasilkan maklumat berkaitan dengan titik tengah pada satu kumpulan nombor.

3.1.1

Data Tidak Berkumpul

Ditunjukkan didalam Jadual 3.1 adalah harga tawaran saham bagi 20 syarikat yang akan disenaraikan di Bursa Saham Kuala Lumpur pada tahun 2000. Bagai data ini, ukuran kecenderungan memusat boleh menghasilkan maklumat berkaitan dengan purata harga tawaran, titik tengah harga tawaran dan juga harga tawaran yang paling kerap ditawarkan. Ukuran kecenderungan memusat tidak menumpukan keatas pengembangan set data atau berapa jauh nilai daripada titik tengah. Ukuran kecenderungan memusat bagi data yang tidak berkumpul adalah min, mod, median, peratusan dan quantil. Jadual 3.1 Harga Saham bagi 20 Kaunter KLSE (RM) 14.25 24.00 27.00 34.22 19.00 Mod 19.00 23.00 25.00 15.50 19.00 11.00 43.25 15.00 15.00 27.00 28.00 19.00 7.00 22.00 21.00

Mod adalah nilai yang paling kerap ujud didalam set data. Bagi data yang ditunjukkan didalam Jadual 3.1, mod ialah RM19.00 kerana harga tawaran berlaku sebanyak 4 kali. Menyusun data didalam susunan yang menaik (menyusun dari nombor terkecil hingga terbesar) membantu kita menentukan mod. Berikut adalah susunan nilai daripada Jadual 3.1. 7.00 21.00 11.00 22.00 14.25 23.00 15.00 24.00 15.00 25.00 15.50 27.00 19.00 27.00 19.00 28.00 19.00 34.22 19.00 43.25

Penyusunan ini membuatkan kita dengan mudah untuk melihat RM19.00 adalah harga yang kerap berlaku. Jika terdapat dua kumpulan angka yang kerap ujud didalam set data, ia mempunyai dua mod. Didalam kes seperti ini, ia dikatakan bi-model. Jika set data tidak sebenarnya bi-model, tetapi mengandungi dua nilai dimana lebih dominan daripada yang lain, sesetengah penyelidik mempunyai kebebasan dengan menunjukkan set data sebagai bi-model walaupun ia sebenarnya tidat terikat kepada mod. Data set dengan lebih daripada dua mod dipanggil sebagai berbilang-model. Didalam dunia perniagaan, konsep mod biasanya digunakan didalam menentukan saiz. Sebagai contoh, pengilang baju mengeluarkan baju didalam empat saiz, S, M, L, dan XL. Setiap saiz adalah berpadanan dengan model badan manusia. Dengan pengurangan bilangan kepada beberapa model saiz, syarikat boleh mengurangkan jumlah kos pengeluaran dengan menghadkan kos penyediaan mesin dan bahan. Mod adalah ukuran kecenderungan memusat sesuai bagi data nominal. Mod boleh digunakan untuk menentukan manakah kategori yang kerap terjadi. Median Median ialah titik tengah sesuatu kumpulan nombor yang disusun secara menaik. Jika bilangan data tersebut adalah ganjil, median ialah nombor yang ditengah. Jika bilangan data adalah genap, median ialah purata dua nombor yang terletak ditengah-tengah. Langkah berikut adalah digunakan untuk menentukan median. LANGKAH 1: LANGKAH 2: LANGKAH 3: Susun data didalam susunan menaik. Jika bilangan data adalah ganjil, carikan sebutan ditengahtengah didalam susunan tersebut. Ia adalah median. Jika bilangan data adalah genap, kirakan purata dua angka ditengah-tengah susunan tersebut. Purata ini adalah median.

Katakan ahli statistik hendak mencari median bagi kumpulan data berikut: 15 11 1 4 3 2 1 1 7 2 2 1 6 1 9 16 5 7 19 8 9 20 4

Susunan nombor didalam sebutan menaik: 3 4 5 7 8 9 1 1 1 4 1 5 1 6 1 6 1 7 1 9 19 20 21 22

Terdapat 17 sebutan (bilangan ganjil), oleh itu median terletak ditengahtengah susunan tersebut, iaitu 15. Jika nombor 22 dikeluarkan daripada senarai, terdapat hanya 16 sebutan (bilangan genap): 3 4 5 7 8 9 11 14 15 16 16 17 19 19 20 21

Sekarang kita mempunyai bilangan sebutan genap, median ditentukan dengan mengira purata dua nombor yang terletak ditengah-tengah susunan tersebut, 14 dan 15. Ini menghasilkan nilai median iaitu 14.5. + Satu cara lain untuk menentukan median ialah mencari sebutan n2 1 didalam susunan yang menaik. Sebagai contoh, jika set data mempunyai 77 sebutan, median adalah terletak pada sebutan yang ke 39, iaitu:

n + 1 77 + 1 = = 39 2 2 Formula ini amat berguna apabila melibatkan bilangan data yang besar. Median tidak dipengaruhi oleh magnitud nilai ekstrim. Ciri-ciri ini merpakan kelebihan disebabkan nilai terbesar atau terkecil tidak mempengaruhi median. Oleh sebab itu, median merupakan ukuran lokasi yang terbaik untuk digunakan didalam analisis pembolehubah seperti kos rumah, pendapatan dan usia. Sebagai contoh, broker perumahan mahu menentukan median, harga jualan 10 buah rumah yang disenaraikan seperti berikut:
67,000 122,000 91,000 148,000 95,000 167,000 3 105,000 189,000 116,000 5,250,000

Median harga rumah tersebut adalah purata dua sebutan ditengah-tengah, 116,000 dan 122,000 atau 119,000. Harga ini adalah munasabah mewakili harga kesemua rumah. Perhatikan harga rumah 5,250,000 tidak termasuk didalam analisis melainkan diambil kira sebagai satu daripada 10 rumah. Jika harga rumah yang ke 10 adalah 200,000, keputusannya masih lagi sama. Walau bagaimanapun, jika semua harga rumah dipuratakan, menghasilkan harga purata 10 rumah adalah RM635,000 dan lebih tinggi daripada harga 9 rumah yang pertama. Kelemahan median ialah tidak semua maklumat daripada data digunakan. Iaitu, maklumat berkaitan dengan harga rumah termahal tidak diambilkira didalam pengiraan median. Paras pengeluaran data mestilah sekurang-kurangnya ordinal untuk median lebih bermakna. Min Min aritmatik adalah susunan sinonim dengan purata kumpulan nombor dan ia dikira dengan menjumlahkan semua nombor dan membahagikannya dengan bilangan nombor tersebut. Disebabkan min aritmatik digunakan dengan meluas, kebanyakan ahli statistik hanya menggunakan istilah min sahaja. Min populasi ditandakan dengan huruf Greek mu (). Min sampel pula ditandakan dengan huruf Roman ( X ). Formula bagi mengira min bagi populasi dan min sampel adalah sebagaimana berikut:

Min populasi:

X = X1 + X 2 + X 3 + ........... X N
N N

Min sampel:

X=

X = X1 + X 2 + X 3 + ........... X n
n n

Huruf Greek sigma () biasanya digunakan oleh ahli matematik untuk menunjukkan jumlah semua nombor-nombor didalam kumpulan data. Disamping itu, N adalah bilangan nombor didalam populasi dan n adalah bilangan nombor didalam sampel. Algorithma untuk mengira min adalah dengan menjumlahkan nombor-nombor didalam populasi atau sampel dan kemudiannya membahagikannya dengan bilangan populasi atau sampel. Secara amnya, definasi min adalah:

Xi
i =1

Walau bagaimanapun, untuk tujuan kursus ini

X Menandakan

Xi
i =1

Min adalah sesuai digunakan untuk menganalisis data sekurangkurangnya data bertaraf interval didalam pengukuran.

Contoh 1.1 Katakan syarikat mempunyai lima jabatan dengan bilangan pekerja 24, 13, 19, 26 dan 11 masing-masingnya. Min populasi adalah:

X = 24 + 13 + 19 +26 + 11
= 93

X = 93 = 18.6
N 5

Pengiraan min sampel adalah menggunakan algorithma yang sama bagi min populasi. Walau bagaimanapun adalah tidak sesuai untuk mengira min sampel untuk populasi atau min populasi untuk sampel. Oleh kerana kedua-dua min populasi dan sampel adalah penting didalam statistik, simbol yang berasingan adalah perlu untuk membezakan min populasi dan sampel. Min adalah dipengaruhi oleh setiap nilai didalam data, yang merupakan kelebihannya. Ia juga merupakan kelemahannya, disebabkan nilai ekstrim yang terbesar atau terkecil boleh menyebabkan nilai min tertarik kearah nilai ekstrim. Min amat biasa digunakan didalam mengukur lokasi disebabkan ia menggunakan setiap data dalam pengiraannya dan ia mempunyai kandungan

matematik yang membuatkkannya menarik untuk digunakan didalam analisis statistik pentaabiran.

1.1.2

Data Berkumpulan

Tiga ukuran kecenderungan memusat akan dibincangkan bagi data berkumpulan iaitu min, median dan mod. Min Bagi data yang tidak terkumpul, min adalah dikira dengan menjumlahkan nilai didalam set data dan kemudiannya membahagikannya dengan bilangan data tersebut. Tetapi bagi data yang telah terkumpul, nilai yang khusus tidak diketahui. Apakah yang boleh digunakan untuk mewakili nilai data? Titik tengah bagi setiap jeda kelas adalah digunakan untuk mewakili semua nilai didalam jeda kelas tersebut. Titik tengah ini akan diwajarkan dengan kekerapan nilai didalam jeda kelas tersebut. Min bagi data terkumpul kemudiannya dikira dengan menjumlahkan hasil dharab titik tengah kelas dengan kekerapan kelas dan membahagiman jumlah tersebut dengan bilangan kekerapan. Formulanya adalah sebagaimana berikut:

kumpulan =
dimana; i = bilangan jeda f = kekerapan kelas M = titik tengah kelas N = jumlah kekarap.

fi mi fi

f 1 m 1 + f 2 m 2 + .........f i m i f 1 + f 2 + ... + f i

Contoh 3.4: Jeda Kelas Kekerapan (fi) Titik Tengah (Mi) fiMi

13 35 57 79 9 11 11 - 13

16 2 4 3 9 6 f = N = 40

2 4 6 8 10 12

32 8 24 24 90 72 fM = 250

fiMi fi

250 = 6.25 40

Min baga data yang terkumpul adalah 6.25. Perlu diingat bahawa setiap jeda kelas diwakili oleh nilai titik tengah kelas tersebut bukannya nilai sebenar. Oleh sebab itu, nilai min tersebut hanyalah nilai penghampiran sahaja. Median Nilai median bagi data tidak terkumpul adalah nilai yang terletak ditengah-tengah apabila data tersebut disusun secara menaik. Bagi data yang terkumpul, pengiraan median agak rumit dan menggunakan formula berikut:
N 2

Median = L +
dimana

- cf p

f med

( W)

L = had bawah jeda kelas median cfp = jumlah terkumpul kekerapan sehingga kelas tersebut, tetapi tidak melibatkan kekerapan median kelas Fmed = kekerapan median W = keluasan jedia kelas median (had atas kelas had bawah kelas) N = jumlah bilangan kekerapan

Contoh 3.5:

1. Kirakan nilai
N 2 40 2

N 2

yang merupakan kedudukan sebutan ditengah-tengah.

= = 20 . Oleh itu median terletak dikedudukan ke 20. Persoalannya dikelas manakah sebutan ke 20? 2. Kirakan kekerapan terkumpul bagi setiap kelas. Jeda Kelas 13 35 57 79 9 11 11 - 13 Kekerapan (fi) 16 2 4 3 9 6 f = N = 40 Titik Tengah (Mi) 2 4 6 8 10 12

Berdasarkan kepada kekerapan terkumpul, sebutan ke 20 terletak didalam kelas ke tiga kerana terdapat hanya 18 nilai sahaja dalam dua kelas pertama. Oleh itu nilai median terletak dimana-mana di antara 5 7 (kelas ke tiga). Jeda kelas yang mengandungi nilai median dirujukkan sebagai jeda kelas median.

3. Oleh kerana nilai ke 20 adalah di antara 5 dengan 7, nilai median adalah


sekurang-kurangnya 5. Tetapi apakah nilai tersebut? Perbezaan di antara kedudukan nilai median, N = 20, dan kekerapan terkumpul sehingga itu, 2 tetapi tidak termasuk jeda kelas median, cfp = 18, memberitahu berapa banyak nilai sehingga jeda kelas median bagi nilai median terletak. Ini bolehb ditentukan dengan menyelesaikan N cfp = 20 18 = 2. Nilai 2 median terletak dia nilai kedalam jeda kelas median. Walau bagaimanapun, terdapat empat nilai didalam jeda kelas median (fmed). Nilai median adalah 2 4 jauh kedalam jeda, iaitu
N 2

- cf p

f med

20 - 18 2 1 = = 4 4 2

4. Oleh itu, nilai median sekurang-kurangnya 5 nilai L dan separuh jauhnya daripada jeda median. Berapa jauhkah secara geometri disepanjang jeda median? Setiap jeda kelas adalah dua unit luas (W). Separuh daripada jarak ini memberitahu kita berapa jauh nilai median ke dalam jeda kelas.

N 2

- cf p

f med

(W) =

40 2

- 18 2 1 (2) = (2) = (2) = 1 4 4 2

5. Menambahkan jarak ini dengan had bawah jeda kelas median menghasilkan nilai median.

Median = L +

N 2

- cf p

f med

( W) = 5 +

20 2

- 18 1 (2) = 5 + (2) = 5 + 1 = 6 4 2

Perlu diingat bahawa nilai median ini juga merupakan nilai penghampiran. Andaian yang dibuat didalam pengiraan ini adalah nilai sebenar adalah jatuh secara seragam disepanjang jeda kelas median. Mod Mod bagi data terkumpul adalah titik tengah kelas mod. Kelas kod adalah jeda kelas yang mempunyai kekerapan yang tertinggi. Di dalam contoh di atas, kelas mod adalah di antara 1 3 dengan bilangan kekerapan 16. Oleh itu titik tengah kelas mod ialah 2 dan mod ialah 2.

1.2 Ukuran Serakan


3.2.1 Data tidak terkumpul
Ukuran kecenderungan memusat menghasilkan maklumat berkaitan titik tertentu bagi set data. Walau bagaimanapun, penyelidik boleh menggunakan kumpulan alatan analisis lain untuk menerangkan set data. Alat ini ialah ukuran serakan yang menerangkan serakan atau pencaran set data. Menggunakan ukuran serakan bersama-sama ukuran kecenderungan memusat membuatkan pemerihalan numerik bagi data lebih lengkap lagi. Sebagai contoh, sebuah syarikat yang mempunyai 25 jurujual dan median jualan tahunan bagi jurujual ini ialah RM1.2 juta. Adakah jurujual tersebut merupakan kejayaan atau tidak? Median memberikan maklumat

berkaitan jualan individu ditengah-tengah, tetapi bagaimana dengan jurujual yang lain? Adakah mereka semua memperolehi RM1.2 juta jualan tahunan, atau adakah angka jualan mempunyai jeda yang luas dengan saorang jurujual menjual RM 5 juta setahun dan yang lain hanya menjual RM0.15 juta setahun? Ukuran serakan memberikan maklumat tambahan yang penting untuk menjawab persoalan ini. Rajah 3.2 menunjukkan tiga taburan dimana min bagi setiap taburan adalah sama ( = 50), tetapi taburan ini mempunyai serakan yang berbeza. Pemerhatian terhadap taburan ini menunjukkan bahawa ukuran serakan adalah perlu sebagai pelengkap kepada nilai min didalam menerangkan data. Kaedah pengiraan ukuran serakan adalah berebza bagi data tidak berkumpul dan data berkumpul. Bahagian ini akan menumpukan kepada jenis ukuran serakan bagi data tidak berkumpul.

10

Rajah 3.2 Tiga Taburan dengan Min Sampel yang Sama dan Serakan Berbeza

=50

Jeda Jeda adalah perbezaan di antara nilai terbesar dan nilai terkecil. Walaupun ia hanya merupakan nilai numerik tunggal, sesetengah penyelidik mendefinasikan jeda sebagai pasangan susunan nombor terkecil dan terbesar [terkecil, terbesar]. Ia merupakan ukuran serakan kasar, menerangkan jarak ke sempadan luar set data. Ia menggambarkan nilai ekstrim disebabkan ia dibina daripadanya. Kelebihan jeda ialah ianya mudah dikira. Satu penggunaan penting jeda ialah didalam penentuan kualiti, dimana jeda digunakan untuk membentuk carta kawalan. Kelemahan jeda ialah disebabkan ia dikira dengan nilaian yang terdapat nilai ekstrim bagi data maka ia dipengaruhi oleh nilai ekstrim tersebut dan oleh itu penggunaannya adalah untuk ukuran serakan adalah terhad. Berdasarkan kepada Jadual 3.1, nilai terkecil ialah RM7.00 dan nilai terbesar ialah RM43.25. Nilai jeda dikira dari perbezaan di antara nilai terbesar dan nilai terkecil. Jeda = Terbesar Terkecil = 43.25 7.00 = RM36.25. Sisihan Purata Mutlah (SPM) Sisihan purata mutlak (SPM) adalah purata nilai mutlak bagi sisihan disekitar min bagi set nombor.

SPM =

X -
N
11

Contoh 3.6: Jika diberi set data 5, 9, 16, 17, dan 19, maka SPM dikira sebagaimana berikut: X 5 9 16 17 18 X = 65 X- -8 -4 +3 +4 +5 (X -) = 0 |X - | +8 +4 +3 +4 +5 |X - | = 24

X = 65 = 13
N 5 | X- | N = 24 = 4.8 5

SPM =

Disebabkan ia dikira menggunakan nilai mutlak, SPM adalah kurang berguna didalam statistik berbanding dengan lain-lain ukuran serakan. Walau bagaimanapun, didalam bidang unjuran ia biasanya digunakan untuk mengukur ralat. Varian Disebabkan nilai mutlak tidak bersesuaian untuk pengiraan yang mudah, ahli-ahli matematik membentuk mekanisma alternatif untuk menyelesaikan jumlah sifar sisihan daripada min. Pendekatan ini menggunakan sisihan kuasa dua daripada min. Ukuran tersebut ialah varian dan merupakan ukuran penting bagi serakan. Varian ialah purata sisihan kuasadua dari min bagi set nombor. Populasi varian ditandakan dengan huruf Greek, 2 dan formulanya:

2 =

(X - ) 2
N 12

Menggunakan set nombor di atas, varian dikira sebagaimana berikut: X 5 9 16 17 18 X = 65 X- -8 -4 +3 +4 +5 (X -) = 0 ( X - |)2 64 16 9 16 25 (X - )2 = 130

Jumlah sisihan kuasadua daripada min (X - )2 bagi set nombor dipanggil sebagai Jumlah Kuasadua X (SSX). Bagi data di atas jumlah kuasadua (SSX) adalah 130. Membahagikan SSX dengan bilangan data akan menghasilkan varian. SSX = (X - )2 = 130

SSX (X - ) 130 Varian = = = = = 26.0 N N 5


2 2

Disebabkan varian adalah dikira daripada sisihan kuasadua, keputusan akhir adalah dinyatakan didalam sebutan unit pengukuran kuasadua. Ukuran statistik didalam unit kuasadua mempunyai masalah didalam tafsiran. Oleh yang demikian, apabila digunakan didalam ukuran pemerihalan, varian hanya dipertimbangkan sebagai pengiraan pertengahan didalam proses memperolehi sisihan piawai sampel. Sisihan Piawai Sisihan piawai adalah ukuran serakan yang popular. Didalam penggunaan sebagai entiti yang berasingan atau sebagai sebahagian analisis lain seperti pengiraan selang keyakinan dan juga didalam pengujian hipotesis. Sisihan piawai ialah punca kuasadua varian. Sisihan piawai populasi ditandakan sebagai , dan dikira sebagaimana berikut:

13

= =
2

(X - ) 2
N

Berdasarkan kepada contoh di atas, nilai sisihan piawai ialah

= 2 = 26 = 5.1

Makna Sisihan Piawai Apakah sisihan piawai? Apakah maknanya? Dua cara menggunakan sishan piawai iaitu peraturan empirikal dan Teorem Chebyshev Peraturan Empirikal Peraturan empirikal adalah peraturan asas yang amat penting yang digunakan untuk menyatakan paras penghampiran nilai yang terletak disekitar sesuatu nombor sisihan piawai. Peraturan empirikal menggunakan hanya tiga nombor sisihan piawai: 1, 2 dan 3. Keperluan data adalah bertaburan normal mengandungi beberapa toleran, dan peraturan empirikal secara amnya digunakan selagi taburan data mempunyai bentuk lonceng. Peraturan Empirikal1 Jarak dari min 1 2 3 Nilai di antara jarak 68% 95% 99%

Jika satu set data adalah bertaburan normal atau berbentuk lonceng, hampir 68% daripada nilai data adalah disekitar satu sisihan piawai min, 95% adalah disekitar dua sisihan piawai dan hampir 100% disekitar tiga sisihan piawai. Sebagai contoh, katakan Kementerian Perdagangan dan hal Ehwal Pengguna menyatakan purata harga ayam di Malaysia ialah RM4.50 sekilogram. Katakan harga ayam disemua negeri adalah bertaburan normal dengan sisihan
1

Berdasarkan kepada andaian taburan data adalah hampir bertaburan normal.

14

piawai RM0.10. Menurut peraturan empirikal, hampir 68% daripada harga sepatutnya jatuh disekitar 1, atau RM4.50 1(0.10). Hampir 68% daripada harga di antara RM4.40 dan RM4.60, sebagaimana ditunjukkan didalam Rajah 3.5a. Hampir 95% sepatutnya jatuh disekitar 2 atau RM4.50 2(0.10) = RM4.50 0.20 atau di antara RM4.30 dan RM4.70, sebagaimana ditunjukkan didalam Rajah 3.5b. Rajah 3.5 Peraturan Empirikal bagi 1 dan 2 Harga Ayam.

1.34

1.42 1.50 =RM1.42 =RM0.08

1.26

1.42 =RM1.42 =RM0.08

1.58

Perhatikan, oleh kerana 68% daripada harga ayam terletak disekitar satu sisihan piawai daripada min, hampir 32% adalah terletak diluar jeda ini. Oleh kerana taburan normal adalah simetri, 32% boleh dipisahkan dimana setengah daripadanya terletak pada setia ekor taburan tersebut. Oleh itu, hampir 16% daripada harga ayam sepatutnya kurang daripada RM4.40 dan hampir 16% daripada harga sepatutnya lebih daripada RM4.60.

3.2.2 Data Terkumpul


15

Dua ukuran serakan bagi data terkumpul dibincangkan disini, iaitu varian dan sisihan piawai. Untuk populasi, varian adalah

dan sisihan piawai

f(M - ) 2 =
N

= 2
dimana: f = kekerapan M = titik tengah kelas N = f atau jumlah kekerapan populasi = min kumpulan bagi populasi. Untuk sampel, varian adalah:

s
dan sisihan piawai

(M - X) =
n -1 s = s2

dimana f = kekerapan M = titik tengah kelas N = f, atau jumlah kekerapan sampel X = min kumpulan bagi sampel

16

Contoh 3.8: Kelas Kekerapan M fM (M - ) (M-)2 F(M-)2 1-3 16 2 32 -4.25 18.063 289.008 3-5 2 4 8 -2.25 5.063 10.126 5-7 4 6 24 -0.25 0.063 0.252 7-9 3 8 24 1.75 3.063 9.189 9-11 9 10 90 3.75 14.063 12.567 11-13 6 12 72 5.75 35.063 198.378 633.520 f=40 fM=250

fM = 250 f 40 f(M - ) 2 f

= 6.25

2 =

633.52 = 15.838 40

= 2 = 15.838 = 3.980

Sebagaimana dengan pengiraan min data terkumpul, titik tengah kelas adalah digunakan untuk mewakili semua nilai didalam jeda kelas. Ini mungkin bersesuaian atau tidak, bergantung kepada samada nilai purata adalah pada titik tengah. Jika situasi ini tidak ujud, maka varian dan sisihan piawai adalah hanya penghampiran. Disebabkan oleh data terkumpul hanya dikira tanpa mengetahui nilai data sebenar, terdapat hanya potensi bagi statistik yang dikira hanya sebagai penghampiran sahaja.

17

You might also like