Download as pdf or txt
Download as pdf or txt
You are on page 1of 22

STATISTIK ASAS TAJUK 6

TAJUK 6

STATISTIK ASAS

PENGENALAN
Pengukuran melibatkan pengumpulan data yang banyak daripada ujian/inventori yang digunakan. Statistik dapat membantu kita untuk merumuskan data yang banyak ini kepada bentuk lain yang mudah kita faham, seperti grafik atau angka rumusan. Kita pernah mengira purata (angka rumusan) bagi angka-angka yang banyak untuk mencari nilai tengah angkaangka ini. Kita juga pernah mencari angka terkecil dan angka terbesar dan juga julat antara kedua-dua angka ini, untuk mencari perbezaan terbesar antara angka-angka tersebut. Purata dan julat bagi angka-angka ini adalah maklumat yang boleh membantu kita memahami taburan angka-angka tersebut, iaitu seperti angka terkecil, angka tengah, angka terbesar dan julatnya. Tajuk ini akan membincangkan beberapa kaedah asas statistik (basic statistical methods) yang diperlukan untuk menganalisis skor/data daripada ujian/inventori.

OBJEKTIF
Di akhir tajuk ini, anda seharusnya dapat: 1. menjelaskan pengertian dan penggunaan statistik; 2. menjelaskan dan melukis kekerapan, histogram dan carta pai; 3. melukis poligon dan ogif serta menjelaskan dan mengira persentil. 4. menjelaskan dan mengira ukuran memusat dan serakan serta skor piawai; dan 5. menjelaskan dan mengira pekali korelasi dan regresi linear mudah.

PETA MINDA

110

OUM

TAJUK 6 STATISTIK ASAS

6.1

PENGERTIAN DAN PENGGUNAAN STATISTIK

Statistik mempunyai pelbagai kepentingan dalam pelbagai organisasi. Biasanya sekumpulan pegawai penyelidik akan dilantik untuk menganalisis data yang ada berdasarkan kelayakan dan kepakaran mereka. Sebagai seorang guru, apakah skil dan kemahiran yang anda perlukan untuk mendapatkan statistik yang tepat dan boleh dipercayai? Statistik digunakan dalam pelbagai bidang yang dengan sendirinya memberikan pengertian yang tertentu. Kepada orang ramai, statistik bermaksud angka yang direkodkan mengikut kategori tertentu. Contohnya, statistik kemalangan jalan raya memberikan kita maklumat tentang kemalangan jalan raya, yang pecahkan kepada beberapa kategori, seperti maut, cedera parah, cedera ringan dan sebagainya. Jabatan Kaji Cuaca, misalnya, memberikan statistik hujan/ramalan hujan setiap bulan. Pihak sekolah pula memberikan statistik pencapaian pelajar, misalnya, bilangan pelajar yang mendapat gred tertentu dalam peperiksaan SPM. Kepada mereka yang menjalankan kajian pula, statistik merupakan kaedah yang boleh digunakan untuk menganalisis data kajian. Kepada ahli-ahli statistik, statistik merupakan satu bidang matematik yang dapat menghasilkan teori dan kaedah untuk menganalisis data. Kesimpulannya, statistik bererti satu set teori dan kaedah yang boleh digunakan untuk memahami data. Dalam bidang pendidikan, statistik boleh diguna untuk menyampaikan maklumat dalam pelbagai situasi. Seperti contoh yang diberikan lebih awal, statistik boleh diguna untuk menunjukkan taburan pelajar mengikut pencapaian. Maklumat ini boleh dibentang dengan menggunakan jadual atau grafik seperti histogram/carta pai. Seterusnya, jika seseorang penyelidik ingin melihat hubungan antara dua pembolehubah, contohnya antara lama masa belajar dengan pencapaian, kaedah statistik korelasi boleh gunakan untuk mengira kekuatan hubungan ini. Statistik juga boleh digunakan untuk menguji hipotesis tertentu, misalnya menguji sama ada wujud hubungan antara lama masa belajar dengan pencapaian. Selain menguji hubungan, kaedah statistik boleh digunakan untuk menguji perbezaan antara dua min atau lebih, iaitu dengan menggunakan ujian-t atau ANOVA.

Rajah 6.1 : Kegunaan statistik

OUM

111

STATISTIK ASAS TAJUK 6

Seterusnya, penyelidik memerlukan pengetahuan statistik untuk mereka bentuk (design) sesuatu penyelidikan, seperti mereka bentuk eksperimen, dan menentukan kaedah analisis data yang sesuai untuk sesuatu reka bentuk. Pengetahuan statistik juga dapat digunakan oleh guru untuk memahami kajian-kajian yang ditulis dalam bentuk empirikal. Dalam bidang pengukuran pula, kaedah statistik digunakan untuk mengira indeks kebolehpercayaan, indeks kesahan atau indek kesahan ramalan. Terdapat dua jenis statistik yang digunakan dalam bidang pendidikan, iaitu statistik deskriptif yang digunakan untuk menjelaskan sesuatu ukuran (seperti min dan sisihan piawai); dan statistik inferensi yang digunakan untuk menguji hipotesis. Sebahagian daripada statistik-statistik ini dibincangkan dalam bahagian-bahagian berikut.

Rajah 6.2 : Statistik yang digunakan dalam pendidikan

6.2

KEKERAPAN, HISTOGRAM DAN CARTA PAI

Selepas data mentah dikumpul ia perlu dirumuskan dalam bentuk yang mudah difaham, misalnya dalam bentuk jadual atau grafik. Salah satu kaedah merumuskan data ialah menyediakan jadual taburan data asal dengan menggunakan kekerapan dan peratus, dan juga melukis histogram taburannya. Jadual kekerapan dan histogram boleh disedia dengan menggunakan data asal atau data yang dikumpulkan ke dalam beberapa kelas. Sebagai contoh, kita gunakan taburan markah ujian mingguan bagi 50 orang pelajar yang markah penuhnya ialah 10. Markah asal diberikan dalam Jadual 6.1.
Jadual 6.1: Markah Ujian 50 Orang Pelajar

2 5 3 8 5

5 6 5 4 7

4 2 6 9 3

1 7 4 6 5

6 8 0 5 6

3 6 7 4 2

7 4 8 7 8

5 2 5 1 4

4 9 3 5 3

7 5 6 10 6

Latihan 6.1
Susunkan data dalam Jadual 6.1 daripada yang terkecil kepada yang terbesar.

112

OUM

TAJUK 6 STATISTIK ASAS

6.2.1

Taburan Kekerapan

Seterusnya, kekerapan markah ini (bilangan pelajar yang mendapat markah tertentu) dan peratus pelajar yang mendapat markah tersebut ditunjukkan dalam Jadual 6.2. Kekerapan boleh dikira dengan mudah daripada markah yang disusun (lihat jawapan Latihan 6.1). Kekerapan ini dimasukkan dalam jadual (Jadual 6.2). Peratusnya dikira dengan membahagikan setiap kekerapan dengan 50 dan didarabkan dengan 100. Sebagai langkah semakan, kita perlu menjumlahkan lajur Kekerapan, yang sepatutnya berjumlah 50 (jumlah pelajar); dan menjumlahkan lajur Peratus, yang sepatutnya berjumlah 100 (jumlah %). Peratus kekerapan boleh diguna untuk menjelaskan bilangan pelajar yang mendapat markah tertentu, selain memberikan kekerapan, misalnya, seramai 10 orang pelajar (20%) telah mendapat 5 markah.
Jadual 6.2 : Taburan Kekerapan Markah Ujian

6.2.2

Histogram

Histogram ialah rajah berbentuk kotak yang dilukis dengan paksi-Y menunjukkan kekerapan dan paksi-X menunjukkan markah yang diperoleh pelajar.

Taburan kekerapan ini juga boleh dibentang dalam bentuk grafik, misalnya histogram. Histogram bagi taburan markah ujian mingguan di atas ditunjukkan dalam Rajah 6.3. Dalam rajah ini, tinggi sesuatu kotak itu menunjukkan kekerapan/bilangan pelajar yang mendapat markah tertentu, misalnya bilangan pelajar yang mendapat 5 markah ialah 10.

OUM

113

STATISTIK ASAS TAJUK 6

Rajah 6.3 : Histogram taburan kekerapan markah ujian

Satu lagi cara memaparkan taburan markah ialah dengan mengumpulkan beberapa markah yang sama julatnya kepada beberapa kelas. Jadual 6.3 menunjukkan taburan kekerapan 50 markah ujian yang dikumpulkan kepada lima (5) kelas [kelas pertama (0-2) mengandungi tiga (3) markah, iaitu 0, 1 dan 2, disebabkan ada 11 markah asal (iaitu, 0 hingga 10)]. Dalam taburan ini, jeda kelas menunjukkan markah-markah yang dimasukkan dalam kelas tersebut. Taburan kekerapan berkelas ini adalah sesuai bagi data yang banyak dan mempunyai julat yang besar. Biasanya bilangan kelas adalah di antara tujuh (7) hingga 10 kelas. Justeru, pengunaan kekerapan berkelas dapat mengurangkan bilangan markah/skor yang dimasukkan ke dalam jadual kekerapan.
Jadual 6.3 : Taburan Kekerapan Berkelas Markah Ujian

Dalam contoh ini, taburan kekerapan markah asal (Jadual 6.2) terdiri daripada 11 markah, sementara taburan kekerapan berkelas hanya terdiri daripada lima (5) kelas. Bagaimanapun, penjimatan ini menyebabkan maklumat asal yang lebih terperinci tidak dapat ditunjukkan.Seterusnya, taburan kekerapan berkelas markah ujian mingguan ini juga boleh dibentang dalam bentuk histogram, iaiitu seperti yang ditunjukkan dalam Rajah 6.4.

114

OUM

TAJUK 6 STATISTIK ASAS

Rajah 6.4 : Histogram taburan kekerapan berkelas markah ujian

Latihan 6.2
Apakah maklumat yang hilang apabila kita mengira min dengan menggunakan taburan kekerapan berkelas?

6.2.3

Carta Pai

Carta pai ialah satu grafik yang menggambarkan saiz kekerapan bagi sesuatu set data yang berkadaran dengan luas sektornya.

Biasanya bilangan kelas kekerapan bagi set data ini adalah kecil untuk memudahkan kita melukis carta ini. Dalam contoh berikut, taburan kekerapan berkelas markah ujian mingguan (Jadual 6.3) yang mempunyai lima (5) kelas kekerapan digunakan untuk melukis carta pai. Carta ini boleh dilukis dengan menggunakan perisian komputer tertentu dengan hanya memasukkan kekerapan. Untuk melukis sendiri carta ini, kita memerlukan maklumat tentang jeda kelas kekerapan, kekerapan dan darjah sudut carta pai. Jadual 6.4 menunjukkan jeda kelas, kekerapan dan darjah sudut bagi markah ujian mingguan.

OUM

115

STATISTIK ASAS TAJUK 6

Jadual 6.4 : Taburan Kekerapan Berkelas dan Darjah Sudut

Untuk mendapatkan darjah sudut carta pai, kita perlu mengiranya seperti berikut. Dalam contoh ini, kekerapan yang digunakan ialah 7, iaitu kekerapan bagi kelas berjeda 0-2. Darjah sudut = Kekerapan x 360o (360o ialah jumlah sudut di pusat bagi satu bulatan). Jumlah Pelajar = 7 x 360o = 2520o = 50.4o 50 50

Rajah 6.5 menunjukkan carta pai bagi kekerapan seperti yang diberikan dalam Jadual 6.4. Luas setiap bahagian carta pai ini menggambarkan kekerapan bagi kelas tertentu, yang setiap satunya dilukis mengikut luas sudut bagi kekerapan tersebut. Contohnya, kekerapan bagi kelas berjeda (5-6) markah ialah 18 (yang terbesar) dan sudut bagi kelas ini ialah 129.6o,, yang memberikan luas yang terbesar.

Nota: Angka dalam kotak adalah jeda kelas kekerapan Rajah 6.5 : Carta pai markah ujian

6.3

POLIGON DAN OGIF

Terdapat dua (2) lagi grafik yang boleh diguna untuk menjelaskan taburan kekerapan, iaitu poligon dan ogif.

116

OUM

TAJUK 6 STATISTIK ASAS

Poligon agak mudah dilukis, iaitu dengan menyambung titik-titik tengah bahagian atas kotak kekerapan dengan garis-garis lurus.

Rajah 6.6 menunjukkan graf poligon bagi taburan kekerapan markah ujian mingguan. Ia dilukis berasaskan histrogram dalam Rajah 6.3. Graf ini dapat menunjukkan bentuk taburan kekerapan dengan lebih jelas. Bagi data yang besar, yang dibahagikan kepada banyak kelas, graf ini hampir menyerupai taburan ukuran populasi sebenar. Di sini populasi bermaksud semua subjek/pelajar sasaran dari mana ukuran itu diambil. Data yang kita cerap/peroleh daripada sekumpulan pelajar hanyalah data sampel sahaja. Semakin besar sampel yang kita cerap, semakin dekat ukuran daripada sampel itu menghampiri ukuran daripada populasi.

Latihan 6.3
Berikan satu contoh populasi, sampel dan ukurannya. Bilakah taburan ukuran sampel akan meyerupai taburan ukuran populasi?

Rajah 6.6 : Poligon taburan kekerapan markah ujian

Untuk melukis ogif (ogive), iaitu graf garis yang menghubungkan peratus kekerapan terkumpul (cumulative frequency percentage), kita perlu mencari peratus kekerapan terkumpul tersebut.

Peratus kekerapan terkumpul boleh dicari dengan menjumlahkan peratus kekerapan daripada ukuran terrendah hingga tertinggi. Jadual 6.5 menunjukkan kekerapan markah ujian mingguan bersama peratus kekerapan dan peratus kekerapan terkumpulnya. Peratus kekerapan terkumpul yang terakhir ialah 100%, iaitu peratus bagi semua kekerapan.

OUM

117

STATISTIK ASAS TAJUK 6

Jadual 6.5 : Peratus Kekerapan Terkumpul Markah Ujian

Rajah 6.7 menunjukkan ogif peratus kekerapan terkumpul yang dilukis dengan paksi-X menunjukkan markah ujian dan paksi-Y menunjukkan peratus kekerapan terkumpul. Peratus ini dilukis pada sempadan sebelah kanan markah, misalnya, bagi markah 4, titik 38% ditanda pada sempadan kanan markah 4, iaitu pada sempadan markah 4 dan markah 5.

Rajah 6.7 : Peratus kekerapan terkumpul markah ujian

Graf ogif ini penting untuk kita mencari dua (2) ukuran, iaitu (a) mencari markah/skor bagi persentil (percentile), dan (b) mencari persentil bagi markah tertentu. Contoh mencari markah dan persentil diberikan di bawah. Persentil di sini bermaksud markah yang mana di bawahnya terdapat markah yang lebih rendah sebanyak peratus tersebut. (a) Mencari markah bagi persentil tertentu. Contohnya, cari markah bagi persentil ke 72 (P72). Untuk mencari markah ini, kita perlu melukis garis pertama (mendatar) mulai pada nilai 72 peratus di paksi-Y hingga ke ogif.
118

OUM

TAJUK 6 STATISTIK ASAS

Kemudian kita lukis garis kedua (menegak) dari titik pertemuan garis pertama dengan ogif ke paksi-X (lihat Rajah 6.6). Markah yang bertemu dengan garis kedua adalah markah bagi P72. Dalam contoh ini P72 = 6.2. Ini bermakna terdapat terdapat 72% pelajar yang mendapat markah lebih rendah daripada 6.2. (b) Mencari persentil bagi markah tertentu. Contohnya, cari persentil bagi markah 8.5. Untuk mencari persentil ini, kita perlu melukis garis pertama (menegak) mulai pada nilai 8.5 di paksi-X hingga ke ogif. Kemudian kita lukis garis kedua (mendatar) dari titik pertemuan garis pertama dengan ogif ke paksi-Y (lihat Rajah 6.8). Peratus yang bertemu dengan garis kedua adalah persentil yang dicari. Dalam contoh ini 8.5 = P91. Ini bermakna seseorang pelajar yang mendapat markah 8.5 berpencapaian lebih baik daripada 91% pelajar lain.

Latihan 6.4
Dengan menggunakan Rajah 6.8, sila cari P80 dan berapa peratus pelajar yang mendapat markah rendah daripada 5?

Rajah 6.8 : Kaedah mencari markah dan persentil

6.4

UKURAN MEMUSAT DAN UKURAN SERAKAN

Kita telah melihat bentuk taburan kekerapan, dengan menggunakan markah ujian mingguan sebagai contoh. Bentuk taburan kekerapan ini boleh digambar dengan menggunakan histogram atau poligon (Rajah 6.6). Markah ini hanyalah merupakan markah sampel 50 orang pelajar daripada populasi tertentu, misalnya semua pelajar tahun 5 dalam sesuatu daerah. Sekiranya kita dapat mengumpul markah daripada populasi, kita akan dapat melihat bentuk taburan markah/skor populasi bagi ujian mingguan tersebut. Contoh taburan skor populasi ditunjukkan dalam Rajah 6.6. Dua (2) unsur penting bagi data daripada sampel atau populasi ialah (a) ukuran memusat dan (b) ukuran serakan.

OUM

119

STATISTIK ASAS TAJUK 6

Ukuran memusat ialah ukuran yang menggambarkan skor tengah bagi sesuatu set data. Ukuran memusat ini termasuklah mod, median dan min. Ukuran kedua bagi sesuatu set data/skor ialah ukuran serakan, iaitu ukuran yang menggambarkan darjah serakan bagi sesuatu set data/skor. Ukuran serakan taburan termasuklah julat, varians dan sisihan piawai. Rajah 6.9 menunjukkan taburan data/ukuran daripada satu populasi tertentu. Min bagi data/ skor daripada sesutu populasi ialah dan sisihan piawainya ialah .

Rajah 6.9 : Taburan data/skor populasi

6.4.1

Pengiraan Ukuran Memusat

Seperti yang dijelaskan, terdapat tiga (3) ukuran memusat yang biasa digunakan, iaitu mod, median dan min seperti dalam rajah 6.10. Kita akan menentukan/mengira mod, median dan min dengan menggunakan markah ujian mingguan sebagai contoh.

Rajah 6.10 : Pengiraan ukuran memusat

120

OUM

TAJUK 6 STATISTIK ASAS

(a) Pengiraan Mod Mod ialah skor yang mempunyai kekerapan paling tinggi, misalnya markah yang pelajar paling ramai memperolehnya.

Mod mudah ditentukan sekiranya kita telah menyediakan taburan kekerapan skor/markah asal terlebih dahulu. Bagi markah ujian bulanan (lihat Jadual 6.2), mod bagi set markah ini ialah 5, iaitu markah yang mempunyai kekerapan paling tinggi (iaitu 10). (b) Pengiraan Median Median ialah skor tengah sesuatu set data/skor, misalnya markah tengah bagi set markah ujian mingguan.

Sekiranya sesuatu set data mempunyai dua (2) angka tengah, media data ini ialah purata kedua-dua data tengah tersebut. Median mudah ditentukan sekiranya kita telah menyusun data daripada yang terrendah hingga tertinggi atau sebaliknya. Bagi markah ujian mingguan, daripada jadual markah yang telah disusun (lihat jawapan Latihan 6.1), median bagi set markah ini ialah 5, iaitu purata dua (2) markah tengah (markah ke-25 = 5 dan markah ke-26 = 5). (c) Pengiraan Min Min ialah purata sesuatu set data/skor, misalnya markah purata bagi set markah ujian mingguan. Min mudah dikira, sekiranya bilangan data adalah kecil, tetapi agak susah dikira bagi data yang banyak.

Bagaimanapun, kita boleh menggunakan komputer untuk mengira min bagi data yang banyak. Untuk kita mengira sendiri min, kita perlu menjumlahkan semua skor/markah dan kemudian dibahagikan dengan bilangan markah/ pelajar. Dalam bentuk simbol matematik, min dikira seperti berikut:

x = x i /n ,
i=1

di mana ialah tanda jumlah xi ialah markah bagi pelajar ke-i (i = 1, 2, ... , n) dan n ialah bilangan pelajar. Dalam contoh markah ujian mingguan (lihat Jadual 6.1), min boleh dikira seperti berikut:

x = xi /n, (2+5+4+ ............ +3+6)/50 = 253/50 = 5.06


i=1

Jadi, bagi data ini, didapati ukuran memusatnya adalah hampir sama, iaitu mod ialah 5, median ialah 5 dan min ialah 5.06.

OUM

121

STATISTIK ASAS TAJUK 6

Latihan 6.5
Cari mod, median dan min bagi markah ujian berikut: 8 4 9 6 5 4 7 1 5 10

6.4.2

Pengiraan Ukuran Serakan

Seperti yang dijelaskan, terdapat tiga (3) ukuran serakan yang biasa digunakan, iaitu julat, varians dan sisihan piawai. Kita akan menentukan/mengira julat, varians dan sisihan piawai ini dengan menggunakan markah ujian mingguan sebagai contoh.

Rajah 6.11 : Pengiraan ukuran serakan

(a) Pengiraan Julat Julat ialah perbezaan skor yang terrtinggi dengan terrendah, misalnya perbezaan markah tertinggi dengan markah terrendah pelajar.

Julat mudah ditentukan sekiranya sekiranya kita telah menyusun data daripada yang terrendah hingga tertinggi atau sebaliknya. Bagi markah ujian mingguan, daripada jadual markah yang telah disusun (lihat jawapan Latihan 6.1), julat bagi set markah ini ialah 10 [iaitu 10 (markah tertinggi) 0 (markah terrendah].
122

OUM

TAJUK 6 STATISTIK ASAS

(b) Pengiraan Varians dan Sisihan Piawai Varians (variance) ialah ukuran serakan yang mengambil kira semua data yang ada, berbeza daripada julat yang bergantung kepada dua (2) ukuran sahaja, iaitu yang terrendah dan terrtinggi. Varians agak sukar dikira sebab ia melibatkan jumlah kuasa-dua (sum of squares) bagi semua ukuran, iaitu kita perlu menjumlahkan kuasa-dua perbezaan setiap ukuran daripada min keseluruhan ukuran. Rumus untuk mengira varians ialah: Varians (s2)

[( x x)
i i=1

]/(n -1),di mana x ialah min keseluruhan data.

Untuk memudahkan pengiraan varians dalam contoh ini, kita hanya menggunakan 10 markah pertama daripada 50 markah ujian mingguan. Min bagi 10 markah ini dan kuasadua perbezaan markah daripada min ditunjukkan dalam Jadual 6.6. Varians bagi data ini boleh dikira seperti berikut:

s2 = [( xi x )2 ]/(n -1) = 36.4/(10-1) = 36.4/9 = 4.04


i=1

Sisihan piawai (standard deviation) adalah juga ukuran serakan dan ia amatlah berkait dengan varians, iaitu sisihan piawai adalah punca-ganda-dua varians: Sisihan piawai (s) = s2
Jadual 6. 6: Jumlah Kuasa-dua Perbezaan Markah daripada Min

Pengiraan sisihan piawai bagi contoh varians di atas ialah s =s2 = (4.04) = 2.01. Varians/ sisihan piawai boleh diguna untuk menunjukkan berapa besar perbezaan antara ukuran. Sekiranya semua ukuran mempunyai nilai yang sama (semua pelajar mendapat markah yang sama), varians/sisihan piawai bagi ukuran ini ialah sifar, iaitu tiada langsung serakan. Selain itu, berbanding dengan varians, sisihan piawai lebih mudah kita fahami, disebabkan bagi data yang banyak, ia mempunyai hubungan langsung dengan ukuran, iaitu dengan

OUM

123

STATISTIK ASAS TAJUK 6

anggaran ukuran tertinggi, terendah dan julat seperti berikut: (a) Anggaran ukuran tertinggi=min+(3 x sisihan piawai)=4.4+(3x2.01)=4.4+6.03=10.43. (b) Anggaran ukuran terrendah=min(3 x sisihan piawai) =4.4-(3x2.01)=4.4-6.03=-1.63. (c) Anggaran julat=Ukuran tertinggiukuran terrendah=6 x sisihan piawai = 6x2.01=12.06.

Latihan 6.6
Min markah peperiksaan yang diambil oleh 1,000 orang calon ialah 50 dengan varians 16. Anggarkan markah terrendah dan tertinggi serta julat markah bagi calon-calon ini.

6.5

SKOR PIAWAI

Biasanya markah ujian/peperiksaan atau ukuran daripada inventori diberi tidak berasaskan kepada markah/skor penuh yang sama. Dengan demikian, kita akan menghadapi masalah apabila kita ingin membuat interpretasi/menilai markah/skor tersebut. Satu kaedah telah digunakan untuk menyeragamkan markah/skor supaya markah/skor ini mempunyai min dan sisihan piawai yang sama. Kaedah ini menghasilkan skor piawai, iaitu skor yang mempunyai min dan sisihan piawai yang tertentu. Skor piawai yang asas ialah skor-z (z-score), yang boleh dikira dengan menggunakan rumus di bawah: Skor-z = Skor Mentah - Min Sisihan Piawai Skor-z ini mempunyai min sifar dan sisihan piawai 1 (=0, =1). Sebagai contoh, skor-z bagi markah 6 dalam Jadual 6.6 boleh dikira seperti berikut: Skor-z = Skor Mentah - Min = 6-4.4 = 1.6_ = 0.79. Sisihan Piawai 2.01 2.01 Rajah 6.12 menunjukkan taburan skor piawai yang mempunyai min 100 dan sisihan piawai 15. Rajah ini juga menunjukkan taburan skor adalah di antara skor tertinggi 145 (min + 3 x sisihan piawai) dan skor terrendah 55 (min 3 x sisihan piawai). Persentil bagi markahmarkah daripada 55 hingga 145 ditunjukkan di bawahnya. Kebanyakan markah peperiksaan menggunakan skor piawai yang mempunyai min 100 dan sisihan piawai 15 dan bagi ujian pencapaian, menggunakan skor piawai yang mempunyai min 10 dan sisihan piawai 3.

124

OUM

TAJUK 6 STATISTIK ASAS

Rajah 6.12 : Taburan skor piawai dan persentil

Secara amnya, skor piawai lain dengan pelbagai min () dan sisihan piawai () boleh dikira menggunakan skor-z seperti rumus berikut: Skor piawai (SP) = z + . Sebagai contoh, jika kita ingin menukar skor mentah seorang pelajar dalam satu ujian pencapaian kepada skor piawai dengan min 10 dan sisihan piawai 3, kita perlu mengira terlebih dahulu skor-z bagi markah mentah pelajar tersebut. Contohnya, kita ingin menukar markah mentah 5 daripada Jadual 6.6 kepada skor piawai (=10, =3). Skor-z = Skor Mentah - Min = 5-4.4 = 0.6_ = 0.29. Sisihan Piawai 2.01 2.01 SP = z + = (3)(0.29) + 10 = 0.87 + 10 = 10.87. Ini bermakna markah mentah 5 seperti dalam Jadual 6.6 (=4.4, =2.01) menjadi 0.29, apabila diubah kepada skor piawai z (=0, =1); dan menjadi 10.87, apabila diubah kepada skor piawai (=10, =3). Apa yang tekal ialah ketiga-tiga skor ini melebihi setiap min bagi skor masing-masing.

6.6

KORELASI LINEAR

Analisis korelasi linear (linear correlation analysis) adalah satu kaedah statistik untuk menilai kekuatan hubungan linear antara dua (2) pemboleh ubah. Hubungan linear di sini bermaksud graf hubungannya adalah berbentuk garis lurus. Sebaliknya, jika hubungan ini tidak linear (mungkin kuadratik/logarisma dsb), maka analisis korelasi linear ini tidak boleh digunakan.

OUM

125

STATISTIK ASAS TAJUK 6

Jadi, sebelum kita meneruskan penganalisisan data, eloklah kita melihat graf hubungan antara dua (2) pemboleh ubah ini dengan melukis skatergram (scattergram). Seterusnya, analisis korelasi linear akan memberikan pekali korelasi antara dua (2) pemboleh ubah. Pekali ini mempunyai nilai antara -1 hingga +1. Pekali korelasi yang positif menunjukkan hubungan secara langsung, iaitu apabila skor pemboleh ubah pertama meningkat, skor pemboleh ubah kedua juga turut meningkat, dan sebaliknya (seperti lama belajar dengan pencapaian). Bagi pekali korelasi yang negatif, hubungan antara pemboleh ubah adalah secara songsang, iaitu apabila skor pemboleh ubah pertama meningkat, skor pemboleh ubah kedua akan menurun, dan sebaliknya (seperti lama menonton TV dengan pencapaian). Bagaimanapun, dari segi kekuatan hubungan, kita perlu melihat nilai mutlak bagi sesuatu nilai pekali korelasi itu (misalnya, nilai mutlak bagi -0.85 ialah +0.85). Secara am, interpretasi terhadap pekali korelasi adalah agak subjektif, bergantung pada sesuatu bidang ilmu. Sebagai contoh, dalam bidang sains sosial, pekali korelasi -0.3 atau +0.3 dianggapkan sudah agak tinggi, memandangkan terdapat banyak faktor yang mempengaruhi sesuatu pemboleh ubah. Sebagai panduan, Jadual 6.7 menunjukkan kekuatan hubungan antara pemboleh ubah berdasarkan nilai mutlak pekali korelasi antaranya.
Jadual 6.7: Kekuatan Hubungan Mengikut Nilai Mutlak Pekali Korelasi Nilai Mutlak < 0.20 0.21 0.40 0.41 0.60 0.61 0.80 0.81 1.00 Kekuatan Hubungan Amat lemah Lemah Sederhana kuat Kuat Sangat kuat

Sebagai contoh pengiraan pekali korelasi, kita akan melihat hubungan antara markah uji-ujisemula, yang boleh digunakan untuk mencari indeks kebolehpercayaan ujian. Data daripada Jadual 6.6 akan digunakan semula, iaitu sebagai markah Ujian 1, sementara markah Ujian 2 (uji semula) ditambah pada Jadual 6.8. Skatergram bagi markah Ujian 1 dan Ujian 2 ditunjukkah dalam Rajah 6.13 Daripada rajah ini, kita boleh andaikan hubungan antara markah Ujian 1 dan Ujian 2 adalah linear.

126

OUM

TAJUK 6 STATISTIK ASAS

Rajah 6.13 : Skatergram markah ujian 1 dan ujian 2

Analisis seterusnya ialah mengira pekali korelasi linear antara markah Ujian 1 dan Ujian 2 dengan menggunakan kaedah analisis korelasi Pearson. Rumus untuk mengira pekali ini ialah seperti berikut dan angka-angka yang perlu dikira telah dimasukkan ke dalam Jadual 6.8.
Jadual 6.8 : Analisis Korelasi Linear bagi Markah Uji-Uji-Semula

Ujian 1 (xi) 2 5 4 1 6 3 7 5 4 7 Min = 4.4

Ujian 2 (yi) 1 4 5 2 6 4 6 6 4 8 Min = 4.6

_ (xi-x) -2.4 0.6 -0.4 -3.4 1.6 -1.4 2.6 0.6 -0.4 2.6 =0

_ (xi-x)2 5.76 0.36 0.16 11.56 2.56 1.96 6.76 .36 0.16 6.76 =36.4

_ (yi-y) -3.6 -0.6 0.4 -2.6 1.4 -0.6 1.4 1.4 -0.6 3.4 =0

_ (yi-y)2 12.96 0.36 0.16 6.76 1.96 0.36 1.96 1.96 0.36 11.56 =38.4

_ _ (xi-x)(yi-y) 8.64 -0.36 -0.16 8.84 2.24 0.84 3.64 0.84 0.24 8.84 =33.6

OUM

127

STATISTIK ASAS TAJUK 6

Pekali korelasi linear Pearson

[(x - x)(y - y)]/(n -1)(s


i i i=1

)(sy )] ,

di mana x dan y ialah masing-masing min markah Ujian 1 dan Ujian 2, sementara sx dan sy ialah masing-masing sisihan piawai markah Ujian 1 dan Ujian 2. Tiga (3) pengiraan berikut perlu dibuat untuk mencari pekali korelasi. Pekali korelasi yang diperoleh ialah 0.9, yang menunjukkan hubungan kuat antara markah Ujian 1 dan Ujian 2, yang juga menjadi indeks kebolehpercayaan bagi ujian tersebut. Justeru, kita boleh memutuskan bahawa ujian ini mempunyai kebolehpercayaan yang tinggi. (a) Sisihan piawai (sx) = 2.01 (telah dikira melalui Jadual 6.6) (b) Sisihan piawai (sy) =
n

[(y - y) ]/(n-1) =
2 i i=1 i i i=1

(38.4/9) = )(sy )] ,

4.26 = 2.06

(c) Pekali korelasi (rxy) =

[(x - x)(y - y)]/[(n -1)(s

= [33.6]/[(9)(2.01)(2.06)] = [33.6]/[37.26] = 0.90

6.7

REGRESI LINEAR MUDAH

Sebagai kesinambungan kepada korelasi linear, kita akan meneroka sedikit tentang regresi linear mudah. Bagi dua pemboleh ubah yang mempunyai hubungan, analisis regresi ini akan menghasilkan persamaan yang menghubungkan pemboleh-pemboleh ubah tersebut. Persamaan ini boleh digunakan untuk tujuan meramal nilai pemboleh ubah ke-2, apabila diberi nilai pemboleh ubah pertama. Seperti yang kita ketahui, dalam pengukuran dan penilaian, kaedah regresi boleh diguna untuk menentukan kesahan ramalan. Seterusnya, perkataan linear dalam frasa regresi linear mudah bermaksud hubungan antara dua pemboleh ubah itu adalah linear, sementara perkataan mudah bermaksud hanya terdapat satu pemboleh ubah peramal dalam persamaan ini. Ringkasannya, regresi linear mudah ialah satu model regresi yang menghubungkan satu pemboleh ubah bersandar (dependent variable) dengan satu pemboleh ubah peramal (predictor variable) secara linear.

128

OUM

TAJUK 6 STATISTIK ASAS

Sebagai contoh pengiraan pekali regresi, kita akan gunakan markah Ujian 1 dan Ujian 2 yang diberikan dalam Jadual 6.8. Di sini, kita mengandaikan markah Ujian 1 sebagai permal kepada markah Ujian 2. Sebagaimana juga analisis korelasi, kita perlu melukis skatergram sebelum melakukan analisis regresi. Seterusnya, bagi mengira pekali regresi, kita boleh gunakan model persamaan regresi berikut: Y = bX + a, di mana Y ialah pemboleh ubah ke-2 (yang diramal), X ialah pemboleh ubah pertama (peramal), b ialah pekali regresi, dan a ialah angkatap persamaan ini. Nilai a dan b boleh dikira dengan menggunakan rumus berikut: b = r(sy/sx) = (0.90)(2.06/2.01) = (0.90)(1.02) = 0.91 a = y b x = (4.6) (0.91)(4.4) = 4.6 4.00 = 0.60
Y = 0.91X + 0.60

Y = bX + a = 0.91X + 0.60. Oleh itu, persamaan yang menghubungkan markah Ujian 2 (Y) dengan markah Ujian 1 (X) ialah: Y = 0.91X + 0.60 Jika kita ingin meramal markah pelajar dalam Ujian 2, sekiranya pelajar ini mendapat 7 markah dalam Ujian 1, kita gantikan X dengan 7 dalam persamaan di atas, iaitu: Y = 0.91X + 0.60 = (0.91)(7) + 0.60 = 6.37 + 0.60 = 6.97 (markah Ujian 2 sebenar ialah 6 dan 8).

RUMUSAN
Tajuk ini telah menjelaskan beberapa kaedah asas statistik yang boleh digunakan dalam bidang pengukuran dan penilaian. Penjelasan awal dibuat tentang pengertian dan penggunaan statistik dalam pendidikan, termasuk dalam bidang pengukuran dan penilaian. Bahagian seterusnya menjelaskan tentang penggunaan angka dan grafik untuk menggambarkan taburan data, iaitu penggunaan kekerapan, histogram dan carta pai. Dua lagi grafik yang penting untuk menjelaskan taburan data dijelaskan juga, iaitu poligon dan ogif. Poligon dilukis bersama histogram untuk menunjukkan taburan data menggunakan graf garis. Ogif pula digunakan untuk mencari persentil sesuatu skor dan sebaliknya. Seterusnya, analisis asas diguna untuk menentukan ukuran memusat dan serakan serta skor piawai. Ukuran ini termasuk mod, median, min, julat, varians, sisihan piawai dan skor piawai. Akhirnya, konsep serta pengiraan pekali korelasi dan regresi turut diperkenalkan.

OUM

129

STATISTIK ASAS TAJUK 6

GLOSARI
Carta Pai Histogram ialah satu grafik yang menggambarkan saiz kekerapan bagi sesuatu set data yang berkadaran dengan luas sektornya. ialah rajah berbentuk kotak yang dilukis dengan paksi-Y menunjukkan kekerapan dan paksi-X menunjukkan skor atau kelas skor. ialah hubungan antara dua pemboleh ubah yang grafnya berbentuk garis lurus. ialah markah yang mana di bawahnya terdapat markah yang lebih rendah sebanyak peratus tersebut. ialah satu model regresi yang menghubungkan satu pemboleh ubah bersandar dengan satu pemboleh ubah peramal secara linear. ialah skor yang mempunyai min dan sisihan piawai yang tertentu. ialah satu set teori dan kaedah yang boleh digunakan untuk memahami data. ialah ukuran yang menggambarkan skor tengah bagi sesuatu set data, iaitu seperti mod, median dan min. ialah ukuran yang menggambarkan darjah serakan bagi sesuatu set data, iaitu seperti julat, varians dan sisihan piawai.

Korelasi Linear Persentil Regresi Linear Mudah

Skor Piawai Statistik Ukuran Memusat Ukuran Serakan

UJIAN 1
(1) Jelaskan pengertian statistik. (2) Bagaimanakah anda mengira buka sudut carta pai di pusat bulatan? (3) Pekali korelasi antara dua pemboleh ubah ialah -0.85. Jelaskan hubungan dan kekuatan hubungan ini.

UJIAN 2
Markah ujian bagi 10 orang pelajar adalah seperti berikut: 5 7 3 5 6 2 8 5 3 6

(a) Cari mod, median dan min bagi markah-markah ini.

130

OUM

TAJUK 6 STATISTIK ASAS

(b) Cari julat, varians dan sisihan piawainya. (c) Tukarkan markah 7 kepada skor-z.

RUJUKAN
Buana: Pengajar Jurusan Sejarah Universitas Negeri Makassar. Ujian Nasional: Penilaian atau Evaluasi? Garfield, J. (1992). Assessment and Teaching Statistics. JSE. Hanna, G.S. & Dettmer, P.A. (2004). Assessment for Effective Teaching: Using ContextAdaptive Planning. Boston:Pearson-Allan & Allyn and Bacon. Mehrens, W.A. & Lehmann, I.J. (1991). Measurement and evaluation in education and psychology (4th ed.). Chicago: Holt, Rinehart and Winston. Nitko, A.J. (2004). Educational Assessment of Students. Upper Saddle River, N.J.: PearsonMerill Prentice Hall. Sarle. W. S. (1997). Disseminations Of The International Statistical Applications Institute, Volume 1, Edition 4, 1995, Wichita: Acg Press, Pp. 61-66. Van Dalen., D.P. (1979). Understanding Educational Research. (4th ed.) McGraw-Hill. Inc.

OUM

131

You might also like