Professional Documents
Culture Documents
Statistik
Statistik
Run a means analysis to display i. mean age of learners by Gender and ii. Mean age of
learners by Ethnicity. Describe the means and standard deviations of output.
95% Confidence
Interval of the
Age in Equal variances .744 .390 -.292 168 .771 -.541 1.857 -4.208 3.125
years assumed
Data menunjukkan nilai Sig.(2-Tailed) ialah 0.771. Nilai menunjukkan melebihi daripada 0.05.
Hal ini bermakna tidak terdapat perbezaan statistik yang signifikan antara male dan female.
b) Ethnicity
Descriptives
Age in years
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum
ANOVA
Age in years
Data ANOVA menunjukkan nilai Sig. ialah 0.768. Nilai Sig. melebihi 0.05, data ini
menunjukkan bahawa tidak terdapat perbezaan yang signifikan antara kaum.
SOALAN B
Display a crosstabulation of Gender by Ethnicity of patients in survey. Show the row and
column counts and percentages. Describe the crosstabultion output.
Cases
Data dalam jadual N = 170 adalah valid dan N = 0 missing, menunjukkan bahawa tidak terdapat
ralat dalam data SPSS.
Ethnicity
Female Count 41 33 20 94
Melalui data di atas untuk bahagian lelaki (N = 76), didapati bahawa kaum Melayu, N = 31/76
mempunyai peratus tertinggi (40.8%), diikuti oleh kaum India, N = 26/76 (34.2%) dan kaum
Cina, 19/76 (25%).
Bahagian perempuan (N = 94) pula menunjukkan kaum Melayu, N = 41/94 mempunyai
peratus tertinggi (43.6%), diikuti oleh kaum Cina, N = 33/94 (35.1%) dan kaum India N = 20/94
(21.3%).
Dari segi perbezaan peratus mengikut jantina dalam kaum masing-masing, kaum Melayu
(N = 72) menunjukkan peratus perempuan, N = 41/72 (56.9%) lebih tinggi daripada lelaki, N =
31/72 (43.1%). Kaum Cina (N = 52) menunjukkan peratus perempuan, N = 33/52 (63.5%) lebih
tinggi daripada lelaki, N = 19/52 (36.5%). Kaum India (N = 46) pula menunjukkan peratus
lelaki, N = 26/46 (56.5%) lebih tinggi daripada perempuan, N = 20/46 (43.5%)
Secara keseluruhannya (N = 170), peratus kaum tertinggi ialah kaum Melayu, N = 72/170
(42.4%), diikuti oleh kaum Cina, N = 52/170 (30.6%) dan kaum India, N = 46/170 (27.1%).
SOALAN C
Recode the Income Variable into 4 categories: i. RM 30,000 and below ii. RM 30,001 - RM
40,000 iii. RM 40,001 - RM 50,000 and iv. RM 50,001 and above. Run the frequency count
of the recoded Income category variable. Describe the output.
Statistics
Income Category
N Valid 170
Missing 0
Mean 2.72
Median 3.00
Std. Deviation 1.126
Minimum 1
Maximum 4
Jadual kategori pendapatan menunjukkan data Mean = 2.72, Median = 3.00 dan SD = 1.126.
Pendapatan minimum ialah 1 (RM 30,000 dan kebawah) dan maximum ialah 4 (RM 50,001 dan
keatas).
Income Category
Cumulative
Frequency Percent Valid Percent Percent
Valid 1 - RM 30,000 and below 31 18.2 18.2 18.2
2 - RM 30,001 - RM 40,000 45 26.5 26.5 44.7
3 - RM 40,001 - RM 50,000 35 20.6 20.6 65.3
4 - RM 50,001 and above 59 34.7 34.7 100.0
Total 170 100.0 100.0
Data dalam jadual di atas menunjukkan bahawa peratus kategori pendapatan tertinggi ialah 4
(RM 50,001 dan keatas) dengan peratus 34.7 (59/170), diikuti oleh kategori 2 (RM 30,001 - RM
40,000) dengan peratus 26.5 (45/170), seterusnya kategori 3 (RM 40,001 - RM 50,000) dengan
peratus 20.6 (35/170) dan kategori 1 (RM 30,000 dan kebawah) dengan peratus 18.2 (31/170).
SOALAN D
Transform the Ethnicity variable with value labels 1: Malays 2: Chinese 3: Indians into 2
categories, i.e i. Bumiputera and ii. Non-Bumiputera. Classify Malay as "Bumiputera" and
Chinese and Indian as "Non-bumiputera". Compute the mean blood Glucose level based
on "Bumiputera" and "Non-Bumiputera" classification. Describe the output.
Group Statistics
Bumiputera N Mean Std. Deviation Std. Error Mean
Glucose Level in mmol/L 1 - Bumiputera 72 7.610 1.4679 .1730
2 - Non-Bumiputera 52 7.638 1.4085 .1953
Data menunjukkan nilai Sig. (0.856) melebihi 0.05 bermakna kepelbagaian antara bumiputera
dan non-bumiputera adalah hampir sama dan tidak ada perbezaan signifikan.
Data Sig.(2-tailed) ialah 0.912 melebihi 0.05. Hal ini juga menunjukkan tidak terdapat
perbezaan statistik yang signifikan antara bumiputera dan non-bumiputera.
SOALAN E
Using the blood Glucose level variable as the dependent variable and Gender and Ethnicity
variables as the independets variables, formulate 2 possible research questions to conduct
this research.
Persoalan Kajian:
1. Apakah perbezaan kandungan paras glukosa dalam darah pelajar berdasarkan pada
jantina?
2. Apakah perbezaan kandungan paras glukosa dalam darah pelajar berdasarkan pada etnik?
SOALAN F
Formulate the relevant null and alternative hypotheses based on the research questions in
E) above.
Hipotesis Null
1. Tidak terdapat perbezaan yang signifikan dalam paras kandungan glukosa dalam darah
pelajar berdasarkan jantina.
2. Tidak terdapat perbezaan yang signifikan dalam paras kandungan glukosa dalam darah
pelajar berdasarkan etnik.
Hipotesis Alternatif
1. Terdapat perbezaan yang signifikan dalam paras kandungan glukosa dalam darah pelajar
berdasarkan jantina.
2. Terdapat perbezaan yang signifikan dalam paras kandungan glukosa dalam darah pelajar
berdasarkan etnik.
SOALAN G
State the appropriate statistical tests to test the hypotheses in F) above.
Ujian T(T Test) digunakan untuk menentukan sama ada terdapat perbezaan yang signifikan
antara dua set paras lukosa. Dalam F(1), independent groups t test akan digunakan dan paling
sesuai. Dalam F(2) pula, ujian statistik yang sesuai digunakn ialah ujian one-way ANOVA antara
kumpulan dengan perbandingan post-hoc.
SOALAN H
Run the appropriate statistical analysis to test the hypotheses stated in F) above. Make
your conclusions on these statistical tests.
Kolmogorov-Smirnova Shapiro-Wilk
Paparan histogram menunjukkan bahawa taburan data bagi Glucose Level in mmol/L adalah
normal.
Paparan pada Q-Q Plot menunjukkan graf berkadar terus. Paras glukosa adalah normal
Ujian T Test
Syarat menggunakan Ujian-t
Terdapat lima syarat yang perlu diambilkira untuk menjalankan statistik data dengan
menggunakan ujian-t. Syarat - syarat tersebut adalan seperti berikut:
I. Skala pengukuran
Data bagi pembolehubah terikat perlulah menggunakan skala pengukuran sela/nisbah dan
skala pengukuran nominal digunakan bagi pembolehubah bebas.
III. Normality
Dalam normality, fokus utama adalah pada 'normal distribution' iaitu yang menyediakan
kedua-dua kaedah grafik dan statistik untuk menilai normality pada sampel.
IV. Saiz sampel
Sampel terdiri daripada satu kumpulan dan kumpulan tersebut adalah berbeza/bebas/tidak
berkaitan. Syarat atau andaian ini adalah berkaitan dengan reka bentuk kajian
V. Homogeneity of variance
Kumpulan daripada populasi haruslah mempunyai varians yang seimbang. Syarat ini
boleh diuji melalui analisis kumpulan bebas.
Group Statistics
Data menunjukkan bahawa male, N=76 (M = 7.939, SD = 1.3485) manakala female, N=94 (M =
7.695, SD = 1.5432).
Glucose Level Equal variances 3.887 .050 1.081 168 .281 .2434 .2251 -.2010 .6879
in mmol/L assumed
Data independent samples test menunjukkan nilai Sig. (0.50), nilai adalah sama dengan α = 0.05
bermaksud kepelbagaian antara lelaki dan perempuan adalah tidak sama. Nilai Sig. (2-tailed)
pula ialah 0.281 adalah kurang daripada .05 menunjukkan terdapat perbezaan statistik yang
signifikan antara lelaki dan perempuan. Kita dapat rumuskan bahawa terdapat perbezaan statistik
yang signifikan dalam tahap glukosa antara lelaki dan perempuan.
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum
ANOVA
Glucose Level in mmol/L
Malay 72 7.610
Chinese 52 7.638
Indian 46 8.296
Secara rumusannya, tidak terdapat perbezaan statistik yang signifikan pada tahap glukosa dalam
kalangan kaum Melayu, Cina dan India
SOALAN I
Run a correlation analysis to show the association among the 2 variables: i. Preference for
physical exercise activities (Exercise_habits) and ii. Preference for outdoor activities
(Lifestyle_indicators). Formulate a hypotheses to test the relationship among these
variables and maku your conclusions isong the empirical evidence from the statistical
output generated.
Terdapat lima syarat yang perlu dipatuhi semasa menjalankan analisis korelasi Pearson iaitu:
I. Related pairs
Data mestilah dikumpul dari pasangan yang berkaitan seperti skor bagi pembolehubah X
dan skor pembolehubah Y mestilah diperoleh dari responden yang sama. Syarat ini
berhubung dengan reka bentuk kajian.
III. Normality
Skor untuk setiap pembolehubah perlu bertabur secara normal. Syarat ini boleh diuji
dengan menggunakan prosedur transformasi data.
IV. Linearity
Hubungan antara kedua-dua pembolehubah mestilah linear. Andaian ini boleh
dikenalpasti dengan merujuk kepada hasil scatterdots bagi pembolehubah yang dikaji.
V. Homogeneity of variance
Penyebaran bagi skor untuk satu pembolehubah adalah lebih kurang sama dengan semua
nilai bagi pembolehubah yang lain. Hal ini berkaitan bagaimana skor tersebut berkumpul
secara seragam disekitar garis regresi
Hipotesis Null
Tidak terdapat hubungan linear yang signifikan antara Preference exercise activities
(Exercise_habits) dan Preference for outdoor activities (Lifestyle_indicators).
Hipotesis Alternatif
Terdapat hubungan linear yang positif yang signifikan antara Preference exercise activities
(Exercise_habits) dan Preference for outdoor activities (Lifestyle_indicators).
Tahap kesignifikan, α
Nilai α = .05
Ujian korelasi
Descriptive Statistics
Data menunjukkan " Preference for physical exercise activities" (M = 4.6420, SD = 0.72548)
manakala " Preference for outdoor activities" (M = 4.6565, SD = 0.74460)
Correlations
Preference for
physical Preference for
exercise outdoor
activities activities
N 170 170
Preference for outdoor Pearson Correlation .681** 1
activities Sig. (1-tailed) .000
N 170 170
Melalui paparan jadual didapati r-value adalah .681** menunjukkan bahawa null hipotesis boleh
ditolak. Dalam kes ini p-value adalah .000, di bawah α = .05, maka hipotesis null "Tidak terdapat
hubungan linear yang signifikan antara Preference exercise activities (Exercise_habits) dan
Preference for outdoor activities (Lifestyle_indicators)" ditolak.
SOALAN J
Generate a scatter diagram to show the association between Preference for physical
exercise activities (Exercise_habits) and Preference for outdoor activities
(Lifestle_indicators). Show the fit line in the diagram. Explain the findings of this scatter
diagram.
Paparan data menunjukkan "scatter dot" berkadar langsung dengan nilai 𝑅 2 Linear = 0.43. Plot
residual adalah normal.
Model Summary
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients