Statistik

SOALAN A
Run a means analysis to display i. mean age of learners by Gender and ii. Mean age of
learners by Ethnicity. Describe the means and standard deviations of output.
Menentukan Means age of learners dengan "gender" dan "ethnicity"

a) Gender
Group Statistics
Gender N Mean Std. Deviation Std. Error Mean
Age in years Male 76 43.89 12.731 1.460
Female 94 44.44 11.454 1.181
Data menunjukkan bahawa male (M = 43.89, SD = 12.731) manakala female (M = 44.44, SD =

11.454).
Independent Samples Test
Levene's Test for
Equality of Variances t-test for Equality of Means
95% Confidence
Interval of the
Sig. (2- Mean Std. Error Difference
F Sig. t df tailed) Difference Difference Lower Upper
Age in Equal variances .744 .390 -.292 168 .771 -.541 1.857 -4.208 3.125
years assumed
Equal variances -.288 152.5 .774 -.541 1.878 -4.252 3.169

not assumed 89
Data menunjukkan nilai Sig.(2-Tailed) ialah 0.771. Nilai menunjukkan melebihi daripada 0.05.
Hal ini bermakna tidak terdapat perbezaan statistik yang signifikan antara male dan female.
b) Ethnicity
Descriptives
Age in years
95% Confidence Interval for

Mean
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum
Malay 72 43.54 12.509 1.474 40.60 46.48 13 60

Chinese 52 44.21 12.169 1.688 40.82 47.60 20 62
Indian 46 45.20 11.185 1.649 41.87 48.52 20 65
Total 170 44.19 12.008 .921 42.38 46.01 13 65
Data menunjukkan bahawa kaum Melayu (M = 43.54, SD = 12.509), Cina (M = 44.21, SD =

12.169) dan India (M = 45.20, SD = 11.185).
ANOVA
Age in years
Sum of Squares df Mean Square F Sig.
Between Groups 76.807 2 38.403 .264 .768

Within Groups 24291.787 167 145.460
Total 24368.594 169
Data ANOVA menunjukkan nilai Sig. ialah 0.768. Nilai Sig. melebihi 0.05, data ini
menunjukkan bahawa tidak terdapat perbezaan yang signifikan antara kaum.
SOALAN B
Display a crosstabulation of Gender by Ethnicity of patients in survey. Show the row and
column counts and percentages. Describe the crosstabultion output.
Menentukan crosstabulation antara gender dan ethnicity.
Case Processing Summary
Cases
Valid Missing Total
N Percent N Percent N Percent
Gender * Ethnicity 170 100.0% 0 .0% 170 100.0%
Data dalam jadual N = 170 adalah valid dan N = 0 missing, menunjukkan bahawa tidak terdapat
ralat dalam data SPSS.
Gender * Ethnicity Crosstabulation
Ethnicity
Malay Chinese Indian Total
Gender Male Count 31 19 26 76
% within Gender 40.8% 25.0% 34.2% 100.0%
% within Ethnicity 43.1% 36.5% 56.5% 44.7%
% of Total 18.2% 11.2% 15.3% 44.7%
Female Count 41 33 20 94
% within Gender 43.6% 35.1% 21.3% 100.0%
% of Total 24.1% 19.4% 11.8% 55.3%

Total Count 72 52 46 170
% within Gender 42.4% 30.6% 27.1% 100.0%
% of Total 42.4% 30.6% 27.1% 100.0%
Melalui data di atas untuk bahagian lelaki (N = 76), didapati bahawa kaum Melayu, N = 31/76
mempunyai peratus tertinggi (40.8%), diikuti oleh kaum India, N = 26/76 (34.2%) dan kaum
Cina, 19/76 (25%).
Bahagian perempuan (N = 94) pula menunjukkan kaum Melayu, N = 41/94 mempunyai
peratus tertinggi (43.6%), diikuti oleh kaum Cina, N = 33/94 (35.1%) dan kaum India N = 20/94
(21.3%).
Dari segi perbezaan peratus mengikut jantina dalam kaum masing-masing, kaum Melayu
(N = 72) menunjukkan peratus perempuan, N = 41/72 (56.9%) lebih tinggi daripada lelaki, N =
31/72 (43.1%). Kaum Cina (N = 52) menunjukkan peratus perempuan, N = 33/52 (63.5%) lebih
tinggi daripada lelaki, N = 19/52 (36.5%). Kaum India (N = 46) pula menunjukkan peratus
lelaki, N = 26/46 (56.5%) lebih tinggi daripada perempuan, N = 20/46 (43.5%)
Secara keseluruhannya (N = 170), peratus kaum tertinggi ialah kaum Melayu, N = 72/170
(42.4%), diikuti oleh kaum Cina, N = 52/170 (30.6%) dan kaum India, N = 46/170 (27.1%).
SOALAN C
Recode the Income Variable into 4 categories: i. RM 30,000 and below ii. RM 30,001 - RM
40,000 iii. RM 40,001 - RM 50,000 and iv. RM 50,001 and above. Run the frequency count
of the recoded Income category variable. Describe the output.
Mengkodkan semula Annual income kepada Income category
(Hasil penuh dapat dilihat melalui Data SPSS)

Menentukan nilai frekuensi bagi IncomeCategory yang dikodkan semula
Statistics
Income Category
N Valid 170
Missing 0
Mean 2.72
Median 3.00
Std. Deviation 1.126
Minimum 1
Maximum 4
Jadual kategori pendapatan menunjukkan data Mean = 2.72, Median = 3.00 dan SD = 1.126.
Pendapatan minimum ialah 1 (RM 30,000 dan kebawah) dan maximum ialah 4 (RM 50,001 dan
keatas).
Income Category
Cumulative
Frequency Percent Valid Percent Percent
Valid 1 - RM 30,000 and below 31 18.2 18.2 18.2
2 - RM 30,001 - RM 40,000 45 26.5 26.5 44.7
3 - RM 40,001 - RM 50,000 35 20.6 20.6 65.3
4 - RM 50,001 and above 59 34.7 34.7 100.0
Total 170 100.0 100.0
Data dalam jadual di atas menunjukkan bahawa peratus kategori pendapatan tertinggi ialah 4
(RM 50,001 dan keatas) dengan peratus 34.7 (59/170), diikuti oleh kategori 2 (RM 30,001 - RM
40,000) dengan peratus 26.5 (45/170), seterusnya kategori 3 (RM 40,001 - RM 50,000) dengan
peratus 20.6 (35/170) dan kategori 1 (RM 30,000 dan kebawah) dengan peratus 18.2 (31/170).
SOALAN D
Transform the Ethnicity variable with value labels 1: Malays 2: Chinese 3: Indians into 2
categories, i.e i. Bumiputera and ii. Non-Bumiputera. Classify Malay as "Bumiputera" and
Chinese and Indian as "Non-bumiputera". Compute the mean blood Glucose level based
on "Bumiputera" and "Non-Bumiputera" classification. Describe the output.
Mengkategorikan pembolehubah Ethnicity kepada Bumiputera dan Non-Bumiputera
(Hasil penuh dapat dilihat melalui Data SPSS)

Menentukan pengiraan Mean bagi blood Glucose level untuk Bumiputera dan Non-
Bumiputera
Group Statistics
Bumiputera N Mean Std. Deviation Std. Error Mean
Glucose Level in mmol/L 1 - Bumiputera 72 7.610 1.4679 .1730
2 - Non-Bumiputera 52 7.638 1.4085 .1953
Data menunjukkan Bumiputera, N = 72 (M = 7.610, SD = 1.4679) manakala Non-Bumiputera, N

= 52 (M = 7.638, SD = 1.4085).

Levene's Test for
Equality of Variances t-test for Equality of Means
95% Confidence
Interval of the
Sig. (2- Mean Std. Error Difference
F Sig. t df tailed) Difference Difference Lower Upper
Glucose Equal .033 .856 -.110 122 .912 -.0289 .2627 -.5489 .4911
Level in variances
mmol/L assumed
Equal -.111 112.6 .912 -.0289 .2609 -.5459 .4880
variances 16
not assumed
Data menunjukkan nilai Sig. (0.856) melebihi 0.05 bermakna kepelbagaian antara bumiputera
dan non-bumiputera adalah hampir sama dan tidak ada perbezaan signifikan.
Data Sig.(2-tailed) ialah 0.912 melebihi 0.05. Hal ini juga menunjukkan tidak terdapat
perbezaan statistik yang signifikan antara bumiputera dan non-bumiputera.
SOALAN E
Using the blood Glucose level variable as the dependent variable and Gender and Ethnicity
variables as the independets variables, formulate 2 possible research questions to conduct
this research.
Persoalan Kajian:
1. Apakah perbezaan kandungan paras glukosa dalam darah pelajar berdasarkan pada
jantina?
2. Apakah perbezaan kandungan paras glukosa dalam darah pelajar berdasarkan pada etnik?
SOALAN F
Formulate the relevant null and alternative hypotheses based on the research questions in
E) above.
Hipotesis Null
1. Tidak terdapat perbezaan yang signifikan dalam paras kandungan glukosa dalam darah
pelajar berdasarkan jantina.
2. Tidak terdapat perbezaan yang signifikan dalam paras kandungan glukosa dalam darah
pelajar berdasarkan etnik.
Hipotesis Alternatif
1. Terdapat perbezaan yang signifikan dalam paras kandungan glukosa dalam darah pelajar
berdasarkan jantina.
2. Terdapat perbezaan yang signifikan dalam paras kandungan glukosa dalam darah pelajar
berdasarkan etnik.
SOALAN G
State the appropriate statistical tests to test the hypotheses in F) above.
Ujian T(T Test) digunakan untuk menentukan sama ada terdapat perbezaan yang signifikan
antara dua set paras lukosa. Dalam F(1), independent groups t test akan digunakan dan paling
sesuai. Dalam F(2) pula, ujian statistik yang sesuai digunakn ialah ujian one-way ANOVA antara
kumpulan dengan perbandingan post-hoc.
SOALAN H
Run the appropriate statistical analysis to test the hypotheses stated in F) above. Make
your conclusions on these statistical tests.
a. Menentukan nilai paras signifikan

Nilai alpha, α = .05
b. Ujian normality bagi paras glukosa
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Glucose Level in mmol/L .073 170 .028 .980 170 .015
a. Lilliefors Significance Correction
Paparan histogram menunjukkan bahawa taburan data bagi Glucose Level in mmol/L adalah
normal.
Paparan pada Q-Q Plot menunjukkan graf berkadar terus. Paras glukosa adalah normal
Paparan Detrended Normal Q-Q plot menunjukkan paten S.

Paparan boxplot menunjukkan kandungan glukosa lebih terarah kepada upper quartile.
Ujian T Test
Syarat menggunakan Ujian-t
Terdapat lima syarat yang perlu diambilkira untuk menjalankan statistik data dengan
menggunakan ujian-t. Syarat - syarat tersebut adalan seperti berikut:
I. Skala pengukuran
Data bagi pembolehubah terikat perlulah menggunakan skala pengukuran sela/nisbah dan
skala pengukuran nominal digunakan bagi pembolehubah bebas.
II. Persampelan rawak

Sampel yang dipilih daripada populasi adalah secara rawak.
III. Normality
Dalam normality, fokus utama adalah pada 'normal distribution' iaitu yang menyediakan
kedua-dua kaedah grafik dan statistik untuk menilai normality pada sampel.
IV. Saiz sampel
Sampel terdiri daripada satu kumpulan dan kumpulan tersebut adalah berbeza/bebas/tidak
berkaitan. Syarat atau andaian ini adalah berkaitan dengan reka bentuk kajian
V. Homogeneity of variance
Kumpulan daripada populasi haruslah mempunyai varians yang seimbang. Syarat ini
boleh diuji melalui analisis kumpulan bebas.
Menentukan Ujian T Test
Group Statistics
Gender N Mean Std. Deviation Std. Error Mean
Glucose Level in mmol/L Male 76 7.939 1.3485 .1547
Female 94 7.695 1.5432 .1592
Data menunjukkan bahawa male, N=76 (M = 7.939, SD = 1.3485) manakala female, N=94 (M =
7.695, SD = 1.5432).
Levene's Test for

Equality of
Variances t-test for Equality of Means
Std. 95% Confidence
Mean Error Interval of the
Sig. (2- Differenc Differenc Difference
F Sig. t df tailed) e e Lower Upper
Glucose Level Equal variances 3.887 .050 1.081 168 .281 .2434 .2251 -.2010 .6879
in mmol/L assumed
Equal variances 1.097 166.9 .274 .2434 .2219 -.1948 .6816

not assumed 57
Data independent samples test menunjukkan nilai Sig. (0.50), nilai adalah sama dengan α = 0.05
bermaksud kepelbagaian antara lelaki dan perempuan adalah tidak sama. Nilai Sig. (2-tailed)
pula ialah 0.281 adalah kurang daripada .05 menunjukkan terdapat perbezaan statistik yang
signifikan antara lelaki dan perempuan. Kita dapat rumuskan bahawa terdapat perbezaan statistik
yang signifikan dalam tahap glukosa antara lelaki dan perempuan.
Ujian untuk Differences Scores terhadap ethnicity.
Maksud ujian ANOVA dan syarat menjalankan ujian ANOVA

Terdapat empat syarat yang perlu digunakan untuk menjalankan ujian one-way ANOVA iaitu:
I. Independent observations or subject
Data haruslah bebas dan tidak bergantungan antara satu sama lain. Subjek tertentu harus
dimiliki oleh satu kumpulan sahaja.
II. Sampel rawak

Sampel yang dipilih adalah secara rawak atau bebas.
III. Population normality

Setiap populasi, pembolehubah yang digunakan haruslah bertabur secara normal. Analisis
varians dikatakan 'rbust' jika setiap taburan adalah simetrik atau jika semua taburan
adalah terpencong pada arah yang sama (skewed). Normality boleh dilihat daripada ujian
normality terhadap skewness dan statistik Kolmogorov-Smirnov.
IV. Homogeneity of variance

Skor bagi setiap kumpulan seharusnya memiliki varians yang sama atau seimbang. Bagi
menentukan varians sama ata seimbang, gunakan Levene Statistic seperti ujian-t sampel
bebas.
Descriptives
Glucose Level in mmol/L
95% Confidence Interval for

Mean
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum
Malay 72 7.610 1.4679 .1730 7.265 7.954 5.1 11.8

Chinese 52 7.638 1.4085 .1953 7.246 8.031 5.2 10.6
Indian 46 8.296 1.4211 .2095 7.874 8.718 5.5 11.1
Total 170 7.804 1.4602 .1120 7.583 8.025 5.1 11.8
Data descriptives menunjukkan kaum Melayu, N = 72 (M = 7.610, SD = 1.4679), kaum Cina, N

= 52 (M = 7.638, SD = 1.4085) dan kaum India, N = 46 (M = 8.296, SD = 1.4211)
Test of Homogeneity of Variances
Levene Statistic df1 df2 Sig.
.040 2 167 .961
ANOVA
Sum of Squares df Mean Square F Sig.
Between Groups 15.295 2 7.648 3.701 .027

Within Groups 345.043 167 2.066
Total 360.339 169
Tukey Ba,b
Subset for alpha = 0.05

Ethnicity N 1 2
Malay 72 7.610
Chinese 52 7.638
Indian 46 8.296
Means for groups in homogeneous subsets are displayed.

a. Uses Harmonic Mean Sample Size = 54.686.
b. The group sizes are unequal. The harmonic mean of
the group sizes is used. Type I error levels are not
guaranteed.
Secara rumusannya, tidak terdapat perbezaan statistik yang signifikan pada tahap glukosa dalam
kalangan kaum Melayu, Cina dan India
SOALAN I
Run a correlation analysis to show the association among the 2 variables: i. Preference for
physical exercise activities (Exercise_habits) and ii. Preference for outdoor activities
(Lifestyle_indicators). Formulate a hypotheses to test the relationship among these
variables and maku your conclusions isong the empirical evidence from the statistical
output generated.
Syarat menggunakan analisis korelasi Pearson
Terdapat lima syarat yang perlu dipatuhi semasa menjalankan analisis korelasi Pearson iaitu:
I. Related pairs
Data mestilah dikumpul dari pasangan yang berkaitan seperti skor bagi pembolehubah X
dan skor pembolehubah Y mestilah diperoleh dari responden yang sama. Syarat ini
berhubung dengan reka bentuk kajian.
II. Skala pengukuran

Data perlulah dalam bentuk sela atau nisbah dan andaian ini juga berhubung dengan reka
bentuk kajian.
III. Normality
Skor untuk setiap pembolehubah perlu bertabur secara normal. Syarat ini boleh diuji
dengan menggunakan prosedur transformasi data.
IV. Linearity
Hubungan antara kedua-dua pembolehubah mestilah linear. Andaian ini boleh
dikenalpasti dengan merujuk kepada hasil scatterdots bagi pembolehubah yang dikaji.
V. Homogeneity of variance
Penyebaran bagi skor untuk satu pembolehubah adalah lebih kurang sama dengan semua
nilai bagi pembolehubah yang lain. Hal ini berkaitan bagaimana skor tersebut berkumpul
secara seragam disekitar garis regresi
Hipotesis Null dan Hipotesis Alternatif
Hipotesis Null
Tidak terdapat hubungan linear yang signifikan antara Preference exercise activities
(Exercise_habits) dan Preference for outdoor activities (Lifestyle_indicators).
Hipotesis Alternatif
Terdapat hubungan linear yang positif yang signifikan antara Preference exercise activities
(Exercise_habits) dan Preference for outdoor activities (Lifestyle_indicators).
Tahap kesignifikan, α
Nilai α = .05
Ujian korelasi
Descriptive Statistics
Mean Std. Deviation N
Preference for physical 4.6420 .72548 170

exercise activities
Preference for outdoor 4.6565 .74460 170
activities
Data menunjukkan " Preference for physical exercise activities" (M = 4.6420, SD = 0.72548)
manakala " Preference for outdoor activities" (M = 4.6565, SD = 0.74460)
Correlations
Preference for
physical Preference for
exercise outdoor
activities activities
Preference for physical Pearson Correlation 1 .681**

exercise activities Sig. (1-tailed) .000
N 170 170
Preference for outdoor Pearson Correlation .681** 1
activities Sig. (1-tailed) .000
N 170 170
**. Correlation is significant at the 0.01 level (1-tailed).
Melalui paparan jadual didapati r-value adalah .681** menunjukkan bahawa null hipotesis boleh
ditolak. Dalam kes ini p-value adalah .000, di bawah α = .05, maka hipotesis null "Tidak terdapat
hubungan linear yang signifikan antara Preference exercise activities (Exercise_habits) dan
Preference for outdoor activities (Lifestyle_indicators)" ditolak.
SOALAN J
Generate a scatter diagram to show the association between Preference for physical
exercise activities (Exercise_habits) and Preference for outdoor activities
(Lifestle_indicators). Show the fit line in the diagram. Explain the findings of this scatter
diagram.
Scatter Diagram (Fit Line)
Paparan data menunjukkan "scatter dot" berkadar langsung dengan nilai 𝑅 2 Linear = 0.43. Plot
residual adalah normal.
Model Summary
Adjusted R Std. Error of the

Model R R Square Square Estimate
1 .681a .463 .460 .53298
a. Predictors: (Constant), Preference for outdoor activities
Coefficientsa
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 1.553 .260 5.983 .000

Preference for outdoor .663 .055 .681 12.047 .000
activities
a. Dependent Variable: Preference for physical exercise activities
Melalui paparan data persamaan regresi ialah y' = 0.663(x) + 1.53.

Statistik

Uploaded by

Document Information

Original Description:

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Statistik

Uploaded by

Copyright:

Available Formats

SOALAN A

Menentukan Means age of learners dengan "gender" dan "ethnicity"

Gender N Mean Std. Deviation Std. Error Mean

Age in years Male 76 43.89 12.731 1.460

Female 94 44.44 11.454 1.181

Data menunjukkan bahawa male (M = 43.89, SD = 12.731) manakala female (M = 44.44, SD =

Independent Samples Test

Levene's Test for

Equality of Variances t-test for Equality of Means

Sig. (2- Mean Std. Error Difference

F Sig. t df tailed) Difference Difference Lower Upper

Equal variances -.288 152.5 .774 -.541 1.878 -4.252 3.169

95% Confidence Interval for

Malay 72 43.54 12.509 1.474 40.60 46.48 13 60

Indian 46 45.20 11.185 1.649 41.87 48.52 20 65

Total 170 44.19 12.008 .921 42.38 46.01 13 65

Data menunjukkan bahawa kaum Melayu (M = 43.54, SD = 12.509), Cina (M = 44.21, SD =

Sum of Squares df Mean Square F Sig.

Between Groups 76.807 2 38.403 .264 .768

Menentukan crosstabulation antara gender dan ethnicity.

Case Processing Summary

Valid Missing Total

N Percent N Percent N Percent

Gender * Ethnicity 170 100.0% 0 .0% 170 100.0%

Gender * Ethnicity Crosstabulation

Malay Chinese Indian Total

Gender Male Count 31 19 26 76

% within Gender 40.8% 25.0% 34.2% 100.0%

% within Ethnicity 43.1% 36.5% 56.5% 44.7%

% of Total 18.2% 11.2% 15.3% 44.7%

% within Gender 43.6% 35.1% 21.3% 100.0%

% within Ethnicity 56.9% 63.5% 43.5% 55.3%

% of Total 24.1% 19.4% 11.8% 55.3%

% within Gender 42.4% 30.6% 27.1% 100.0%

% within Ethnicity 100.0% 100.0% 100.0% 100.0%

% of Total 42.4% 30.6% 27.1% 100.0%

Mengkodkan semula Annual income kepada Income category

(Hasil penuh dapat dilihat melalui Data SPSS)

Mengkategorikan pembolehubah Ethnicity kepada Bumiputera dan Non-Bumiputera

(Hasil penuh dapat dilihat melalui Data SPSS)

Data menunjukkan Bumiputera, N = 72 (M = 7.610, SD = 1.4679) manakala Non-Bumiputera, N

Independent Samples Test

a. Menentukan nilai paras signifikan

Statistic df Sig. Statistic df Sig.

Glucose Level in mmol/L .073 170 .028 .980 170 .015

a. Lilliefors Significance Correction

Paparan Detrended Normal Q-Q plot menunjukkan paten S.

II. Persampelan rawak

Menentukan Ujian T Test

Gender N Mean Std. Deviation Std. Error Mean

Glucose Level in mmol/L Male 76 7.939 1.3485 .1547

Female 94 7.695 1.5432 .1592

Independent Samples Test

Levene's Test for

Std. 95% Confidence

Mean Error Interval of the

Sig. (2- Differenc Differenc Difference

F Sig. t df tailed) e e Lower Upper

Equal variances 1.097 166.9 .274 .2434 .2219 -.1948 .6816

Ujian untuk Differences Scores terhadap ethnicity.

Maksud ujian ANOVA dan syarat menjalankan ujian ANOVA

II. Sampel rawak