Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 18

SOALAN A

Run a means analysis to display i. mean age of learners by Gender and ii. Mean age of
learners by Ethnicity. Describe the means and standard deviations of output.

Menentukan Means age of learners dengan "gender" dan "ethnicity"


a) Gender
Group Statistics

Gender N Mean Std. Deviation Std. Error Mean

Age in years Male 76 43.89 12.731 1.460

Female 94 44.44 11.454 1.181

Data menunjukkan bahawa male (M = 43.89, SD = 12.731) manakala female (M = 44.44, SD =


11.454).

Independent Samples Test

Levene's Test for

Equality of Variances t-test for Equality of Means

95% Confidence

Interval of the

Sig. (2- Mean Std. Error Difference

F Sig. t df tailed) Difference Difference Lower Upper

Age in Equal variances .744 .390 -.292 168 .771 -.541 1.857 -4.208 3.125
years assumed

Equal variances -.288 152.5 .774 -.541 1.878 -4.252 3.169


not assumed 89

Data menunjukkan nilai Sig.(2-Tailed) ialah 0.771. Nilai menunjukkan melebihi daripada 0.05.
Hal ini bermakna tidak terdapat perbezaan statistik yang signifikan antara male dan female.
b) Ethnicity

Descriptives

Age in years

95% Confidence Interval for


Mean

N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum

Malay 72 43.54 12.509 1.474 40.60 46.48 13 60


Chinese 52 44.21 12.169 1.688 40.82 47.60 20 62

Indian 46 45.20 11.185 1.649 41.87 48.52 20 65

Total 170 44.19 12.008 .921 42.38 46.01 13 65

Data menunjukkan bahawa kaum Melayu (M = 43.54, SD = 12.509), Cina (M = 44.21, SD =


12.169) dan India (M = 45.20, SD = 11.185).

ANOVA
Age in years

Sum of Squares df Mean Square F Sig.

Between Groups 76.807 2 38.403 .264 .768


Within Groups 24291.787 167 145.460
Total 24368.594 169

Data ANOVA menunjukkan nilai Sig. ialah 0.768. Nilai Sig. melebihi 0.05, data ini
menunjukkan bahawa tidak terdapat perbezaan yang signifikan antara kaum.
SOALAN B
Display a crosstabulation of Gender by Ethnicity of patients in survey. Show the row and
column counts and percentages. Describe the crosstabultion output.

Menentukan crosstabulation antara gender dan ethnicity.

Case Processing Summary

Cases

Valid Missing Total

N Percent N Percent N Percent

Gender * Ethnicity 170 100.0% 0 .0% 170 100.0%

Data dalam jadual N = 170 adalah valid dan N = 0 missing, menunjukkan bahawa tidak terdapat
ralat dalam data SPSS.

Gender * Ethnicity Crosstabulation

Ethnicity

Malay Chinese Indian Total

Gender Male Count 31 19 26 76

% within Gender 40.8% 25.0% 34.2% 100.0%

% within Ethnicity 43.1% 36.5% 56.5% 44.7%

% of Total 18.2% 11.2% 15.3% 44.7%

Female Count 41 33 20 94

% within Gender 43.6% 35.1% 21.3% 100.0%

% within Ethnicity 56.9% 63.5% 43.5% 55.3%

% of Total 24.1% 19.4% 11.8% 55.3%


Total Count 72 52 46 170

% within Gender 42.4% 30.6% 27.1% 100.0%

% within Ethnicity 100.0% 100.0% 100.0% 100.0%

% of Total 42.4% 30.6% 27.1% 100.0%

Melalui data di atas untuk bahagian lelaki (N = 76), didapati bahawa kaum Melayu, N = 31/76
mempunyai peratus tertinggi (40.8%), diikuti oleh kaum India, N = 26/76 (34.2%) dan kaum
Cina, 19/76 (25%).
Bahagian perempuan (N = 94) pula menunjukkan kaum Melayu, N = 41/94 mempunyai
peratus tertinggi (43.6%), diikuti oleh kaum Cina, N = 33/94 (35.1%) dan kaum India N = 20/94
(21.3%).
Dari segi perbezaan peratus mengikut jantina dalam kaum masing-masing, kaum Melayu
(N = 72) menunjukkan peratus perempuan, N = 41/72 (56.9%) lebih tinggi daripada lelaki, N =
31/72 (43.1%). Kaum Cina (N = 52) menunjukkan peratus perempuan, N = 33/52 (63.5%) lebih
tinggi daripada lelaki, N = 19/52 (36.5%). Kaum India (N = 46) pula menunjukkan peratus
lelaki, N = 26/46 (56.5%) lebih tinggi daripada perempuan, N = 20/46 (43.5%)
Secara keseluruhannya (N = 170), peratus kaum tertinggi ialah kaum Melayu, N = 72/170
(42.4%), diikuti oleh kaum Cina, N = 52/170 (30.6%) dan kaum India, N = 46/170 (27.1%).

SOALAN C
Recode the Income Variable into 4 categories: i. RM 30,000 and below ii. RM 30,001 - RM
40,000 iii. RM 40,001 - RM 50,000 and iv. RM 50,001 and above. Run the frequency count
of the recoded Income category variable. Describe the output.

Mengkodkan semula Annual income kepada Income category

(Hasil penuh dapat dilihat melalui Data SPSS)


Menentukan nilai frekuensi bagi IncomeCategory yang dikodkan semula

Statistics
Income Category

N Valid 170

Missing 0
Mean 2.72
Median 3.00
Std. Deviation 1.126
Minimum 1
Maximum 4

Jadual kategori pendapatan menunjukkan data Mean = 2.72, Median = 3.00 dan SD = 1.126.
Pendapatan minimum ialah 1 (RM 30,000 dan kebawah) dan maximum ialah 4 (RM 50,001 dan
keatas).

Income Category
Cumulative
Frequency Percent Valid Percent Percent
Valid 1 - RM 30,000 and below 31 18.2 18.2 18.2
2 - RM 30,001 - RM 40,000 45 26.5 26.5 44.7
3 - RM 40,001 - RM 50,000 35 20.6 20.6 65.3
4 - RM 50,001 and above 59 34.7 34.7 100.0
Total 170 100.0 100.0

Data dalam jadual di atas menunjukkan bahawa peratus kategori pendapatan tertinggi ialah 4
(RM 50,001 dan keatas) dengan peratus 34.7 (59/170), diikuti oleh kategori 2 (RM 30,001 - RM
40,000) dengan peratus 26.5 (45/170), seterusnya kategori 3 (RM 40,001 - RM 50,000) dengan
peratus 20.6 (35/170) dan kategori 1 (RM 30,000 dan kebawah) dengan peratus 18.2 (31/170).
SOALAN D
Transform the Ethnicity variable with value labels 1: Malays 2: Chinese 3: Indians into 2
categories, i.e i. Bumiputera and ii. Non-Bumiputera. Classify Malay as "Bumiputera" and
Chinese and Indian as "Non-bumiputera". Compute the mean blood Glucose level based
on "Bumiputera" and "Non-Bumiputera" classification. Describe the output.

Mengkategorikan pembolehubah Ethnicity kepada Bumiputera dan Non-Bumiputera

(Hasil penuh dapat dilihat melalui Data SPSS)


Menentukan pengiraan Mean bagi blood Glucose level untuk Bumiputera dan Non-
Bumiputera

Group Statistics
Bumiputera N Mean Std. Deviation Std. Error Mean
Glucose Level in mmol/L 1 - Bumiputera 72 7.610 1.4679 .1730
2 - Non-Bumiputera 52 7.638 1.4085 .1953

Data menunjukkan Bumiputera, N = 72 (M = 7.610, SD = 1.4679) manakala Non-Bumiputera, N


= 52 (M = 7.638, SD = 1.4085).

Independent Samples Test


Levene's Test for
Equality of Variances t-test for Equality of Means
95% Confidence
Interval of the
Sig. (2- Mean Std. Error Difference
F Sig. t df tailed) Difference Difference Lower Upper
Glucose Equal .033 .856 -.110 122 .912 -.0289 .2627 -.5489 .4911
Level in variances
mmol/L assumed
Equal -.111 112.6 .912 -.0289 .2609 -.5459 .4880
variances 16
not assumed

Data menunjukkan nilai Sig. (0.856) melebihi 0.05 bermakna kepelbagaian antara bumiputera
dan non-bumiputera adalah hampir sama dan tidak ada perbezaan signifikan.
Data Sig.(2-tailed) ialah 0.912 melebihi 0.05. Hal ini juga menunjukkan tidak terdapat
perbezaan statistik yang signifikan antara bumiputera dan non-bumiputera.

SOALAN E
Using the blood Glucose level variable as the dependent variable and Gender and Ethnicity
variables as the independets variables, formulate 2 possible research questions to conduct
this research.
Persoalan Kajian:
1. Apakah perbezaan kandungan paras glukosa dalam darah pelajar berdasarkan pada
jantina?
2. Apakah perbezaan kandungan paras glukosa dalam darah pelajar berdasarkan pada etnik?
SOALAN F

Formulate the relevant null and alternative hypotheses based on the research questions in
E) above.

Hipotesis Null

1. Tidak terdapat perbezaan yang signifikan dalam paras kandungan glukosa dalam darah
pelajar berdasarkan jantina.
2. Tidak terdapat perbezaan yang signifikan dalam paras kandungan glukosa dalam darah
pelajar berdasarkan etnik.

Hipotesis Alternatif
1. Terdapat perbezaan yang signifikan dalam paras kandungan glukosa dalam darah pelajar
berdasarkan jantina.
2. Terdapat perbezaan yang signifikan dalam paras kandungan glukosa dalam darah pelajar
berdasarkan etnik.

SOALAN G
State the appropriate statistical tests to test the hypotheses in F) above.

Ujian T(T Test) digunakan untuk menentukan sama ada terdapat perbezaan yang signifikan
antara dua set paras lukosa. Dalam F(1), independent groups t test akan digunakan dan paling
sesuai. Dalam F(2) pula, ujian statistik yang sesuai digunakn ialah ujian one-way ANOVA antara
kumpulan dengan perbandingan post-hoc.
SOALAN H
Run the appropriate statistical analysis to test the hypotheses stated in F) above. Make
your conclusions on these statistical tests.

a. Menentukan nilai paras signifikan


Nilai alpha, α = .05
b. Ujian normality bagi paras glukosa
Tests of Normality

Kolmogorov-Smirnova Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

Glucose Level in mmol/L .073 170 .028 .980 170 .015

a. Lilliefors Significance Correction

Paparan histogram menunjukkan bahawa taburan data bagi Glucose Level in mmol/L adalah
normal.
Paparan pada Q-Q Plot menunjukkan graf berkadar terus. Paras glukosa adalah normal

Paparan Detrended Normal Q-Q plot menunjukkan paten S.


Paparan boxplot menunjukkan kandungan glukosa lebih terarah kepada upper quartile.

Ujian T Test
Syarat menggunakan Ujian-t
Terdapat lima syarat yang perlu diambilkira untuk menjalankan statistik data dengan
menggunakan ujian-t. Syarat - syarat tersebut adalan seperti berikut:
I. Skala pengukuran
Data bagi pembolehubah terikat perlulah menggunakan skala pengukuran sela/nisbah dan
skala pengukuran nominal digunakan bagi pembolehubah bebas.

II. Persampelan rawak


Sampel yang dipilih daripada populasi adalah secara rawak.

III. Normality
Dalam normality, fokus utama adalah pada 'normal distribution' iaitu yang menyediakan
kedua-dua kaedah grafik dan statistik untuk menilai normality pada sampel.
IV. Saiz sampel
Sampel terdiri daripada satu kumpulan dan kumpulan tersebut adalah berbeza/bebas/tidak
berkaitan. Syarat atau andaian ini adalah berkaitan dengan reka bentuk kajian

V. Homogeneity of variance
Kumpulan daripada populasi haruslah mempunyai varians yang seimbang. Syarat ini
boleh diuji melalui analisis kumpulan bebas.

Menentukan Ujian T Test

Group Statistics

Gender N Mean Std. Deviation Std. Error Mean

Glucose Level in mmol/L Male 76 7.939 1.3485 .1547

Female 94 7.695 1.5432 .1592

Data menunjukkan bahawa male, N=76 (M = 7.939, SD = 1.3485) manakala female, N=94 (M =
7.695, SD = 1.5432).

Independent Samples Test

Levene's Test for


Equality of
Variances t-test for Equality of Means

Std. 95% Confidence

Mean Error Interval of the

Sig. (2- Differenc Differenc Difference

F Sig. t df tailed) e e Lower Upper

Glucose Level Equal variances 3.887 .050 1.081 168 .281 .2434 .2251 -.2010 .6879
in mmol/L assumed

Equal variances 1.097 166.9 .274 .2434 .2219 -.1948 .6816


not assumed 57

Data independent samples test menunjukkan nilai Sig. (0.50), nilai adalah sama dengan α = 0.05
bermaksud kepelbagaian antara lelaki dan perempuan adalah tidak sama. Nilai Sig. (2-tailed)
pula ialah 0.281 adalah kurang daripada .05 menunjukkan terdapat perbezaan statistik yang
signifikan antara lelaki dan perempuan. Kita dapat rumuskan bahawa terdapat perbezaan statistik
yang signifikan dalam tahap glukosa antara lelaki dan perempuan.

Ujian untuk Differences Scores terhadap ethnicity.

Maksud ujian ANOVA dan syarat menjalankan ujian ANOVA


Terdapat empat syarat yang perlu digunakan untuk menjalankan ujian one-way ANOVA iaitu:
I. Independent observations or subject
Data haruslah bebas dan tidak bergantungan antara satu sama lain. Subjek tertentu harus
dimiliki oleh satu kumpulan sahaja.

II. Sampel rawak


Sampel yang dipilih adalah secara rawak atau bebas.

III. Population normality


Setiap populasi, pembolehubah yang digunakan haruslah bertabur secara normal. Analisis
varians dikatakan 'rbust' jika setiap taburan adalah simetrik atau jika semua taburan
adalah terpencong pada arah yang sama (skewed). Normality boleh dilihat daripada ujian
normality terhadap skewness dan statistik Kolmogorov-Smirnov.

IV. Homogeneity of variance


Skor bagi setiap kumpulan seharusnya memiliki varians yang sama atau seimbang. Bagi
menentukan varians sama ata seimbang, gunakan Levene Statistic seperti ujian-t sampel
bebas.
Descriptives
Glucose Level in mmol/L

95% Confidence Interval for


Mean

N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum

Malay 72 7.610 1.4679 .1730 7.265 7.954 5.1 11.8


Chinese 52 7.638 1.4085 .1953 7.246 8.031 5.2 10.6
Indian 46 8.296 1.4211 .2095 7.874 8.718 5.5 11.1
Total 170 7.804 1.4602 .1120 7.583 8.025 5.1 11.8

Data descriptives menunjukkan kaum Melayu, N = 72 (M = 7.610, SD = 1.4679), kaum Cina, N


= 52 (M = 7.638, SD = 1.4085) dan kaum India, N = 46 (M = 8.296, SD = 1.4211)
Test of Homogeneity of Variances
Glucose Level in mmol/L

Levene Statistic df1 df2 Sig.

.040 2 167 .961

ANOVA
Glucose Level in mmol/L

Sum of Squares df Mean Square F Sig.

Between Groups 15.295 2 7.648 3.701 .027


Within Groups 345.043 167 2.066
Total 360.339 169
Glucose Level in mmol/L
Tukey Ba,b

Subset for alpha = 0.05


Ethnicity N 1 2

Malay 72 7.610
Chinese 52 7.638
Indian 46 8.296

Means for groups in homogeneous subsets are displayed.


a. Uses Harmonic Mean Sample Size = 54.686.
b. The group sizes are unequal. The harmonic mean of
the group sizes is used. Type I error levels are not
guaranteed.

Secara rumusannya, tidak terdapat perbezaan statistik yang signifikan pada tahap glukosa dalam
kalangan kaum Melayu, Cina dan India
SOALAN I

Run a correlation analysis to show the association among the 2 variables: i. Preference for
physical exercise activities (Exercise_habits) and ii. Preference for outdoor activities
(Lifestyle_indicators). Formulate a hypotheses to test the relationship among these
variables and maku your conclusions isong the empirical evidence from the statistical
output generated.

Syarat menggunakan analisis korelasi Pearson

Terdapat lima syarat yang perlu dipatuhi semasa menjalankan analisis korelasi Pearson iaitu:

I. Related pairs
Data mestilah dikumpul dari pasangan yang berkaitan seperti skor bagi pembolehubah X
dan skor pembolehubah Y mestilah diperoleh dari responden yang sama. Syarat ini
berhubung dengan reka bentuk kajian.

II. Skala pengukuran


Data perlulah dalam bentuk sela atau nisbah dan andaian ini juga berhubung dengan reka
bentuk kajian.

III. Normality
Skor untuk setiap pembolehubah perlu bertabur secara normal. Syarat ini boleh diuji
dengan menggunakan prosedur transformasi data.

IV. Linearity
Hubungan antara kedua-dua pembolehubah mestilah linear. Andaian ini boleh
dikenalpasti dengan merujuk kepada hasil scatterdots bagi pembolehubah yang dikaji.

V. Homogeneity of variance
Penyebaran bagi skor untuk satu pembolehubah adalah lebih kurang sama dengan semua
nilai bagi pembolehubah yang lain. Hal ini berkaitan bagaimana skor tersebut berkumpul
secara seragam disekitar garis regresi

Hipotesis Null dan Hipotesis Alternatif

Hipotesis Null

Tidak terdapat hubungan linear yang signifikan antara Preference exercise activities
(Exercise_habits) dan Preference for outdoor activities (Lifestyle_indicators).
Hipotesis Alternatif

Terdapat hubungan linear yang positif yang signifikan antara Preference exercise activities
(Exercise_habits) dan Preference for outdoor activities (Lifestyle_indicators).

Tahap kesignifikan, α

Nilai α = .05

Ujian korelasi

Descriptive Statistics

Mean Std. Deviation N

Preference for physical 4.6420 .72548 170


exercise activities
Preference for outdoor 4.6565 .74460 170
activities

Data menunjukkan " Preference for physical exercise activities" (M = 4.6420, SD = 0.72548)
manakala " Preference for outdoor activities" (M = 4.6565, SD = 0.74460)

Correlations

Preference for
physical Preference for
exercise outdoor
activities activities

Preference for physical Pearson Correlation 1 .681**


exercise activities Sig. (1-tailed) .000

N 170 170
Preference for outdoor Pearson Correlation .681** 1
activities Sig. (1-tailed) .000

N 170 170

**. Correlation is significant at the 0.01 level (1-tailed).

Melalui paparan jadual didapati r-value adalah .681** menunjukkan bahawa null hipotesis boleh
ditolak. Dalam kes ini p-value adalah .000, di bawah α = .05, maka hipotesis null "Tidak terdapat
hubungan linear yang signifikan antara Preference exercise activities (Exercise_habits) dan
Preference for outdoor activities (Lifestyle_indicators)" ditolak.
SOALAN J
Generate a scatter diagram to show the association between Preference for physical
exercise activities (Exercise_habits) and Preference for outdoor activities
(Lifestle_indicators). Show the fit line in the diagram. Explain the findings of this scatter
diagram.

Scatter Diagram (Fit Line)

Paparan data menunjukkan "scatter dot" berkadar langsung dengan nilai 𝑅 2 Linear = 0.43. Plot
residual adalah normal.
Model Summary

Adjusted R Std. Error of the


Model R R Square Square Estimate

1 .681a .463 .460 .53298

a. Predictors: (Constant), Preference for outdoor activities

Coefficientsa

Standardized
Unstandardized Coefficients Coefficients

Model B Std. Error Beta t Sig.

1 (Constant) 1.553 .260 5.983 .000


Preference for outdoor .663 .055 .681 12.047 .000
activities

a. Dependent Variable: Preference for physical exercise activities

Melalui paparan data persamaan regresi ialah y' = 0.663(x) + 1.53.

You might also like