Bab 3

You might also like

Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 45

Statistika Bisnis

BAB 3
Pengukuran Deskriptif Numerik

Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-1
Tujuan Kuliah

In this chapter, you learn:


 Menggambarkan sifat dari central tendency,

variation, and shape/bentuk dalam data numerik


 Menghitung hasil pengolahan deskriptif untuk

populasi

Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-2
Topik di Bab ini
 Pengukuran dari central tendency
 Mean, median, mode, geometric mean

Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-3
Measures of Central Tendency
Overview
Central Tendency

Arithmetic Mean Median Mode Geometric Mean

X i
XG  ( X1  X 2    Xn )1/ n

X i1
n Nilai tengah Nilai yang
dari data paling
yang telah banyak
diurutkan muncul

Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-4
Arithmetic Mean
 The arithmetic mean (sample mean) is the
most common measure of central tendency

 For a sample of size n:


n

X i
X1  X 2    Xn
X i1

n n

Sample size Observed values

Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-5
Arithmetic Mean
(continued)

 The most common measure of central tendency


 Mean = sum of values divided by the number of values
 Affected by extreme values (outliers)

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

Mean = 3 Mean = 4
1  2  3  4  5 15 1  2  3  4  10 20
 3  4
5 5 5 5

Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-6
Median
 In an ordered array, the median is the “middle”
number (50% above, 50% below)

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

Median = 3 Median = 3

 Not affected by extreme values

Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-7
Finding the Median

 The location of the median:

n 1
Median position  position in the ordered data
2
 If the number of values is odd, the median is the middle number
 If the number of values is even, the median is the average of
the two middle numbers

n 1
 Note that is not the value of the median, only the
2
position of the median in the ranked data

Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-8
Mode
 A measure of central tendency
 Value that occurs most often
 Not affected by extreme values
 Used for either numerical or categorical
(nominal) data
 There may be no mode
 There may be several modes

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6

No Mode
Mode = 9
Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-9
Review Example
 Five houses on a hill by the beach
$2,000 K
House Prices:

$2,000,000
500,000 $500 K
300,000 $300 K
100,000
100,000

$100 K

$100 K

Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-10
Review Example:
Summary Statistics

House Prices:
 Mean: ($3,000,000/5)
$2,000,000 = $600,000
500,000
300,000
100,000
100,000
 Median: middle value of ranked data
Sum $3,000,000
= $300,000

 Mode: most frequent value


= $100,000
Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-11
Which measure of location
is the “best”?
 Mean is generally used, unless
extreme values (outliers) exist
 Then median is often used, since
the median is not sensitive to
extreme values.
 Example: Median home prices may be
reported for a region – less sensitive to
outliers

Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-12
Geometric Mean
 Geometric mean
 Used to measure the rate of change of a variable
over time

XG  ( X1  X 2    Xn ) 1/ n

 Geometric mean rate of return


 Measures the status of an investment over time

R G  [(1  R1 )  (1  R 2 )    (1  Rn )]1/ n  1
 Where Ri is the rate of return in time period i

Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-13
Example

An investment of $100,000 declined to $50,000 at the


end of year one and rebounded to $100,000 at end
of year two:

X1  $100,000 X 2  $50,000 X3  $100,000

50% decrease 100% increase

The overall two-year return is zero, since it started and


ended at the same level.
Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-14
Example
(continued)

Use the 1-year returns to compute the arithmetic


mean and the geometric mean:

Arithmetic ( 50%)  (100%)


mean rate X  25% Misleading result
2
of return:

Geometric R G  [(1  R1 )  (1  R 2 )    (1  Rn )]1/ n  1


mean rate
 [(1  ( 50%))  (1  (100%))]1/ 2  1 More
of return:
accurate
 [(.50)  (2)]1/ 2  1  11/ 2  1  0% result
Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-15
Tugas

 All Seasons Plumbing has two service trucks


that frequently need repair. If the probability the
first truck is available is .75, the probability the
second truck is available is .50, and the
probability that both trucks are available is .30,
what is the probability neither truck is available?

Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc. Chap 3-16
Varians/Variance

 Untuk mengetahui variasi penyebaran di sekitar


mean pada sampel
n
 Varians sampel:
 (X i  X) 2

S  2 i1
n -1
Dimana X= rata-rata sampel
n = ukuran sampel
Xi = nilai ke I dari variabel X
Business Statistics, A First Course
(4e) © 2006 Prentice-Hall, Inc. Chap 3-17
Contoh Perhitungan:
Data
Sampel (Xi) : 10 12 14 15 17 18 18 24
n=8 Rata-rata = X = 16

(10  X ) 2  (12  X ) 2  (14  X ) 2    (24  X ) 2


S
n 1

(10  16) 2  (12  16) 2  (14  16) 2    (24  16) 2



8 1

Rata-rata sebaraan data disekitar rata-


130
  4.3095 rata hitung
7
Business Statistics, A First Course
(4e) © 2006 Prentice-Hall, Inc. Chap 3-18
Deviasi Standar
 Alat ukur yang paling umum digunakan dalam
mengukur variansi
 Menunjukkan variansi disekitar rata-rata
 Merupakan akar dari variansi

 Deviasi Standar Sampel: n

 i
(X  X ) 2

S i1
n -1
Business Statistics, A First Course
(4e) © 2006 Prentice-Hall, Inc. Chap 3-19
Mengukur Variasi

Simpangan Baku yang kecil

Simpangan Baku yang besar

Business Statistics, A First Course


(4e) © 2006 Prentice-Hall, Inc. Chap 3-20
Perbandingan Simpangan Baku

Data A
Rata-rata = 15.5

11 12 13 14 15 16 17 18 19 20 21
S = 3.338

Data B
Rata-rata = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 0.926

Data C
Rata-rata = 15.5

11 12 13 14 15 16 17 18 19 20 21
S = 4.567
Business Statistics, A First Course
(4e) © 2006 Prentice-Hall, Inc. Chap 3-21
Koefisien Variasi
 Mengukur variasi relatif
 Selalu dalam bentuk persentasi (%)
 Menunjukkan variasi relatif terhadap rata-rata
 Digunakan untuk mengukur
kehomogenan/keheterogenan dua buah data
yang memiliki ukuran yang berbeda

 S 
CV     100%

X 
Business Statistics, A First Course
(4e) © 2006 Prentice-Hall, Inc. Chap 3-22
Membandingkan Koefisien
Variasi
 Saham A:
 Harga rata-rata pada akhir tahun = $50

 Deviasi Standar = $5

S $5
CVA     100%   100%  10%
X $50 Masing-masing
 Saham B: saham memiliki
deviasi standar
 Harga rata-rata pada akhir tahun = $100
yang
 Deviasi Standar = $5 sama,namun
saham B kurang
berfluktuatif
S $5 terhadap harga
CVB     100%   100%  5%
X $100
Business Statistics, A First Course
(4e) © 2006 Prentice-Hall, Inc. Chap 3-23
Keuntungan dari Varians dan
Deviasi Standar
 Setiap nilai pada data dilibatkan pada
perhitungan

 Nilai yang jauh dari rata-rata akan


memberikan bobot yang lebih besar
(karena deviasi dari rata-rata dikuadratkan)

Business Statistics, A First Course


(4e) © 2006 Prentice-Hall, Inc. Chap 3-24
Z-scores / Nilai-Z

 Untuk mengidentifikasi adakah nilai


ekstrem/outliers/pencilan yang letaknya jauh
dari mean
 Pencilan teridentifikasi bila nilai-Z di bawah -3
atau di atas +3

XX
Z
S
Bentuk dari Distribusi

 Menggambarkan bagaimana data terdistribusi


 Simetrik atau cenderung miring

Miring Kiri Simetrik Miring Kanan


Rata-rata < Median Rata-rata = Median Median < rata-rata

Business Statistics, A First Course


(4e) © 2006 Prentice-Hall, Inc. Chap 3-26
Contoh Soal
• Data mentah berikut adalah data sampel dengan
n=7:
Data 1: 0 3 4 7 7 9 12
Data 2: -8 -5 7 7 9 10 12
a. Tentukan mean, median, modus.
b. Tentukan range, varians, simpangan baku, dan
koefisien variasi. Manakah data yang lebih
homogen?
c. Hitung Z-scores. Apakah ada outliers/pencilan?
d. Jelaskan bentuk dari data
Pengukuran Numerik untuk Populasi
 Pengukuran untuk populasi disebut sebagai parameter
 Rata-rata Populasi adalah jumlah dari populasi dibagi
dengan ukuran populasi
N

X i
X1  X 2    XN
 i 1

N N
Dimana μ = rata – rata populasi
N = ukuran populasi
Xi = nilai ke I dari variabel X
Business Statistics, A First Course
(4e) © 2006 Prentice-Hall, Inc. Chap 3-28
Varians Populasi

 Untuk mengetahui variasi penyebaran di sekitar


mean pada populasi
N
 Varians Populasi :  (X i  μ) 2

σ2  i 1
N

Dimana μ = rata – rata populasi


N = ukuran populasi
Xi = nilai ke – I dari variabel X
Business Statistics, A First Course
(4e) © 2006 Prentice-Hall, Inc. Chap 3-29
Deviasi Standar Populasi
 Paling umum digunakan untuk mengukur variasi
 Menunjukkan variasi data disekitar rata – rata
hitung
 Merupakan akar dari varians populasi

 Deviasi Standar Populasi: N

 i
(X  μ) 2

σ i1
N
Business Statistics, A First Course
(4e) © 2006 Prentice-Hall, Inc. Chap 3-30
Hukum Empirik
 Apabila distribusi data terdistribusi dengan
normal maka memiliki interval:

μ  1σ Mengandung kurang lebih 68%


dari nilai data pada populasi atau
sampel

68%

μ
μ  1σ
Business Statistics, A First Course
(4e) © 2006 Prentice-Hall, Inc. Chap 3-31
Hukum Empirik
 μ  2σ Mengandung kurang lebih 95% dari
nilai data pada populasi atau
sampel
μ  3σ
 Mengandung kurang lebih 99.7%
dari nilai data pada populasi atau
sampel

95% 99.7%

μ  2σ μ  3σ
Business Statistics, A First Course
(4e) © 2006 Prentice-Hall, Inc. Chap 3-32
Teorema Chebyshev

 Menjelaskan bagaimana data terdistribusi,


paling sedikit (1 - 1/k2) x 100% dari nilai data
yang terletak dalam k deviasi standar rata-
rata hitung (untuk k > 1)
 Contoh:
Paling Sedikit Dalam
(1 - 1/12) x 100% = 0% ……..... k=1 (μ ± 1σ)
(1 - 1/22) x 100% = 75% …........ k=2 (μ ± 2σ)
(1 - 1/32) x 100% = 89% ………. k=3 (μ ± 3σ)

Business Statistics, A First Course


(4e) © 2006 Prentice-Hall, Inc. Chap 3-33
Analisi Data Eksploratori
 Diagram Kotak Garis: Penampakan grafis yang
didasarkan pada nilai kuartil, untuk
memudahkan kita menggambar suatu kelompok
berdasarkan data
Minimum -- Q1 -- Median -- Q3 -- Maksimum

Contoh:
25% 25% 25% 25%

Minimum 1st Median 3rd Maximum


Quartile Quartile
Business Statistics, A First Course
(4e) © 2006 Prentice-Hall, Inc. Chap 3-34
Bentuk dari Diagram Kotak Garis

 Kotak dan garis diletakkan pada angka akhir jika


datanya simetrik pada sekitar median

Min Q1 Median Q3 Max

 Diagram Kotak Garis dapat digunakan juga dalam


bentuk vertikal

Business Statistics, A First Course


(4e) © 2006 Prentice-Hall, Inc. Chap 3-35
Bentuk Distribusi dan Diagram
Kotak Garis

Miring Kiri Simetrik Miring Kanan

Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3

Business Statistics, A First Course


(4e) © 2006 Prentice-Hall, Inc. Chap 3-36
Contoh Diagram Kotak Garis

 Dibawah ini merupakan diagram kotak garis untuk


sekumpulan data:
 Min Q1 Q2 Q3 Max
0 2 2 2 3 3 4 5 5 10 27

0 23 5 27
 Data menunjukkan miring kanan

Business Statistics, A First Course


(4e) © 2006 Prentice-Hall, Inc. Chap 3-37
Kovarians Sampel
 Kovarians sampel mengukur kuat tidaknya hubungan
linier antara dua variabel (data bivariat)

 Kovarians Sampel:
n

 ( X  X)( Y  Y )
i i
cov ( X , Y )  i1
n 1
 Hanya berkonsentrasi dengan kuatnya hubungan

Business Statistics, A First Course


(4e) © 2006 Prentice-Hall, Inc. Chap 3-38
Interpretasi Kovarians

 Kovarians antara dua variabel:

cov(X,Y) > 0 X dan Y bergerak ke arah yang sama


cov(X,Y) < 0 X dan Y bergerak ke arah yang berlawanan
cov(X,Y) = 0 X dan Y bersifat independen

Business Statistics, A First Course


(4e) © 2006 Prentice-Hall, Inc. Chap 3-39
Korelasi Koefisien
 Mengukur kuatnya hubungan linier antara dua
variabel secara relatif
 Koefisien Korelasi Sampel:

cov (X , Y)
r
SX SY
Dimana,

n n n
 (X  X)(Y  Y)
i i  (X  X) i
2
 (Y  Y )
i
2

cov (X , Y)  i1
SX  i1
SY  i1
n 1 n 1 n 1
Business Statistics, A First Course
(4e) © 2006 Prentice-Hall, Inc. Chap 3-40
Karakteristik dari Koefisien
Korelasi, r
 Memiliki jarak antara –1 dan 1
 Semakin mendekati -1, memiliki hubungan negatif yang
kuat
 Semakin mendekati 1, memiliki hubungan positif yang
kuat
 Semakin mendekati 0 memiliki hubungan yang lemah

Business Statistics, A First Course


(4e) © 2006 Prentice-Hall, Inc. Chap 3-41
Scatter Plots of Data dengan
Korelasi Koefisien yang Beragam
Y Y Y

X X X
r = -1 r = -.6 r=0

Y
Y Y

X X X
r = +1
Business Statistics, A First Course
r = +.3 r=0
(4e) © 2006 Prentice-Hall, Inc. Chap 3-42
Ringkasan Pengukuran Deskriptif
Numerik

 Analisis data yang objektif


 Harus dapat menampilkan kesimpulan berdasarkan
asumsi data yang ada
 Interpretasi data yang subjektif
 Harus dilakukan secara adil, netral dan sesuai kaidah

Business Statistics, A First Course


(4e) © 2006 Prentice-Hall, Inc. Chap 3-43
Contoh Soal
Bulan Promosi Penjualan
Januari 3 9
Februari 4 12
Maret 5 15
April 6 18
Mei 7 21
Juni 8 24
Juli 9 27
Agustus 10 30
September 12 36
Oktober 15 45
November 18 54

a. Hitung Five Number Summary/kelima indikator (nilai terkecil, Q1,


Q2/Mean, Q3, nilai terbesar) dari masing-masing data di atas
b. Bangun box-and-whisker plot dan jelaskan bentuk masing-masing data
c. Dari kedua data diatas (promosi dan penjualan), Manakah data yang
lebih homogen? ?
 Estimate the mean and the standard deviation of the
following frequency distribution showing the number of
times students eat at campus dining places in a month.

You might also like