2-1一維據分析

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 22

第二章數據分析

2-1 一維數據分析
林信安老師編寫

(甲)表達資料的統計量
表達資料的統計量可以用來描述資料的中心點與集中趨勢,此類的統計量常見的有算術
平均數、加權平均數、中位數、幾何平均數等。國中時曾學過算術平均數與中位數,用
以下例題來複習:
 算術平均數與中位數的意義:
設 n 個值分別為 x1,x2,…….xn,
1
(1)n 個值的算術平均數=n(x1+x2+…+xn)。

(2)將 n 個值分別為 x1,x2,…….xn,由小至大依序排列成 x(1)、x(2)、…、x(n)


當資料數為奇數(n=2k+1),中間那個數 x(k+1)為中位數。
x( k )  x( k 1)
當資料數為偶數(n=2k),中間兩個數 x(k)、xk+1)的算術平均數 為中位數。
2

中位數代表數據的中心點,大約會有 50%的資料大於中位數,50%的資料會小於中位數。
9  11
例如:3,5,6,9,11,13,20 的中位數為 9;3,5,6,9,11,13,20,30 的中位數為 =10。
2

[例題1] 強強高中的 9 位籃球隊員練習罰球,每人投 100 顆球,投中的球數如下: 25,


35,60,70,75,80,90,85,20。
求這 9 位隊員投中球數的平均數、中位數。
[解法]:
25  35  60  70  75  80  90  85  20
平均數= =60。
9
要求中位數,先將 9 個數據先依大小排序如下表:

因為有奇數比資料,故中間第 5 個數 70 為中位數。

一般來說,一筆資料的算術平均數比中位數更容易受極端值影響,例題 1 中雖然平均數
為 60,但是其實有 3 個人投 100 顆球進了 80、85、90 顆球,但是也有 3 個人投 100 顆
球進了 20、25、35 顆球,這 6 筆資料都與平均數 60 有段差距;另一方面,中位數 70 代
表約有一半的球員進球數大於(小於)等於 70,即使資料中 20 改為 15,20 改為 16 都不會
影響中位數 70,但是平均數會變成 59。

~211~
(2)算術平均數與中位數的特性:
(a)在任一數列中,各項數值與其算術平均數之差的總和為零。
(b)算術平均數公式簡單,計算容易,適於代數處理。
(c)算術平均數較中位數容易受極端度量影響,
(d)利用 Excel 計算算術平均數與中位數:

(練習1) 試求下列各資料的中位數:
(1)12,6,13,40,31 (2)5,16,4,11
Ans:(1)13 (2)8

[例題2] 若 x1,x2,…,xn 之算術平均數為X,若 yi=Axi+B(常以 Y=AX+B 表示)而


y1,y2,y3,…,yn 之算術平均數為Y,證明:Y =AX +B。

(練習2) 某班段考的數學成績經統計後,得到平均分數為 48 分,而且最高分也只有 60 分,


因此老師決定將每人的成績乘以 1.5 後,再加 10 分,求經此調整後,平均分數為
多少分。Ans:82

(練習3) 某一組資料為 N1 個,其平均值 y¯1;另一組資料 N2 個,其平均值 y¯2,則此兩組混合


後之平均值為
y1+y 2 y1+y 2 N1 y1+N 2 y 2 N1 y1+N 2 y 2
(A) (B) (C) (D) 。Ans:(C)
2 N1+N 2 N1+N 2 2

~212~
(練習4) 已知某籃球校隊五位先發球員的身高(公分)分別為 186, 188, 189, 191, 226, 求其
中位數與算術平均數。
Ans:算術平均數 196 公分,中位數 189 公分

 加權平均數:
設資料 xi 的權數為 wi,i=1,2,3,….,n,
n
則 x1,x2,…….xn 的加權平均數 W 定義為 W=  xi wi 。
i 1

為什麼要使用加權平均數?
統計資料中,如果每一筆資料的重要性不同,則必須使用加權來處理平均數。
例如:學生各科成績的重要性依上課時數的不同而異,此時若以各科成績的算術平均數
作為學生的學期總平均成績,顯然不適當,於是為了正確的表達評量標準,必須考慮各
科的授課時數而採用加權的方式來處理。

加權平均數的適用時機為何?
若各科平均數資料的重要性不同,則必須對各筆統計資料分別賦予一個對應的權數,再
利用加權平均數來表示母群體的性質。

[例題3] 小強本學期數學科的平常、第一次期中考、第二次期中考與期末考的分 數與其


所占的比重如下表。

試以比重為權數,計算小強的數學科學期成績。
[解答]:
學期成績=8420%+7520%+8820%+30%=85.4。

(練習5) 小安某次定期考試的科目與學分數如下表所示,

試以學分數所佔的比例當成權數計算小安此次考試分數的加權平均數。
Ans:73.5

~213~
 幾何平均數:
(1)定義:

一組正數資料 x1,x2,x3,……,xn 的幾何平均數(簡寫成 G.M.),定義為 G.M.= n x1 x 2    x n 。

62
實例:2,4,8,16,32 的幾何平均數為 5 215 =8,算術平均數為 5 。

(2)應用:
人類的經濟活動,常常要表達薪資、經濟指標、營業額、投資報酬率等每年的變化率,
我們在表達在一段時間內的變化率或成長率的平均值,常以幾何平均數來表示。
例如:某公司去年的銷售量比前年成長 20%,而今年的銷售額比去年衰退 20%,請問這
兩年間的平均銷售量為多少?
20%20%
[解法一]:用算術平均數,平均銷售量= 2 =0。

[解法二]:用幾何平均數
設前年的銷售量為 A,則去年的銷售量為 A(1+20%),
而今年的銷售量為 A(1+20%)(120%)=A(14%)=A96%。

換句話說,這兩年來的銷售是呈現衰退現象,如用算術平均數來表示的話,會得出今年
的銷售量與前年相同,這與實際的情形並不相同,因此用算術平均數無法表現出實際的
成長情形。如何計算這兩年的平均成長率呢?

設這兩年的平均成長率為 x,則去年的銷售量為 A(1+x),今年的銷售量為 A(1+x)2


 A(1+x)2= A(1+20%)(120%)

(1+x)2=1.20.8 1+x= 1.2  0.8 x= 0.96 1= 0.0202

所以這兩年的平均成長率為2.02%
(即銷售量成負成長,平均每年減少銷售量的 2.02%)。

結論:
若 n 年的成長率分別為 y1、y2、y3、…、yn,

則這 n 年的平均成長率為 n (1  y1 )(1  y 2 )    (1  y n ) 1。

~214~
[例題4] 台灣從 2012 年~2019 年經濟成長率的折線圖,如下表所示:

資料來源:
https://www.taipeiecon.taipei/econ_obs_cont.aspx?MmmID=3001&CatID=2&MSid=
2001
請計算這 8 年的平均經濟成長率。
[解法]:
8 年的平均經濟成長率
= 8 2.22  2.48  4.72 1.47  2.17  3.31 2.79  2.96 11.63(%)。

(練習6) 某公司民國 85 年營業額為 4 億元,民國 86 年營業額為 6 億元,該年的成長率為


50%。87、88、89 年三年的成長率皆相同,且民國 89 年的營業額為 48 億元。則該
公司 89 年的成長率為 %。
Ans:100 (2002 學科)

(練習7) 大明開設一公司,連續三年的成長率依序為10%,20%,60%,則此公司三年的年
成長率平均值為 。Ans:20%

(練習8) 新成立的某家公司,四年來的營業額依次為 242,271,264,306(單位:百萬


元),則每年平均成長率為 %。(利用計算機求至小數點後第一位)
Ans:8.1%

~215~
(乙)百分位數
 四分位數
了解大量的資料除了透過算術平均數與中位數之外,還可以把資料按大小大致上分成 4
個範圍,這些範圍的分界點分別是第一四分位數(Q1)、中位數(Me)與第三四分位數(Q3)。
全體資料中約有 25%的資料會小於等於 Q1,約有 50%的資料會小於等於 Me,全體資料
中約有 75%的資料會小於等於 Q3,因此算出 Q1、Me、Q3 就能更了解整個資料的分布情
形。
舉例說明如何計算 Q1 與 Q3
例一:
280 位成人在休息狀態時每分鐘的呼吸次數分配如下表。

呼吸次數 15 16 17 18 19 20 21
人數 16 31 48 81 67 34 3

將上述表格的數據依序排成 x1x2….x279x280
25 x x 17  17
計算 Q1:280 =70 為整數,Q1= 70 71 = =17。
100 2 2
75 x x 19  19
計算 Q3:280 =210 為整數,Q3= 210 211 = =19。
100 2 2
例二:
某校 250 位學生,每位各投籃 6 次,他們的進球數如下表。
進球數 0 1 2 3 4 5 6
人數 3 39 48 60 35 38 27

將上述表格的數據依序排成 x1x2….x249x250
25
計算 Q1:250 =62.5 不為整數,Q1= x(62.5整數部分)+1 =x63=2。
100
75
計算 Q3:280 =187.5 為整數,Q3= x(187.5整數部分)+1 =x188=5。
100

~216~
 百分位數
下圖是 37 歲男童生長曲線的百分位圖,根據百分位圖,5 歲男童身高的 85 百分位數是
115 公分,這是甚麼意思呢?

將大量資料按大小分成四等分,其範圍的分界點為 Q1、Me 與 Q3 時,若要更進一步了解


資料的分布,可以將資料按大小分成 100 等分,其分界點由小至大為 P1、P2、…、P99。
稱 Pk(k=1,2,…,99)稱為第 k 百分位數。
定義:
若 x1 , x2 , …,xn 是 n 筆由小排到大的數據資料,設 Pk 為第 k 百分位數,(k=1,2,…,99)
則 Pk 須滿足下列條件:
「至少有 k%的資料小於或等於 Pk 且至少有(100k)%的資料大於或等於 Pk。」

根據定義,可以得知 Q1 是 25 百分位數 P25、Me 是 50 百分位數、Q3 是 75 百分位數。


例如:考慮 2~100 的 50 個連續偶數,考慮 P20 與 P63。
如下圖所示:
至少 20%的資料P20 且至少 80%的資料P20,故 20、22 此範圍的數都滿足,習慣上,20
與 21 的平均數當作百分位數。

~217~
如下圖所示:
至少有 63%的資料P63 且至少有 37%的資料P63,只有 64 滿足此要求,故 P63=64。

百分位數的求法
若 x1 , x2 , …,xn 是 n 筆由小排到大的數據資料,第 k 百分位數 Pk 的求法如下:
k x x
(1)若 m=n  為整數,則此數據的第 k 百分位數 Pk= m m1 。
100 2
k
(2)若 m=n  不為整數,則此數據的第 k 百分位數 Pk= x( m的整數部分) +1 。
100

[例題5] 某職棒大聯盟 80 位球員 2015 年的打擊率由低至高排序如下表所示

求這 80 位球員打擊率的第 16 百分位數與第 45 百分位數。


[解法]:設 80 位球員的打擊率由低至高為 x1 , x2 , …, x80
16
(1)80 =12.8,故 P16=x13=0.25。
100
45 x x 0.275  0.276
(2)80 =36,故 P45= 36 37 = =0.2755。
100 2 2

[例題6] 280 位成人在休息狀態時每分鐘的呼吸次數分配如下表。

試求 P17 與 P60。
Ans:P17=17、P60=18

~218~
(練習9) 某校 250 位學生,每位各投籃 6 次,他們的進球數如下表。

求這 250 筆進球數數據的

(1)第 35 百分位數 P35 。(2)第 60 百分位數 P60 。Ans:(1)P35=84 (2)P60=3.5

(練習10) 270 位成人在休息狀態時每分鐘的呼吸次數分配如下表。

求這 270 筆數據的

(1)第 15 百分位數 P15 。

(2)第 80 百分位數 P80 。 Ans:(1) P15 =16 (2) P80 =19

(丙)表達資料分散趨勢的統計量
表達資料分散程度的統計量有全距、四分位距、變異數與標準差等,下面介紹變異數與
標準差
 變異數與標準差
差異量數中的全距與四分位距,都是根據統計資料中某特定兩點的距離而得,無法代表
全部資料的分散情形,且全距易受抽樣的影響,四分位距忽視前後百分之五十的資料。
標準差是以全部資料的算術平均數為中心,計算全部資料與算術平均數的平均距離,代
表整個資料的分散情形。

要表達一組資料的分散程度,很自然想到以資料離中心點多遠來表示。
設有一組資料 x1,x2,x3,……,xn,平均數為,則 xi稱為第 i 筆資料 xi 的離差。
1 n
因為  ( xi   ) =0,所以平均離差無法提供資料分散的程度。
n i 1
如何衡量數據與算術平均數的差異程度,進而提供資料分散的程度。

(1)變異數與標準差
一組資料 x1,x2,x3,……,xn 的變異數2 定義為數據離差平方的平均。
1 n
即2= 
n i 1
( xi   ) 2 ,為資料的算術平均數。

~219~
由於變異數的單位是資料單位的平方,(如本來單位是 cm,但變異數為 cm2),它必須開
方後才能與平均數、中位數等「集中」統計量做加、減等運算,因此常以變異數開方來
表示資料的分散程度,稱之為標準差。即

1 n
標準差= 變異數= 
n i 1
( xi   ) 2 。

1 n
變異數2= 
n i 1
( xi   ) 2

1
= [( x1   ) 2  ( x2   ) 2  ...  ( xn   )2 ]
n
1
= [( x12  x2 2  ...  xn 2 )  2( x1  x2  ...  xn )   n 2 ]
n
1
= [( x12  x2 2  ...  xn 2 )  2(n )   n 2 ]
n
1
= ( x12  x2 2  ...  xn 2 )   2
n
1 n 2
=( 
n i 1
xi )   2 (數據平方的平均數據平均的平方)

(2)標準差的特性:
(a)以算術平均數為中心的標準差,較任何其它的平均數為中心的標準差小。
(b)標準差的特性與算術平均數相同。
(c)標準差易於做代數運算。

[例題7] 試求 4 個數據:6,1,7,10 的算術平均數與標準差。


42
Ans:算術平均數 6,標準差= 3.24
2

10 10
2
[例題8] 有 10 個資料 x1,x2,……,x10,已知 Σ xi =155, Σ xi =2551,求其算術平均
i=1 i=1
數為___________,標準差為_________。
Ans:15.5;3.9

~2110~
1 n
 ( x  xk )2 為 x 的二次多項式,證明:
[例題9] 若 f ( x ) 
n k 1
當 x=時, f ( x) 有最小值2。其中與分別為算術平均數與標準差。

資料很龐大時,可以利用計算機求算術平均數與標準差等統計量
[例題10] 下表為 10 包洗衣精的重量(單位:公斤),測量數據準
確到 4 位有效數字。
利用 Excel 求此 10 個數據的算術平均數與標準差。
[解法]:
(1)將游標放在 B14,
在指令欄中輸入「=AVERAGE (B3:B12)」
就會在 B14 算出 10 個數據的算術平均數=1.3472。

(2)將游標放在 B16,
在指令欄中輸入「=STDEV.P(B3:B12)」
就會在 B16 算出 10 個數據的標準差=0.0075。
請注意用 Excel 算出來的算術平均數或標準差可能
只是近似值。

~2111~
(練習11) 下列五個直方圖表示的資料,何者之標準差最大? (2005 指定乙)

Ans:(4)

(練習12) 求下列各數的標準差:9,12,8,5 Ans:2.5

(練習13) 小安第一次月考六科的平均成績為 80 分,若已知其中五科的成績為


68,80,80,80,86,則其成績的標準差為 分。 Ans:6 分

(練習14) 設 n 個數據中有 k 個 1、其餘均為 0,試求此數據的算術平均數與標準差。


k k
Ans:算術平均數=n,標準差= p(1p) (p=n)

(練習15) 設連續正整數 1,2,3…,n 的標準差為 30,試求 n 的值。 Ans:19

(練習16) 下表示某個班級中 12 位同學某次定期考試的數學成績:

試利用 Excel 求這 12 位同學數學成績的算術平均數與標準差。


(四捨五入至小數點後第二位) Ans:算術平均數=74.25 分與標準差=12.22 分

~2112~
(丁)數據的平移與伸縮
 數據平移伸縮前後算術平均數與標準差的關係:
數據有時候會換單位,例如公分換算成英呎,公斤換算成磅等等,此時算術平均數與標
準差會有麼變化呢?
事實上,將一組數據中的各數據同乘以一個數(伸縮)或同加一個數(平移)後,其平
均數與標準差的變化如下:

n 筆數據 x1,x2,…,xn 的平均數為 μx,標準差為 σx,將每筆數據乘 a,再加 b 成另一組


數據 y1,y2,…,yn,即 yi=axi+b,i=1,2,…,n,
令 μy,σy 為 y1,y2,…,yn 的平均數與標準差。則下列結果成立:
(1) μy=aμx+b。
(2) σy=| a |.σx。
[證明]:
1 n 1
(1) μy= 
n i 1
yi = [(ax1  b)  (ax2  b)  ...  (axn  b)]
n
1 1
=a[ ( x1  x2  ...  xn ) ]+ (nb)=aμx+b。
n n
n
(2) (y  
i 1
i y ) 2 = [(ax1  b)  (a  x  b)  (ax2  b)  ( a x  b)   (axn  b)  (a  x  b)]2
n
=a2 [( x1   x ) 2  ( x2   x ) 2   ( xn   x ) 2 ] =  a 2 ( xi   x )2
i 1

1 n 2 1
n
1 n
所以  y = 
n i 1
( yi   y ) 2
= a ( 
n i 1
( xi   x ) 2
) =|a| 
n i 1
( xi   x )2 =|a|  x 。

[例題11] 測量一物件 9 次,得其長度(公尺)為 2.43,2.46,2.41,2.45,2.44,2.48,


2.46,2.47,2.45 將上面的數據每一個都乘以 100,再減去 240 得一組新的數距
為 3,6,1,5,4,8,6,7,5,問下列選項何者為真? (A)新數據的算術平均
數為 5 (B)新數據的標準差為 2 (C)原數據的算術平均數為 2.45 (D)原數據的
標準差為 0.2 (E)原數據的中位數為 2.45
Ans:(A)(B)(C)(E) (88 學科)

~2113~
[例題12] 有一組數據 x1,x2,…,x10 的平均數為 15,標準差為 0.3,現在將每筆數據減
xi-15
15,再除以 0.3,成為一組新數據 y1,y2,…,y10,即 yi= 0.3 ,i=1,
2,…,10。試求 y1,y2,…,y10 此筆數據的平均數與標準差。
Ans:0,1

(練習17) 某日每隔 2 小時量測室溫一次,得出結果如下表:

現在將室溫改以華氏表示,試問室溫數據的算術平均數與標準差為何?
9
華氏溫度(F)= 攝氏溫度(C)+32
5
Ans:算術平均數=78.8(F)、標準差=4.86(F)

(練習18) 已知 2021 筆數據 x1 , x2 , , x2021 的算術平均數為 4,標準差為 3,則:

(1) 3x1  5, 3x2  5, , 3x2021  5 的標準差為何?

(2) 3x12  25,3x2 2  25, ,3x20212  25 的算術平均數為何?

Ans:(1)9 (2) 100

 數據的標準化
數據的平移與伸縮最常見的是將數據調整成算術平均數為 0,標準差為 1 的新數據,我
們稱為數據標準化,數據標準化的做法如下:
xi-μ
令 xi 表第 i 筆原數據,而 xi表第 i 筆新數據,則 xi= σ ,

其中 μ,σ 是原數據的平均數與標準差,由於數據 xi 的平均數 μ 與標準差 σ 是同單位,


所以標準化後的 xi為無單位。轉換後的數據稱為標準分數或 z 分數。
數據轉換成標準分數其算術平均數為 0,標準差為 1。

~2114~
例如:5 位學生的成績如下:
35,45,50,55,65,算出平均分數μ=50,標準差σ=10,
35-50
第 1 位學生的標準分數為 x1= 10 =-1.5,
45-50
第 2 位學生的標準分數為 x2= 10 =-0.5 ,
其他三位學生標準分數分別為 0,0.5,1.5。
許多重要考試都會使用 T 分數,標準分數經過平移與伸縮可得 T 分數,
數據的 T 分數=50+10(數據的標準分數)
因此 T 分數的算術平均數為 50,標準差為 10。
[例題13] 小安第一次定期考試數學、國文成績,與該
班數學、國文算術平均數與標準差列表如
右:
(1)試求小安數學與國文成績的標準分數。
(2)將小安的數學與國文成績用 T 分數來表示。
(3)相對於全班的成績,請問小安數學與國文哪一科表現比較好?
Ans:(1)數學標準分數=1、國文標準分數=0.5
(2)數學 T 分數=60 分,國文 T 分數=45 分
(3)數學表現比較好

(練習19) 某班段考的數學與英文成績之平均數與標準
差如右表。已知班上小華此次段考數學成績
為 72 分,英文成績為 68 分,
(1)試求小華數學與英文成績的標準分數。
(2)將小華的數學與英文成績用 T 分數來表
示。
(3)相對於全班的成績,請問小安數學與英文哪一科表現比較好?
Ans:(1)數學標準分數=0.5、英文標準分數=0.8
(2)數學 T 分數=55 分,英文 T 分數=58 分
(3)英文表現較好。

~2115~
習題

基本題
1. 有 250 位同學參加數學競賽,其中一題證明題配分 7 分,他們此題得分 ( 單位:次 )
如下表。

求這 250 筆數據的
(1)第 35 百分位數 P35;(2)第 60 百分位數 P60;(3)第 1 四分位數 Q1;
(4)第 3 四分位數 Q3。

2. 已知某地區人口近三年每年的成長率分別為 10%, 21%與 33.1%,求此地區人口這三


年的平均成長率。
3. 某次數學測驗分為選擇題與非選擇題兩部分。下列的散佈圖中每個點(X,Y)分別代表
一位學生於此兩部分的得分, 其中 X 表該生選擇題的得分,Y 表該生非選擇題的得
分。設 Z= X+Y 為各生在該測驗的總分。
共有 11 位學生的得分數據。
試問以下哪些選項是正確的?

(1) X 的中位數 Y > 的中位數

(2) X 的標準差 Y > 的標準差

(3) X 的全距 Y > 的全距

(4) Z 的中位數= X 的中位數+ Y 的中位數


(2006 指定乙)
4. 下列 5 組資料(每組各有 10 筆)
A:1,1,1,1,1,10,10,10,10,10
B:1,1,1,1,1,5,5,5,5,5
C:4,4,4,5,5,5,5,6,6,6
D:1,1,2,2,3,3,4,4,5,5
E:1,2,3,4,5,6,7,8,9,10
試問哪一組資料的標準差最大?
(1)A (2)B (3)C (4)D (5)E

~2116~
5. 有 6 筆數據的算術平均為 20,若已知其中有 5 個數據為 8, 20, 20, 20, 26,則第六個
數據為 ,又標準差為 。
6. 民調公司調查該城市 1000 位公民對於某項議題的支持程度,結果有 400 位支持,而
有 600 位不支持;將支持的數據寫成 1,不支持的數據寫成 0,請問這 1000 筆數據
的變異數等於多少?
7. 玉山觀測站提供的 2018 年每月氣溫(℃)如下表。

利用電腦軟體 Excel,求玉山 2018 年氣溫的算術平均數與標準差。


(四捨五入到小數
點以下第 1 位)
8. 十位同學的身高如下:
155,156,158,158,160,160,161,163,163,166 單位公分 選出正確的選項:
(1)全距是 11 (2)中位數是 160 (3)四分位距是 6
(4)算術平均數是 160 (5)標準差大於 4。
9. 某班有 40 人參加考試,老師計算成績後得全班之平均分數為 51 分,標準差為 2
分,但教務處通知:考生阿牛因作弊,其原分數 40 分應改為 0 分。則這班同學考試
成績之真正標準差應為__________分。
10. 100 位同學參加某次考試,老師將考試的分數開平方根乘以 10 作為調整,已知調整
後成績的算術平均數為 65 分,標準差為 15 分,試求未調整前分數的算術平均數。
11. 有 9 位學員,分別測量會議桌的長度 ( 單位:公尺 ) 分別是
1.43 , 1.45 , 1.42 , 1.44 , 1.46 , 1.45 , 1.46 , 1.48 , 1.46
a
則這 9 個數據 (1) 求算術平均數。 (2) 標準差為 公尺,求 a=?
300
12. 一個 41 人的班級某次數學考試,每個人的成績都未超過 59 分。老師決定以下列方
x 1
式調整成績:原始成績為 x 分的學生,新成績調整為 40 log 10 ( )  60 (四捨五入到
10
整數)。請選出正確的選項。
(1)若某人原始成績是 9 分, 則新成績為 60 分
(2)若某人原始成績超過 20 分, 則其新成績超過 70 分
(3)調整後全班成績的全距比原始成績的全距大
(4)已知小文的原始成績恰等於全班原始成績的中位數, 則小文的新成績仍然
等於調整後全班成績的中位數
(5)已知小美的原始成績恰等於全班原始成績的平均,則小美的新成績仍然等
於調整後全班成績的平均。(四捨五入到整數) (2016 學科能力測驗)

~2117~
13. 某商店進一批水果,平均單價為每個 50 元,標準差為 10 元。今每個水果以進價的
1.5 倍為售價出售,則水果平均售價為每個 元,標準差為 元。
(2 0 1 0 指 考 乙 )
14. 某次期中考試,班上的數學成績不太理想,全班的平均分數為 40 分,標準差為 12
分,且全班的最高分為 72 分。數學老師決定將每位學生的原始成績 x 乘以 a 再加
b,調整為成績 y,即 y  ax  b 。已知調整後的成績 y 的最高分為 96 分,且平均數
為 60 分。試求下列兩小題:
(1)求 a,b 的值。(2)求成績 y 的標準差

15. 下列關於 z 分數(標準分數)的敘述哪些是正確的?


(1)z 分數表示某數與中位數的距離是標準差的幾倍。
(2)z 分數一定是正數。
(3)z 分數常用來比較不同單位之量數間的大小。
(4)將整組數據標準化後所得的新數據,其標準差為 1。
(5)將整組數據標準化後所得的新數據,其算術平均數為 0。

16. 設 n 筆數據 x1 , x2 ,, xn 的算術平均數為  x ,標準差為  x ,則

xi- x
yi= (1  i  n)的算術平均數為  y ,標準差為  y ,證明:
σx

(1) y1  y2    yn  0 (2) y12  y2 2    yn 2  n 。

17. 小明參加某次國文、英文、數學、自然、社會五個科目的測驗,每一科的分數均為
0~100 分。已知小明國英數三科的分數分別為 75,80,85 分。試問下列哪些選項會讓
小明五科成績的平均不低於 80 分且五科標準差不大於 5 分?

1 n
(註:標準差= 
n i 1
( xi   ) 2 ,其中為平均數。)

(1) 自然 75 分,社會 80 分
(2) 自然與社會兩科皆為 80 分
(3) 自然與社會的平均 85 分
(4) 自然與社會兩科之和不低於 160 分且兩科差距不超過 10 分
(5) 自然與社會的分數都介於 80 與 82 分之間。 (2017 指考乙)
18. 高一某班 50 名同學的期中考數學成績,中位數為 74 分,算術平均數為 75.2 分,眾
數 75 分,現在發現小明的成績應為 76 分誤登記為 86 分,試問下列哪些統計量不會
改變?
(1)算術平均數 (2)中位數 (3)全距 (4)標準差 (5)第 1 四分位數。

~2118~
19. 下列哪些敘述是正確的?
(1)在十個數據中加入一個新的數據 30 後,所得的算術平均數會增加 3。
(2)若所有數據的值都相等,則其標準差為 0。

(3)若數據 xi 與數據 yi 的關係式為 yi  4 xi  2 ,則  y  4 x 。

(4)一組數據的中位數一定大於或等於它的平均數。
(5)一組數據的第一四分位數 Q1 為第二十五百分位數 P25。
20. 關於百分位數的敘述,選出正確的選項。
(1)任一組資料都恰有一個第 40 百分位數
(2)若將原資料每個數據分別乘以 3,
則原資料的第 40 百分位數乘以 3 也會是新資料的第 40 百分位數
(3)若將原資料每個數據分別加 3,
則原資料的第 40 百分位數加 3 也會是新資料的第 40 百分位數

(4)若有 A, B 兩組資料且其第 40 百分位數分別為 xA , xB ,

則 xA  xB 也是此兩組資料合併成一組後的第 40 百分位數

(5)任一組資料的第 40 百分位數必小於該組資料的算術平均數。

進階題
21. 某班有 48 名學生,某次數學考試之成績,經計算得算術平均數 70 分,標準差為 S
分。後來發現成績登記有誤,某甲得 80 分確誤記為 50 分,某乙得 70 分確誤記為
100 分,更正後重算得標準差為 S1 分,試問 S1 與 S 之間,有下列那一種大小關係?

1 n 1 n 2
(n 個數值 x1 , x2 , …,xn 的標準差為  i x
n i 1
( x   ) 2
=  xi   x 2 ,
n i 1

1 n
而  x =n  xi )
i 1

(A)S1<S5 (B)S5S1<S (C)S1<S (D)S<S1S+5 (E)S+5<S1

~2119~
1
22. 定義一組資料的第一十分位數 w1 為『至少有(含) 的資料不大於 w1 ,且至少有
10
9
(含) 的資料不小於 w1 』,試問下列敘述何者為真?
10
(1)任一組資料都恰有一個第一十分位數
(2)若將原資料每個數據分別乘以 5,則原資料的第一十分位數乘以 5 也會是新資料
的第一十分位數
(3)若將原資料每個數據分別加 5,則原資料的第一十分位數加 5 也是此新資料的
第一十分位數

(4)若有 A,B 兩組資料其第一十分位數分別為 w A , w B ,則 w A + w B 也是此兩組資料合

併成一組後的第一十分位數
(5)任一組資料的第一十分位數必小於該組資料之算術平均數 (2005 指考乙)
23. 下表為體育老師紀錄一年級與二年級男生吊單槓的次數,根據表格提供的資訊

試求
(1)一年級學生吊單槓次數的算術平均數與標準差。
(2)全體 300 位學生吊單槓次數的算術平均數與標準差。

~2120~
答案
1. (1)3 (2)3.5 (3)2 (4)4
2. 21%
3. (1)(2)(3)
4. (1)
5. 26;6

6. 0.24
7. 算術平均數為 4.9,標準差為 2.9。

8. (1)(2)(4)

9. 65 =8.06 分

10. 44.5
提示:設 x1 , x2 ,…,x100 為調整前的分數,調整後為 10 x1 , 10 x2 , …,10 x100
1
15= (10 x1  10 x2  ...  10 x100 )  652  x1  x2  ...  x100  652 =15
100
1
=100(x1+x2+…+x100)=44.5

11. (1)1.45 (2)26


(提示:可以將原數據乘上 100 減去 140 得到新數據,計算新數據的算術平均數與標
準差,再換成原數據的算術平均數與標準差)

12. (1)(2)(4)
[解法]:
(1)若某人原始成績是 9 分, 則新成績為 40log10(1)+60=60 分。
21
(2)若某人原始成績超過 20 分,則新成績>40log10(10)+60>40log2+60>70。

(3)當大家成績都一樣時,全距都不變。
x 1
(4)因為 y= 40 log 10 ( )  60 為遞增函數,故調整前後成績的順序不變。
10
(5)成績調整並不是線性變換,故(5)不正確。
13. 75; 15。

9
14. (1)a= 、b=15 (2)13.5
8

15. (3)(4)(5)

~2121~
16. [提示]:

(1)因為  y =0,所以 y1  y2    yn  0 。

1
(2)因為  y =1,且  y 2 = ( y12  y2 2    yn 2 )   y =1 y12  y2 2    yn 2  n 。
n

17. (2)(5)
[解法]:設自然與社會的分數為 a,b
75+80+85+a+b 240+a+b
= 5 = 5 80  a+b160。

注意標準差易受極端值影響
(1)錯誤, a+b=155<160
(2)正確,a=b=80,=80,容易得知225
(3)錯誤,例如 a=70,b=100,=82,2=49+4+9+144+324>25
(4)錯誤,例如 a=99,b=91,,=86,2=121+36+1+169+25>25
(5)正確,80a,b8280,觀察數據可以得知225。

18. (2)(5)
19. (2)(5)
20. (2)(3)
(5)反例 1,2,2,…,2(共有 99 個 2),<2=P40。

21. (B)
22. (2)(3)
23. (1) 算術平均數=5 次,標準差=1 次

(2) 算術平均數=6 次,標準差= 3 次

~2122~

You might also like