一維數據分析

莊貴淳

代表數據的數

眾數

中位數

算術平均數

幾何平均數

1.

表示數據離散趨勢的數

全距

四分位距

標準差

2.

線性變換


3.

數據標準化

 

4.

代表數據的數

統計的常用代表數

如果我們有一個班的成績要統計...

90

70

30

10

90

58

平均

如果我們要統計一個國家的收入...

300

平均

200

100

100

100

1000

幾何平均數

算術平均數

中位數

眾數

90

70

30

10

90

眾數

眾數

出現次數最高

90

90

70

30

10

90

90

中位數

在中間位置的數字

70

90

70

30

10

90

中位數

在中間位置的數字

90

70

30

10

90

90

90

中位數

在中間位置的數字

90

70

30

10

90

90

90

+

80

2

中位數

在中間位置的數字

90

70

30

10

90

90

90

80

90

70

30

10

90

90

90

80

若數量n為偶數

k=\frac{n}{2}

中位數是

\frac{x_k+x_{k+1}}{2}

70

90

70

30

10

90

n為奇數

k=\frac{n+1}{2}

中位數是

\frac{x_k+x_{k+1}}{2}

算術平均數

90

70

30

10

90

58

平均

算術平均數

90

70

30

10

90

\mu = \frac{1}{n}(x_1+x_2+...+x_n) = \frac{1}{n} \sum_{k=1}^{n}x_i

幾何平均數

90

70

30

10

90

G = \sqrt[n]{x_1*x_2......*x_n}

平均成長率

當n年的成長率分別為

r_1, r_2, r_3, ..., r_n
G = \sqrt[n]{(1+r_1)(1+r_2......(1+r_n)}

幾何平均數

G = \sqrt[n]{x_1*x_2......*x_n}

平均成長率

當n年的成長率分別為

r_1, r_2, r_3, ..., r_n
G = \sqrt[n]{(1+r_1)(1+r_2)......(1+r_n)}

代表數據的數

例題

求數值

3, 2, 3, 7, 5, 3, 6, 4, 1, 3, 6, 8

的眾數與中位數

眾數 3,中位數 3.5

眾數 7,中位數 6

某班參加英文能力檢定的成績

 

求眾數與中位數

級分3456789
人數1654821

1, 2, 3, 4, 5, 5, 7, 7, 7, 9

十個數據的算術平均數

算術平均數 5

擲一骰子 100 次﹐將其結果記錄如下表

 

求此資料的算術平均數﹒

算術平均數 3.4

級分123456
人數102520201015

某班段考成績如下﹐求算術平均數

算術平均數 67

分數30~4040~5050~6060~7070~8080~9090~100合計
人數57671010550

以分組數據用組中點代表該組數據

如圖是高二學生 100 人數學考試成績的累積次數分配曲線圖。假設各組內的次數都平均分布在組距內﹐求算術平均數。

算術平均數 64.5

某公司統計其產品 4 年來的銷售量成長率分別為10%﹐21%﹐21%﹐33.1%﹐求這 4 年銷售量的平均成長率。(列式)

21%

已知股票每天最大漲跌幅為前一日的

正負7%。某股票漲停 2 天又跌停 2 天﹐
求此股票 4 天的平均漲跌幅。(列式)

-0.25%

表示數據離散趨勢的數

全距、四分位距

級分3456789
人數1654821

全距

9-3
6
級分3456789
人數1654821

四分位距

第一四分位數

第三四分位數

Q_1
Q_3
級分3456789
人數1654821
Q_i
k_i=\frac{i}{4}\times n , i=1, 2, 3, ...

是整數

Q_i= \frac{第 k_i 個位置的值 + 第 k_{i+1} 個位置的值}{2}
Q_i= 比 k_i 大的下一個整數位置所對應的數 值

不是整數

級分3456789
人數1654821
Q_1
k_1=\frac{1}{4}\times 27
= \frac{27}{4}

不是整數

7
Q_i
k_i=\frac{i}{4}\times n , i=1, 2, 3, ...
級分3456789
人數1654821
Q_1
=
4
Q_3
k_3=\frac{3}{4}\times 27
= \frac{81}{4}

不是整數

22
級分3456789
人數1654821
Q_1
=
4
Q_3
=
7
IQR
=

四分位距

級分3456789
人數1654821
=
=
Q_1
4
Q_3
IQR
=
=
-
7

四分位距

級分3456789
人數1654821
Q_1
4
3
Q_3
IQR
=
=
=
-
-
7

四分位距

表示數據離散趨勢的數

例題

求數值

 

的全距與四分位距

全距 7,四分位距 3.5

3, 2, 3, 7, 5, 3, 6, 4, 1, 3, 7, 8

表示數據離散趨勢的數

標準差

x_1, x_2, ..., x_n
\mu
\sigma^2 = \frac{1}{n} \sum_{i=1}^{n}(x_i-\mu)^2
\sigma = \sqrt{\frac{1}{n} \sum_{i=1}^{n}(x_i-\mu)^2}
= \sqrt{\frac{1}{n} \sum_{i=1}^{n}x_i^2-\mu^2}
x_1
x_2
x_3
x_4
x_5
x_6
x_7
\mu
\mu
\mu
\mu
\mu
\mu
\mu
\mu
-
-
-
-
-
-
-

離均差

\sigma= \sqrt{\frac{1}{n} \sum_{i=1}^{n}x_i^2-\mu^2}

平方的平均 - 平均的平方

\sigma = \sqrt{\frac{1}{n} \sum_{i=1}^{n}(x_i-\mu)^2}
= \sqrt{\frac{1}{n} \sum_{i=1}^{n}x_i^2-\mu^2}

有什麼意義?

10 10 10 90 90 90

50

50 50 50 50 50 50

表示數據離散趨勢的數

例題

求數值

 

的算術平均數、變異數和標準差

算術平均數 3,變異數 2,標準差 2

1,2,3,4,5,6,7,8,9

某班50人的數學成績

求算術平均數;設標準差為     ,求 k 的值

分數30~4040~5050~6060~7070~80
人數51010205

以分組數據用組中點代表該組數據

\sqrt{k}
57, 136

某公司 40 名員工的薪資(萬元)

求薪資的算術平均數與標準差

數值0~22~44~66~8
次數714118
\mu = 4, \sigma=2

求下表數據的全距﹑四分位距及標準差。

數值1357
次數7351
全距 6, 四分位距IQR= 4, \sigma=2

某射擊小組有六人﹐今各射擊 5 發﹐各人命中數分別為 4, 1, 4, 3, 2, 4 發﹐若 a 表
其算術平均數﹐ b 表其眾數﹐ c 表其中位數﹐ d 表其幾何平均數﹐ e 表標準差﹐
則 a ﹑ b ﹑ c ﹑ d 與 e 的大小關係為何﹖

a=3,b=4,c=3.5,d=\sqrt[6]{384}<3, e=\sqrt[6]{\frac{64}{27}}
b>c>a>d>e

有 10 個數據﹐

其中 6 個數的算術平均數為 9﹐標準差為 3;

剩餘 4 個數的算術平均數為 4﹐標準差為 2﹐

求全部 10 個數的算術平均數及標準差

\mu = 7, \sigma=\sqrt{13}

已知 10 個人的數學成績﹐成績的算術平均數為 62 分﹐標準差為 10 分。

但因甲生違背考場規則﹐其成績 80 分須由 10 個成績中剔除。

求成績更改後﹐9 個成績的算術平均數與標準差。

\mu = 60, \sigma=\frac{8\sqrt{10}}{3}

線性變換

x_1, x_2, ..., x_n
\overline{x}
Me(x)
R(x)
IQR(x)
S_x
\times a + b
?
?
?
?
?

數據

平均數

中位數

全距

四分位距

標準差

y_1, y_2, ..., y_n
\overline{y}
Me(y)
R(y)
IQR(y)
S_y
x_1, x_2, ..., x_n
\overline{x}
Me(x)
R(x)
IQR(x)
S_x
\times a + b
\times a +b
\times a+b
\times|a|
\times|a|
\times|a|

數據

平均數

中位數

全距

四分位距

標準差

y_1, y_2, ..., y_n
\overline{y}
Me(y)
R(y)
IQR(y)
S_y
\overline{x} = \frac{1}{n}(x_1+x_2+...+x_n) = \frac{1}{n} \sum_{k=1}^{n}x_i
\overline{y}= \frac{1}{n}((ax_1+b)+(ax_2+b)+...+(ax_n+b))
=\frac{1}{n}((ax_1+ax_2+...+ax_n)+b\times n)
= a\frac{x_1+x_2+...+x_n}{n}+b
= a\overline{x}+b
1,2,3,4,5
\times 2 +1
3,5,7,9,11
Me(y)=aMe(x)+b
x_1, x_2, ..., x_n
(ax_1+b), (ax_2+b), ..., (ax_n+b)
R(x)=x_n-x_1
R(y)=(ax_n+b)-(ax_1+b)
=ax_n+b-ax_1-b
=a(x_n-x_1)
=aR(x)
1,2,3,4,5
\times 2 +1
3,5,7,9,11
R(y)=aR(x)
5-1=4
11-3=8
x_1, x_2, ..., x_n
(ax_1+b), (ax_2+b), ..., (ax_n+b)
IQR(x)=Q_3-Q_1
IQR(y)=Q_3^\prime-Q_1^\prime
=aQ_3+b-aQ_1-b
=a(Q_3-Q_1)
=aIQR(x)
1,2,3,4,5
\times 2 +1
3,5,7,9,11
k_1=\frac{1}{4}\times 5 = 1.25
Q_1 = 5
k_3=\frac{3}{4}\times 5 = 3.75
Q_3 = 9
IQR(x)=2
Q_1 = 2
Q_3 = 4
1,2,3,4,5
\times 2 +1
3,5,7,9,11
k_1=\frac{1}{4}\times 5 = 1.25
Q_1 = 5
k_3=\frac{3}{4}\times 5 = 3.75
Q_3 = 9
IQR(x)=2
Q_1 = 2
Q_3 = 4
IQR(x)=4
1,2,3,4,5
\times 2 +1
3,5,7,9,11
k_1=\frac{1}{4}\times 5 = 1.25
Q_1 = 5
k_3=\frac{3}{4}\times 5 = 3.75
Q_3 = 9
IQR(x)=2
Q_1 = 2
Q_3 = 4
IQR(x)=4
x_1, x_2, ..., x_n
(ax_1+b), (ax_2+b), ..., (ax_n+b)
\overline{x}
\sigma_y^2 = \frac{1}{n}\sum_{i=1}^{n}(y_i-\overline{y})^2
= \frac{1}{n}\sum_{i=1}^{n}((ax_i+b)-(a\overline{x}+b))^2
\overline{y} = a\overline{x}+b
= \frac{1}{n}\sum_{i=1}^{n}a^2(x_i-\overline{x})^2
= a^2 \sigma_x^2
x_1, x_2, ..., x_n
(ax_1+b), (ax_2+b), ..., (ax_n+b)
\overline{x}
\sigma_y^2
\overline{y} = a\overline{x}+b
= a^2 \sigma_x^2
\sigma_y= |a| \sigma_x

線性變換

例題

Bento

By sbincer32