Multiclass Classification, Cross validation
講師 Suzy (蘇西)
技能點:
寶寶蘇西
Classification 分類問題
I. Binary 二元分類
II. Multi-class 多類別分類
Softmax function
:thonk_owo:
ok 我們要分類
ok 我們要分類
one hot vector: 把變數變得更單純,只把我們要的變數值設為「1」,
其他變數值設為「0」
數學小知識:向量內積
例:
假設今天有一筆資料
算機率
算機率
Naive Bayes
貝氏分類器
正常信件
垃圾郵件
分類
正常信件
垃圾郵件
你好
朋友
吃飯
建北
電資
沒錢
匯款
你好
朋友
吃飯
建北
電資
沒錢
匯款
統計字詞出現次數
8
7
5
2
1
1
3
2
1
6
7
8
統計字詞出現次數
正常信件
你好
朋友
吃飯
建北
電資
沒錢
匯款
8
7
5
2
1
1
垃圾郵件
你好
朋友
吃飯
建北
電資
沒錢
匯款
統計字詞出現次數
3
2
1
6
7
8
Prior Probability
事前機率
根據 training data (無其他資訊)的情況下,預估可能是 normal 或 spam 的機率。
根據 training data (無其他資訊)的情況下,預估可能是 normal 或 spam 的機率。
training data: 8 封 normal 4 封 spam
信件內容:「早安朋友」
信件內容:「早安,建北電資我的朋友。我沒錢,能匯款嗎」
Gaussian Naive Bayes
Decision trees
決策樹 🌲
類似這種東西
電神
電神
不是電神
不是電神
不是電神
不是電神
電神
會競程
會音遊(?
睡眠時間
我們要決定哪個決策要素要放在上面的 node
吉尼不純度 Gini Impurity
Cross validation
交叉驗證