Machine Learning 3

SVM, unsupervised learning, dimensionality reduction

目錄

Support vector machines
Unsupervised learning
- K-means clustering
- DBSCAN

講師 Suzy （蘇西）

北資一六學術長

技能點：

Python
機器學習（機器在學習講師也在學習）
C++ 可以說是會跟不會差不多
養了兩四隻 Labubu

寶寶蘇西

Support Vector Machines

Unsupervised Learning

非監督式學習

K-means clustering

要把這些分類

K-means clustering

step 0. 設定 k = ?

step 1. 在 feature space 隨機給 k 個群心

step 2. 將每筆資料分類判給距離最近的那個群心

step 3. 每個群心內都會有被分類過來的資料，用這些資料更新一次新的群心。

K-means clustering

step 0. 設定 k = ?

step 1. 在 feature space 隨機給 k 個群心

step 2. 將每筆資料分類判給距離最近的那個群心

step 3. 每個群心內都會有被分類過來的資料，用這些資料更新一次新的群心。

K-means clustering

step 0. 設定 k = ?

step 1. 在 feature space 隨機給 k 個群心

step 2. 將每筆資料分類判給距離最近的那個群心

step 3. 每個群心內都會有被分類過來的資料，用這些資料更新一次新的群心。

用平均值找新的群心

K-means clustering

收斂條件：以隨機群心起始，找到的結果是一樣的

K-means clustering

DBSCAN

要把這些分類，

並找出離群值 (Outlier)

DBSCAN (Density-based spatial clustering of applications with noise)

step 0. 設定圈圈大小（MinPoints）

核心點 (Core Point)：在半徑內，包含自己至少有 MinPts 個點。
邊界點 (Border Point)：在半徑內點數少於 MinPts，但它落在某個核心點的半徑內。

DBSCAN (Density-based spatial clustering of applications with noise)

step 1. 標記每個點

step 2.

隨機選擇一個尚未被訪問過的核心點作為種子，建立一個新的分群（Cluster），並將這個核心點加入該分群中。

對於這些新加入的鄰近點，如果它們也是核心點，就繼續挖掘它們的半徑鄰近點，並同樣加入分群中。