SVM, unsupervised learning, dimensionality reduction
講師 Suzy (蘇西)
技能點:
寶寶蘇西
Support Vector Machines
Unsupervised Learning
非監督式學習
K-means clustering
要把這些分類
K-means clustering
step 0. 設定 k = ?
step 1. 在 feature space 隨機給 k 個群心
step 2. 將每筆資料分類判給距離最近的那個群心
step 3. 每個群心內都會有被分類過來的資料,用這些資料更新一次新的群心。
K-means clustering
step 0. 設定 k = ?
step 1. 在 feature space 隨機給 k 個群心
step 2. 將每筆資料分類判給距離最近的那個群心
step 3. 每個群心內都會有被分類過來的資料,用這些資料更新一次新的群心。
K-means clustering
step 0. 設定 k = ?
step 1. 在 feature space 隨機給 k 個群心
step 2. 將每筆資料分類判給距離最近的那個群心
step 3. 每個群心內都會有被分類過來的資料,用這些資料更新一次新的群心。
用平均值找新的群心
K-means clustering
收斂條件:以隨機群心起始,找到的結果是一樣的
K-means clustering
DBSCAN
要把這些分類,
並找出離群值 (Outlier)
DBSCAN (Density-based spatial clustering of applications with noise)
step 0. 設定圈圈大小 (MinPoints)
核心點 (Core Point):在 半徑內,包含自己至少有 MinPts 個點。
邊界點 (Border Point):在 半徑內點數少於 MinPts,但它落在某個核心點的半徑內。
DBSCAN (Density-based spatial clustering of applications with noise)
step 1. 標記每個點
step 2.
隨機選擇一個尚未被訪問過的核心點作為種子,建立一個新的分群(Cluster),並將這個核心點加入該分群中。
對於這些新加入的鄰近點,如果它們也是核心點,就繼續挖掘它們的半徑鄰近點,並同樣加入分群中。