Machine Learning 3

SVM, unsupervised learning, dimensionality reduction

目錄

  • Support vector machines 
  • Unsupervised learning
    • K-means clustering
    • DBSCAN

講師  Suzy (蘇西)

  • 北資一六 學術長

 

技能點:

  • Python
  • 機器學習  (機器在學習講師也在學習)
  • C++ 可以說是會跟不會差不多
  • 養了 兩  四隻 Labubu

寶寶蘇西

Support Vector Machines

Unsupervised Learning

非監督式學習

K-means clustering

要把這些分類

K-means clustering

step 0. 設定 k = ?

 

step 1. 在 feature space 隨機給 k 個群心

 

step 2. 將每筆資料分類判給距離最近的那個群心

 

step 3. 每個群心內都會有被分類過來的資料,用這些資料更新一次新的群心。

 

 

 

K-means clustering

step 0. 設定 k = ?

 

step 1. 在 feature space 隨機給 k 個群心

 

 

 

 

 

step 2. 將每筆資料分類判給距離最近的那個群心

 

 

 

 

step 3. 每個群心內都會有被分類過來的資料,用這些資料更新一次新的群心。

 

K-means clustering

step 0. 設定 k = ?

 

step 1. 在 feature space 隨機給 k 個群心

 

 

 

 

 

step 2. 將每筆資料分類判給距離最近的那個群心

 

 

 

 

step 3. 每個群心內都會有被分類過來的資料,用這些資料更新一次新的群心。

 

用平均值找新的群心

 

K-means clustering

收斂條件:以隨機群心起始,找到的結果是一樣的

 

K-means clustering

DBSCAN

要把這些分類,

並找出離群值 (Outlier)

DBSCAN (Density-based spatial clustering of applications with noise)

step 0. 設定圈圈大小 (MinPoints)

 

  • 核心點 (Core Point):在  半徑內,包含自己至少有 MinPts 個點。

  • 邊界點 (Border Point):在 半徑內點數少於 MinPts,但它落在某個核心點的半徑內。

DBSCAN (Density-based spatial clustering of applications with noise)

step 1. 標記每個點

 

step 2.

隨機選擇一個尚未被訪問過的核心點作為種子,建立一個新的分群(Cluster),並將這個核心點加入該分群中。

 

對於這些新加入的鄰近點,如果它們也是核心點,就繼續挖掘它們的半徑鄰近點,並同樣加入分群中。