選單
×
   ❮     
HTML CSS JAVASCRIPT SQL PYTHON JAVA PHP HOW TO W3.CSS C C++ C# BOOTSTRAP REACT MYSQL JQUERY EXCEL XML DJANGO NUMPY PANDAS NODEJS R TYPESCRIPT ANGULAR GIT POSTGRESQL MONGODB ASP AI GO KOTLIN SASS VUE DSA GEN AI SCIPY AWS CYBERSECURITY DATA SCIENCE
     ❯   

資料聚類

  • 聚類是相似資料的集合
  • 聚類是一種無監督學習
  • 相關係數描述了關係的強度。

聚類

聚類是基於相似性的資料集合。

圖上聚集在一起的資料點通常可以歸類到不同的聚類中。

在下面的圖中,我們可以區分出 3 個不同的聚類


識別聚類

聚類可以包含大量有價值的資訊,但聚類的形狀千差萬別,我們該如何識別它們呢?

兩種主要方法是

  • 使用視覺化
  • 使用聚類演算法

聚類

聚類是一種無監督學習

聚類試圖

  • 將相似的資料分組
  • 將不相似的資料歸入其他組

聚類方法

  • 密度法
  • 層次法
  • 劃分法
  • 基於網格法

密度法認為密集區域的點比低密度區域的點具有更多的相似性和差異性。密度法具有較高的準確性。它還能合併聚類。
兩種常用演算法是 DBSCAN 和 OPTICS。

層次法以樹狀結構形成聚類。新聚類是使用先前形成的聚類來建立的。
兩種常用演算法是 CURE 和 BIRCH。

基於網格法將資料構造成有限數量的單元格,形成網格狀結構。
兩種常用演算法是 CLIQUE 和 STING

劃分法將物件劃分為 k 個聚類,每個分割槽形成一個聚類。
一種常用演算法是 CLARANS。



相關係數

相關係數 (r) 描述了散點圖上 x/y 變數之間線性關係的強度和方向。

r 的值總是在 -1 和 +1 之間

-1.00完美下坡負線性關係。
-0.70強下坡負線性關係。
-0.50中等下坡負線性關係。
-0.30弱下坡負線性關係。
0無線性關係。
+0.30弱上坡正線性關係。
+0.50中等上坡正線性關係。
+0.70強上坡正線性關係。
+1.00完美上坡正線性關係。

完美上坡 +1.00:

完美下坡 -1.00:

'

強上坡 +0.61:

無關係:


×

聯絡銷售

如果您想將 W3Schools 服務用於教育機構、團隊或企業,請傳送電子郵件給我們
sales@w3schools.com

報告錯誤

如果您想報告錯誤,或想提出建議,請傳送電子郵件給我們
help@w3schools.com

W3Schools 經過最佳化,旨在方便學習和培訓。示例可能經過簡化,以提高閱讀和學習體驗。教程、參考資料和示例會不斷審查,以避免錯誤,但我們無法保證所有內容的完全正確性。使用 W3Schools 即表示您已閱讀並接受我們的使用條款Cookie 和隱私政策

版權所有 1999-2024 Refsnes Data。保留所有權利。W3Schools 由 W3.CSS 提供支援