ML 術語
- 關係
- 標籤
- 功能
機器學習關係
機器學習系統利用輸入之間的關係來產生預測。
在代數中,關係通常寫成y = ax + b
- y 是我們想要預測的標籤
- a 是線的斜率
- x 是輸入值
- b 是截距
在機器學習中,關係寫成y = b + wx
- y 是我們想要預測的標籤
- w 是權重(斜率)
- x 是特徵(輸入值)
- b 是截距
機器學習標籤
在機器學習術語中,標籤是我們想要預測的事物。
它類似於線性圖中的y
代數 | 機器學習 |
y = ax + b | y = b + wx |
機器學習特徵
在機器學習術語中,特徵是輸入。
它們類似於線性圖中的x 值
代數 | 機器學習 |
y = ax + b | y = b + wx |
有時會有許多具有不同權重的特徵(輸入值)
y = b + w1x1 + w2x2 + w3x3 + w4x4
- 機器學習模型
- 機器學習訓練
- 機器學習推理
- 機器學習階段
機器學習模型
模型定義了標籤 (y) 和特徵 (x) 之間的關係。
模型生命週期有三個階段
- 資料收集
- 訓練
- 推理
機器學習訓練
訓練的目標是建立一個能夠回答問題的模型。例如,房子的預期價格是多少?
機器學習推理
推理是指訓練好的模型用於使用即時資料推斷(預測)值。例如,將模型投入生產。
機器學習階段
機器學習有兩個主要階段
1. 訓練
使用輸入資料計算模型的引數。
2. 推理
“訓練好的”模型會從任何輸入中輸出正確的資料。
- 監督機器學習
- 無監督機器學習
- 自監督機器學習
監督學習
監督機器學習使用一組輸入變數來預測輸出變數的值。
監督學習使用帶標籤的資料(已知答案的資料)來訓練演算法以
- 分類資料
- 預測結果
監督學習可以根據已知的垃圾郵件示例對資料進行分類,例如“電子郵件中的垃圾郵件是什麼”。
監督學習可以預測結果,例如根據您觀看過的影片預測您可能喜歡的影片型別。
無監督學習
無監督機器學習使用來自任何無標籤資料集的模式,試圖理解資料中的模式(或分組)。
無監督學習用於預測未定義的關聯,例如資料中有意義的模式。
它旨在建立能夠自我改進的計算機演算法。
預計機器學習將轉向無監督學習,以便程式設計師無需建立模型即可解決問題。
強化學習
強化學習基於無監督學習,但會從使用者那裡接收關於決策是好是壞的反饋。反饋有助於改進模型。
自監督學習
自監督學習與無監督學習相似,因為它使用沒有人工新增標籤的資料。
區別在於,無監督學習使用聚類、分組和降維,而自監督學習則自己得出迴歸和分類任務的結論。