深度學習 (DL)
深度學習革命始於 2010 年左右。
從那時起,深度學習解決了許多“無法解決”的問題。
深度學習革命並非由單一發現引起。它大概發生在幾個必要因素都已準備就緒之時:
- 計算機速度足夠快
- 計算機儲存足夠大
- 發明了更好的訓練方法
- 發明了更好的調優方法
神經元
科學家們一致認為,我們的大腦有 800 到 1000 億個神經元。
這些神經元之間有數千億個連線。

圖片來源:巴塞爾大學生物中心。
神經元(也稱神經細胞)是我們大腦和神經系統的基本單元。
神經元負責接收外部世界的輸入,傳送輸出(給肌肉的指令),以及處理其間的電訊號。
神經網路
人工神經網路通常被稱為神經網路 (NN)。
神經網路實際上是多層感知器。
感知器定義了進入多層神經網路的第一步。
神經網路是深度學習的精髓。
神經網路是歷史上最重要的發現之一。
神經網路可以解決無法透過演算法解決的問題
- 醫學診斷
- 人臉檢測
- 語音識別
神經網路模型
輸入資料(黃色)經過隱藏層(藍色)處理,再經過另一個隱藏層(綠色)修改,最終產生輸出(紅色)。

Tom Mitchell
Tom Michael Mitchell(生於 1951 年)是一位美國計算機科學家,卡內基梅隆大學(CMU)的大學教授。
他曾任 CMU 機器學習系的系主任。
E:經驗(出現的次數)。
T:任務(駕駛汽車)。
P:效能(好或壞)。
長頸鹿的故事
2015 年,倫敦帝國理工學院的學生Matthew Lai創造了一個名為Giraffe的神經網路。
Giraffe 經過 72 小時的訓練,就能以與國際象棋大師相同的水平下棋。
計算機下棋並不新鮮,但這個程式建立的方式是新的。
經典的國際象棋程式需要數年時間才能構建,而 Giraffe 使用神經網路在 72 小時內建成。
深度學習
經典程式設計使用程式(演算法)來產生結果
傳統計算
資料 + 計算機演算法 = 結果
機器學習使用結果來建立程式(演算法)
機器學習
資料 + 結果 = 計算機演算法
機器學習
機器學習通常被等同於人工智慧。
這是不正確的。機器學習是人工智慧的一個子集。
機器學習是人工智慧的一個學科,它使用資料來教導機器。
“機器學習是一個研究領域,它賦予計算機在不被程式設計的情況下學習的能力。”
Arthur Samuel (1959)
智慧決策公式
- 儲存所有動作的結果
- 模擬所有可能的結局
- 將新動作與舊動作進行比較
- 檢查新動作是好是壞
- 如果新動作較不壞,則選擇它
- 不斷重複
計算機能夠這樣進行數百萬次的事實,證明了計算機可以做出非常明智的決策。