機器學習

機器學習是人工智慧的一個分支。人工智慧的研究歷史有著一條從以「推理」為重點，到以「知識」為重點，再到以「學習」為重點的自然、清晰的脈絡。顯然，機器學習是實現人工智慧的一個途徑之一，即以機器學習為手段，解決人工智慧中的部分問題。機器學習在近30多年已發展為一門多領域科際整合，涉及機率論、統計學、逼近論、凸分析、計算複雜性理論等多門學科。

機器學習理論主要是設計和分析一些讓電腦可以自動「學習」的演算法。機器學習演算法是一類從資料中自動分析獲得規律，並利用規律對未知資料進行預測的演算法。因為學習演算法中涉及了大量的統計學理論，機器學習與推論統計學聯絡尤為密切，也被稱為統計學習理論。演算法設計方面，機器學習理論關注可以實現的，行之有效的學習演算法（要防止錯誤累積）。很多推論問題屬於非程式化決策，所以部分的機器學習研究是開發容易處理的近似演算法。

機器學習已廣泛應用於資料探勘、電腦視覺、自然語言處理、生物特徵辨識、搜尋引擎、醫學診斷、檢測信用卡詐騙（英語：Credit card fraud）、證券市場分析、DNA序列定序、語音和手寫辨識、遊戲和機器人等領域。

定義

機器學習有下面幾種定義：

機器學習是一門人工智慧的科學，該領域的主要研究物件是人工智慧，特別是如何在經驗學習中改善具體演算法的效能。
機器學習是對能通過經驗自動改進的電腦演算法的研究。
機器學習是用資料或以往的經驗，以此最佳化電腦程式的效能標準。

電腦科學家Tom M. Mitchell（英語：Tom M. Mitchell）在其著作的Machine Learning一書中定義的機器學習為：A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.^[1]

分類

機器學習可以分成下面幾種類別：

監督學習從給定的訓練資料集中學習出一個函數，當新的資料到來時，可以根據這個函數預測結果。監督學習的訓練集要求是包括輸入和輸出，也可以說是特徵和目標。訓練集中的目標是由人標註的。常見的監督學習演算法包括迴歸分析和統計分類。

監督學習和非監督學習的差別就是訓練集目標是否有人為標註。他們都有訓練集且都有輸入和輸出

無監督學習與監督學習相比，訓練集沒有人為標註的結果。常見的無監督學習演算法有生成對抗網路（GAN）、聚類。
半監督學習介於監督學習與無監督學習之間。
強化學習機器為了達成目標，隨著環境的變動，而逐步調整其行為，並評估每一個行動之後所到的回饋是正向的或負向的。^[2]

演算法

具體的機器學習演算法有：

構造間隔理論分布：聚類分析和圖型識別
- 類神經網路
- 決策樹
- 感知器
- 支援向量機
- 整合學習 AdaBoost
- 降維與度量學習
- 聚類
- 貝氏分類器
構造條件機率：迴歸分析和統計分類
- 高斯過程迴歸
- 線性判別分析
- 最近鄰居法
- 徑向基函數核
通過再生模型構造機率密度函數：
- 最大期望值演算法
- 機率圖模型：包括貝氏網路和Markov隨機場
- Generative Topographic Mapping
近似推斷技術：
最佳化：大多數以上方法，直接或者間接使用最佳化演算法。
量子機器學習

軟體

包含各種機器學習演算法的軟體套裝包括：

免費開源軟體

Caffe
Deeplearning4j
DeepSpeed
ELKI
Google JAX
Infer.NET
Keras
Kubeflow
LightGBM
Mahout
Mallet
Microsoft Cognitive Toolkit
ML.NET
mlpack
MXNet
OpenNN
Orange
pandas (software)
ROOT (TMVA with ROOT)
scikit-learn
Shogun
Spark MLlib
SystemML
TensorFlow
Torch / PyTorch
Weka / MOA
XGBoost
Yooreeka

Python軟體庫及框架

參考文獻

參照

[1]
Tom M. Mitchell. Machine Learning. McGraw-Hill. 1997年3月: 第2頁. ISBN 0070428077 （英語）.
[2]
林東清. 资讯管理：e化企业的核心竞争能力七版. 台北市: 智勝文化. 2018年8月: 第118頁. ISBN 9789864570478 （中文）.

來源

書籍

Bishop, C. M. (1995). 《圖型識別神經網路》，牛津大學出版社. ISBN 0-19-853864-2.
Bishop, C. M. (2006). 《圖型識別與機器學習》，Springer. ISBN 978-0-387-31073-2.
Richard O. Duda, Peter E. Hart, David G. Stork (2001). 《模式分類》（第2版）, New York: Wiley. ISBN 0-471-05669-3.
MacKay, D. J. C. (2003). 《資訊理論、推理和學習演算法》（頁面存檔備份，存於網際網路檔案館），劍橋大學出版社. ISBN 0-521-64298-1
Mitchel.l, T. (1997). 《機器學習》, McGraw Hill. ISBN 0-07-042807-7
Sholom Weiss, Casimir Kulikowski (1991). Computer Systems That Learn, Morgan Kaufmann. ISBN 1-55860-065-5.

外部連結

UCI description （頁面存檔備份，存於網際網路檔案館）
機器學習軟體Weka （頁面存檔備份，存於網際網路檔案館）
Pablo Castro首頁（頁面存檔備份，存於網際網路檔案館）
機器學習網郵寄清單（頁面存檔備份，存於網際網路檔案館）
機器學習和自然語言處理-弗萊堡大學（頁面存檔備份，存於網際網路檔案館）
機器學習和資料探勘，生物資訊學小組，慕尼黑工業大學
機器學習和生物計算-Bristol大學（頁面存檔備份，存於網際網路檔案館）
機器學習和應用統計學@微軟研究
機器學習研究月刊（頁面存檔備份，存於網際網路檔案館）
機器學習期刊（頁面存檔備份，存於網際網路檔案館）
機器學習-Kmining，資料探勘和KDD科學參考（頁面存檔備份，存於網際網路檔案館）
Book "智慧型系統社群" by Walter Fritz
開放目錄專案（頁面存檔備份，存於網際網路檔案館）
機器學習論文-CiteSeer （頁面存檔備份，存於網際網路檔案館）
Orange，使用Python手稿語言的機器學習組件和視覺化編程介面（頁面存檔備份，存於網際網路檔案館）

參見

人工智慧
生成式人工智慧
深度學習
遷移學習
微調 (深度學習)
強化學習
貝氏學習
隨機森林
決策樹
計算學習理論
提示工程
計算智慧型
資料探勘
圖型識別
機器學習方面重要出版物（電腦科學）
機器學習方面重要出版物（統計學）
自主控制機器人
歸納邏輯編程
神經網路
最近鄰居法
機器學習控制
量子機器學習

[1] [1]
Tom M. Mitchell. Machine Learning. McGraw-Hill. 1997年3月: 第2頁. ISBN 0070428077 （英語）.

[2] [2]
林東清. 资讯管理：e化企业的核心竞争能力七版. 台北市: 智勝文化. 2018年8月: 第118頁. ISBN 9789864570478 （中文）.

[1]

[2]