機器學習人工智慧的一個分支。人工智慧的研究歷史有著一條從以「推理」為重點,到以「知識」為重點,再到以「學習」為重點的自然、清晰的脈絡。顯然,機器學習是實現人工智慧的一個途徑之一,即以機器學習為手段,解決人工智慧中的部分問題。機器學習在近30多年已發展為一門多領域科際整合,涉及機率論統計學逼近論凸分析計算複雜性理論等多門學科。

機器學習理論主要是設計和分析一些讓電腦可以自動「學習」的演算法。機器學習演算法是一類從資料中自動分析獲得規律,並利用規律對未知資料進行預測的演算法。因為學習演算法中涉及了大量的統計學理論,機器學習與推論統計學聯絡尤為密切,也被稱為統計學習理論。演算法設計方面,機器學習理論關注可以實現的,行之有效的學習演算法(要防止錯誤累積)。很多推論問題屬於非程式化決策,所以部分的機器學習研究是開發容易處理的近似演算法。

機器學習已廣泛應用於資料探勘電腦視覺自然語言處理生物特徵辨識搜尋引擎醫學診斷、檢測信用卡詐騙英語Credit card fraud證券市場分析、DNA序列定序、語音手寫辨識、遊戲機器人等領域。

定義

機器學習有下面幾種定義:

  • 機器學習是一門人工智慧的科學,該領域的主要研究物件是人工智慧,特別是如何在經驗學習中改善具體演算法的效能。
  • 機器學習是對能通過經驗自動改進的電腦演算法的研究。
  • 機器學習是用資料或以往的經驗,以此最佳化電腦程式的效能標準。

電腦科學家Tom M. Mitchell英語Tom M. Mitchell在其著作的Machine Learning一書中定義的機器學習為:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.[1]

分類

機器學習可以分成下面幾種類別:

  • 監督學習從給定的訓練資料集中學習出一個函數,當新的資料到來時,可以根據這個函數預測結果。監督學習的訓練集要求是包括輸入和輸出,也可以說是特徵和目標。訓練集中的目標是由人標註的。常見的監督學習演算法包括迴歸分析統計分類

監督學習和非監督學習的差別就是訓練集目標是否有人為標註。他們都有訓練集 且都有輸入和輸出

  • 無監督學習與監督學習相比,訓練集沒有人為標註的結果。常見的無監督學習演算法有生成對抗網路(GAN)、聚類
  • 半監督學習介於監督學習與無監督學習之間。
  • 強化學習機器為了達成目標,隨著環境的變動,而逐步調整其行為,並評估每一個行動之後所到的回饋是正向的或負向的。[2]

演算法

具體的機器學習演算法有:

軟體

包含各種機器學習演算法的軟體套裝包括:

免費開源軟體

Python軟體庫及框架

參考文獻

外部連結

參見

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.