机器学习
對電腦系統用於在沒有明確指令的情況下執行任務的演算法與統計模型的科學研究 来自维基百科,自由的百科全书
机器学习(英語:machine learning)是人工智能的一个分支。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法(要防止錯誤累積)。很多推论问题属于非程序化決策,所以部分的机器学习研究是开发容易处理的近似算法。
![]() | 此條目可参照英語維基百科相應條目来扩充。 |
机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡詐騙、证券市场分析、DNA序列测序、语音和手写识别、游戏和机器人等领域。机器学习在近30多年已发展为一门多领域科际整合,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论、資訊理論等多门学科。
定義
機器學習有下面幾種定義:
- 機器學習是一門人工智能的科學,該領域的主要研究對象是人工智能,特別是如何在經驗學習中改善具體算法的性能。
- 機器學習是對能通過經驗自動改進的計算機算法的研究。
- 機器學習是用數據或以往的經驗,以此優化計算機程序的性能標準。
另外,電腦科學家湯姆·米切爾在其著作的Machine Learning一書中定義的機器學習為[1]:
A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.
——Tom Mitchell,Machine Learning
分类
机器学习可以分成下面几种类别:
- 监督学习从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。
监督学习和非监督学习的差别就是训练集目标是否有人为标注。他们都有训练集 且都有输入和输出
算法
具体的机器学习算法有:
软件
包含各種機器學習演算法的軟體套裝包括:
- Caffe
- Deeplearning4j
- DeepSpeed
- ELKI
- JAX
- Infer.NET
- Keras
- Kubeflow
- LightGBM
- Mahout
- Mallet
- Microsoft Cognitive Toolkit
- ML.NET
- mlpack
- MXNet
- OpenNN
- Orange
- pandas (software)
- ROOT (TMVA with ROOT)
- scikit-learn
- Shogun
- Spark MLlib
- SystemML
- TensorFlow
- Torch / PyTorch
- Weka / MOA
- XGBoost
- Yooreeka
参考文献
外部链接
参见
Wikiwand - on
Seamless Wikipedia browsing. On steroids.