MNISTデータベース

MNISTデータベース（英: MNIST database, Modified National Institute of Standards and Technology databaseの略）は、さまざまな画像処理システムの学習に広く使用される手書き数字画像の大規模なデータベース^[1]^[2]。米国商務省配下の研究所が構築したこのデータベースは、機械学習分野での学習や評価に広く用いられている^[3]^[4]。

[1]

[2]

[3]

[4]

分類器の種別	分類器の説明 (784-100-10といった表記は、ニューラルネットワークにおける各層のノード数を表す。またPはプーリング層。)	歪み加工	前処理	誤検知率（％）
線形分類器	ペアワイズ線形分類器	—	自動傾き補正	7.6^[10]
ランダム化された木を使用したデジションストリーム^{[注釈 3]}	単一モデル（深さ400以上）	—	—	2.7^[24]
K近傍法	非線形変換を伴うK-NN（P2DHMDM）	—	エッジずらし	0.52^[25]
決定株（英語版）のブースト	Haar特徴を用いた決定株のブースト	—	Haar特徴量（英語版）	0.87^[26]
サポートベクターマシン（SVM）	仮想SVM	—	自動傾き補正	0.56^[27]
ディープニューラルネットワーク（DNN）	2層 784-800-10	—	—	1.6^[28]
ディープニューラルネットワーク	2層 784-800-10	弾性歪み	—	0.7
ディープニューラルネットワーク	6層 784-2500-2000-1500-1000-500-10	弾性歪み	—	0.35^[29]
畳み込みニューラルネットワーク (CNN)	6層 784-40-80-500-1000-2000-10	—	学習データの拡張	0.31^[30]
畳み込みニューラルネットワーク	6層 784-50-100-500-1000-10-10	—	学習データの拡張	0.27^[31]
畳み込みニューラルネットワーク	13層 64-128（5x）-256（3x）-512-2048-256-256-10	—	—	0.25^[17]
畳み込みニューラルネットワーク	35個のCNNの組み合わせ、1-20-P-40-P-150-10	弾性歪み	幅の正規化	0.23^[12]
畳み込みニューラルネットワーク	5つのCNNの組み合わせ, 6層 784-50-100-500-1000-10-10	—	学習データの拡張	0.21^[19]^[20]
ランダムマルチモデルディープラーニング（RMDL）	10個のニューラルネットワーク, 10個のリカレントニューラルネットワーク、10個の畳み込みニューラルネットワーク	—	—	0.18^[21]

		MNIST	QMNIST
データ数	train	60,000^[34]	60,000^[34]
データ数	test	10,000^[35]	60,000^[35]
話者数	train	539^[36]	539^[37]
話者数	test	298^[38]	535^[39]

MNISTデータベース

概要

データセット

MNISTによる性能評価の歴史

分類器と性能の一覧

QMNIST

pMNIST

関連項目

脚注

参考文献

外部リンク

Wikiwand - on