ディープラーニング

ディープラーニング（英: deep learning）または深層学習（しんそうがくしゅう）とは、対象の全体像から細部までの各々の粒度の概念を階層構造として関連させて学習する手法のことである^[2]^{[注釈 1]}。深層学習は複数の独立した機械学習手法の総称であり、その中でも最も普及した手法は、（狭義には4層以上^[3]^{[注釈 2]}の）多層の人工ニューラルネットワーク（ディープニューラルネットワーク、英: deep neural network; DNN）による機械学習手法である^[4]。

要素技術としてはバックプロパゲーションなど、20世紀のうちに開発されていたものの、4層以上の深層ニューラルネットについて、局所最適解や勾配消失などの技術的な問題によって十分学習させられず、性能も芳しくなかった。しかし、ジェフリー・ヒントンの研究チームが2006年に多層ニューラルネットワークを用いたオートエンコーダを発表したことをきっかけに、多層ニューラルネットワークの学習の研究が進展し、同時に学習に必要な計算機の能力向上とインターネットの発展による学習データの流通が相まって、十分に学習させられるようになった。その結果、音声・画像・自然言語を対象とする諸問題に対して他の手法を圧倒する高い性能を示し^[5]、2000年代末から2010年代にかけて急速に普及した^[3]^[6]^[7]^{[注釈 3]}。

深層学習が機械学習分野に与えた影響は非常に大きく、2015年に発表された拡散モデルに代表される生成モデルの多くに組み込まれたほか、2017年に発表されたTransformerをはじめとする大規模言語モデルなどの基盤にもなっている^[8]。しかし、深層学習によって行われたパターン認識がどのような根拠に基づいているかを解析することは難しく、ブラックボックス問題を引き起こしている^[9]。また、開発競争がきわめて激しく、最新の手法が数ヶ月で古くなるような事もあり得る状況であるため、常に最先端の技術を追いかけ続けることは容易ではない^[10]^{[注釈 4]}。

[2]

[注釈 1]

[3]

[注釈 2]

[4]

[1]

[5]

[6]

[7]

[注釈 3]

[8]

[9]

[10]

[注釈 4]

手法名	量子化単位	勾配	利用モデル名	原論文
ベクトル量子化, VQ 英: vector quantization	ベクトル	STE^[69]	VQ-VAE	^[70]
英: product quantization ^[71]	サブベクトル	softmax or STE^[72]		^[73]
英: residual vector quantization, RVQ	ベクトル		SoundStream
英: finite scalar quantization, FSQ ^[74]	スカラー	STE^[75]		^[76]

表. 量子化勾配生成手法
手法名
英: straight-through estimator, STE
英: Gumbel-Softmax

概要

歴史

前史

ネオコグニトロン（1979年）

LeNet-5（1998年）

多層ニューラルネットワークの実現（2006 - 2012年）

学習モデルの複雑化・数学的抽象化の時代（2012年 - 現在）

利用

ネットワークモデル

畳み込みニューラルネットワーク

スタックドオートエンコーダ

Residual network

敵対的生成ネットワーク

Transformer

MLP-mixer

ボルツマンマシン

制限ボルツマンマシン

回帰型ニューラルネットワーク

特有の問題

勾配消失問題

過学習

局所最適解へのトラップ

テクニック

データ拡張

活性化関数

ReLU

maxout

ドロップアウト

スパースコーディング

バッチ正則化

量子化

ミニバッチ法

蒸留

事前学習 (Pre-training)

AdaGrad

Adam

ライブラリ

脚注

参考文献

教科書

関連項目

外部リンク