Richard Sutton est un informaticien canadien, enseignant en informatique à l'université de l'Alberta. Il est considéré comme l'un des fondateurs de l'apprentissage par renforcement, domaine auquel il a apporté plusieurs contributions majeures telles que le temporal difference learning et les méthodes de gradient.

Faits en bref Naissance, Nationalité ...
Richard S. Sutton
Thumb
Richard Sutton, le 27 octobre 2016
Biographie
Naissance
Nationalité
Domicile
Formation
Activités
Autres informations
A travaillé pour
Membre de
Directeur de thèse
Andrew Barto (en)Voir et modifier les données sur Wikidata
Distinction
AAAI Fellow (2001)
President's Award (INNS) (2003)
Fermer

Formation

Sutton a reçu son B.A. en psychologie à l'université Stanford en 1978, et ses M.Sc. et Ph.D en informatique à l'université du Massachusetts à Amherst en 1980 et 1984, sous la direction d'Andrew Barto (en). Sa thèse, « Temporal Credit Assignment in Reinforcement Learning », introduisait en particulier des idées de temporal difference learning.

Publications

  • (en) Sutton, R. S., Barto, A. G., Reinforcement Learning: An Introduction. MIT Press, 1998. 2e édition MIT Press en 2018.
  • (en) Miller, W. T., Sutton, R. S., Werbos, P. J. (Eds.), Neural Networks for Control. MIT Press, 1991.
  • (en) Sutton, R. S. (Ed.), Reinforcement Learning. Reprinting of a special issue of Machine Learning Journal. Kluwer Academic Press, 1992

Références

Liens externes

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.