Datawetenschap, vaak ook onvertaald in het Engels: data science, is een interdisciplinair onderzoeksveld met betrekking tot wetenschappelijke methoden, processen en systemen om kennis en inzichten te onttrekken uit (zowel gestructureerde als ongestructureerde) data.

Thumb
Stroomdiagram uit Doing Data Science, van Schutt & O'Neil (2013)

Datawetenschap is een concept om statistieken, data-analyse en aanverwante methoden te verenigen. Het maakt gebruik van technieken en theorieën ontleend aan vele disciplines binnen het brede gebied van de wiskunde, statistiek, informatiekunde en computerwetenschappen. In het bijzonder de subdomeinen van machinaal leren, classificatie, cluster-analyse, datamining, databases, en visualisatie zijn belangrijke hulpvakken.

Turing awardwinnaar Jim Gray beschouwt datawetenschap als de "vierde" paradigma van de wetenschap, naast empirie, theorievorming en computationaliteit. Hij veronderstelt dat wetenschap verandert vanwege de impact van informatietechnologie en de overvloed aan data.

Stichtingen

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.