joukko menetelmiä, joilla pyritään oleellisen tiedon löytämiseen suurista datajoukoista From Wikipedia, the free encyclopedia
Tiedonlouhinta (engl. data mining) tarkoittaa joukkoa menetelmiä, joilla pyritään oleellisen tiedon löytämiseen suurista datajoukoista.
Tiedonlouhintaa voidaan soveltaa hyvin laaja-alaisesti, sillä lähtökohdaksi tarvitaan ainoastaan dataa. Tyypillisesti tiedonlouhinnassa käytetty data on esimerkiksi mittauksia teollisuusprosessista, otteita asiakastietokannasta tai vaikkapa web-palvelimen loki-tiedostoja.
Määritelmänä tiedonlouhinta ei rajaa käytettäviä menetelmiä. Useimmiten käytettäviä algoritmeja ovat mm. erilaiset klusteroinnit, korrelaatiot, neuroverkot, itseorganisoituvat kartat, jne. Yleisesti ottaen tiedonlouhinnan menestyksellisessä hyödyntämisessä kaikkein oleellisinta on datan ja sen eri suureiden kokonaisvaltainen ymmärtäminen. Myös pelkkä innovatiivinen lähestymistapa esimerkiksi datan visualisoinnissa voi auttaa näkemään tietovaraston hyötyjä täysin uudesta perspektiivistä.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.