From Wikipedia, the free encyclopedia
Perlombongan data ialah suatu proses menemukan corak dalam set data besar yang melibatkan persimpangan pembelajaran mesin, statistik dan sistem pangkalan data.[1] Proses penting ini menggunakan kaedah kecerdasan untuk memperoleh corak data.[1][2] Ia merupakan subbidang sains komputer yang bersifat antara disiplin.[1][3][4]
Proses ini bermatlamat memperoleh maklumat daripada set data seterusnya menukarkan maklumat tersebut menjadi suatu struktur yang mudah difahami untuk penggunaan selanjutnya.[1] Proses perlombongan ini merupakan langkah menganalisis dalam proses penemuan pengetahuan dalam pangkalan data (knowledge discovery in databases, atau KDD).[5]
"Proses penemuan pengetahuan dalam pangkalan data" ditakrifkan secara umumnya melalui langkah-langkah berikut:
Set data dunia sebenar lazimnya mengandungi pelbagai isu antaranya data tidak lengkap (incomplete data), data hingar (noise data) dan data tidak konsisten. Oleh itu langkah prapemprosesan data perlu dilaksanakan terlebih dahulu sebelum teknik perlombongan data diaplikasikan ke atas data tersebut. Secara umumnya tugas prapemprosesan data boleh dikategorikan kepada empat iaitu:
Langkah-langkah prapemprosesan data dilaksanakan secara berulang sehingga mencapai output yang dikehendaki dan tidak perlu menuruti jujukan langkah tertentu. Bahkan bukan kesemua langkah tersebut perlu dilaksanakan, sebaliknya ia bergantung kepada kualiti set data yang ingin diproses.
Teknik perlombongan data boleh dikategorikan kepada dua iaitu:
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.