כריית מידע
ויקיפדיה האנציקלופדיה encyclopedia
כריית מידע או כריית נתונים (באנגלית: Data mining) היא שימוש בכלים סטטיסטיקיים כדי לגלות מתאמים, הצלבות ומגמות בתוך "Big data", כלומר בכמויות גדולות של מידע מבוזר ממקורות שונים, שאינו מאורגן כמסד נתונים או בצורה אחרת. התהליך נועד לחקור ולנתח כמות גדולה של מידע באמצעים אוטומטיים ככל שניתן כדי לגלות דפוסים תקפים חדשים, שימושיים (מקבלי ההחלטות יכולים להשתמש בדפוסים שהתגלו כדי לשפר תהליכים קיימים) ובעלי משמעות (מובנים למקבל ההחלטות). עם ההתפתחות המתמדת בעולם טכנולוגיית המידע, כשכמות המידע הדיגיטלי גדלה כל הזמן, עולה החשיבות של תחום כריית המידע, שבאמצעותו ניתן להפוך מידע לידע.
המושג כריית מידע נגזר מפעולת הכרייה הגאולוגית בה כורים באדמה כדי למצוא אוצרות טבע.
המונח "כריית נתונים" מתאר שלב אחד בתוך התהליך המכונה "גילוי ידע במסדי נתונים" - השלב בו מריצים אלגוריתמים במחשב. מלבד שלב כריית הנתונים כולל התהליך שלבים אחרים, חלקם קודמים לכריית הנתונים (כגון הכנת החיתוך) וחלקם עוקבים (כגון ניתוח התוצאות). הבעיות הנפוצות של כריית מידע הן בעיות סיווג, ניתוח אשכולות, רגרסיה ולמידת חוקי אסוציאציה.