அமெரிக்க அரசியலமைப்பின் விதிகள் எத்தனை? From Wikipedia, the free encyclopedia
தரவு அகழ்தல் (Data mining) என்பது எந்திரக் கற்றல், புள்ளியியல், தரவுத்தளம் ஆகிய அமைப்புகளின் குறுக்குவெட்டில் உள்ள முறைகளை உள்ளடக்கிய பெரிய தரவுத் தொகுப்புகளில் உள்ள பாணிகளைப் பிரித்தெடுத்துக் கண்டுபிடிக்கும் செயல்முறையாகும். தரவு அகழ்தல், எந்திர கற்றல், புள்ளியியல், தரவுத்தள அமைப்புகளை அமைக்கிறது[1] தரவு அகழ்தல் என்பது கணினி அறிவியல், புள்ளியியலின் ஓர் இடைநிலை துணைத் துறையாகும் , இது தரவுத் தொகுப்பிலிருந்து தகவல்களைப் பிரித்தெடுப்பதற்கும் , மேலும் பயன்படுத்த தகவல்களை புரிந்துகொள்ளக்கூடிய கட்டமைப்பாக மாற்றுவதற்குமான ஒட்டுமொத்த குறிக்கோளுடன் செயல்படுகிறது.[1][2][3][4] தரவு அகழ்தல் என்பது தரவுத்தளங்களில் அறிவு கண்டுபிடிப்பு செயல்முறை அல்லது அதன் பகுப்பாய்வுப் படியாகும். [5] மூலப் பகுப்பாய்வுப் படிகளைத் தவிர , தரவுத்தள, தரவு மேலாண்மையின் கூறுகள், தரவு முன் செயலாக்கம், படிமம், உய்த்துணர்வுக் கருதல்கள், சுவைமை அளவுகள், சிக்கலான கருதல்கள், கண்டுபிடிக்கப்பட்ட கட்டமைப்புகளின் பிந்தைய செயலாக்கம், காட்சிப்படுத்தல், இணையப் புதுப்பித்தல் போன்றவற்றை உள்ளடக்கியது -. [1]
" தரவு அகழ்தல் " என்ற சொல் ஒரு தவறான பெயராகும் , ஏனெனில் இதன் குறிக்கோள் பெரிய அளவிலான தரவுகளிலிருந்து பாணிகளையும் அறிவையும் பிரித்தெடுப்பதே தவிர , தரவைப் பிரித்தெடுப்பது அல்ல. இது ஒரு முதன்மைச் சொல்லாகும். மேலும் இது எந்தவொரு பெரிய அளவிலான தரவு அல்லது தகவல் செயலாக்கத்திற்கும் ( திரட்டல், தேக்கல், பகுப்பாய்வு, புள்ளியியல்) மேலும், செயற்கை நுண்ணறிவு (எ. கா. இயந்திர கற்றல், வணிக நுண்ணறிவு) உள்ளிட்ட கணினி முடிவு ஏற்பு அமைப்பின் எந்தவொரு பயன்பாட்டிற்கும் அடிக்கடி பயன்படுத்தப்படுகிறது.[6] (இது பெரும்பாலும் எந்திரக் கற்றல் பொருட்களை உள்ளடக்கியது) இது நடைமுறை எந்திரக் கற்றல் என்ற புத்தகம் முதலில் வெளிவந்ததும் பெயரிடப்பட்டது. தரவு அகழ்தல் என்ற சொல் சந்தைப்படுத்தல் காரணங்களுக்காக மட்டுமே சேர்க்கப்பட்டது. [7] பெரிய அளவிலான தரவு பகுப்பாய்வு அல்லது உண்மையான முறைகளைக் குறிப்பிடும்போது, செயற்கை நுண்ணறிவு, எந்திர கற்றல் ஆகியனவே மிகவும் பொருத்தமானவை.
உண்மையான தரவு அகழ்தல் பணி என்பது , முன்னர் அறியப்படாத தரவுக் குழுக்கள் (கொத்துப் பகுப்பாய்வு), இயல்பற்ற, பதிவுகள் (ஒழுங்கின்மை கண்டறிதல்), சார்புகள் (இணைவு விதி) போன்ற சுவையான பணிகளைப் பிரித்தெடுக்க, பேரளவிலான தரவுகளின் அரைத் தானியங்கி அல்லது தானியங்கி பகுப்பாய்வு ஆகும். இது பொதுவாக இடஞ்சார்ந்த சுட்டுகள் போன்ற தரவுத்தள நுட்பங்களைப் பயன்படுத்துவதை உள்ளடக்கியது. இந்தப் பாணிகள் பின்னர் உள்ளீட்டு தரவுகளின் சுருக்கமாகப் பார்க்கப்படலாம். மேலும் பகுப்பாய்வில் பயன்படுத்தப்படலாம். அல்லது எடுத்துக்காட்டாக எந்திர கற்றல், முன்கணிப்புப் பகுப்பாய்வுகளில் பயன்படுத்தப்படலாம். எடுத்துக்காட்டாக , தரவு அகழ்தல் நடவடிக்கை தரவுகளில் பல குழுக்களை அடையாளம் காணலாம் , பின்னர் அவை ஒரு முடிவலேற்பு அமைப்பு வழி மிகவும் துல்லியமான முன்கணிப்பு முடிவுகளைப் பெற பயன்படுத்தப்படலாம். தரவு திரட்டலோ தரவு ஆயத்தமோ அல்லது முடிவோ , விளக்கமோ அறிக்கையோ தரவு அகழ்தல் நடவடிக்கையின் ஒரு பகுதியல்ல. இருப்பினும் அவை கூடுதல் படிகளாக ஒட்டுமொத்த KDD செயல்முறையைச் சேர்ந்தவை.
தரவு பகுப்பாய்விற்கும் தரவு அகழ்வுக்கும் உள்ள வேறுபாடு என்னவென்றால் , தரவு பகுப்பாய்வில் படிமங்கள், கருதுகோள்களைச் சோதிக்க தரவு பகுப்பாய்வு பயன்படுத்தப்படுகிறது. எ. கா. தரவுகளின் அளவைப் பொருட்படுத்தாமல் சந்தைப்படுத்தல் பரப்புரையின் செயல்திறனைப் பகுப்பாய்வு செய்கிறது. இதற்கு மாறாக , தரவு அகழ்தல் எந்திரக் கற்றல், புள்ளியியல் படிமங்களைப் பயன்படுத்தி பேரளவிலான தரவுகளில் இரகசியமாக உள்ள அல்லது மறைக்கப்பட்ட பாணிகளைக் கண்டறிகிறது.[8]
தரவு உளவும் தரவு உள்விவரிப்பும் இரண்டுமே பெரிய மக்கள்தொகை தரவுத் தொகுப்பின் பகுதிகளைப் படிமமாக்கத்துக்குப் பயன்படும் தரவு அகழ்தல் முறைகளைப் பயன்படுத்துவதையே குறிக்கின்றன ( இவை கண்டுபிடிக்கப்பட்ட எந்தவொரு பாணிகளின் செல்லுபடியாகும் தன்மை பற்றியும் நம்பகமான புள்ளியியல் உய்த்துணர்வுகள் செய்யப்படுவதற்கு மிகவும் சிறிய அளவில் பயன்படுத்தலாம்). தரவு அகழாய்வு, தரவு மீன்பிடி, தரவு உளவு இருப்பினும் , இந்த முறைகள் பெருந்தரவு மக்கள்தொகைக்கான பெருந்தரவுச் செய்முறைகளைச் செய்ய, புதிய கருதுகோள்களை உருவாக்குவதில் பயன்படலாம்.
1960களில் புள்ளியியலாளர்களும் பொருளியல் வல்லுனர்களும் தரவு மீன்பிடித்தல்(data fishing) அல்லது தரவு அகழ்தல்(data dredging) போன்ற சொற்களைப் பயன்படுத்தினர். அவை எந்த ஒரு முன்னுரிமைக் கருதுகோளும் இல்லாமல் தரவைப் பகுப்பாய்வு செய்வதற்கான மிகத் தாழ்ந்த நடைமுறையைக் குறித்தன. ஒரு முன்னுரிமையோடு 1983 ஆம் ஆண்டில் பொருளியல் ஆய்வுகளின் மதிப்பாய்வு இதழில் வெளியிடப்பட்ட ஒரு கட்டுரையில் பொருளியலாளர்ர் மைக்கேல் உலோவெல் இதேபோன்ற திறனாய்வு வழியில் " தரவு அகழ்தல்(data mining) " என்ற சொல்லைப் பயன்படுத்தினார். [9] இந்த நடைமுறைச் செய்முறை " (நேர்முகம்) முதல் " மீன்பிடித்தல் " அல்லது " ஸ்னூபிங் " (எதிர்மறை) வரை பல்வேறு மாற்றுப்பெயர்களில் " முகமூடி அணிந்துள்ளது " என்று உலோவெல் குறிப்பிடுகிறார்.
தரவு அகழ்தல் என்ற சொல் 1990 ஆம் ஆண்டில் தரவுத்தளச் சமூகத்தில் பொதுவாக நேர்முகப் பொருளுடன் தோன்றியது. தரவு அகழ்தல் 1980களில் ஒரு குறுகிய காலத்திற்கு " தரவுத்தலகழ்தல் " என்ற சொற்றொடர் பயன்படுத்தப்பட்டது , ஆனால் இது சான் டியாகோவை தளமாகக் கொண்ட ஒரு நிறுவனத்தால் தங்கள் தரவுத்தள அகழ்தல் சார்ந்த பணிநிலையத்தை முன்வைத்ததும் வணிக முத்திரை குத்தப்பட்டதால் , ஆராய்ச்சியாளர்கள் அதன் விளைவாக தரவு அகழ்தலுக்கு மாறினர். சான் டியாகோவின் தரவு அகழ்தல்[10] சார்ந்து பயன்பட்ட பிற சொற்களில் தரவுத் தொல்லியல், தகவல் அறுவடை, தகவல் கண்டுபிடிப்பு, அறிவு பிரித்தெடுத்தல் போன்றவை அடங்கும் கிரிகோரி பியாடெட்சுகி - சாபிரோ அதே தலைப்பிலான முதல் பட்டறைக்கு (கேடிடி - 1989) தரவுத்தளங்களில் அறிவு கண்டுபிடிப்பு என்ற சொல்லை உருவாக்கிப் பயன்படுத்தினார் , மேலும் இந்த சொல் செயற்கை நுண்ணறிவு, எந்திரக் கற்றல் சமூகங்களில் மிகவும் பரவலானது. இருப்பினும் , தரவு அகழ்தல் என்ற சொல் வணிக, ஊடகச் சமூகங்களில் மிகவும் புகழடைந்தது.[11] தற்போது தரவு அகழ்தல், அறிவுக் கண்டுபிடிப்பு என்ற சொற்கள் ஒன்றுக்கொன்று மாற்றாகப் பயன்படுத்தப்படுகின்றன.
தரவுகளிலிருந்து பாணிகளைக் கையால் பிரித்தெடுப்பது பல நூற்றாண்டுகளாக நிகழ்ந்துவந்தது. தரவுகளில் உள்ள பாணிகளை அடையாளம் காணும் தொடக்கநிலை முறைகளில் பாயேசு தேற்றம் (1700 களில்) பின்னேகும் பகுப்பாய்வு (1800 களில்) ஆகியவை அடங்கும்[12] கணினி தொழில்நுட்பத்தின் பெருக்கமும் அதன் உயர்ந்து வரும் திறனும் தரவு திரட்டல் , தேக்குதல், கையாளுதல் திறனை வியத்தகு முறையில் உய்ர்த்தின. தரவுத் தொகுப்புகள் அளவோடு சிக்கலான தன்மையிலும் வளர்ந்துள்ளதால் , நேரடியான கையால் செய்யும் தரவு பகுப்பாய்வு பெருகியதால், மறைமுகத் தானியங்கி தரவுச் செயலாக்கத்துக்கு வழிவிட்டது. இதற்குக் கணினி அறிவியலில் உள்ள பிற கண்டுபிடிப்புகளும் உதவுகின்றன. குறிப்பாக, எந்திரக் கற்றல் துறையில் நரம்பியல் வலைப்பிணையங்கள் , கொத்துப் பகுப்பாய்வு , மரபணு வழிமுறைகள் (1950 கள்), முடிவெடுத்தல் மரங்கள், முடிவெடுத்தல் விதிகள் (1960 கள்) ஏற்பு திசையன் எந்திரங்கள் போன்றவை. உதவுகின்றன. தரவு அகழ்தல் என்பது மறைக்கப்பட்ட பாணிகளைக் கண்டுபிடிக்கும் நோக்கத்துடன் இந்த முறைகளைப் பயன்படுத்தும் செயல்முறையாகும்.[13] பேரளவுத் தரவுத் தொகுப்புகளில். இது பயன்பாட்டு புள்ளியியல், செயற்கை நுண்ணறிவு ஆகியவற்றிலிருந்தான இடைவெளியைக் குறைக்கிறது (இது பொதுவாக தரவுத்தளங்களில் தரவு தேக்கப்பட்டு குறியிடப்பட்ட விதத்தை பயன்படுத்தி உண்மையான கற்றல், கண்டுபிடிப்பு வழிமுறைகளை மிகவும் திறமையாக செயல்படுத்துவதால் தரவுத்தளம் கையாளலுக்கு மிகவும் உதவுகிற கணிதப் பின்புலத்தை வழங்குகிறது).
தரவுத்தளங்களில் அறிவுக் கண்டுபிடிப்பு (KDD)செயல்முறை பொதுவாக பின்வரும் கட்டங்களால் வரையறுக்கப்படுகிறது.
இருப்பினும் , தரவு அகழ்தலுக்கான குறுக்குத் தொழில் செந்தரச் செயல்முறை, அதாவது CRISP முறைத் தரவு .அகழ்வு போன்ற கருப்பொருளில் பல வேறுபாடுகளில் அமைகிறது. இது கீழ்வரும் ஆறு கட்டங்களை வரையறுக்கிறது.
அல்லது (1) முன்செயலாக்கம் (2) தரவகழ்தல் (3) முடிவுகள் சரிபார்ப்பு போன்ற எளிய முக்கட்டச் செயல்முறை பயனில் உள்ளது.
2002, 2004, 2007, 2014 ஆம் ஆண்டுகளில் நடத்தப்பட்ட கருத்துக்கணிப்புகள் , CRISP - DM முறை என்பது தரவகழ்தல் வல்லுனர்களால் பயன்படுத்தப்படும் முன்னணி முறையாக ஏற்றம் கண்டது என்பதைக் காட்டுகின்றன. இந்த வாக்கெடுப்புகளில் பெயரிடப்பட்ட மற்ற தரவு அகழ்தல் செந்தரம் செம்மா மட்டுமே. செம்மா இருப்பினும் , 3 முதல் 4 மடங்கு மக்கள் CRISP முறைத் தரவு அகழ்தலைப் பயன்படுத்துவதாக தெரிவித்தனர். பல ஆராய்ச்சியாளர்களும் குழுக்களும் தரவு அகழ்தல் செயல்முறைப் படிமங்கள் பற்றிய மதிப்பீடுகளை வெளியிட்டுள்ளன , மேலும் அஜெவெடோ, சாண்டோசு, CRISP - DM, SEMMA ஆகியவற்றை 2008 ஆம் ஆண்டில் பலர் ஒப்பிட்டனர்.[14][15]
தரவு அகழ்தல் வழிமுறைகளைப் பயன்படுத்துவதற்கு முன், ஒரு இலக்கு தரவுத் தொகுப்பு ஒன்று திரட்டப்பட வேண்டும். தரவு அகழ்தலால் தரவுகளில் உண்மையில் இருக்கும் பாணிகளை மட்டுமே கண்டுபிடிக்க முடியும் என்பதால் , இலக்கு தரவுத் தொகுப்பு இந்த பாணிகளைக் கொண்டிருக்க போதுமான அளவு பெரியதாக இருக்க வேண்டும். அதேவேளையில் ஏற்றுக்கொள்ளக்கூடிய கால வரம்பிற்குள் அகழப்படும் அளவுக்கு சுருக்கமாகவும் இருக்க வேண்டும். தரவுகளுக்கான பொதுவான ஏற்பு தரவு சந்தை அல்லது தரவுக் கிடங்கு ஆகும். தரவு அகழ்தலுக்கு முன் பல்வகை தரவுத் தொகுப்புகளை பகுப்பாய்வு செய்ய முன் செயலாக்கம் தேவையாகும். பன்முகத்தன்மை கொண்டவை. பின்னர் இலக்கு தொகுப்பு சீர் செய்யப்படுகிறது. தரவுச்சீர்செய்தல் நோக்கீடுகள் தரவு சாராதவற்றை நீக்குகிறது.
தரவு அகழ்தலில் பின்வரும்ஆறு பொதுவான வகைப் பணிகள் அடங்கும்.[5]
தரவு அகழ்தல் முறை தற்செயலாக தவறாகப் பயன்படுத்தப்படலாம். குறிப்பிடத்தக்கதாகத் தோன்றும், ஆனால் எதிர்கால நடத்தையை உண்மையில் கணிக்கமுடியாத, தரவுகளின் புதிய படிமத்தில் மீண்டும் உருவாக்க முடியாத முடிவுகளைத் தரலாம் எனவே சிறிய பயன்பாட்டைக் கொண்டு. மறுஉருவாக்கம் செய்யப்படும். இது சிலவேளைகளில் பல கருதுகோள்களை ஆராய்ந்து சரியான புள்ளியியல் கருதுகோள் செய்முறையைச் செய்யாததால் ஏற்படுகிறது. புள்ளியியல் கருதுகோள் செய்முறை எந்திரக் கற்றலில் இந்த சிக்கலின் எளிய பதிப்பு மிகைப்பொருத்தல் என்று அழைக்கப்படுகிறது , ஆனால் அதே சிக்கல் செயல்முறையின் வெவ்வேறு கட்டங்களிலும் கூட எழலாம். இதனால் ஒரு தொடருந்து / செய்முறைப் பிளவு பொருந்தும்போது, இது நடப்பதைத் தடுக்க போதுமானதாக இருக்காது.[16]
தரவுகளிலிருந்து அறிவு கண்டுபிடிப்பின் இறுதி கட்டம் , தரவுச் சுரங்க வழிமுறைகளால் உற்பத்தி செய்யப்படும் பாணிகள் பரந்த தரவுத் தொகுப்பில் நிகழ்கின்றனவா என்பதைச் சரிபார்க்க வேண்டும். வழிமுறைகளால் கண்டறியப்பட்ட அனைத்து வடிவங்களும் செல்லுபடியாக வேண்டிய கட்டாயமில்லை. தரவுச் சுரங்க வழிமுறைகள் பொதுவான தரவுத் தொகுப்பில் இல்லாத பாணிகளைப் பயிற்சி தொகுப்பில் கண்டுபிடிப்பது பொதுவானது. இது மிகைப்பொருத்தல் என்று அழைக்கப்படுகிறது. இதை மேலாள மதிப்பீட்டு தரவு அகழ்தல் வழிமுறைக்குப் பயிற்சி அளிக்கப்படாத தரவுகளின் செய்முறைத் தொகுப்பைப் பயன்படுத்துகிறது. செய்முறைத் தொகுப்பு கற்ற பாணிகள் இந்தச் செய்முறைகட்குப் பயன்படுத்தப்படுகின்றன.இதன் விளைவாக வரும் வெளியீடு விரும்பிய வெளியீட்டுடன் ஒப்பிடப்படுகிறது. எடுத்துக்காட்டாக, மின்னஞ்சல்களின் பயிற்சி தொகுப்பில் பயிற்சி அளிக்கப்படும் " வீண் " மற்றும் " சட்டவியலான " மின்னஞ்சல்களை வேறுபடுத்த முயற்சிக்கும் தரவு அகழ்தல் வழிமுறைப் படிமம். பயிற்சித் தொகுப்பு ஒருமுறை பயிற்சி பெற்ற பிறகு கற்ற பாணிகள் அது பயிற்சி பெறாத மின்னஞ்சல்களின் செய்முறைத் தொகுப்பிற்குப் பயிற்சிதரப் பயன்படுத்தப்படும். பாணிகளின் துல்லியத்தை அவை எத்தனை மின்னஞ்சல்களை சரியாக வகைப்படுத்துகின்றன என்பதிலிருந்து அளவிட முடியும். ROC வளைவுகள் போன்ற வழிமுறையை மதிப்பிடுவதற்கு பல புள்ளயியல் முறைகள் பயன்படுத்தப்படலாம்.
கற்ற பாணிகள் விரும்பிய செந்தரங்களை நிறைவு செய்யவில்லை என்றால் , முன் செயலாக்கம், தரவு சுரங்க படிகளை மறு மதிப்பீடு செய்து மாற்றுவது கட்டாயம். கற்ற பாணிகள் விரும்பிய செந்தரங்களை நிறைவு செய்தால் , கற்ற பாணிகளை விளக்கி அவற்றை அறிவாக மாற்றுவதே இறுதி கட்டமாகும்.
இந்தத் துறையில் முதன்மையான தொழில்முறை அமைப்பு கணிப்பு எந்திரங்களுக்கான கழகம் (ACM), சிறப்பு வட்டி குழு (SIG), அறிவு கண்டுபிடிப்பு, தரவு அகழ்வு அமைப்பு (SIGKDD) ஆகியன ஆகும்.[17][18] 1989 முதல் இந்த ACMSIG ஒவ்வொரு ஆண்டும் பன்னாட்டு மாநாட்டை நடத்தி அதன் நடவடிக்கைகளை வெளியிட்டது , மேலும் 1999 முதல் இது " SIGKDD தேட்டங்கள் " என்ற தலைப்பில் ஆண்டுதோறுமான கல்வி இதழை வெளியிட்டுள்ளது.[19]
தரவு அகழ்தலில் நடந்த கணினி அறிவியல் மாநாடுகள் பின்வருமாறு:
ICDE மாநாடு, SIGMOD மாநாடு, மீப் பெருந்தரவு தளங்கள் குறித்த பன்னாட்டு மாநாடு போன்ற பல தரவு மேலாண்மை / தரவுத்தள மாநாடுகளிலும் தரவு அகழ்தல் தலைப்புகள் அமைந்தன.
தரவு அகழ்தல் செயல்முறைக்கான செந்தரங்களை வரையறுக்க சில முயற்சிகள் மேற்கொள்ளப்பட்டுள்ளன , எடுத்துக்காட்டாக 1999 ஐரோப்பியக் குறுக்குத் தொழில் செந்தரச் செயலாக்கம் (CRISP - DM), 2004 ஜாவா தரவகழ்தல் செந்தரம் (JDM), ஆகிய செயல்முறைகளுக்கு அடுத்தடுத்து (CRISP - DM 2 மற்றும் JDM 2) 2006 இல் செயலில் இருந்தது , ஆனால் அதன் பின்னர் நிறுத்தப்பட்டது. ஜேடிஎம் 2 இறுதி வரைவை எட்டாமல் திரும்பப் பெறப்பட்டது.
பிரித்தெடுக்கப்பட்ட படிமங்களை பரிமாறிக்கொள்வதற்கு, குறிப்பாக முன்கணிப்பு பகுப்பாய்வுகளில் பயன்படுத்துவதற்கு முதன்மைச் செந்தர முன்கணிப்புப் படிம மார்க்கப் மொழி (பி. எம். எம். எல்) ஆகும் , இது தரவுச் சுரங்கக் குழுவால் (டி. எம். ஜி) உருவாக்கப்பட்ட எக்ஸ். எம்.எல் அடிப்படையிலான மொழியாகும். மேலும் பல தரவுச் செயலாக்கப் பயன்பாடுகளால் பரிமாற்ற வடிவமாக ஏற்கப்படுகிறது. முன்கணிப்பு பகுப்பாய்வு முன்கணிப்புப் படிம மார்க்கப் மொழி XML பெயர் குறிப்பிடுவது போல , இது முன்கணிப்பு மாதிரிகளை மட்டுமே உள்ளடக்கியது. வணிக பயன்பாடுகளுக்கு உயர் முதன்மை வாய்ந்த குறிப்பிட்ட தரவுச் சுரங்க பணி. இருப்பினும் , மறைப்பதற்கான நீட்டிப்புகள் (எடுத்துக்காட்டாக , துணைக் கொத்தாக்கம்) டி. எம். ஜியில் இருந்து தற்சார்பாக முன்மொழியப்பட்டுள்ளன.
இலக்கவியல் தரவு கிடைக்கும் இடங்களில் தரவு அகழ்தல் பயன்படுகிறது. தரவு அகழ்தலின் குறிப்பிடத்தக்க எடுத்துக்காட்டுகளாக, வணிக மருத்துவம் , அறிவியல் , நிதி, கண்காணிப்பு ஆகியன காணப்படுகின்றன.
" தரவு அகழ்தல் " என்ற சொல்லுக்கு தாமே எந்த நெறிமுறைத் தாக்கங்களையும் கொண்டிருக்கவில்லை என்றாலும் , இது பெரும்பாலும் பயனர் நடத்தை (நெறிமுறை மற்றும் பிற) தொடர்பாக தகவல்களை அகழ்வதோடு தொடர்புடையது.[20]
தரவு அகழ்தலைப் பயன்படுத்தக்கூடிய வழிகள் சில வேளைகளிலும் சூழல்களிலும் தனியுரிமை சட்டம் சார்ந்த தன்மை, நெறிமுறைகள் குறித்து கேள்விகளை எழுப்பலாம். தனியுரிமை நெறிமுறைகள்[21] குறிப்பாக , தரவு அகழ்தல் அரசு அல்லது தேசியப் பாதுகாப்பு அல்லது சட்டச் செயலாக்க நோக்கங்களுக்காக வணிக தரவுத் தொகுப்புகள் , மொத்த தகவல் விழிப்புணர்வு திட்டம் அல்லது அறிவுரையில் உள்ளவை, தேசியப் பாதுகாப்புச் சட்டச் செயலாக்கம், மொத்த தகவல் விழிப்புணர்வு அறிவுரை சார்ந்த தனியுரிமைக் கவலைகளை எழுப்பியுள்ளது. [22][23]
தரவு அகழ்வுக்குத் தரவு ஆயத்தமும் ஆக்கமும் தேவைப்படுகிறது. இது ரகசியத்தன்மை, தனியுரிமைக் கடமைகளை விட்டுகொடுக்க செய்யும் தகவல் அல்லது பாணிகளைக் கண்டுபிடிக்கும். தனியுரிமை இது ஏற்படுவதற்கான ஒரு பொதுவான வழி தரவு திரட்டலே ஆகும். தரவு தேக்கல், தரவு திரட்டுதல் என்பது தரவை ஒன்றாக இணைப்பதை உள்ளடக்கியது (பகுப்பாய்வு செய்ய உதவும் வகையில் பல்வேறு வாயில்களிலிருந்து அமையலாம்) (ஆனால் இது தனிப்பட்ட நிலைத் தரவை அடையாளம் காணக்கூடியதாகவோ அல்லது வெளிப்படையாகவோ இருக்கலாம்).[24] இந்த ஒரு பிரிவே தரவு அகழ்வு அன்று.ஆனால், இது பகுப்பாய்விற்கு முன்னும் பின்னுமான தரவு ஆக்கத்தின் விளைவாகும். தனக்காக ஒரு தனிநபரின் தனியுரிமைக்கு அச்சுறுத்தல் ஏற்படுகிறது. ஒரு முறை தொகுக்கப்பட்ட தரவு அகழ்வுத் தரவு அல்லது புதிதாக தொகுக்கப்பட்ட தரவுகளுக்கான அணுகல் உள்ள எவரும் குறிப்பாக தரவு முதலில் பெயரிடாமல் இருக்கும்போது குறிப்பிட்ட நபர்களை அடையாளம் காண முடியும். .[25]
தரவு திரட்டப்படுவதற்கு முன்பு பின்வருவனவற்றை அறிந்திருக்க வேண்டும் என்று பரிந்துரைக்கப்படுகிறது.[24]
தனிநபர்களை எளிதில் அடையாளம் காண முடியாதபடி பெயரில்லாமல் மாறும் வகையில் தரவுகளும் மாற்றியமைக்கப்படலாம்.[24] இருப்பினும், பெயரில்லாத தரவுத் தொகுப்புகள் கூட தனிநபர்களை அடையாளம் காண வழிவகுக்கும் போதுமான தகவல்களைக் கொண்டிருக்கலாம். இந்நிலை, ஊடகவியலாளர்கள் கவனக்குறைவாக வெளியிடப்பட்ட தேடல் வரலாறுகளின் அடிப்படையில் பல நபர்களைக் கண்டுபிடிக்க முடிந்தபோது, ஏற்பட்டது.[26]
வழங்குநருக்கு வழிவகுக்கும் தனிப்பட்ட முறையில் அடையாளம் காணக்கூடிய தகவல்களை கவனக்குறைவாக வெளிப்படுவது நேர்மையான தகவல் நடைமுறைகளை மீறுகிறது. தனிப்பட்ட முறையில் அடையாளம் காணக்கூடிய தகவல், இந்த கவனக்குறைவு, குறிப்பிட்ட நபருக்கு நிதி சார்ந்த உணர்ச்சி சார்ந்த அல்லது உடல் சார்ந்த தீங்கை ஏற்படுத்தும். தனியுரிமை மீறல் ஒரு நிகழ்வு சார்ந்து, வால்கிரீன்சின் புரவலர்கள், தரவு அகழ்தல் நிறுவனங்களுக்கு பரிந்துரைக்கப்பட்ட தகவல்களை அவர்கள் மருந்து நிறுவனங்களுக்கு விற்றதற்காக 2011 ஆம் ஆண்டில் நிறுவனத்திற்கு எதிராக ஒரு வழக்கைத் தாக்கல் செய்தனர்.[27]
ஐரோப்பா வலுவான தனியுரிமைச் சட்டங்களைக் கொண்டுள்ளது. மேலும் நுகர்வோரின் உரிமைகளை இன்னும் வலுப்படுத்த முயற்சிகள் நடந்து வருகின்றன. ஐரோப்பா எனினும், அமெரிக்க - ஐரோப்பிய ஒன்றியம் 1998க்கும் 2000 க்கும் இடையில் உருவாக்கப்பட்ட அமெரிக்க காப்பான துறைமுக நெறிமுறைகள் தற்போது ஐரோப்பிய பயனர்களை அமெரிக்க நிறுவனங்களால் தனியுரிமைச் சுரண்டலுக்கு திறம்பட ஆட்படுத்துகின்றன. எட்வர்டு சுனோடனின் உலகளாவிய கண்காணிப்பு வெளிப்பாட்டின் விளைவாக , இந்த ஒப்பந்தத்தை நீக்க விவாதம் அதிகரித்துள்ளது , குறிப்பாக தரவு தேசியப் பாதுகாப்பு நிறுவனம் அமெரிக்காவுடன் முழுமையாக வெளிப்படையான ஒரு உடன்பாட்டை எட்டுவதற்கான முயற்சிகள் தோல்வியடைந்துள்ளன.[28]
குறிப்பாக ஐக்கிய இராச்சியத்தில் , நிறுவனங்கள் தரவு அகழ்தலைப் பயன்படுத்தி சில வாடிக்கையாளர்களின் குழுக்களை இலக்காகக் கொண்டு நேர்மையற்ற முறையில் அதிக விலைகளை செலுத்த வேண்டிய கட்டாயத்தில் உள்ளன. இந்த குழுக்கள் குறைந்த சமூக - பொருளாதார நிலை நபர்களாக இருக்க முனைகின்றன. அவர்கள் இலக்கவியல் சந்தை இடங்களில் சுரண்டும் வழிமுறைகளில் ஆர்வமாக இல்லை.[29]
அமெரிக்காவில் தனியுரிமை குறித்த கவலைகள் அமெரிக்கப் பேராயத்தால் நலவாழ்வுக் காப்பீட்டு பெயர்வுத்திறன், பொறுப்புக்கூறல் சட்டம் (HIPAA) போன்ற ஒழுங்குமுறை கட்டுப்பாடுகள் வழியாகத் தீர்க்கப்பட்டுள்ளன. அமெரிக்க காங்கிரஸ் சுகாதார காப்பீட்டு பெயர்வுத்திறன், பொறுப்புக்கூறல் சட்டம் தனிநபர்கள் தாங்கள் வழங்கும் தகவல்கள், அதன் தற்போதைய, எதிர்கால பயன்பாடுகள் குறித்து தங்கள் தகவலறிந்த ஒப்புதலை வழங்க வேண்டும் என்று கோருகிறது. உயிரித் தொழில்நுட்ப வணிக வீக் இதழில் உள்ள ஒரு கட்டுரையின்படி , " நலவாழ்வுக் காப்பீட்டு பெயர்வுத்திறன், பொறுப்புக்கூறல் சட்டம் ஆராய்ச்சி அரங்கில் நீண்டகால விதிமுறைகளை விட பெரிய பாதுகாப்பை வழங்காது " என்று AAHC கூறுகிறது. மிக முதன்மையாக , தகவலறிந்த ஒப்புதலின் வழியாக பாதுகாப்பதற்கான விதியின் குறிக்கோள் சராசரி தனிநபர்களுக்கு புரிந்துகொள்ள முடியாத அளவை அணுகுவதாகும்.[30]
நலவாழ்வுக் காப்பீட்டு பெயர்வுத்திறன், பொறுப்புக்கூறல் சட்டம், குடும்ப கல்வி உரிமைகள், தனியுரிமை சட்டம் (FERPA) போன்ற அமெரிக்கத் தகவல் தனியுரிமைச் சட்டங்கள் , அத்தகைய ஒவ்வொரு சட்டமும் உரையாற்றும் குறிப்பிட்ட பகுதிகளுக்கு மட்டுமே பொருந்தும். குடும்பக் கல்வி உரிமைகள் , தனியுரிமை சட்டம் அமெரிக்காவில் உள்ள பெரும்பாலான வணிகங்களால் தரவு அகழ்தலைப் பயன்படுத்துவது எந்தச் சட்டத்தாலும் கட்டுப்படுத்தப்படவில்லை.
ஐரோப்பியப் பதிப்புரிமை தரவுத்தளச் சட்டங்களின் கீழ் , பதிப்புரிமை உரிமையாளரின் ஒப்புதலின்றி பதிப்புரிமை படைப்புகளை (வலை சுரங்கங்கள் போன்றவை) தரவு அகழ்வது சட்டவியலானது அல்ல. ஐரோப்பாவில் ஒரு தரவுத்தளம் தூய தரவாக இருக்கும்போது , பதிப்புரிமை இல்லை..ஆனால் தரவுத்தள உரிமைகள் இருக்கலாம் - எனவே தரவு அகழ்தல் தரவுத்தள வழிகாட்டுதலால் பாதுகாக்கப்படும் அறிவுசார் சொத்துரிமை உரிமையாளர்களின் உரிமைகளுக்கு உட்பட்டது. அறிவுசார் சொத்து தரவுத்தளளஆணை கர்க்ரீவ்சு மீளாய்வின் பரிந்துரையின் பேரில் , உள்ளடக்கத் தரவு அகழ்தலை ஒரு வரம்பாகவும் விதிவிலக்காகவும் ஒப்புதல் அளிக்க இங்கிலாந்து அரசு 2014 ஆம் ஆண்டில் அதன் பதிப்புரிமைச் சட்டத்தைத் திருத்த வழிவகுத்தது.[31] 2009 ஆம் ஆண்டில் தரவடகழ்தலுக்கு விதிவிலக்கு அறிமுகப்படுத்திய ஜப்பானுக்கு அடுத்தபடியாக அவ்வாறு செய்தது. உலகின் இரண்டாவது நாடு இங்கிலாந்து ஆகும். இருப்பினும் , தகவல் கழக ஆணை (2001) இன் கட்டுப்பாடு காரணமாக , இங்கிலாந்து விதிவிலக்கு வணிகவியல் நோக்கங்களுக்காக மட்டுமே உள்ளடக்கத் தரவு அகழ்தலுக்கு ஒப்புதல் அளிக்கிறது. தகவல் கழக ஆணை இங்கிலாந்து பதிப்புரிமைச் சட்டமும் இந்த விதியை ஒப்பந்த விதிமுறைகளாலும் கட்டுத்தளைகளாலும் இசைவு தராது. 2020 ஆம் ஆண்டிலிருந்தும் சுவிட்சர்லாந்து தரவு அகழ்தலை 24d சுவிசு பதிப்புரிமைச் சட்டத்தின் கீழ் சில கட்டுபாடுகளின் கீழ் ஆராய்ச்சித் துறையில் அனுமதிப்பதன் வழி ஒழுங்குபடுத்துகிறது. இந்தக் கட்டுரை 2020 ஏப்ரல் 1ஆம் தேதி முதல் நடைமுறைக்கு வந்தது.[32]
ஐரோப்பிய ஆணையம் 2013 ஆம் ஆண்டில் ஐரோப்பாவிற்கான உரிமங்கள் என்ற தலைப்பில் உரை, தரவு அகழ்தலில் பங்குதாரர்களின் விவாதத்திற்கு ஏர்பாடு செய்தது. ஐரோப்பிய ஆணையம்[33] வரம்புகள், விதிவிலக்குகளை விட உரிமம் போன்ற இந்தச் சட்டச் சிக்கலுக்கான தீர்வில் கவனம் செலுத்தியதால் , பல்கலைக்கழகங்களின் பேராளர்கள் ஆராய்ச்சியாளர்கள், நூலகங்கள், குடிமைச் சமூக குழுக்கள், திறந்த அணுகல் வெளியீட்டாளர்கள் மே 2013 இல் பங்குதாரர்களின் உரையாடலை விட்டு வெளியேற வழிவகுத்தது.[34]
அமெரிக்கப் பதிப்புரிமைச் சட்டம், குறிப்பாக நேரியப் பயன்பாட்டிற்கான அதன் விதிகள் அமெரிக்கா, இசுரேல், தைவான், தென் கொரியா போன்ற பிற நேரியப் பயன்பாட்டு நாடுகளில் உள்ளடக்கத் தர்வு அகழ்தலின் சட்டவியலான தன்மையை நிலைநிறுத்துகிறது. அமெரிக்கப் பதிப்புரிமை சட்டம், நேரியப் பயன்பாடு, உள்ளடக்கத் தரவு அகழ்தல் ஆகியன உருமாறும் தன்மை கொண்டதாக இருப்பதால், அது முதன்மை வேலையை மாற்றாது. இது நேரியப் பயன்பாட்டின் கீழ் சட்டவியலானதாக கருதப்படுகிறது. எடுத்துக்காட்டாக , கூகிள் புக் தீர்வின் ஒரு பகுதியான வழக்கின் தலைமை நீதிபதி , இலக்க மயமாக்கல் திட்டம் காண்பிக்கும் உருமாறும் பயன்பாடுகளின் காரணமாக , பதிப்புரிமை புத்தகங்களின் கூகிளின் இலக்க மயமாக்கல் திட்டம் ஓரளவு சட்டவியலானது என்று தீர்ப்பளித்தார்.[35]
பின்வரும் விண்ணப்பங்கள் கட்டற்ற/ திறந்த வாயில் உரிமங்களின் கீழ் கிடைக்கின்றன. பயன்பாட்டு வாயில் குறிமுறைக்கான பொது அணுகலும் கிடைக்கிறது.
பின்வரும் மென்பொருள் விண்ணப்பங்கள் தனியுரிமை உரிமங்களின் கீழ் கிடைக்கின்றன.
எடுத்துகாட்டுகள்
தரவுகளிலிருந்து தகவல்களைப் பிரித்தெடுப்பது பற்றிய கூடுதல் தகவலுக்கு (தரவை பகுப்பாய்வு செய்வதற்கு மாறாக) பார்க்கவும்: தரவு பகுப்பாய்வு
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.