vaba ja kõigile avatud teadmusbaas, mida loovad ja toimetavad vabatahtlikud kaastöölised From Wikipedia, the free encyclopedia
Wikidata (eestipäraselt Vikiandmed) on vabatahtlike kaastööliste koostöös toimetatav teadmusbaas, mis on mõeldud olema Vikipeedia ja selle sõsarprojektide ühiselt jagatud andmeallikas. Kuna baasis olevad andmed litsentsitakse avalikku omandisse, siis on Wikidata piiramatult kasutatavad ka kolmandatele osapooltele. Teadmusbaas kasutab Wikibase tarkvara ning teadmusbaasi haldab Wikimedia Foundation.
Wikidata on Vikipeedia taristu mõttes analoogne Wikimedia Commonsiga, mis on Vikipeedia ja sõsarprojektide ühiselt jagatud meediapank.
Wikidatas on üle 100 miljoni andmeüksuse.
Wikidata on iseseisev struktureeritud linkandmete projekt, mille eesmärgiks on luua universaalne andmeontoloogia ning täita see ajakohase ning usaldusväärse andmesisuga autoriteetsetest andmeallikatest. Ulatuslike andmetega täidetud ja ajakohane teadmuspank oleks Vikipeedia jaoks vahend sisu kvaliteedi tagamisel ning Wikidatas kasutatav semantilistest kolmikutest koosnev subjekt-predikaat andmestruktuur võimaldaks andmesisu abil genereerida väiteid ning lauseid mistahes keeles ning panna sellega aluse uue põlvkonna andmepõhisele entsüklopeediale.[1]
Wikidata arenduses seati esialgu eesmärgiks juurutada andmete kasutamist Vikipeedias kolmes faasis:
2018. aasta alguses oli Wikidata seisus, kus loodavate andmeüksuste ning kasutajate arv tõusis kiiresti[4] ning lahendamist ootasid küsimused ülemontoloogia loomisega ning selle kureerimisega[5], ka põhjustasid arutelusid andmeallikate viidatus ning automaatsed andmete importimise ja uuendamise vahendid ning nende haldus[6]. Seejuures oli Wikidata juba võtnud üle DBpedia ja Freebase'i ülesanded ning on laialdaselt kasutusel eri infoühiskonna teenuste juures, ka on Wikidatas olemas terviklikud andmehulgad eri valdkondadest, nt geneetikast.[7]
Andmed on Vikiandmete teadmusbaasis esitatud andmeüksustena (ingl k item). Igal üksusel on unikaalne identifikaator kujul Q1234567, üksus võib olla nii konkreetne objekt või isik, liiginimi, mõiste vmt, st mistahes mis on olemas ning unikaalsena identifitseeritav. Iga üksuse juurde kuuluvad avaldused (ingl k statement) selle üksuse kohta, mis on väljendatud omadustena (ingl k property või attribute), mille abil omistatakse üksustele väärtusi (ingl k value). Väärtused võivad olla nt arvandmed, pildid, aga ka teised Wikidata andmeüksused.
Ka omadused on varustatud unikaalsete identifikaatoriga kujul P12345 ning need seovad omavahel andmeüksusi ja andmeid või andmeüksusi üksteisega ning annavad sellega teadmuspangas talletatud väidetele sisu. Kui andmeüksused võivad olla semantilise kolmiku mõttes subjekti ja predikaadi positsioonis, siis omadused on alati koopula ehk siduva verbi positsioonis.[8][9]
Wikidata tavakasutaja puutub kokku peamiselt andmeüksuste loomise või nende muutmisega, nt uute avalduste lisamisega olemasolevatele üksustele vmt. Omaduste loomine on aga juba seotud Wikidata spetsiifilise ontoloogiaga ning uue omaduse loomise ettepanek tähendab, et olemasolev ontoloogia ei ole maailma kirjeldamiseks piisav ning vajab täiendamist. Uute omaduste loomise taotlused vaadatakse Wikidata kaastööliste poolt ühiselt läbi ning kui nende järele on vajadus, siis need kinnitatakse.[10]
Wikidata sai alguse 30. oktoobril 2012[11] ning oli Wikimedia Foundationi esimene uus projekt alates 2006. aastast. Esimese faasina loodi andmebaas intervikilinkidest, millele Vikipeedia eri keeleversioonidel puudus ligipääs. Wikidata lingistikku rakendati esimest korda 14. jaanuaril 2013 ungarikeelses Vikipeedias[12]. 30. jaanuaril järgnesid heebrea ja itaalia Vikipeediad[13], 13. veebruaril inglise Vikipeedia. Kõigis ülejäänud keeleversioonides (sh eestikeelses Vikipeedias) võeti Wikidata kasutusele 6. märtsil 2013[14].
Wikidata üks kolmest eesmärgist on pakkuda ühisest allikast teatud andmetüüpe (nt sünnikuupäevi) Wikimedia projektidele nagu Vikipeedia. Intervikilinkide järel on Wikidata töö teise faasi jõudmisel hakatud pakkuma ka teisi andmetüüpe, sh lisaks Wikimedia Commonsi pildifailidele, geograafilistele koordinaatidele, kuupäevadele jmt ka linkandmeid paljudest autoriteetsetest avaandmete kogudest. Vikipeedia keeleversioonidel on neile andmetele täielik ligipääs alates aprillist 2016.[15]
Kolmandas faasis hakatakse Vikipeedias olevaid nimekirju, tabeleid jm andmetel põhinevat sisu automaatselt genereerima Wikidata põhjal ning üleminek sellesse faasi alles käib.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.