Loading AI tools
多語語義網絡和百科詞典 来自维基百科,自由的百科全书
BabelNet是一個多語詞彙語義網絡和本體,由羅馬薩皮恩扎大學(羅馬大學)計算機科學系的計算語言學實驗室所創建。[1][2] BabelNet是自動構建的,其將最大的多語Web百科全書維基百科連結到最常用的英語計算詞典WordNet。這種連結整合,以自動映射的方式完成;對於資源匱乏的語言所存在的詞彙空缺,藉助於統計機器翻譯來補充。其結果是一個「百科詞典」,提供了多種語言的概念和命名實體,並包含了它們之間的豐富的語義關係。通過與免費授權使用的OmegaWiki、英語維基詞典、維基數據、FrameNet、VerbNet等語義資源建立連結,BabelNet還補充了其它一些詞彙和定義。和WordNet類似,BabelNet將不同語言中的詞語以同義詞集的形式進行組織,稱之為Babel synset。對於每一個Babel synset,BabelNet提供簡短的定義(稱為註釋),這些定義具有多種語言版本,主要來自於WordNet和維基百科。
當前版本 | BabelNet 3.7(August 2016) |
---|---|
作業系統 |
|
類型 |
|
許可協議 | Attribution-NonCommercial-ShareAlike 3.0 Unported |
網站 | babelnet |
截至2016年8月,BabelNet(v3.7)已覆蓋了271種語言,包栝全部的歐洲語言、大多數亞洲語言及拉丁語。BabelNet 3.7包含了大約1400萬個同義詞集和7.46億個詞義(不論其語言)。在每種語言中,每個Babel synset(詞義)平均包含2個同義詞。BabelNet的語義網絡包含了豐富的詞彙語義關係。這些語義關係有兩個來源:一是,來自於WordNet的語義關係,如上下位關係、部分整體關係、反義、同義關係等,總共大約36.4萬條關係;二是,來自於維基百科的非特定的相關關係,總共大約3.8億條關係。[1] BabelNet 3.7將大約1100萬張圖片與Babel synset建立了關聯,並為這些資源提供了Lemon RDF編碼[3],可通過SPARQL endpoint獲取。BabelNet 3.7為267萬個同義詞集指定了領域標籤。
BabelNet可廣泛應用在多語自然語言處理中。BabelNet中的詞彙化知識可在以下任務中取得最佳效果:
BabelNet是一個多語詞彙語義網絡和本體,因其在克服語言障礙和利用異構數據源方面做了巨大的開創性工作,BabelNet於2015年被授予META(頁面存檔備份,存於互聯網檔案館)獎。
BabelNet是最新的詞彙知識資源庫,具有巨大創新性,《時代周刊》曾專題報道BabelNet的研究工作[9],認為BabelNet將在21世紀發揮引領作用。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.