統制語彙
対象の情報群を用意した用語の集合に関連付けることで(情報群の)収拾・構造化及びその記述を図る語彙体系 ウィキペディアから
統制語彙[1]:30 [2]:62(とうせいごい、英: controlled vocabularies)又は統制語[3]:716(とうせいご、英: controlled term; CT)とは、対象の情報群を用意した用語の集合に関連付けることで(情報群の)収拾・構造化及びその記述を図る[4]:443語彙体系である。
同義語や表記揺れがある自由語[3]:716(英: free term; FT)又は非統制語彙[5]と対比的に用いられる[6]。
概要
範列的曖昧性を次のような段階で制御できる[2]:63。
- 文法的変種の統制
- 表記揺れに対する優先語の設定
- 優先語間の階層構造等の構築
時折、第二段階(暗黙的に第一段階を包有する)だけを意識して、「表記揺れを統制した語彙」などと表現される[7]:x。
特徴
利点
- 検索漏れの防止
- 同義語や語形変化を統制してある[8]:3ので、表現の違いによる検索漏れを防ぐことができる[9]。
- 〝雑音〟の少ない検索結果
- (自由語による検索などとは異なり)文書の全内容を闇雲に探索するのではなく、文書作成者が意図的に選択、賦与した語彙による検索を主軸とする[10]為に、検索結果に目的としない余計な情報が混ざりにくくなる[9]。
- 網羅的検索[3]:718
問題点
例
他体系との連関
自由語
統制語彙と対照をなす性質故に長短が逆転する自由語は、屡々統制語彙と適宜併用され[3]:716、 双方の利点を兼ね備えた〝折衷〟体系として実務に応用されている[18]。
特に統制語彙が苦手とする専門用語や新しい概念の索引として自由語が利用される傾向がある[19]。
民衆分類との連関
民衆分類は利用者が主体的に附加する語彙体系であり、 集合知の代表格と見做されている[20]:1217。 その民主性によって前述の乖離を解消すること等が期待されている[2]:66。
Webなど、タグ付けに統制語彙を用いるのが実際上又経済上の理由から困難である環境においては、 情報の整理・分類に、民衆分類が次善策として[注釈 3]用いられる[21]:240。
脚注
参考文献
関連項目
外部リンク
Wikiwand - on
Seamless Wikipedia browsing. On steroids.