ベクトル空間モデル
情報検索を行うためのアルゴリズムの一つ ウィキペディアから
情報検索を行うためのアルゴリズムの一つ ウィキペディアから
ベクトル空間モデルとは情報検索を行うためのアルゴリズムの一つ。ベクトル空間モデルによる検索は高次元のベクトル空間上に配置した検索対象のベクトル表現と検索語のベクトル表現の相関量をコサイン類似度、内積、距離等によって計算して関連度を求める。
単語文書行列とはメタデータの生成・表現法の一つであり、ベクトル空間モデルによる検索を行う際に非常に頻繁に用いられるメタデータの形式である。一般に単語文書行列は以下に示す構造を持つ。
単語文書行列:
文書diに単語tjがn回出現するとき、wijをnとし、行列を形成する。単純に出現回数を利用する以外にtf-idf等のアルゴリズムによって得た重みを用いる生成方法がしばしば行われる。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.