Loading AI tools
ウィキペディアから
レコメンダシステム(英: recommender system)は、情報フィルタリング (IF) 技法の一種で、特定ユーザーが興味を持つと思われる情報(映画、音楽、本、ニュース、画像、ウェブページなど)、すなわち「おすすめ」を提示するものである。通常のレコメンダシステムは、ユーザーのプロファイルを何らかのデータ収集基準と比較検討し、ユーザーが個々のアイテムにつけるであろう評価を予測する。基準は情報アイテム側から形成する場合(コンテンツベースの手法)とユーザーの社会環境から形成する場合(協調フィルタリングの手法)がある。
ユーザーのプロファイルを構築するとき、データ収集の明示的部分と暗黙的部分を区別する。
明示的データ収集には次のようなものがある。
暗黙的データ収集には次のようなものがある。
レコメンダシステムはこのようにして集めたデータを他のデータと比較し、そのユーザーへのお勧めアイテムの一覧を計算する。商用または非商用のいくつかの例が協調フィルタリングの項目にある。Adomavicius はレコメンダシステムの概要を論じている[2]。Herlocker はレコメンダシステムの評価技法の概要を論じている[3]。
レコメンダシステムは、ユーザーが自力では見つけられないアイテムを提示できる可能性があり、情報検索の有益な代案となっている。レコメンダシステムは標準的でないデータに索引をつけた検索エンジンを使って実装されているものが多い。
レコメンダシステムでよく使われているアルゴリズムとして最近傍探索がある[4]。社会的ネットワークにおいて、特定ユーザーに近い上位N個の近傍(に重みを付けたもの)との相関係数を計算することでその嗜好(指向)空間での近傍がわかる。ユーザーの嗜好はそのデータをある技法で計算することで予測できる。
Netflix Prize は1億以上の映画格付け情報を集め、それに対して最も正確な検索を行った新規アルゴリズムに100万ドルを与えるものである。2007年の最も正確なアルゴリズムは、107個のアルゴリズムを組み合わせて1つの予測を導いていた[5]。
Predictive accuracy is substantially improved when blending multiple predictors. Our experience is that most efforts should be concentrated in deriving substantially different approaches, rather than refining a single technique. Consequently, our solution is an ensemble of many methods.
(上記の和訳)予測の正確さは、複数の予測を混合するときに大幅に高められる。我々の経験によれば、1つの技法を改良するよりも、複数の異なる技法を新たに生み出す方がよい。その結果、我々の解法は多数の手法の寄せ集めとなった。
推薦システムはデータマイニングや機械学習においては主要な研究分野であり、下記の会議以外でも多くの論文が発表されています。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.