最小哈希计算机科学中的一种快速判断两个集合是否相似的技术 / 维基百科,自由的 encyclopedia 在电脑科学领域,最小哈希(或最小哈希式独立排列局部性敏感哈希(英语:locality sensitive hashing))方法是一种快速判断两个集合是否相似的技术。这种方法是由Andrei Broder (1997),[1]发明的,最初在AltaVista搜索引擎中用于在搜索结果中检测并消除重复Web页面。[2] 它同样也应用于大规模聚类问题,比如通过文档间包含的词语相似性进行聚类。[1]
在电脑科学领域,最小哈希(或最小哈希式独立排列局部性敏感哈希(英语:locality sensitive hashing))方法是一种快速判断两个集合是否相似的技术。这种方法是由Andrei Broder (1997),[1]发明的,最初在AltaVista搜索引擎中用于在搜索结果中检测并消除重复Web页面。[2] 它同样也应用于大规模聚类问题,比如通过文档间包含的词语相似性进行聚类。[1]