Loading AI tools
来自维基百科,自由的百科全书
基於內容的圖像檢索(英語:Content-based image retrieval,CBIR;或content-based visual information retrieval),屬於圖像分析的一個研究領域。基於內容的圖像檢索目的是在給定查詢圖像的前提下,依據內容信息或指定查詢標準,在圖像數據庫中搜索並查找出符合查詢條件的相應圖片。
此條目沒有列出任何參考或來源。 (2017年8月14日) |
互聯網絡上傳統的搜索引擎,包括Google、Yahoo以及MSN都推出相應的圖片搜索功能,但是這種搜索主要是基於圖片的文件名建立索引來實現查詢功能(也許利用了網頁上的文字信息)。這種從查詢文字,文件名,最後到圖片查詢的機制並不是基於內容的圖像檢索。基於內容的圖像檢索指的是查詢條件本身就是一個圖像,或者是對於圖像內容的描述,它建立索引的方式是通過提取底層特徵,然後通過計算比較這些特徵和查詢條件之間的距離,來決定兩個圖片的相似程度。
基於內容的圖像檢索通常包括以下幾個部分:
可提取的特徵可以包括顏色、紋理、平面空間對應關係、外形,或者其他統計特徵。 圖像特徵的提取與表達是基於內容的圖像檢索技術的基礎。從廣義上講,圖像的特徵包括基於文本的特徵(如關鍵字、注釋等)和視覺特徵(如色彩、紋理、形狀、對象表面等)兩類。視覺特徵又可分為通用的視覺特徵和領域相關的視覺特徵。前者用於描述所有圖像共有的特徵,與圖像的具體類型或內容無關,主要包括色彩、紋理和形狀;後者則建立在對所描述圖像內容的某些先驗知識(或假設)的基礎上,與具體的應用緊密有關,例如人的面部特徵或指紋特徵等。
從圖像中提取的特徵可以組成一個向量,兩個圖像之間可以通過定義一個距離或者相似性的測量度來計算相似程度。
在傳統的基於文字的查詢技術中,不存在這個問題,因為查詢關鍵字基本能夠反映查詢意圖。但是在基於內容的圖像查詢中,就存在一個底層特徵和上層理解之間的差異(這也就是著名的semantic gap)。主要原因是底層特徵不能完全反映或者匹配查詢意圖。彌補這個鴻溝的技術手段主要有:
最早成功應用基於內容的圖像檢索技術的是IBM的QBIC系統。這個系統是為一個俄國博物館製作的繪畫作品查詢系統。QBIC系統的網站為IBM的QBIC系統。除了IBM的QBIC系統之外,比系較著名的反向圖像搜索統還包括UIUC大學的MARS系統、MIT的Photo book、UC Berkeley的Digital Library Project,加拿大的TinEye.com, 以及Columbia大學的VisualSEEk等。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.