圖像分割
維基百科,自由的 encyclopedia
在計算機視覺領域,圖像分割(segmentation)指的是將數字圖像細分為多個圖像子區域(像素的集合)(也被稱作超像素)的過程。圖像分割的目的是簡化或改變圖像的表示形式,使得圖像更容易理解和分析。[1]圖像分割通常用於定位圖像中的物體和邊界(線,曲線等)。更精確的,圖像分割是對圖像中的每個像素加標籤的一個過程,這一過程使得具有相同標籤的像素具有某種共同視覺特性。
圖像分割的結果是圖像上子區域的集合(這些子區域的全體覆蓋了整個圖像),或是從圖像中提取的輪廓線的集合(例如邊緣檢測)。一個子區域中的每個像素在某種特性的度量下或是由計算得出的特性都是相似的,例如顏色、亮度、紋理。鄰接區域在某種特性的度量下有很大的不同。[1]
分割操作也可以利用像素的全局和局部特性來完成。全局特性是通過多個像素的均值和物體的連續邊緣來計算,而局部特性則由連續像素和圖像邊界的相互作用來表徵。通過改進的加權函數來適應局部項和全局項之間的權重,可以顯著提高分割速度。[2]