視覺粵拼si6 gok3),學術上叫視知覺,係對感知過程:視網膜上面嘅感光細胞會對光起反應,會按自己接收到嘅光嘅特徵(強度顏色等)向個處理視覺嘅區域射訊號,話俾個腦知自己見到乜[1][2]

Thumb
眼係視知覺嘅起始點。

視知覺係一個多層嘅過程:喺最基本嗰一層,腦要知眼睇到嘅嘢嘅物理特徵;跟住要按睇到嘅嘢嘅呢啲特徵,將眼睇到嘅影像分做各件物件,並且評估環境入面每件物件係乜-例如如果睇到件物件中間有一條垂直、啡啡地噉色嘅幹,而幹上面有好多綠色嘅薄片,嗰件物件好可能係一樖;然後再將物件分類-將嗰件物件同表示心智表徵連埋一齊[3][4]。呢啲複雜嘅認知過程冚唪唥都屬於視知覺嘅一部份[1]

認知科學等領域有對視知覺進行詳細嘅研究,而呢啲研究相當有實用價值[5][6]:例如有唔少研究視知覺嘅科學家都會運用眼動追蹤嘅方法,喺受試者睇視藝作品嗰陣監察住佢哋眼珠嘅郁動,研究幅作品嘅特徵(題材同構圖等)會點樣影響受試者嘅眼珠郁動,而眼珠郁動又會點影響受試者有幾鍾意幅作品-而呢啲研究令到本嚟只係憑經驗同直覺視藝設計原則(指藝術界一柞有關「要點先可以令幅作品受歡迎」嘅諗法)得到科學證據支撐,所以呢啲研究對廿一世紀嘅藝術設計起咗唔少作用[7]

研究方法

一個受試者做眼動追蹤研究嘅片

認知科學等嘅領域有對視知覺進行詳細嘅研究。認知科學家會用好多種認知科學上用開嘅方法研究視知覺,包括:做實驗睇吓一個視覺刺激嘅特性會點影響人嘅行為,靠噉判斷視覺處理過程當中發生乜嘢事[8];又有研究會嘗試睇吓某個腦區受損會點影響一個人嘅視覺能力,從而判斷嗰個腦區喺視知覺當中扮演咗乜嘢角色[9];有研究會一路要受試者做一啲要求視覺嘅認知作業,一路用神經成像方法監察住受試者嘅腦活動,睇吓邊啲腦區同邊啲視覺過程有關[10]。另一方面,學界仲有眼動追蹤呢種專門做視知覺相關研究嘅方法[5][11]

眼動追蹤

内文:眼動追蹤

眼動追蹤(eye tracking)指用某啲方法量度受試者眼珠嘅郁動相關嘅資訊-好似係「對眼喺呢個時間點望住呢個位,逗留咗幾多幾多秒」等等[12]。喺廿一世紀嘅眼動追蹤研究裏面,最常用嘅做法係拍片影住受試者對眼,個眼動追蹤器會得到受試者眼珠嘅影像,用機械學習演算法等嘅方法加埋「個鏡頭喺邊個位置」嘅資訊,判斷受試者喺拍片期間每個時間點對眼望緊邊個位。呢啲資訊跟住就可以攞嚟做進一步嘅分析[5]。想像家陣有份噉嘅研究:研究者搵柞畫人物嘅畫返嚟,叫受試者睇吓啲畫,一路用眼動追蹤器監察住佢哋嘅眼珠;佢哋跟住發現,多數受試者都會望咗(視覺固定)幅畫當中塊人面先-於是呢份研究就搵到一啲有趣嘅資訊[11][13]

視覺檢索(visual search)就係視覺研究上會用嘅一類眼動追蹤實驗,研究人點樣由一大柞視覺資訊入面搵出一部份對佢有用嘅資訊出嚟,喺做視覺檢索嗰陣,研究者會喺一個熒幕上顯示一大柞視覺資訊,再睇吓受試者嘅眼珠郁動等嘅變數會受乜因素影響。舉個例說明:喺其中一個版本嘅視覺檢索實驗入面,個受試者會俾研究者安排坐喺度望住個熒幕,個熒幕喺每次試驗當中都會顯示若干個圓形四方形,而個受試者嘅任務係喺每次試驗之後答吓喺嗰次試驗入面個熒幕度有冇出現過(例如)綠色嘅圓形。跟手個研究者就可以透過操控某一啲實驗上嘅變數嚟做唔同嘅研究,再唔係或者一路俾啲受試者做個作業,一路用腦電圖(EEG)等嘅方法監察住佢哋嘅腦活動,睇吓個腦邊幾忽嘅活動同視覺檢索有關[14]

眼動追蹤研究上成日會分析嘅變數有以下呢啲[15][16]

  • 視覺固定 fixation):指對眼望實某一個區域,喺若干秒之間停留喺嗰個區域之內(眼好少可會真係完全唔郁,所以視覺固定指嘅係停留喺個區域以內,郁嘅幅度好細,未至於大到會離開嗰個區域);
  • 掃視(saccade):指對眼由一個位置快速噉移去另一個位置,期間冇喺任何一個眼經過嘅位置上逗留超過若干毫秒,而一次掃視嘅起點同終點都有出現固定。
  • 平滑追蹤(smooth pursuit):指對眼固定於一件郁緊嘅物件之上,維持呢個狀態若干秒。
Thumb
眼動追蹤嘅圖例;圖上嘅一個圓圈代表個受試者有𥄫實過嘅區域(望咗超過若干秒),而圓圈上嘅數字表示望嘅次序。

雙眼競爭

内文:雙眼競爭

雙眼競爭(binocular rivalry)係另一種常用嘅視覺實驗。喺做雙眼競爭實驗嗰陣,個研究者都會俾個受試者戴啲特製嘅眼罩,而呢啲眼罩內置兩個熒幕(左眼一個右眼一個),令到個研究者可以控制個受試者左眼同右眼分別睇到啲乜,跟住研究者就可以做實驗睇吓受試者睇到同記得嘅嘢會受乜因素影響。例:當左眼同右眼睇到好唔同嘅影像嗰陣,個人意識上會覺得自己睇到兩幅交替噉出現嘅影像,但有啲研究就發現,喺做實驗之前叫個受試者喺腦入面想像一啲影像會影響到佢睇到啲乜-如果家吓喺個實驗入面左眼個熒幕顯示綠色圓形,而右眼個熒幕顯示藍色四方形,事前俾個研究者叫佢哋喺腦入面想像綠色圓形嘅受試者比較大機會會話自己淨係見到綠色圓形。除此之外,雙眼競爭實驗成日俾人攞嚟研究左右腦之間嘅差異對視知覺有乜影響[17]

Thumb
一個人其中一隻眼望到藍色嘅 red 字(英文紅色噉解)、另一隻眼望到紅色嘅 blue 字(英文藍色噉解),佢最後望到嘅影像會係點?

視覺系統

Thumb
視覺系統各部份嘅簡化圖解
内文:視覺系統

視覺系統係指中央神經系統裏面負責處理視覺資訊(眼所探測到嘅光)嘅部份。喺人同多數哺乳類當中,

  • 光會通過眼角膜射落去對光敏感、位於隻眼最後嘅視網膜嗰度。
  • 視網膜上有感光細胞(一塊人類視網膜上有上億粒感光細胞)會按接收到嘅光嘅物理特性(強度同顏色等)嚟決定射乜嘢訊號:例如有啲感光細胞淨係會對藍色光有反應,所以如果呢柞細胞有射訊號,個腦就可以知道隻眼實係接收到藍色光;又有啲感光細胞射訊號嘅頻率會視乎收到嘅光嘅強度而定,所以個腦可以透過觀察呢啲訊號嘅頻率得知隻眼睇到嘅光嘅強度。
  • 呢啲訊號會經視神經上腦,目的地係位於枕葉(最近後尾枕嗰塊腦葉)後方嘅視覺皮層[18]-視覺皮層係成塊大腦皮層大腦最外面嗰浸組織)嘅視覺資訊中心,負責處理個腦收到嘅視覺訊號,而視覺皮層病變可以搞到個人就算對眼好地地都[9][10]

一般嚟講,人嘅視覺系統會對電磁波譜當中波長喺 370 至 730 納米之間嘅電磁波有反應-呢啲電磁波係所謂嘅可見光[19]。不過一個人睇得到乜嘢電磁波可以受年齡等因素影響,例如有研究發現,佢哋研究樣本當中嘅細路可以睇得到大人睇唔到、波長得嗰 340 納米嘅紫外光[20]

視覺系統最重要嘅部份有以下呢啲[19]

  • :具有多個幫手將光轉化成腦解讀到嘅神經訊號嘅器官。
    • 眼角膜(cornea):位於隻眼最前,負責將光引導去視網膜嗰度。
    • 視網膜(retina):上面有感光細胞,會將光轉化成神經訊號,神經訊號嘅特性會隨接收到嘅光嘅特性變化。
  • 視筋(optic nerve):位於視網膜後面,幫手將訊號轉上腦,途中訊號會經過多個腦區。
  • 丘腦(thalamus):位於腦幹(brain stem)對上嘅一個腦區,會幫手將各種感官嚟嘅訊號轉介去專門處理嗰種訊號嘅大腦皮層區域嗰度-包括將視覺訊號轉介去視覺皮層[21]
  • 視覺皮層(詳情可以睇下面):位於大腦皮層嘅枕葉後方,負責做多種視知覺相關嘅資訊處理。視覺皮層又有得再細分做多個子區域,每個子區域都負責處理唔同類嘅視覺資訊[22]
Thumb
一個健康大人嘅右眼視網膜;一條條嗰啲係負責向視網膜供血嘅血管

由下至上定係由上至下?

視覺系統對感光細胞傳出嘅資訊嘅處理可以分做兩大種[23]

  • 由下至上過程(bottom-up):感官會客觀噉將佢哋收到嘅資訊傳上去個腦嗰度,俾個腦知道外界有乜。
  • 由上至下過程(top-down):個腦會按自身嘅目的,控制同指揮感官以及點樣處理感官資訊,例如係按自己想睇乜而移動對眼,影響對眼睇到乜。

不專注視盲係由上至下過程嘅一個出名例子。喺一份 1975 年做嘅研究當中,有幾個研究者搵咗班受試者返嚟,叫佢哋睇一段兩隊人喺度打籃球嘅短片,跟住要求班受試者係噉數住「邊隊傳咗幾多次波」等要佢哋望實個波先睇得到嘅資訊;中途段片有個人會著住一件大猩猩嘅衫行過,結果發現,有成大約 50% 嘅受試者好專心噉喺度數嘢,事後問返佢哋,佢哋完全冇留意到有人著住大猩猩衫行過(因為「不專注」而睇唔到一啲嘢)-呢個實驗顯示咗,人對視覺資訊嘅處理唔係純粹客觀,而係會受到佢哋做緊啲乜或者諗緊啲乜影響,展示咗由上至下過程[8]

感光細胞

内文:感光細胞
睇埋:彩色視覺

感光細胞係負責做視覺感官轉導(將一種感官刺激轉化做第樣嘢嘅過程)嘅一種細胞,會接收隻眼所探測到嘅光,再按啲光嘅特性決定射點樣嘅訊號-將「光」呢種刺激轉化做「神經活動」[24]

一個正常大人塊視網膜當中有上億粒感光細胞,而感光細胞嘅所在地就係視覺感官轉導發生嘅地區。感光細胞可以細分做

  • 視桿細胞(rod;一個正常大人視網膜有大約 1 億 2,000 萬粒[25])同
  • 視錐細胞(cone;一個正常大人視網膜有大約 600 萬粒[25]

兩種,前者對光嘅敏感度高啲,方便喺光唔夠嘅情況(四周圍好黑)嗰陣睇嘢,而後者雖然對光嘅敏感度低啲(所以喺周圍黑嗰時會失效),但能夠分辨顏色-視錐細胞有得按對乜嘢色有反應再細分做三大種,每種色嘅可見光喺三種視錐細胞當中引起嘅反應都唔同,令個腦可以靠睇三種視錐細胞分別嘅活動,嚟判斷眼前物件係乜色[26]。喺某啲人當中,塊視網膜可能因為遺傳等嘅原因,搞到某啲視錐細胞少咗啲甚至冇嗮-呢啲人就會唔能夠分辨某啲顏色,而呢種情況就係所謂嘅色盲[27][28]

視覺皮層

Thumb
邊度
係乜
Thumb
雙流假說嘅圖解;淡紅色嗰笪係視覺皮層,而視覺皮層會出兩大流輸出。
内文:視覺皮層
睇埋:心像

視覺皮層(visual cortex)係大腦皮層嘅視覺資訊中心,位於成塊大腦皮層最近後尾枕嗰忽。視覺皮層同視網膜之間有大量嘅視覺神經,呢啲神經會將視網膜所收到嘅資訊(經過丘腦等嘅腦區)傳上去視覺皮層嗰度,等視覺皮層可以對呢啲資訊作出分析。視覺皮層可以細分做幾橛,每橛有唔同功能[10][29]

  • 主要視覺皮層(V1)負責直接由丘腦等嘅轉介腦區(將感官資訊轉介去相關腦區嘅腦區)嗰度接收訊號輸入[30];V1 對於有意識噉處理視覺資訊嚟講零舍重要-研究發現,V1 受損嘅病人好多時會出現盲視嘅現象,個病人會(例如)能夠喺行路嗰陣避開自己身前嘅障礙物,但就唔能夠有意識噉講出自己眼前有啲乜(同時佢哋喺語言能力上冇異常),即係話佢哋個腦能夠一定程度上處理視覺資訊,但唔能夠有意識噉知道啲資訊嘅內容[31]
  • 視覺 V2 區會由 V1 嗰度接收強嘅單向訊號,而且同 V3、V4、同 V5 等再深啲嘅視覺區域有強烈嘅連繫;V2 嘅細胞對睇到嘅物件嘅方向敏感,而且亦都會區分顏色同物件嘅郁動[32][33]
  • V1、V2、同 V3 合稱做早期視覺區(early visual area),因為科學界曾經認為佢哋主要係做由下至上過程,但廿一世紀初嘅研究指,呢幾個區仲會支援由上至下過程。例如有研究試過噉做:研究員一路要一班受試者做要用到心像(指喺腦入面想像一啲視覺資訊,但嗰啲資訊並唔存在喺周圍環境當中,所以心像係一個由上至下過程)嘅作業,一路用架生監察住受試者 V1、V2、同 V3 嘅活動;結果發現,佢哋可以靠淨係睇呢啲腦區嘅活動,分辨得到個受試者喺度想像緊邊一個影像-即係話呢幾個區會幫手做由上至下嘅過程[34]

雙流假說

内文:雙流假說

雙流假說(two-streams hypothesis)係一個描述神經系統點處理一種感官資訊嘅假說。根據描述視覺系統嘅雙流假說,視覺皮層會向第啲腦區傳訊號,而呢啲訊號流可以分做兩大流-腹側同埋背側[35]

  • 腹側(ventral)流會將訊號傳去顳葉(近頭殼兩側嘅腦葉)同邊緣系統嗰度,其中一樣邊緣系統管嘅嘢係情緒,腹側流訊號帶有「睇到嘅物件係乜」(係乜)嘅資訊,令到個人曉對睇到嘅物件起適當嘅情緒反應(例如見到獵食者要識驚);而腹側流相關嘅腦區受損會搞到病人認物件有困難[36]
  • 背側(dorsal)流會將訊號傳去頂葉(近頭殼頂嗰笪腦葉)等嘅腦區嗰度,當中頂葉最主要係負責控制身體嘅郁動,而背側流嘅訊號帶有「睇到嘅物件喺乜位置」(邊度)嘅資訊,頂葉等嘅腦區會運用呢啲資訊,引導個身體作出適當嘅郁動(例如避開對眼見到嘅障礙物)[37]

完形心理學

睇埋:視錯覺

完形心理學(gestalt psychology,嚟自德文 gestalt,即係德文形態噉解)包含一柞描述感知點樣組織一個景嘅原則[38][39]:當一個人望世界嗰陣,佢通常會將得到嘅資訊了解成若干件同組物件,後面有個背景,而每件物件有會有若干組成部份,所以一個心靈要識得由視網膜收到嘅資訊-呢啲資訊只係若干個點,每點有隻色-嗰度作出「邊柞點係一件物件」同「邊啲點係背景」等嘅判斷。視覺嘅完形心理學主要係用實驗方法,嘗試了解人嘅心靈點樣將視網膜嘅資訊組織成對睇到嘅嘢嘅概念了解。

完形原則

根據完形心理學嘅研究,人嘅心靈傾向憑以下原則組織見到嘅嘢,例如[39]

  • 接近原則:當一個人見到一柞同類物件嗰陣,會傾向將離彼此相近、離組外物件遠嗰啲當做同一組,例如係下面有兩幅圖,左手邊嗰幅會傾向俾人當做「一柞圓圈」,而右手邊嗰幅就會傾向俾人睇做「三組圓圈」[40]
Thumb
  • 相似原則:當一個人見到一柞物件嗰陣,傾向將外形上相似嘅當做一組-「外形上相似」可以包括形狀、色水、以及第啲外形上嘅特徵。以下圖為例,人傾向將灰色圓圈睇做一組,同埋將黑色圓圈睇做一組[40]
Thumb
  • 封閉原則:人傾向將物件視為完整嘅,並且忽略物件嘅缺口(只要啲缺口唔大得滯)。好似係下面嗰幅圖噉,下圖當中查實並冇任何完整嘅圖形,但多數人望到幅圖都會話自己見到一個圓形同一個四方形-忽略咗嗰啲細嘅缺口[40]
Thumb

電腦視覺

Thumb
一個簡單嘅前饋神經網絡圖解;一粒細胞嘅啟動程度會受打前嗰層嘅細胞嘅啟動程度影響,最後俾出一個輸出。
内文:電腦視覺

電腦視覺人工智能嘅一個子領域,涉及科學家嘗試教電腦做人類視覺系統做到嘅工作-電腦視覺涉及研究教電腦由睇到嘅影像當中分辨睇到啲乜嘢物件、判斷周圍物件嘅位置(呢種技術對自駕車嚟講好有用)、以至認人樣等等[41]

做電腦視覺基本步驟如下:

事先處理
電腦視覺程式會由某啲型式嘅光感應器嗰度得到訊號,再將訊號轉化做電腦記得住嘅碼。舉個例說明,喺用紅綠藍色彩模式(RGB model)將一幅圖存入去佢嘅記憶體嗰陣,部電腦會記住「」噉嘅一系列數字,每組數字有三個數,每個最細係 0 最大係 255,第一個數代表嗰一點有幾多紅(R),第二個數代表嗰一點有幾多綠(G),而第三個數代表嗰一點有幾多藍(B),而成串嘢當中有 組「每組三個數」嘅數- 就係幅圖嘅象素;最後形成一個矩陣,令到部電腦可以記住幅圖嘅樣[42]
運算方法
喺做咗事先處理之後,影像數據就可以用好多演算法嚟處理。想像一個人工神經網絡(ANN),一個簡單嘅前饋人工神經網絡分若干層,每層有若干粒人工神經細胞,每粒人工神經細胞都有個數值,個數代表佢嘅啟動程度,而每粒神經細胞嘅啟動程度嘅數值都有條式計,呢條式包括咗喺佢之前嗰啲神經細胞嘅啟動程度,即係話個程式會有一條類似噉樣嘅算式:
喺條式當中, 代表嗰粒神經細胞嘅啟動程度, 代表其他神經細胞當中第 粒嘅啟動程度,而 就係其他神經細胞當中第 粒嘅權重(指嗰粒神經細胞有幾影響到 )。所以當一粒人工神經細胞啟動嗰陣,會帶起佢後面啲人工神經細胞跟住佢啟動,似十足生物神經網絡入面嗰啲神經細胞噉。喺一個卷積網絡當中,最前嗰層有 粒細胞,每 粒細胞代表幅輸入圖像嘅像素嘅色水,而最後嗰層有一粒細胞,呢粒細胞有兩個可能數值,1(陽性)同 0(陰性)[43]
機械學習
跟住研究者要個網絡做學習:個研究者走去搵柞數據返嚟-呢柞數據就係所謂嘅訓練集(training set);呢個訓練集會包括咗一連串嘅輸入個案,每個個案都係一幅影X 光片,研究者亦已經知道啲個案當中邊個有肺癌邊個冇;跟手個研究者就可以將個訓練集嘅數據入落去個神經網絡做輸入,等部電腦計出喺每一個個案入面,個神經網絡俾出嚟嘅輸出(即係佢對「呢幅 X 光片個人係咪有肺癌」嘅診斷)同正確嘅輸出值有幾大出入,跟手事先編寫好嘅學習法則就會按照呢啲落差值計吓啲權重要點變,先可以令到個神經網絡俾出更準確嘅答案。如是者,喺個神經網絡運算過大量嘅個案之後,佢嗰啲權重等等嘅參數就會有所改變,變到更加能夠計到正確嘅答案-個研究者就可以攞呢個神經網絡嚟去做將來嘅肺癌診斷。呢種用電腦視覺做醫療診斷嘅做法喺廿一世紀醫學上經已取得咗相當嘅成功,甚至有研究發現,用呢種程式做診斷仲準過要醫生做[44][45]

視藝研究

視覺科學(vision science)研究視覺系統對圖像嘅處理,而視藝作品係圖像嘅一種,所以有唔少研究視知覺相關現象嘅科學家都有興趣了解人類視覺系統點樣處理視藝作品,而呢啲研究嘅結果對廿一世紀嘅藝術設計嚟講相當有影響。例如有唔少視覺研究者都有用眼動追蹤嚟睇吓受試者睇一幅畫嗰陣對眼會點郁,同埋視覺固定嘅數量、維持幾耐、以及位置等嘅變數會受乜因素影響[46][47]

呢方面嘅視覺研究幫手為視藝設計原則提供科學證據:

  • 視藝設計原則係藝術界一柞有關「要點先可以令幅作品受歡迎」嘅諗法,傳統嚟講係由藝術家憑經驗而觀察到嘅現象;
  • 廿世紀開始嘅視覺研究就有開始探討視藝設計原則嘅真確度,例如有一條視藝設計原則指出,人類傾向比較鍾意兩邊對稱嘅影像(包括人面同畫),所以藝術家喺畫畫嗰時要令幅畫某啲方面對稱,例如一幅畫一班人嘅畫要左右兩邊有相同數量嘅人;
  • 而有實驗就試咗搵咗柞畫返嚟,一啲有對稱性一啲冇,發覺受試者真係會比較傾向鍾意兩邊對稱嘅畫

-令「對稱原則」呢條本嚟只係藝術家經驗之談嘅諗法得到科學證據支撐[48]

Thumb
梵高 1890 年嘅作品《麥田群鴉》;一個賞畫者欣賞呢幅作品嗰陣對眼會點郁(固定喺乜位、固定幾耐、同以乜嘢軌跡掃視)?藝術專家同普通人嘅眼郁動有冇分別?幅畫本身嘅特徵(構圖等)又會點影響眼郁動?呢啲都係視覺科學研究藝術嗰時會問嘅問題[47]

相關科學

睇埋:認知科學

相關藝術

内文:視覺藝術

垃雜相關

文獻

英文文獻:

  • Cornsweet, T. (2012). Visual perception. Academic press.
  • Haber, R. N., & Hershenson, M. (1973). The psychology of visual perception. Holt, Rinehart & Winston.
  • Hung, C. P., Kreiman, G., Poggio, T., & DiCarlo, J. J. (2005). Fast readout of object identity from macaque inferior temporal cortex (PDF). Science, 310(5749), 863-866.
  • Von Helmholtz, Hermann (1867). Handbuch der physiologischen Optik. 3. Leipzig: Voss. Quotations are from the English translation produced by Optical Society of America (1924–25): Treatise on Physiological Optics.

引述

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.