圖像記憶是視覺感覺記憶寄存器,負責儲存快速衰減的視覺資訊,也是視覺記憶系統的元件之一,其它元件還包括視覺短期記憶(VSTM)和長期記憶(LTM)。 圖像記憶是極短(小於1秒)、預分類(pre-categorical)、高容量的記憶儲存,[1] [2]在短時間內提供完整連貫的視知覺表徵,從而促成視覺短期記憶。圖像記憶有助於解釋像是改變視盲現象以及跳視英語Saccade期間的連續性經驗現象。圖像記憶不再被視為單個實體,而是至少有兩個不同元件。[3]包括斯珀林的部分報告範式以及現代技術在內的經典實驗,則持續為感官記憶的儲存性質帶來洞見。

概述

歷史上已有許多人觀察到,在物體偏移後,會出現持續的生理圖像。這個現象最早出自於亞里士多德的記載,他認為後像與夢的體驗有關。在18世紀和19世紀,研究人員觀察到,若快速移動柴火棍,柴火棍末端的餘燼會產生光跡,進而引發他們的興趣並開始對這種現象進行實證研究[4],而這現象後來被稱為視覺暫留[3]在20世紀,由於假設視覺暫留在視覺短期記憶中,對視覺資訊有着預分類表徵英語Categorical perception的作用,因此視覺暫留在記憶中扮演的角色引起了相當大的關注。 1960年,為了確認視覺感官記憶是否存在,以及確認容量和持續時間等特徵,喬治·斯珀林進行了經典的部分報告實驗。[1]1967年,奈瑟(Ulric Neisser)將這種迅速衰減的記憶儲存稱為圖像記憶 。 [5]在斯珀林實驗過後約20年,在視覺感官記憶中,浮現兩個獨立元件的概念,即「視覺暫留」(visual persistence)和「資訊暫留」(informational persistence)。斯珀林的實驗主要測試了刺激的資訊暫留,而其他如Coltheart則進行了視覺暫留的直接測試。[3] 1978年,Di Lollo提出了一種視覺感官記憶的雙態模型。[6]儘管歷史上一直存在爭議,但目前明確將圖像記憶區分為視覺暫留和資訊暫留,這兩種暫留性質的測試方法不同,並具有根本不同的屬性。資訊暫留是圖像記憶的基礎,作為預分類感官儲存,被認為是視覺短期記憶的關鍵因素。[3] [7] 類似的儲存區還有聲音的臨時倉庫[8]

元件

圖像記憶的兩個主要元件是視覺暫留和資訊暫留 。視覺暫留為由感覺系統創建的物理圖像之中相對簡短的(150ms)預分類視覺表徵,為個人觀察和感知的「快照」。資訊暫留則是更持久的記憶儲存器,其將視覺圖像編碼後的版本表示為後分類資訊(post-categorical information),為大腦接收及處理之後的「原始數據」。還可以考慮第三個元件「神經暫留」(neural persistence),指的是「視覺系統的身體活動和記錄」。[3][9]神經暫留通常以神經科學技術如EEGfMRI為代表。

視覺暫留

視覺暫留是在物理偏移之後視覺圖像仍然存在的顯著印象,這可以被認為是神經暫留的副產物。對於刺激的物理參數,視覺暫留比對資訊暫留更敏感,這反映在其兩個關鍵屬性:[3]

  1. 視覺暫留的持續時間與刺激持續時間成負相關。這意味着物理刺激的呈現時間越長,視覺圖像在記憶中衰減得越快。
  2. 視覺暫留的持續時間與刺激亮度成負相關。當刺激的光度或亮度增加時,視覺暫留的持續時間會減少[2]。由於神經系統的參與,視覺暫留高度依賴於光感受器的生理機能和視覺皮層中不同細胞類型的激活。這種可見表徵會受到遮蔽效應的影響,也就是說,在刺激消退期間或刺激消退之後,藉由呈現干擾,這會立即妨礙對刺激的回想。[10]

為了得知視覺暫留的持續時間,已經使用不同的技術進行嘗試。刺激持續時間技術是其中之一,在實驗開始的同時會呈現探測刺激(聽覺的「咔嚓聲」),並在獨立試驗中以視覺顯示的消退來呈現 ,其差異代表視覺儲存的持續時間,大約是100-200毫秒。[10]而其他技術像是現象連續性及移動狹縫技術,則估計視覺暫留時間為300毫秒。[11]在第一個範式中,圖像會不連續地呈現,在圖像演示之間夾雜空白時段。如果暫留時間夠短,那麼參與者將感知到連續圖像。同理,移動狹縫技術也是基於參與者對連續圖像的觀察,但只會使圖像的「狹縫」的部分閃爍,而非整個圖像刺激。當狹縫以正確的速度閃爍時,參與者仍可以看到完整的圖像。

神經基礎

底層的視覺暫留是視覺感覺路徑的神經暫留,長期視覺表徵始於視網膜中感光受體的激活。已經發現到,視杆細胞視錐細胞中激活持續時間超過物理刺激的消退時間,而視桿系統比錐體系統持續更久。 [12]參與維持視覺圖像的其他細胞還包括M和P視網膜神經節細胞英語Retinal ganglion cell(retinal ganglion cells) 。M細胞(暫態細胞)僅在刺激開始和刺激消退期間有活性,而P細胞(持續細胞)在刺激開始、持續及消退期間,皆表現出持續性的活性。[12][13]目前已經在負責處理視覺資訊的枕葉初級視覺皮層(V1)中發現視覺圖像的皮層暫留性。[12][14]

資訊暫留

在物理刺激消退後,資訊暫留代表仍持續存在的刺激資訊 。雖然它本質上是視覺的,但不可見[7]斯珀林實驗是對資訊暫留的一項測試。[3]刺激持續時間是影響資訊持續時間的關鍵因素,隨着刺激持續時間的增加,視覺碼的持續時間也會增加。[15]資訊暫留所代表的非可視的成分表示為,圖像的抽象特徵及空間位置。由於資訊暫留的性質與視覺暫留不同,因此不受遮蔽效應的影響。 [10]圖像記憶的這一元件的特徵表明,資訊暫留對後分類記憶儲存起着關鍵作用,使得視覺短期記憶可以進行資訊訪問以整頓記憶。[7]

Thumb
背部流(綠色)和腹側流(紫色)同樣起源於視覺皮層。

神經基礎

儘管與視覺暫留相比,關於資訊暫留的神經表徵的研究較少,但新的電生理學技術已經開始揭示相關的皮層區域。與視覺暫留不同的是,資訊暫留被認為依賴於視覺皮層之外的更高級視覺區域。前側顳上溝(STS)是腹側流的一部分,發現在獼猴的圖像記憶任務中會被激活[來源請求],而這個大腦區域與物體再認和物體識別有關。圖像記憶在變化檢測中的作用與枕中回(MOG)的激活有關,已發現MOG激活持續時間約2000ms,這表明圖像記憶的持續時間可能比目前所認為的還要長。圖像記憶還受到基因和大腦中產生的蛋白質之影響。腦源性神經營養因子(BDNF)是神經生長因子中的神經營養因子家族的一部分。已經證明具有編碼BDNF的BDNF基因突變的個體具有縮短的、不太穩定的資訊暫留。[16]

任務

圖像記憶為大腦提供了平滑的視覺資訊流,可以透過視覺短期記憶在較長時間內提取出來,以便整頓成更加穩定的形式。圖像記憶的其中一個關鍵作用是對我們的視覺環境進行變化檢測,這有助於我們感知運動 [17]

時間整合

圖像記憶能夠沿着連續的圖像流,整合視覺資訊。例如在觀看電影時,在初級視覺皮層中,新刺激不會擦除先前刺激的資訊,反而會包含最近刺激的反應以及之前刺激的等量資訊。[14]這種one-back記憶可能是圖像記憶和遮蔽效應中整合處理的主要基板,而具體結果取決於兩個後續分量圖像(「圖標」),僅在隔離(遮蔽)時或疊加(整合)時才有意義。

改變視盲

圖像記憶中的簡短表徵被認為,在檢測視覺場景變化的能力中起著關鍵作用。「改變視盲」現象讓我們深入了解了圖像記憶儲存的本質及其在視覺中的作用。「改變視盲」指的是,當兩個場景之間相隔着一個非常短的空白間隔或刺激間間隔(ISI)時,我們無法在兩個場景之間檢測到差異[18]。因此,視盲可以被定義為圖像記憶的輕微失誤。[19]如果場景在沒有ISI的情況下呈現,這種變化就很容易被檢測到。據認為,場景在圖像記憶中的詳細記憶儲存會被每個ISI擦除,使得記憶無法觸接,因此降低了在連續場景之間進行比較的能力[18]

眼球跳視運動

已有研究表明,在眼球跳視運動英語Saccade期間,圖像記憶在提供連續性體驗方面發揮了作用[20]。這些快速眼球運動約30毫秒發生一次,每次注視持續約300毫秒。然而,跳視之間的資訊記憶在很大程度上依賴於視覺短期記憶,而不是圖像記憶。人們認為,儲存在圖像記憶中的資訊在跳視時實際上會被刪除,而不是有助於跨跳記憶。在眨眼時也會發生類似的現象,有意無意的眨眼都會破壞圖像記憶中的資訊[21]

發展

圖像記憶從出生起,便隨着主要和次要視覺系統而持續發展。到6個月大時,嬰兒的圖像記憶的能力便接近了成年人。[22]5歲時,兒童已經發展出成人所具有的無限容量的圖像記憶能力[來源請求]。資訊暫留時間從5歲時的大約200毫秒,增加到成人(大於11歲)的1000毫秒的漸近水平。隨着年齡的增長,視覺暫留會略有衰減。將20歲出頭的人與60歲晚期的人進行比較,可以觀察到大約有20毫秒的減少。[23]人的一生中有可能發生輕度認知功能障礙英語Mild cognitive impairment(MCIs),因而產生如情景記憶中的錯誤(關於人、地方及其背景的自傳體記憶),以及由於海馬迴及聯合皮質區損傷導致的工作記憶中的錯誤(STM的活躍處理成分)。情節記憶是一個人可以討論的自傳事件。目前已經發現,MCIs患者的圖像記憶能力和持續時間都有所下降。MCIs患者的圖像記憶障礙可被用於預測更嚴重的缺陷的發展,如阿爾茨海默病失智症

斯珀林的部分報告法

1960年,斯珀林首先成為使用部分報告範式來研究VSTM的二分模型的人。[1]在斯珀林於1960年的最初實驗中,觀察人員在短暫時間內(50毫秒)會看到一個由3x3或3x4個字母及數字組成的陣列,作為速示視覺刺激英語Tachistoscope

P Y F G
V J S A
D H B U

受試者根據刺激消退後的線索去回憶,引導受試者回憶最初顯示的某一行字母。記憶表現會在兩種情況下作比較:全部報告和部分報告。

全部報告

Thumb
斯珀林最初的部分報告範式。

全部報告條件要求參與者儘可能地回憶最初顯示的元素所在的位置。參與者通常能夠從十二個字符中回憶三到五個字符(大約35%)。[1]這表明全部報告受到容量為4到5個項目的記憶系統限制。

部分報告

部分報告條件要求參與者使用線索回憶,並從視覺顯示中,識別出一部分的字符。在刺激消退之後,以不同時間間隔(約50ms)發出的音調作為線索。音調的頻率(高、中、低)表示要報告顯示器中的哪組字符。由於參與者不知道哪一行會被回憶,因此部分報告條件中的表現,可以被視為對觀察者全部顯示記憶的隨機抽樣。這種類型的抽樣顯示,在刺激消退之後,參與者可以在給定行中回憶大多數字母(12個字母中的9個),表明整個視覺顯示中有75%可以被記憶所觸接,[1]使原本從全部報告試驗得出的圖像記憶假設容量獲得大幅度增長。

部分報告法的變化

Thumb
Averbach&Coriell的部分報告範例。

視覺線索

在斯珀林的部分報告法中一個小變化,會產生類似的結果,那就是改用「視覺條標記」而不是「聽覺音調」作為提取線索。在此修改中,會於50毫秒內向參與者展示兩行8個字母的視覺顯示。探針是一種視覺條,放置在字母位置的上方或下方,與陣列消退同時發生。當參與者被要求回憶指定的字母時,平均準確率為65%。[24]

時間差異

透過改變顯示消退量和聽覺線索(提示音)之間的時間間隔,斯珀林可以估計出感覺記憶的時間過程。斯珀林偏離了最初的程序,從刺激消退後立即呈現音調,變成到150、500或1000毫秒後才呈現。使用這種技術,刺激顯示的初始記憶在顯示消退後會迅速衰減。在刺激消退後約1000毫秒,部分報告和整個報告條件下的回憶率並沒有差異。總體而言,使用部分報告的實驗,為顯示消退後大約持續1000毫秒的快速衰減的感覺痕跡提供了證據。[1][24][25]

圓形提示和遮蔽

遮蔽效應是透過在字母周圍畫一個圓圈作為回憶的線索來識別的。[26]當圓圈出現在視覺刺激開始之前,或與刺激消退同時出現時,回憶與「使用條形或音調時候」配對。然而,如果在刺激消退100毫秒後,用一個圓圈作為線索,那麼回憶的準確性就會下降。隨着圓圈顯示延遲的增加,準確性又再次提高。這種現像是後向對比遮蔽的一個例子。當刺激消退後立即顯示隨機線之類的圖像時,也會觀察到遮蔽[27]

參考文獻

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.