雙生子研究(英語:twin study)展現個體中環境與遺傳分別造成的絕對、相對影響。雙生子研究是行為遺傳學研究的重要工具。行為遺傳學研究還使用兄弟姐妹關係、領養關係、家族史等等信息。

雙胞胎具有非常高的研究價值,用來研究不同家庭環境(不同對雙胞胎所擁有的)與不同基因組成性狀造成的影響:同卵雙生雙胞胎有接近 100% 一樣的基因,也就是雙胞胎兩者大部分不同(包括身高、無聊易感性英語sensation seeking、智能、抑鬱程度等等)都是由雙胞胎其中一位有而另一位沒有的經驗造成的[來源請求]異卵雙生雙胞胎僅有 50% 的基因是共有的。雙胞胎兩者由於在相同時間、地點出生,擁有非常相似的環境因素(例如:子宮環境、 父母教養方式英語parenting style、教育、家庭富有程度、文化等等)。同卵雙生雙胞胎中其中一位有而另一位沒有的性狀為環境因素研究提供了有力的數據。

古典雙生子研究將同卵雙胞胎的相似性與異卵雙胞胎的相似性進行比較,如果同卵雙胞胎比異卵雙胞胎更相似(在大部分性狀都是如此),這表示基因在這些性狀占有比較重要的角色。透過比較上百對雙胞胎的家庭狀況,研究人員得以更理解遺傳因素、共享環境、獨特環境分別在塑造人類行為上的重要性。

近代雙子研究顯示接近所有性狀都具有遺傳差異帶來的部分影響,有些特徵受到遺傳比較強的影響(例如:身高),有些受到遺傳中等程度的影響(例如:性格特質),而有些有複雜的遺傳關係:在自閉症中不同的基因影響性狀的不同部分。

歷史

自從人類文明開始以來,學者就一直對雙胞胎感興趣。希波克拉底(公元前五世紀)將雙胞胎共有的疾病歸咎於雙胞胎共有的物質條件[需要解釋]波希多尼(公元前一世紀)將共有的疾病歸咎於雙胞胎共有的星象條件[1]。後來弗朗西斯·高爾頓開創了透過雙胞胎進行基因、環境對人類發育、行為影響的研究,然而高爾頓並沒有發現同卵、異卵雙胞胎之間的差異[2]

這個差異在愛德華·桑代克(1905)為五十對雙胞胎進行第一個心理學雙生子測試的時候仍尚未被意識到,這個研究透過比較 9-10 歲、13-14 歲的雙胞胎與一般手足的差異試圖證明家庭對行為的影響隨着年齡逐漸減弱。桑代克從他的數據不正確的推論出雙胞胎只有一種類型。最早了解這個差異的可能是德國的遺傳學家赫爾曼·沃納·西門子英語Hermann Werner Siemens在 1924 年的研究[3]

方法

雙生子設計的說服力來自於這一事實,即所有雙胞胎分為單合子: 雙胞胎由同一受精卵發育而來,因而所有等位基因相同,稱為同卵雙胞胎;及雙合子 : 雙胞胎分別由不同受精卵發育而來,因而平均只有50%的等位基因相同,該水平與非雙胞胎的兄弟姐妹一致。這些在遺傳相似性方面的已知區別,以及對同卵或異卵雙胞胎所在環境相同的可驗證的假設[4],共同構成了雙胞胎設計的基礎,以探索遺傳多樣性及環境多樣性對某一形狀的影響。[5][6]

雙生子研究的邏輯基礎只需很少的數學基礎就能理解,包括對相關性的理解,以及對變異的概念的理解。

與所有的行為遺傳學研究類似,傳統的雙生子研究從評估一個大群體中的行為多樣性開始(遺傳學家稱為性狀),並盡力估計其受以下因素影響的程度:

  • 遺傳效應(遺傳度);
  • 共同處在的環境 – 共同作用在雙胞胎身上的環境因素,以同一方式影響兩者;
  • 各異的環境因素 – 不共同作用於雙胞胎的環境因素。

作為代表,以上三個因素分別被簡寫為A (additive genetics,附加的遺傳因素)、C (common environment,共同的環境因素) 和 E (unique environment, 各異的環境因素);因此三者的縮寫連起來就是"ACE"。另外,估計非附加遺傳因素所造成的影響也是可以的(由於全稱是dominance故一般被標註為DADE模型英語ADE model);下文有更多關於複雜雙生子設計的介紹)。

ACE模型揭示了對於影響某一性狀的因素來說,可遺傳的多樣性所占比例是多大,以及共同環境因素以及各異環境因素所占比例是多少。該研究是通過SEM系統例如OpenMx英語OpenMx來完成的,然而雙生子設計的核心邏輯是不變的,如下所述:

在同一個家庭里長大的同卵雙胞胎,其基因完全相同,環境完全相同,所有各異環境因素都是隨機的。這種同卵雙胞胎可以為我們提供A+C的參數估計。異卵雙胞胎的C也是相同的,但彼此只有50%的基因是相同的: 因而這種異卵雙胞胎可以直接用來估計½A+C。假設r是correlation相關係數,那麼rmzrdz就分別是同卵雙胞胎和異卵雙胞胎的性狀相關係數。對於任一形狀來說,有:

rmz = A + C
rdz = ½A + C

因而A等於同卵雙胞胎和異卵雙胞胎相關係數差異的兩倍: 基因相加效應(Falconer's formula英語Falconer's formula)。C就能通過同卵雙胞胎相關係數減去A得到。同卵雙胞胎的差異只由各異環境因素造成,因而隨機(各異)因素E 等於1 − rmz。(Jinks & Fulker, 1970; Plomin, DeFries, McClearn, & McGuffin, 2001).

再次聲明,以上兩個加和式子可供我們解出A,C,E的值。由於同卵和異卵相關係數的差異是完全由只有一半的遺傳相似性造成的,所以基因相加效應A就是相關係數差值的兩倍:

A = 2 (rmzrdz)

由於同卵雙胞胎的相關係數反映的是A和C的影響,因而E可以由1減去此兩者而得到:

E = 1 − rmz

最終, C可以由此得到:

C = rmzA

現代模型

從20世紀70年代開始,研究逐漸轉向對遺傳問題進行 建模,環境因素的影響通過最大似然模型得到(Martin & Eaves, 1977)。當計算變得越加得複雜,該方法表現出了許多優勢,因而成為現在研究中的常用手段。

一個作為例子的結構模型展示如下( 為了估計身高的遺傳度 ),其以丹麥男性數據為基礎 (一個有代表性的群體中的8個獨立多國隊列)[7]

Thumb Thumb

左邊的模型展示了身高的原始多樣性,其在用於得到基因和環境的絕對效應時很有用,即將效應量化成自然單位,比如研究身高改變時得到毫米級的指標。有時標準化參數是很有用的,這樣各個參數可以直接作為總和的一部分而不用換算。由於我們已經把多樣性分解為A,C,E了,所以多樣性的總和直接就是A+C+E。我們可以將各個參數換算成其在總和中所占的比例,比標準化的A = A/(A+C+E):

模型比較

建模最基本的優勢在於其能夠對各個模型進行明確比較:比起傳統的簡單地對各個參數返回數值,建模可以計算參數的置信區間,但關鍵的是它能夠去掉或添加路徑,並通過統計學方法(如 AIC)檢測其效果。舉個例子,想要測試模型對於家庭或共同環境因素對性狀的影響效應的話,我們可以用AE模型和ACE模型進行比較;就以上圖的身高為例: C (共同環境因素) 被去掉的話會導致模型擬合程度的顯著下降嗎?另外,對於每一個路徑來說,置信區間也能夠被計算得到。

多群體和多變量模型

建模也包括多變量建模,其在用於解決明顯是多變量之間的遺傳關係的問題時非常有用。比如:智商和長期記憶之間有共同的基因嗎?有共同的環境因素影響嗎?多變量模型的優勢還包括處理區間、閾值和連續數據,在數據包含缺失數值時保留全部數據,將測得變量與潛在模型進行整合,比如測得的環境變量,或者測得的分子遺傳標記如SNPs。另外,建模能夠避免把變量數值標準化,而是直接帶入其原始值。

多變量和多時間波研究現在已成為了標準,其包含測得的環境變量和對潛在可能有因果關係的性狀測量。其模型包括擴展的雙生子設計,[8][9] 單一模型,[10] 以及生長曲線模型。[11]

SEM 系統(比如OpenMx[12] 以及其他適用於標準化數據及多群體的應用)使得這項新技術能夠被有一定技能的人所使用。

對環境建模: 單合子不一致設計

由於同卵雙胞胎的基因和家庭環境因素完全一樣,其差異全部被歸結於E: 各異環境因素。研究者可以由這一信息通過有力的方式來理解環境,包括流行病學中致病因素的檢測,其在其他方法中會被其他因素(如基因-環境協方差,逆因果關係混雜因素)混淆。 關於單合子不一致設計的效果,有一個例子如下左圖所示。雙胞胎中在性狀1中得分更高的那個,在性狀2中同樣得分更高。這是因為性狀1的「劑量」會導致性狀2的增加。當然,性狀2也會影響性狀1。解出這兩個概率需要一個不同的設計( 例子見諸下文 )。零假設是二者並無因果關係。

Thumb
「單合子不一致模型效應的例子」
Thumb
「MZ不一致測試的假設:運動能夠保護我們免得抑鬱症」

舉個例子,關於抑鬱症和運動之間可見的聯繫( 見右上圖 )。對於抑鬱人群有報告稱其存在運動較少的情況。因而我們或許會假設其存在因果關係:給抑鬱症患者一定「劑量」的運動能夠幫助他們精神振奮並緩解抑鬱。下一幅圖展示了對二者進行經驗上的檢驗所得到的結果:空。[13]

縱向不一致設計

如下圖所示,該設計可以被拓展到多次測量,因而模型就能反映出更加多元的信息。這被稱為交叉滯後模型(對多性狀進行多次測量)。[14]

在縱向不一致模型中,同卵雙胞胎之間的差異能夠被用於研究在時間點1時性狀之間的差異(路徑1),然後檢測各個明確假設,如一個個體與另一個體相比在性狀1上的數值盈餘會導致其同一性狀在未來的額外增量(路徑B和E), 或者另一方面, 也是很重要的一方面, 對其他性狀的額外增亮(路徑C和D)。 在本例中,關於抑鬱症患者的運動量低於人群平均水平,其二者的關聯是有因果關係的假設,能夠被成功驗證。如果運動能夠緩解抑鬱症,那麼路徑D應該是顯著的,即雙胞胎中運動量更大的那個,抑鬱程度應該更輕。

Thumb
A cross-lagged longitudinal MZ discordant twin design. This model can take account of relationships among differences across traits at time one, and then examine the distinct hypotheses that increments in trait1 drive subsequent change in that trait in the future, or, importantly, in other traits.

假設

從上面的模型中可以看出,雙生子研究的主要假設是相同的環境。這個假設已經直接測試。特殊情況是,父母相信他們是異卵雙胞胎,但事實上,他們基因完全相同。一系列心理特徵的研究表明,這些孩子仍然像同卵雙胞胎。<ref>Kendler, K.S., Neale, M.C., Kessler, R.C., Heath, A.C. and Eaves, L.J., 1993. Panic disorder in women: A population-based twin study. Psychological Medicine 23, pp. 397–406</ref> 分子遺傳學的遺傳力估算法提供了一些證據表明,雙生子研究的經典設計——相同環境假設的可能是有效的,實實在在的,穩固的,合理的。

相似性測定:雙生子研究假設的直接測試

Visscher等[15] 報道了一種針對雙生子研究的強大的測試技術。他們利用了這一事實——兄弟姐妹平均有50%的基因相同,而對於特定的兄弟姐妹同胞對,相同基因數在這個數字附近,也就是說本質上是在家庭中創建一個連續的遺傳相似性或「雙胞胎」(填補普通同胞與雙胞胎之間的空隙)。基於直接估計基因相似性來估計遺傳力,為該方法的假設提供支持。

性別差異

兩性之間的遺傳因素可能不同,包括基因表達和基因環境相互作用。異性異卵雙胞胎是在闡明這些效應中有重要價值。 一個極端的例子是,一個基因可能只在一種性別中表達(性別的定性限制)。通常,基因的影響可能受個人的性別的影響。基因可能導致男性體重改變100克,但也許在雌性中導致體重改變150克——基因的數量效應。一些環境可能影響基因發揮功能而環境是通過性別來產生影響。例如如果把女性排除在選舉之外,影響投票行為的基因在女性中不發揮作用。更為普遍的是,性別差異測試的邏輯可以擴展到任意定義的子群的個體。在這樣的情況下,同性和異性異卵雙胞胎的相關性會不同,而與性別差異的影響無關。 由於這個原因,區分三種類型的異卵雙胞胎是需要的。標準的分析流程將涉及測試性別限制通過擬合為五組——男性同卵雙胞胎,女性同卵雙胞胎,男性異卵雙胞胎,女性異卵雙胞胎,異性異卵雙胞胎。雙胞胎建模從而不僅是測試變量(如性別)的因果模型的相關關係。

基因環境相互作用

基因影響可能會依賴於環境。這種相互作用被稱為「基因-環境相互作用」,在一個基因的某種基因型在不同的環境產生的效應不同。一個簡單的例子是一個基因與環境的影響協同:在高營養環境中可能讓身高增加1英寸,但在低營養環境中只讓身高增加0.5英寸。對於不同的基因型,個體對不同環境的反應程度也不同。 通常研究者感興趣於在不同條件下遺傳效應的變化:在某種環境中,等位基因可以對表型產生較大的影響(如上)。 第二個作用是「基因環境相關性」,也就是說在特定的等位基因往往處於特定的環境。如果一個基因導致父母喜歡閱讀,由於基因環境的相關性,繼承這個等位基因的孩子更可能在有書的家庭長大:一個或兩個父母有這個等位基因,因此會在家庭積累書籍並且傳遞閱讀的等位基因。這種效應可以直接通過測量環境關聯性(在本例中為在家裡的書籍)來測試。 通常環境似乎在個體的最早期中作用最大,隨着[義務教育]的開始作用迅速減少。這種現象可以在閱讀[16]以及智力[17]觀察到。這是基因-年齡效應的一個例子,並允許考量的由父母帶來的(隨着時間,作用慢慢減弱)基因-環境相關性和個體主動選擇特定環境帶來的基因-環境相關性。[18]

反應基線

研究植物或動物允許實驗隨機組合基因型和環境的來衡量各種變量的影響。相比之下,人類研究通常只能選擇觀察。[19][20] 這可能表明,反應基線難以評估。[21][22]

在其他領域如經濟學流行病學,幾個設計開發利用能夠利用不同的基因相似度,重複暴露,並測量暴露於環境(如兒童的社會階級、家庭混亂,教育質量、營養、毒素等)來對抗那些混淆的因素。經典的雙生子研究設計內在吸引力是其避開了這些混淆因素。例如,同卵及異卵雙胞胎環境相同和基因的影響並不受到混淆。[6] 雙胞胎的研究從而在一定程度上試圖利用家庭成員基因的隨機組合來幫助理解這些相關性。

而雙生子研究只告訴我們在觀察範圍內的環境中基因和家庭如何影響行為,基因和環境將共變的警告,比起過去(不知道基因和環境的不同的角色),這是一個相當大的進步。[23] 因此雙生子研究經常被用於至少控制觀察變量中的一個部分的手段:例如把先前假定為家庭環境的因素劃分到共同環境因素和附加遺傳因素裡面,這要通過完全相同或部分相同的雙胞胎基因組實驗來完成。[23]

沒有單一的設計可以解決所有的問題。經典的雙生子研究設計有額外可用的信息。雙生子收養的研究設計是一種自然實驗(將相同的基因型的個體置於不同的環境中)。[24]關聯分析,如[25]允許直接研究等位基因的效應。等位基因的孟德爾隨機化還提供了研究隨機等位基因的影響對他們的相關環境和其他基因的機會,例如[26] 允許對等位基因效應的直接研究。等位基因的孟德爾隨機化也給我們提供了研究等位基因在隨機情況下效應的機會,其能考慮到與等位基因關聯的環境和其他基因。例如[26]

拓展雙生子研究設計,更多複雜的遺傳學模型

基本的或經典的雙生子研究設計只包含同卵和異卵雙胞胎在其生物學家庭中成長情況。這只是所有可能的遺傳和環境的關係的一個子集。因此,可以說,基於雙生子研究的遺傳估計只是理解的行為遺傳學的第一步。 變量(雙生子研究分為遺傳相加性,共享環境,不共享環境)是完整研究基因-環境共變性,基因-環境相關性,其他對行為的非加和性的效應的一次嘗試。分子遺傳學的革命提供了更有效的描述基因組的工具,許多研究人員使用分子遺傳學來直接評估等位基因和環境對表型的影響。 雙生子研究設計的局限性首先是它不提供同時考慮共享環境和非加和基因效應的途徑。這種限制可以通過添加額外的兄弟姐妹到設計中來解決。 第二個限制是基因-環境相關性不是作為確定無疑的效應來觀察。解決這個限制需要整合收養模型,或採用雙生子的子女研究設計,來評估相同基因時家庭的影響。

連續變量和有序變量

雖然一致性研究比較特徵的存在或不存在於每一個雙胞胎,相關研究比較在雙胞胎不斷變化表型的一致性。

批評

雙生子方法一直以來受到來自統計遺傳學、統計學及心理學界的批評,這些批評認為通過這種方法得到的結論是模糊或沒有意義的。這些批評的核心要點和他們的陳述如下。

統計方法的批評

據稱,雙生子研究是沒有統計學基礎的。這種統計學批評認為大部分雙生子研究的遺傳力評估依靠在未經驗證、有限制的假設之上,如果這樣,那該研究的數據不能被嚴格信任。

例如,Peter Schonemann 就對20世紀70年代發展出的遺傳力評估方法提出異議。他認為雙生子研究中的遺傳評估可能反映出別的因素而非共享基因本身。 使用發表在 Loehlin and Nichols (1976),[27] 的統計學模型對問題「你會擦背嗎?」進行分析顯示:該行為對0.92的男性存在遺傳性,對0.21的女性存在遺傳性,對問題「你會在天黑後佩戴太陽眼鏡嗎?」則對130%的男性存在遺傳性,對103%的女性存在遺傳性。[28][29]

對統計方法的批評的回應

在沒有計算機以前,統計人員被迫使用有已知的限制,但計算易進行的方法。在20世紀80年代這些不精確的統計方法已經被丟棄:基於結構方程模型的現代雙生子方法已經不受上方提到的因數學上不可能的影響。[30] 更重要的是,這些新的方法允許顯性地測試各種通路上不同角色帶來的複雜效應。[23]

取樣:雙胞胎作為代表性人群

雙生子研究的結果不能認為是派生出他們的人群的研究結果。因此,明白這是基於特定樣品或是有雙胞胎本身特性的研究結果很重要。雙胞胎不是人群中的隨機樣品,且他們的成長環境不同。在這個意義上說,他們不具有代表性。[31]

例如:異卵雙胞胎的出生受很多因素影響。有些女性經常會在經期產生多於1個的卵子,因此她們更易懷有雙胞胎。這個趨勢在整個家族中都表現明顯,通常父系與母系都是這樣。年齡大於35歲的女性更易產生2個卵子。擁有3個及以上孩子的女性也更易擁有異卵雙胞胎。人工誘導排卵體外受精胚胎置入也可產生多胎和同卵雙胞胎。[32][33][34][35][36][37]

對雙胞胎代表性的回應

雙胞胎與非雙胞胎兄弟姐妹差別甚小。研究表明雙胞胎與非雙胞胎兄弟姐妹各自的個性及智力評估非常相似。(如 Deary et al. 2006).

以分離雙胞胎為代表的其他雙胞胎

分離雙胞胎中,同卵或異卵多因被領養而分開。這使得他們原來的家庭並不具有代表性,因為他們放棄撫養孩子,而他們去的新家庭也不具有代表性,因為他們經過兒童保護機構批准,且大部分家庭沒有親生孩子。這些參與研究的志願者甚至不能代表分離雙胞胎,因為並非所有分離雙胞胎都同意參與雙生子研究。[38][39]

10%的環境影響因素不能解釋弗林效應

一些如Steven Pinker的心理學家使用的數字因無法解釋弗林效應而遭到批評,這些數字是45%遺傳,45%天命(指隨機性,無宗教含義),10%環境,按這些數字估算,20世紀早些時候的平均IQ提升過大,甚至超過了今天。按定義,隨機個體的幾率不會隨時間顯示出任何趨勢。[40][41]

檢出與否的問題

在人們選擇保密及因被歧視等原因而曾經選擇保密的行為案例中,存在事實未檢出的問題。假如環境對該行為沒有影響,但由於扭曲的結果,則可能使得環境因素看起來起了作用。對於環境似乎不起作用的案例,要不就是行為及其頑固,要不就是在研究中存在致使研究科學上不可用的缺陷。即使環境確實有影響,但數據仍會出錯。[42][43][44]

Physical few-character stereotypes causing behavioral correlations

Apparent correlation between heredity and behavior may be due to social stereotypes making people with certain physical characteristics (which may be hereditary physical characteristics) behave in certain ways, without any biological link between the genetic factor and the behavior. This factor has an especially high likelihood of being the case for behaviors that are culturally depicted in mass media as being more accepted by those who consider them to be biological than by those who consider them learned (e.g. sexuality and some psychiatric diagnoses) and for physical characteristics that are not culturally considered by mass media to be bigoted to associate with certain behaviors (e.g. not ethnic or racial). Such unequal environment biases may concentrate on a relatively small number of minor physical characteristics that are subject to stereotypes that are considered to be politically correct, with no statistically significant effect on overall ratings of physical similarity, let alone anywhere near being able to pass identical twins off as being fraternal.[45][46][47]

Terminology

Pairwise concordance

For a group of twins, pairwise concordance is defined as C/(C+D), where C is the number of concordant pairs and D is the number of discordant pairs.

For example, a group of 10 twins have been pre-selected to have one affected member (of the pair). During the course of the study four other previously non-affected members become affected, giving a pairwise concordance of 4/(4+6) or 4/10 or 40%.

Probandwise concordance

For a group of twins in which at least one member of each pair is affected, probandwise concordance is a measure of the proportion of twins who have the illness who have an affected twin and can be calculated with the formula of 2C/(2C+D), in which C is the number of concordant pairs and D is the number of discordant pairs.

For example, consider a group of 10 twins that have been pre-selected to have one affected member. During the course of the study, four other previously non-affected members become affected, giving a probandwise concordance of 8/(8+6) or 8/14 or 57%.

參考資料

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.