基因的編碼區(英語:Coding region),亦稱為「編碼序列」(Coding sequence)或「CDS」(Coding DNA Sequence),是指DNARNA中由外顯子組成,編碼蛋白質的部分。該區域的邊界範圍從靠近5′末端起始密碼子開始,到靠近3′末端終止密碼子為止。mRNA的編碼區範圍位於5′非轉譯區和部分同樣為外顯子的3′非轉譯區之間。[1]

某個生物體的編碼區是指該生物由基因編碼區組成的基因組的總和。[2]

編碼序列註釋

雖然識別DNA序列內的開放閱讀框簡單明了,但識別編碼序列卻並非如此,因為細胞只會把所有開放閱讀框的一部分轉譯為蛋白質。[3]目前CDS預測透過對細胞mRNA取樣測序完成,但要判斷給定mRNA究竟哪一部分實際轉譯為了蛋白質,目前仍是問題。CDS預測屬於基因預測的一部分,後者不僅包括對編碼蛋白質的DNA序列預測,也包括對其它功能元件,如RNA基因和調節序列的預測。

參見

參考文獻

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.