PDB文件格式(PDB為蛋白質數據庫英語名稱「Protein Data Bank」縮寫),顧名思義是一種由蛋白質數據庫最先採納,用於儲存蛋白質三維結構的文件格式。這種文件格式詳細記錄了 蛋白質中每個原子的坐標信息、蛋白質二級結構信息,以及原子之間的相互作用等信息,同時附有簡要的蛋白質的名稱與生物學性質信息。
歷史
1976年,研究人員認為應該有一種人類可直接閱讀的保存蛋白數據文件,將這種文件上傳到數據庫中將會有利於研究人員相互交流不同蛋白質的結構信息,因此發明了PDB文件格式。PDB文件固定有80列,這是因為當時早期電腦的打孔卡最多只支持在一行打80個孔[1]。此後,PDB文件經過了一些調整,截至2011年7月,最新的PDB格式版本是3.30[2]。
例子
以下是一個人工合成的多肽的PDB文件:
HEADER EXTRACELLULAR MATRIX 22-JAN-98 1A3I TITLE X-RAY CRYSTALLOGRAPHIC DETERMINATION OF A COLLAGEN-LIKE TITLE 2 PEPTIDE WITH THE REPEATING SEQUENCE (PRO-PRO-GLY) ... EXPDTA X-RAY DIFFRACTION AUTHOR R.Z.KRAMER,L.VITAGLIANO,J.BELLA,R.BERISIO,L.MAZZARELLA, AUTHOR 2 B.BRODSKY,A.ZAGARI,H.M.BERMAN ... REMARK 350 BIOMOLECULE: 1 REMARK 350 APPLY THE FOLLOWING TO CHAINS: A, B, C REMARK 350 BIOMT1 1 1.000000 0.000000 0.000000 0.00000 REMARK 350 BIOMT2 1 0.000000 1.000000 0.000000 0.00000 ... SEQRES 1 A 9 PRO PRO GLY PRO PRO GLY PRO PRO GLY SEQRES 1 B 6 PRO PRO GLY PRO PRO GLY SEQRES 1 C 6 PRO PRO GLY PRO PRO GLY ... ATOM 1 N PRO A 1 8.316 21.206 21.530 1.00 17.44 N ATOM 2 CA PRO A 1 7.608 20.729 20.336 1.00 17.44 C ATOM 3 C PRO A 1 8.487 20.707 19.092 1.00 17.44 C ATOM 4 O PRO A 1 9.466 21.457 19.005 1.00 17.44 O ATOM 5 CB PRO A 1 6.460 21.723 20.211 1.00 22.26 C ... HETATM 130 C ACY 401 3.682 22.541 11.236 1.00 21.19 C HETATM 131 O ACY 401 2.807 23.097 10.553 1.00 21.19 O HETATM 132 OXT ACY 401 4.306 23.101 12.291 1.00 21.19 O ...
參見
- mmCIF
參考資料
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.