בנק מידע החלבונים (אנגלית: Protein Data Bank או בראשי תיבות PDB) הוא מאגר מידע ממוחשב אשר מכיל תיאור של המבנה התלת־ממדי של מולקולות ביולוגיות גדולות, כדוגמת חלבונים וחומצות גרעין. המידע, שבדרך כלל מושג בקריסטלוגרפיה באמצעות קרני רנטגן או בספקטרוסקופיה באמצעות NMR, ונשלח על ידי ביולוגים וביוכימאים מרחבי העולם, ניתן לאחזור בחינם מהאינטרנט. על בנק המידע מפקח ארגון ושמו "Worldwide Protein Data Bank" ("בנק מידע החלבונים ברחבי העולם" בראשי תיבות wwPDB).

עובדות מהירות סוג, תקופת הפעילות ...
בנק מידע החלבונים
Protein Data Bank
Thumb
סוג מאגר מידע קריסטלוגרפי עריכת הנתון בוויקינתונים
תקופת הפעילות 1971–הווה (כ־53 שנים) עריכת הנתון בוויקינתונים
www.wwpdb.org
לעריכה בוויקינתונים שמשמש מקור לחלק מהמידע בתבנית
סגירה

בנק המידע הוא מקור חשוב בתחומי הביולוגיה המבנית כדוגמת גנומיקה מבנית. מרבית כתבי העת המדעיים, וכמה מהארגונים המחלקים מענקי מחקר כדוגמת המכונים הלאומיים לבריאות (NIH) שבארצות הברית, דורשים כיום מהמדענים לשלוח מידע על מבנים שפוענחו לבנק המידע. בנק המידע הוא המקור הראשי למאות מאגרי מידע נגזרים המסווגים את המידע בצורה שונה. דוגמאות הן שיטת הסיווג המכונה SCOP (ראשי תיבות של Structural Classification of Proteins – סיווג מבני של חלבונים) ושיטת הסיווג CATH (ראשי תיבות של שיטת הסיווג Class Architecture Topology Homologous superfamily – מחלקה, ארכיטקטורה, טופולוגיה ומשפחת על הומולוגית) מסווגים מבנים על פי סוג המבנה ומניחים קשרים אבולוציוניים, שיטת הסיווג GO (ראשי תיבות Gene ontology – אונטולוגיה של גנים) מסווגת מבנים על בסיס גנים.[1]

היסטוריה

בנק מידע החלבונים (PDB) החל כמיזם עצמאי של כמה מדענים.[1] ב-1971 הסכים וולטר המילטון (Walter Hamilton) מהמעבדה הלאומית בברוקהייבן (Brookhaven National Laboratory) לנהל את ה-PDB בברוקהייבן. המילטון נפטר שנתיים אחר כך, וטום קוזטלה (Tom Koeztle) נטל על עצמו את ניהול ה-PDB. בינואר 1994 מונה הקריסטלוגרף והביולוג הישראלי פרופ' יואל זוסמן ממכון ויצמן למנהל ה-PDB. באוקטובר 1998[2] הועבר ה-PDB לResearch Collaboratory for Structural Bioinformatics או בראשי תיבות RSCB. ההעברה הושלמה ביוני 1999. כמנהל בנק המידע מונתה הלן ברמן מאוניברסיטת ראטגרס (אחד מהמוסדות החברים ב-RSCB).[3] עם הקמת ה-wwPDB ב-2003 הפך ה-PDB להיות ארגון בינלאומי. כל אחד מארבעת החברים בארגון (שניים מארצות הברית, ארגון אירופי וארגון יפני) יכול לפעול כמרכז לאחסון, עיבוד נתונים והפצה של המידע המצוי ב-PDB. עיבוד נתונים מתייחס לעובדה שהצוות של ה-wwPDB בוחן ומעיר הערות על כל מבנה המתקבל. המידע נבדק בצורה ממוחשבת לישימות המבנה. (תוכנת הבדיקה שוחררה לציבור בלא תשלום).

תכולה

בנק מידע החלבונים מתעדכן פעם בשבוע (ביום שלישי). בדומה, האתר PDB Current Holdings Breakdown (אורכב 04.07.2007 בארכיון Wayback Machine) מתעדכן פעם בשבוע. נכון לשבוע של ה-27 בדצמבר 2015 הכיל המאגר 114,569 מבנים של חלבונים שפוענחו על פי הפירוט הבא:

Thumb
דוגמאות למבנים של חלבונים מה-PDB (נוצרו על ידי תוכנת כימרה של אוניברסיטת UCSF)
מידע נוסף שיטת הפענוח, חלבונים ...
שיטת
הפענוח
חלבונים חומצות גרעין תרכובות
חלבון/חומצת גרעין
אחרים סך-הכול
עקיפה של קרני רנטגן95,6361,6944,8174102,151
NMR9,8401,135231811,214
מיקרוסקופ אלקטרוני666292270922
מעורב8332189
אחר1704613193
סך הכול106,2932,8655,28326114,569
סגירה
ל-91,748 מבנים ב-PDB יש קובץ structure factor
ל-8,531 מבנים יש קובץ NMR restraint
ל-2,289 מבנים יש קובץ chemical shifts
ל-901 מבנים ב-PDB יש קובץ מיפוי 3 ממדי המאוחסן ב-EM Data Bank

הטבלה מראה כי מרבית המבנים פוענחו על ידי עקיפה באמצעות קרני רנטגן, אבל בשנים האחרונות כ-10% מהמבנים נקבעים על ידי שימוש ב-NMR, ומספר נמוך מזה באמצעות מיקרוסקופ אלקטרוני או, ליתר דיוק, קריו-מיקרוסקופ אלקטרוני, שכן הדגימה נחקרת בטמפרטורה של חנקן נוזלי (הקלקה על המספרים בטבלה המוצגת באתר מראה דוגמאות למבנים שפוענחו בשיטה זו).

החשיבות של קובצי ה-structure factor שהוזכרו דלעיל היא שעבור מבנים ב-PDB שנקבעו על ידי עקיפה של קרני רנטגן, שלהם יש קובץ מבנה, ניתן לצפות במפת צפיפות האלקטרונים. המידע על מבנים אלו מאוחסן ב-electron density server, שם ניתן לצפות במפות האלקטרונים.

בעבר גדל מספר המבנים ב-PDB כמעט בצורה מעריכית, וב-2014 עבר מספר המבנים את נקודת ה-100,000,[4] ועם זאת, מ-2007 החל קצב הגידול להתייצב והוא מתקרב ל-10,000 מבנים חדשים מדי שנה.

פורמט הקובץ

הפורמט המקורי בו נעשה שימוש ב-PDB היה קרוי פורמט PDB. פורמט זה היה מוגבל לרוחב של כרטיסי מחשב מנוקבים, כלומר 80 תווים בשורה. החל משנת 1996 החל להיכנס לשימוש הפורמט "mmCIF" (ראשי תיבות של "macromolecular Crystallographic Information file" - קובץ מידע קריסטלוגרפי מאקרומולקולרי). גרסת XML של פורמט זה תוארה ב-2005.[5] את קובצי המבנה ניתן להוריד בכל אחד משלושת הפורמטים. למעשה, קבצים בודדים נטענים בקלות לתוך תוכנות גרפיות תוך שימוש בכתובות רשת (URL):

  • לקבצים בפורמט PDB יש להשתמש ב: http://www.pdb.org/pdb/files/4hhb.pdb.gz
  • לקבצים בפורמט PDBML (XML) יש להשתמש ב: http://www.pdb.org/pdb/files/4hhb.xml.gz

ה-"4hhb" הוא מזהה ה-PDB. כל מבנה המתפרסם ב-PDB מקבל מזהה בן ארבעה תווים אלפאנומריים, ה-PDB ID שלו (לא ניתן להשתמש במספר מזהה זה כמזהה של הביומולקולה, שכן לעיתים קרובות מכיל ה-PDB כמה מבנים לאותה מולקולה – בסביבות או תצורות שונות – תחת PDB ID שונים).

צפייה במידע

ניתן לצפות בתצוגה גרפית של המבנים בעזרת אחת מכמה תוכנות חופשיות. בין התוכנות החופשיות, אם כי לא בקוד פתוח מצויות:

  • VMD – ראשי תיבות של Visual molecular dynamics
  • MDL Chime
  • Swiss-PDB Viewer
  • StarBiochem – תוכנת הצגה מולקולות אינטראקטיבית הכתובה ב-Java והכוללת מנוע חיפוש בתוך בנק מידע החלבונים.
  • Sirius visualization software
  • VisProt3DS – כלי לדימות של חלבון בתלת־ממד בתצוגה סטריאוסקופית

אתר ה-PDB של ה-RSCB מכיל רשימה נרחבת (אורכב 24.08.2018 בארכיון Wayback Machine) של תוכנות לתצוגה של מולקולות (חופשיות ומסחריות) ותוכנות תקע לדפדפני אינטרנט.

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא בנק מידע החלבונים בוויקישיתוף

הערות שוליים

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.