Remove ads
מאגר מידע ביוכימי מוויקיפדיה, האנציקלופדיה החופשית
בנק מידע החלבונים (אנגלית: Protein Data Bank או בראשי תיבות PDB) הוא מאגר מידע ממוחשב אשר מכיל תיאור של המבנה התלת־ממדי של מולקולות ביולוגיות גדולות, כדוגמת חלבונים וחומצות גרעין. המידע, שבדרך כלל מושג בקריסטלוגרפיה באמצעות קרני רנטגן או בספקטרוסקופיה באמצעות NMR, ונשלח על ידי ביולוגים וביוכימאים מרחבי העולם, ניתן לאחזור בחינם מהאינטרנט. על בנק המידע מפקח ארגון ושמו "Worldwide Protein Data Bank" ("בנק מידע החלבונים ברחבי העולם" בראשי תיבות wwPDB).
סוג | מאגר מידע קריסטלוגרפי |
---|---|
תקופת הפעילות | 1971–הווה (כ־53 שנים) |
www | |
בנק המידע הוא מקור חשוב בתחומי הביולוגיה המבנית כדוגמת גנומיקה מבנית. מרבית כתבי העת המדעיים, וכמה מהארגונים המחלקים מענקי מחקר כדוגמת המכונים הלאומיים לבריאות (NIH) שבארצות הברית, דורשים כיום מהמדענים לשלוח מידע על מבנים שפוענחו לבנק המידע. בנק המידע הוא המקור הראשי למאות מאגרי מידע נגזרים המסווגים את המידע בצורה שונה. דוגמאות הן שיטת הסיווג המכונה SCOP (ראשי תיבות של Structural Classification of Proteins – סיווג מבני של חלבונים) ושיטת הסיווג CATH (ראשי תיבות של שיטת הסיווג Class Architecture Topology Homologous superfamily – מחלקה, ארכיטקטורה, טופולוגיה ומשפחת על הומולוגית) מסווגים מבנים על פי סוג המבנה ומניחים קשרים אבולוציוניים, שיטת הסיווג GO (ראשי תיבות Gene ontology – אונטולוגיה של גנים) מסווגת מבנים על בסיס גנים.[1]
בנק מידע החלבונים (PDB) החל כמיזם עצמאי של כמה מדענים.[1] ב-1971 הסכים וולטר המילטון (Walter Hamilton) מהמעבדה הלאומית בברוקהייבן (Brookhaven National Laboratory) לנהל את ה-PDB בברוקהייבן. המילטון נפטר שנתיים אחר כך, וטום קוזטלה (Tom Koeztle) נטל על עצמו את ניהול ה-PDB. בינואר 1994 מונה הקריסטלוגרף והביולוג הישראלי פרופ' יואל זוסמן ממכון ויצמן למנהל ה-PDB. באוקטובר 1998[2] הועבר ה-PDB לResearch Collaboratory for Structural Bioinformatics או בראשי תיבות RSCB. ההעברה הושלמה ביוני 1999. כמנהל בנק המידע מונתה הלן ברמן מאוניברסיטת ראטגרס (אחד מהמוסדות החברים ב-RSCB).[3] עם הקמת ה-wwPDB ב-2003 הפך ה-PDB להיות ארגון בינלאומי. כל אחד מארבעת החברים בארגון (שניים מארצות הברית, ארגון אירופי וארגון יפני) יכול לפעול כמרכז לאחסון, עיבוד נתונים והפצה של המידע המצוי ב-PDB. עיבוד נתונים מתייחס לעובדה שהצוות של ה-wwPDB בוחן ומעיר הערות על כל מבנה המתקבל. המידע נבדק בצורה ממוחשבת לישימות המבנה. (תוכנת הבדיקה שוחררה לציבור בלא תשלום).
בנק מידע החלבונים מתעדכן פעם בשבוע (ביום שלישי). בדומה, האתר PDB Current Holdings Breakdown (אורכב 04.07.2007 בארכיון Wayback Machine) מתעדכן פעם בשבוע. נכון לשבוע של ה-27 בדצמבר 2015 הכיל המאגר 114,569 מבנים של חלבונים שפוענחו על פי הפירוט הבא:
שיטת הפענוח |
חלבונים | חומצות גרעין | תרכובות חלבון/חומצת גרעין |
אחרים | סך-הכול |
---|---|---|---|---|---|
עקיפה של קרני רנטגן | 95,636 | 1,694 | 4,817 | 4 | 102,151 |
NMR | 9,840 | 1,135 | 231 | 8 | 11,214 |
מיקרוסקופ אלקטרוני | 666 | 29 | 227 | 0 | 922 |
מעורב | 83 | 3 | 2 | 1 | 89 |
אחר | 170 | 4 | 6 | 13 | 193 |
סך הכול | 106,293 | 2,865 | 5,283 | 26 | 114,569 |
הטבלה מראה כי מרבית המבנים פוענחו על ידי עקיפה באמצעות קרני רנטגן, אבל בשנים האחרונות כ-10% מהמבנים נקבעים על ידי שימוש ב-NMR, ומספר נמוך מזה באמצעות מיקרוסקופ אלקטרוני או, ליתר דיוק, קריו-מיקרוסקופ אלקטרוני, שכן הדגימה נחקרת בטמפרטורה של חנקן נוזלי (הקלקה על המספרים בטבלה המוצגת באתר מראה דוגמאות למבנים שפוענחו בשיטה זו).
החשיבות של קובצי ה-structure factor שהוזכרו דלעיל היא שעבור מבנים ב-PDB שנקבעו על ידי עקיפה של קרני רנטגן, שלהם יש קובץ מבנה, ניתן לצפות במפת צפיפות האלקטרונים. המידע על מבנים אלו מאוחסן ב-electron density server, שם ניתן לצפות במפות האלקטרונים.
בעבר גדל מספר המבנים ב-PDB כמעט בצורה מעריכית, וב-2014 עבר מספר המבנים את נקודת ה-100,000,[4] ועם זאת, מ-2007 החל קצב הגידול להתייצב והוא מתקרב ל-10,000 מבנים חדשים מדי שנה.
הפורמט המקורי בו נעשה שימוש ב-PDB היה קרוי פורמט PDB. פורמט זה היה מוגבל לרוחב של כרטיסי מחשב מנוקבים, כלומר 80 תווים בשורה. החל משנת 1996 החל להיכנס לשימוש הפורמט "mmCIF" (ראשי תיבות של "macromolecular Crystallographic Information file" - קובץ מידע קריסטלוגרפי מאקרומולקולרי). גרסת XML של פורמט זה תוארה ב-2005.[5] את קובצי המבנה ניתן להוריד בכל אחד משלושת הפורמטים. למעשה, קבצים בודדים נטענים בקלות לתוך תוכנות גרפיות תוך שימוש בכתובות רשת (URL):
http://www.pdb.org/pdb/files/4hhb.pdb.gz
http://www.pdb.org/pdb/files/4hhb.xml.gz
ה-"4hhb
" הוא מזהה ה-PDB. כל מבנה המתפרסם ב-PDB מקבל מזהה בן ארבעה תווים אלפאנומריים, ה-PDB ID שלו (לא ניתן להשתמש במספר מזהה זה כמזהה של הביומולקולה, שכן לעיתים קרובות מכיל ה-PDB כמה מבנים לאותה מולקולה – בסביבות או תצורות שונות – תחת PDB ID שונים).
ניתן לצפות בתצוגה גרפית של המבנים בעזרת אחת מכמה תוכנות חופשיות. בין התוכנות החופשיות, אם כי לא בקוד פתוח מצויות:
אתר ה-PDB של ה-RSCB מכיל רשימה נרחבת (אורכב 24.08.2018 בארכיון Wayback Machine) של תוכנות לתצוגה של מולקולות (חופשיות ומסחריות) ותוכנות תקע לדפדפני אינטרנט.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.