Ontologija gena

ontologija za opis funkcije gena i genskih proizvoda From Wikipedia, the free encyclopedia

Ontologija gena (eng. Gene Ontology: GO) glavna je bioinformatička inicijativa za objedinjavanje zastupljenosti atributa gena i genskih proizvoda u svim vrstama.[1] Preciznije, cilj projekta je

  1. održavanje i razvoj svog kontroliranog rječnika gena i svojstava genskih proizvoda;
  2. označavanje gena i genskih proizvoda, te asimilacija i širenje podatke o bilješkama;
  3. pružanje alata za lahak pristup svim aspektima podataka predviđenih projektom i omogućavanje funkcionalne interpretacije eksperimentalnih podataka koristeći GO, naprimjer putem analize obogaćenja.[2][3] GO je dio većeg napora u klasifikaciji, Otvorene biomedicinske ontologije, jedan od prvih članova kandidata za OBO livnicu.[4]
Kratke činjenice Skraćenica, Datum osnivanja ...
Ontologija gena/Genska ontologija
SkraćenicaGO
Datum osnivanja1998.
VrstaBiološka baza ontoloških podataka
StatusAktivna
Glavno sjedišteSlobodni pristup
ČlanstvoGlobalno
JezikEngleski
Glavni organKonzorcij za ontologiju gena
Br. volonteraNeograničen
Veb-sajthttp://geneontology.org/
Zatvori

Dok se označavanje gena fokusira na gene i genske proizvode, ontologija gena usredotočuje se na funkciju gena i genskih proizvoda. GO također proširuje napore koristeći jezik markiranja za izradu podataka (ne samo gena i njihovih proizvoda već i kuriranih atributa) mašinski čitljivih, i to na način koji je objedinjen u svim vrstama (dok se konvencije genske nomenklature razlikuju u zavisnosti od biološkog taksona).

Pojmovi i ontologija

S praktičnog gledišta, ontologija je prikaz nečega o čemu znamo. "Ontologije" se sastoje od prikaza stvari koje se mogu otkriti ili direktno uočiti, kao i odnosa između tih stvari.

U biologiji i srodnim domenama ne postoji univerzalna standardna terminologija, a upotreba izraza može biti specifična za vrstu, područje istraživanja ili čak određenu istraživačku skupinu. To otežava komunikaciju i razmjenu podataka. Projekt genske ontologije pruža ontologiju definiranih pojmova koji predstavljaju svojstva genskog proizvoda. Ontologija pokriva tri domena:

  • ćelijska komponenta, dijelove ćelije ili njenog vanćelijskog okruženja;
  • molekulska funkcija, elementarne aktivnosti genskog proizvoda na molekulSKom nivou, poput vezanja ili kataliza;
  • biološki proces, operacije ili skupove molekulskih događaja s definiranim početkom i krajem, koji se odnose na funkcioniranje integriranih životnih jedinica: ćelije, tkiva, organi i organizmi.

Svaki GO pojam u ontologiji ima svoj naziv, koji može biti:

  • riječ ili niz riječi;
  • jedinstveni alfanumerički identifikator;
  • definicija sa navedenim izvorima, i
  • ontologija koja ukazuje na domen kojem pripada.

Termini mogu imati i sinonime, koji se klasificiraju kao tačno ekvivalentni nazivu, širi, uži ili povezani; reference na ekvivalentne koncepte u drugim bazama podataka i komentari o značenju ili upotrebi izraza. GO ontologija je strukturirana kao usmjereni aciklični grafikon, a svaki pojam je definirao odnose sa jednim ili više drugih pojmova u istm domenu, a ponekad i na drugim domenima. GO rječnik je dizajniran da bude neutralan prema vrstama i uključuje termine koji se primjenjuju na prokariote i eukariote, pojedinačne i višećelijse organizme.

GO nije statična, a dopune, ispravke i izmjene predlažu i traže od njih članovi istraživačkih i anotacijskih zajednica, kao i oni koji su direktno uključeni u GO projekt.[5] Naprimjer, komentator može zatražiti određeni termin koji predstavlja metabolički put ili se dio ontologije može revidirati uz pomoć stručnjaka iz zajednice (npr.[6]). Predložene izmjene pregledaju urednici ontologije i primjenjuju se prema potrebi.

Datoteke GO ontologije i napomena su besplatno dostupne na web stranici GO[7] in a number of formats, or can be accessed online using the GO browser AmiGO. Projekt Ontologija gena također nudi mapiranje svojih pojmova za preuzimanje u druge sisteme klasifikacije.

Primjeri termina

id: GO:0000016
ime: laktazna aktivnost
ontologija: molekulska_funkcija
def: "Kataliza reakcije: laktoza + H2O=D-glukoza + D-galaktoza". [EC:3.2.1.108]
sinonim: "lactase-phlorizin hydrolase activity" BROAD [EC:3.2.1.108]
sinonim: "aktivnost laktoza-galaktohidrolazew" EXACT [EC:3.2.1.108]
xref: EC:3.2.1.108
xref: MetaCyc:LACTASE-RXN
xref: Reaktom:20536
is_a: GO:0004553 ! hidrolazma aktivnost, hidroliziranje spojeva O-glikozila

Podatak o izvoru:[8]

Označavanje

Označavanje genoma obuhvata praksu pribavljanja podataka o genskom proizvodu, a GO oznake za to koriste termine iz GO. Bilješke kustosa GO integrirane su i distribuirane na web stranici GO, gdje se mogu direktno preuzeti ili pregledati na mreži pomoću AmiGO.[9] Pored identifikatora genskog proizvoda i relevantnog izraza GO, GO oznake imaju najmanje sljedeće podatke:

  • Referenca korištena za izradu napomena (npr. članak u časopisu);
  • Šifra dokaza koja označava tip dokaza na kojima se zasniva napomena;
  • Datum i kreator napomene

Dodatne informacije, ovisno o rerminu GO i korištenim dokazima, kao i posebne informacije, poput uvjeta pod kojima se funkcija poštuje, također se mogu uključiti u napomenu GO.

Kodiranje dokaza dolazi iz kontroliranog rječnika kodova Ontologije koda dokaza, koji pokriva i ručne i automatizirane metode označavanje.[10] Naperimjer, Traceable Author Statement (TAS) znači da je kustos (kurator) pročitao objavljeni naučni rad i da metapodaci za tu napomenu navode taj rad; Izvučeno iz sličnosti sekvence (ISS) znači da je ljudski kustos pregledao rezultate pretraživanja sličnosti sekvenci i potvrdio da je biološki značajan. Oznake iz automatiziranih procesa (naprimjer, preslikavanje bilješki kreiranih korištenjem drugog rječnika označavanje) dobivaju kod Izvučeno iz elektronske bilješke (IEA). U 2010. godini preko 98% svih GO oznaka izvedeno je računarski, ne od strane kustosa, ali od 2. jula 2019. računarski je izvedeno samo oko 30% svih GO oznaka.[11][12]

Budući da ove oznake ne provjerava čovjek, GO konzorcij smatra da su marginalno manje pouzdane i da su obično na višem nivou, manje detaljni pojmovi. Cjeloviti skupovi podataka o označavanjima mogu se preuzeti s web stranice GO. Da bi podržao razvoj anotacija, GO konzorcij pruža radionice i mentore novim grupama kustosa i programera.

Mnogi algoritmi mašinskog učenja dizajnirani su i implementirani za predviđanje napomena o genetičkoj ontologiji.[13][14]

Primjeri označavanja

Genski proizvod : Aktin, srčani mišić alfa 1, UniProtKB:P68032
GO termin: heart contraction ; GO:0060047 (biološki proces)
Kod dokaza: Inferencija mutantnog fenotipa (IMP)
Referenca: PubMed
Označio: UniProtKB, 6. jun, 2008

Podatak o izvoru:[15]

Alati

Dostupan je veliki broj alata,[16] kako na mreži, tako i za preuzimanja koja koriste podatke koje pruža projekt GO. Velika većina njih dolazi od trećih strana; konzorcij GO razvija i podržava dva alata, AmiGO i OBO-Edit.

AmiGO[9][17] je internetska aplikacija koja omogućava korisnicima da pretražuju, pregledavaju i vizualiziraju ontologije i podatke o oznakama genskog proizvoda. Također ima alat BLAST-a,[18] tools allowing analysis of larger data sets,[19][20] and an interface to query the GO database directly.[21]

AmiGO može se koristiti na mreži na web stranici GO za pristup podacima koje pruža GO konzorcij ili se može preuzeti i instalirati za lokalnu upotrebu, u bilo kojoj bazi podataka koja koristi shemu baze podataka GO (npr.[22]). Besplatni softver otvorenog koda dostupan je kao dio distribucije go-dev softvera.[23]

OBO-Edit[24] je uređivač ontologije otvorenog koda, neovisan o platformi, koji je razvio i održava Konzorcij za genetičku ontologiju. Implementiran je u [[Java (programski jezik] | Java]] i koristi pristup orijentiran na grafove za prikaz i uređivanje ontologija. OBO-Edit uključuje sveobuhvatni interfejs (sučelje) za pretraživanje i filtriranje, s opcijom prikazivanja podskupina pojmova, kako bi ih vizualno razlikovali; korisnički interfejs se takođe može prilagoditi prema korisničkim željama. OBO-Edit također ima rezoner koji može zaključiti veze koje nisu izričito navedene, na osnovu postojećih odnosa i njihovih svojstava. Iako je razvijen za biomedicinske ontologije, OBO-Edit može se koristiti za pregled, pretraživanje i uređivanje bilo koje ontologije. Slobodno je dostupan za preuzimanje.[23]

Konzorcij

Konzorcij za gensku ontologiju je skup bioloških baza podataka i istraživačkih grupa koje su aktivno uključene u projekt genske ontologije.[12] To uključuje niz baza podataka o model organizama i baze podataka o više vrsta, grupe za razvoj softvera i namjensku redakciju.

Historija

Ontologija gena je prvobitno konstruirana 1998., u organizaciji Konzorcija istraživača koji su proučavali genome tri modelnih organizma: Drosophila melanogaster (voćna mušica), Mus musculus (miš) i Saccharomyces cerevisiae (pivski ili pekarski kvasac).[25] Mnoge druge baze podataka o model-organizmima pridružile su se Konzorciju ontologoje gena, doprinoseći ne samo anotacijskim podacima, već i razvoju ontologija i alata za pregled i primjenu podataka. Mnoge velike baze podataka o biljkama, životinjama i mikroorganizmima daju svoj doprinos ovom projektu.[7] As of July 2019, the GO contains 44,945 terms; there are 6,408,283 annotations to 4,467 different biological organisms.[7] Postoji značajna literatura o razvoju i upotrebi GO-a, a ona je postala standardni alat u bioinformatičkom arsenalu. Njihovi ciljevi imaju tri aspekta: izgradnja ontologije gena, dodjeljivanje ontologije genima/genskim proizvodima i razvoj softvera i baza podataka za prva dva objekta.

Počinje se pojavljivati i nekoliko analiza genske ontologije, koristeći formalna svojstva razreda (metasvojstva), koja su nezavisna od domena. Naprimjer, vidi ontološka analiza bioloških ontologija.[26]

Također pogledajte

  • BLAST
  • Blast2GO[27]
  • Uporedna toksikogenomska baza podataka
  • DAVID bioinformatika
  • Interferom
  • Nacionalni centar za biomedicinsku ontologiju

Reference

Vanjski linkovi

Wikiwand - on

Seamless Wikipedia browsing. On steroids.