ontologija za opis funkcije gena i genskih proizvoda From Wikipedia, the free encyclopedia
Ontologija gena (eng. Gene Ontology: GO) glavna je bioinformatička inicijativa za objedinjavanje zastupljenosti atributa gena i genskih proizvoda u svim vrstama.[1] Preciznije, cilj projekta je
Ontologija gena/Genska ontologija | |
---|---|
Skraćenica | GO |
Datum osnivanja | 1998. |
Vrsta | Biološka baza ontoloških podataka |
Status | Aktivna |
Glavno sjedište | Slobodni pristup |
Članstvo | Globalno |
Jezik | Engleski |
Glavni organ | Konzorcij za ontologiju gena |
Br. volontera | Neograničen |
Veb-sajt | http://geneontology.org/ |
Dok se označavanje gena fokusira na gene i genske proizvode, ontologija gena usredotočuje se na funkciju gena i genskih proizvoda. GO također proširuje napore koristeći jezik markiranja za izradu podataka (ne samo gena i njihovih proizvoda već i kuriranih atributa) mašinski čitljivih, i to na način koji je objedinjen u svim vrstama (dok se konvencije genske nomenklature razlikuju u zavisnosti od biološkog taksona).
S praktičnog gledišta, ontologija je prikaz nečega o čemu znamo. "Ontologije" se sastoje od prikaza stvari koje se mogu otkriti ili direktno uočiti, kao i odnosa između tih stvari.
U biologiji i srodnim domenama ne postoji univerzalna standardna terminologija, a upotreba izraza može biti specifična za vrstu, područje istraživanja ili čak određenu istraživačku skupinu. To otežava komunikaciju i razmjenu podataka. Projekt genske ontologije pruža ontologiju definiranih pojmova koji predstavljaju svojstva genskog proizvoda. Ontologija pokriva tri domena:
Svaki GO pojam u ontologiji ima svoj naziv, koji može biti:
Termini mogu imati i sinonime, koji se klasificiraju kao tačno ekvivalentni nazivu, širi, uži ili povezani; reference na ekvivalentne koncepte u drugim bazama podataka i komentari o značenju ili upotrebi izraza. GO ontologija je strukturirana kao usmjereni aciklični grafikon, a svaki pojam je definirao odnose sa jednim ili više drugih pojmova u istm domenu, a ponekad i na drugim domenima. GO rječnik je dizajniran da bude neutralan prema vrstama i uključuje termine koji se primjenjuju na prokariote i eukariote, pojedinačne i višećelijse organizme.
GO nije statična, a dopune, ispravke i izmjene predlažu i traže od njih članovi istraživačkih i anotacijskih zajednica, kao i oni koji su direktno uključeni u GO projekt.[5] Naprimjer, komentator može zatražiti određeni termin koji predstavlja metabolički put ili se dio ontologije može revidirati uz pomoć stručnjaka iz zajednice (npr.[6]). Predložene izmjene pregledaju urednici ontologije i primjenjuju se prema potrebi.
Datoteke GO ontologije i napomena su besplatno dostupne na web stranici GO[7] in a number of formats, or can be accessed online using the GO browser AmiGO. Projekt Ontologija gena također nudi mapiranje svojih pojmova za preuzimanje u druge sisteme klasifikacije.
Podatak o izvoru:[8]
Označavanje genoma obuhvata praksu pribavljanja podataka o genskom proizvodu, a GO oznake za to koriste termine iz GO. Bilješke kustosa GO integrirane su i distribuirane na web stranici GO, gdje se mogu direktno preuzeti ili pregledati na mreži pomoću AmiGO.[9] Pored identifikatora genskog proizvoda i relevantnog izraza GO, GO oznake imaju najmanje sljedeće podatke:
Dodatne informacije, ovisno o rerminu GO i korištenim dokazima, kao i posebne informacije, poput uvjeta pod kojima se funkcija poštuje, također se mogu uključiti u napomenu GO.
Kodiranje dokaza dolazi iz kontroliranog rječnika kodova Ontologije koda dokaza, koji pokriva i ručne i automatizirane metode označavanje.[10] Naperimjer, Traceable Author Statement (TAS) znači da je kustos (kurator) pročitao objavljeni naučni rad i da metapodaci za tu napomenu navode taj rad; Izvučeno iz sličnosti sekvence (ISS) znači da je ljudski kustos pregledao rezultate pretraživanja sličnosti sekvenci i potvrdio da je biološki značajan. Oznake iz automatiziranih procesa (naprimjer, preslikavanje bilješki kreiranih korištenjem drugog rječnika označavanje) dobivaju kod Izvučeno iz elektronske bilješke (IEA). U 2010. godini preko 98% svih GO oznaka izvedeno je računarski, ne od strane kustosa, ali od 2. jula 2019. računarski je izvedeno samo oko 30% svih GO oznaka.[11][12]
Budući da ove oznake ne provjerava čovjek, GO konzorcij smatra da su marginalno manje pouzdane i da su obično na višem nivou, manje detaljni pojmovi. Cjeloviti skupovi podataka o označavanjima mogu se preuzeti s web stranice GO. Da bi podržao razvoj anotacija, GO konzorcij pruža radionice i mentore novim grupama kustosa i programera.
Mnogi algoritmi mašinskog učenja dizajnirani su i implementirani za predviđanje napomena o genetičkoj ontologiji.[13][14]
Podatak o izvoru:[15]
Dostupan je veliki broj alata,[16] kako na mreži, tako i za preuzimanja koja koriste podatke koje pruža projekt GO. Velika većina njih dolazi od trećih strana; konzorcij GO razvija i podržava dva alata, AmiGO i OBO-Edit.
AmiGO[9][17] je internetska aplikacija koja omogućava korisnicima da pretražuju, pregledavaju i vizualiziraju ontologije i podatke o oznakama genskog proizvoda. Također ima alat BLAST-a,[18] tools allowing analysis of larger data sets,[19][20] and an interface to query the GO database directly.[21]
AmiGO može se koristiti na mreži na web stranici GO za pristup podacima koje pruža GO konzorcij ili se može preuzeti i instalirati za lokalnu upotrebu, u bilo kojoj bazi podataka koja koristi shemu baze podataka GO (npr.[22]). Besplatni softver otvorenog koda dostupan je kao dio distribucije go-dev softvera.[23]
OBO-Edit[24] je uređivač ontologije otvorenog koda, neovisan o platformi, koji je razvio i održava Konzorcij za genetičku ontologiju. Implementiran je u [[Java (programski jezik] | Java]] i koristi pristup orijentiran na grafove za prikaz i uređivanje ontologija. OBO-Edit uključuje sveobuhvatni interfejs (sučelje) za pretraživanje i filtriranje, s opcijom prikazivanja podskupina pojmova, kako bi ih vizualno razlikovali; korisnički interfejs se takođe može prilagoditi prema korisničkim željama. OBO-Edit također ima rezoner koji može zaključiti veze koje nisu izričito navedene, na osnovu postojećih odnosa i njihovih svojstava. Iako je razvijen za biomedicinske ontologije, OBO-Edit može se koristiti za pregled, pretraživanje i uređivanje bilo koje ontologije. Slobodno je dostupan za preuzimanje.[23]
Konzorcij za gensku ontologiju je skup bioloških baza podataka i istraživačkih grupa koje su aktivno uključene u projekt genske ontologije.[12] To uključuje niz baza podataka o model organizama i baze podataka o više vrsta, grupe za razvoj softvera i namjensku redakciju.
Ontologija gena je prvobitno konstruirana 1998., u organizaciji Konzorcija istraživača koji su proučavali genome tri modelnih organizma: Drosophila melanogaster (voćna mušica), Mus musculus (miš) i Saccharomyces cerevisiae (pivski ili pekarski kvasac).[25] Mnoge druge baze podataka o model-organizmima pridružile su se Konzorciju ontologoje gena, doprinoseći ne samo anotacijskim podacima, već i razvoju ontologija i alata za pregled i primjenu podataka. Mnoge velike baze podataka o biljkama, životinjama i mikroorganizmima daju svoj doprinos ovom projektu.[7] As of July 2019, the GO contains 44,945 terms; there are 6,408,283 annotations to 4,467 different biological organisms.[7] Postoji značajna literatura o razvoju i upotrebi GO-a, a ona je postala standardni alat u bioinformatičkom arsenalu. Njihovi ciljevi imaju tri aspekta: izgradnja ontologije gena, dodjeljivanje ontologije genima/genskim proizvodima i razvoj softvera i baza podataka za prva dva objekta.
Počinje se pojavljivati i nekoliko analiza genske ontologije, koristeći formalna svojstva razreda (metasvojstva), koja su nezavisna od domena. Naprimjer, vidi ontološka analiza bioloških ontologija.[26]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.