From Wikipedia, the free encyclopedia
GenBank baza podataka sekvenci je otvoreno pristupna, označena zbirka svih javno dostupnih nukleotidnih sekvenci i njihovih proteinskih prijevoda. Proizvodi ga i održava Nacionalni centar za informacije o biotehnologiji (NCBI; dio Nacionalnih instituta za zdravlje u Sjedinjenim Državama) kao dio Međunarodne baze podataka o nukleotidnim sekvencama Saradnja (INSDC).
GenBank | |
---|---|
Skraćenica | GB |
Prethodnik | Novoosnovana |
Datum osnivanja | 1982. |
Vrsta | Javna baza podataka o nukleotidima |
Status | Aktivan |
Cilj | Prikupljanje nolvih podataka o nukleotidima i genima Do 2023.: Nukleotidne sekvence za više od 300.000 organizama s pratećom bibliografskom i biološkom napomenom |
Glavno sjedište | NCBI |
Članstvo | Neograničeni |
Jezik | Engleski |
Ključne osobe | Walter Goad |
Glavni organ | Uredništvo |
Br. zaposlenih | ? |
Veb-sajt | = NCBI |
GenBank i njeni saradnici primaju sekvence proizvedene u laboratorijama širom svijeta od više od 500.000 formalno opisanih vrsta.[1] Bazu podataka pokrenuli su Walter Goad i Nacionalna laboratorija Los Alamosa, 1982. GenBank je postala važna baza podataka za istraživanja u biološkim poljima i rastao je posljednjih godina eksponencijalnom stopom udvostručavajući se otprilike svakih 18 mjeseci.[2][3]
Izdanje 250.0, objavljeno u junu 2022., sadržavalo je preko 17 triliona nukleotidnih baza u više od 2,45 milijardi sekvenci.[4] GenBank je napravljen direktnim podnošenjem iz pojedinačnih laboratorija, kao i iz masovnih predaja iz velikih centara sekvenciranje.
GenBank se mogu poslati samo originalne sekvence. Direktno podnošenje se vrši GenBank koristeći BankIt, koji je web-bazirani obrazac, ili samostalni program za podnošenje, Sequin. Po prijemu predaje sekvence, osoblje GenBank-a ispituje originalnost podataka i dodjeljuje pristupni broj sekvenci i vrši provjere osiguranja kvaliteta. Prijave se zatim puštaju u javnu bazu podataka, gdje se unosi mogu pronaći putem Entrez ili preuzeti putem FTP. Grupno slanje eksprimirana oznaka sekvence (EST), lokacija označena sekvencom (STS), sekvenca istraživanja genoma (GSS) i sekvenca genoma visoke propusnosti (HTGS) podatke najčešće dostavljaju veliki centri za sekvenciranje. Grupa za direktno podnošenje GenBank-a također obrađuje kompletne sekvence mikrobnog genoma.[5][6]
Baza podataka GenBank uključuje dodatne skupove podataka koji su konstruisani mehanički iz prikupljanja podataka glavne sekvence, i stoga su isključeni iz ovog brojanja.
Organizam | Bazni parovi |
---|---|
Triticum aestivum | 2,15443744183×10 11 |
SARS-CoV-2 | 1,65771825746×10 11 |
Hordeum vulgare ssp. vulgare | 1,01344340096×10 11 |
Mus musculus | 3,0614386913×10 10 |
Homo sapiens | 2,7834633853×10 10 |
Avena sativa | 2,1127939362×10 10 |
Escherichia coli | 1,5517830491×10 10 |
Klebsiella pneumoniae | 1,1144687122×10 10 |
Danio rerio | 1,0890148966×10 10 |
Bos taurus | 1,0650671156×10 10 |
Triticum turgidum subsp. durum | 9,981529154×10 9 |
Zea mays | 7,412263902×10 9 |
Avena insularis | 6,924307246×10 9 |
Secale cereale | 6,749247504×10 9 |
Rattus norvegicus | 6,548854408×10 9 |
Aegilops longissima | 5,920483689×10 9 |
Canis lupus familiaris | 5,776499164×10 9 |
Aegilops sharonensis | 5,272476906×10 9 |
Sus scrofa | 5,179074907×10 9 |
Rhinatrema bivittatum | 5,178626132×10 9 |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.