From Wikipedia, the free encyclopedia
C2orf16 jest protein koji je kod ljudi kodiran genom C2orf16 sa hromosoma 2. Izoforma 2 ovog proteina (NCBI ID: CAH18189.1[4] od sada se naziva C2orf16) duga je 1.984 aminokiseline.[5] Gen sadrži jedan egzon i nalazi se na poziciji 2p23.3.[6] Aliasi C2orf16 uključuju otvoreni okvir čitanja 16 hromozoma 2 i sekvencu koja sadrži ponavljanja P-S-E-R-S-H-H-S na 2p23.3.[6][7] Po ovom genu poznato je 68 ortologs, uključujući mišjje i ovčije, ali paralozi nisu pronađen.[8]
C2orf16 | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifikatori | |||||||||||||||||||||||||
Aliasi | C2orf16 | ||||||||||||||||||||||||
Vanjski ID-jevi | HomoloGene: 82476 GeneCards: C2orf16 | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ortolozi | |||||||||||||||||||||||||
Vrste | Čovjek | Miš | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ensembl |
| ||||||||||||||||||||||||
UniProt |
| ||||||||||||||||||||||||
RefSeq (mRNK) | |||||||||||||||||||||||||
RefSeq (bjelančevina) |
| ||||||||||||||||||||||||
Lokacija (UCSC) | Chr 2: 27.54 – 27.58 Mb | n/a | |||||||||||||||||||||||
PubMed pretraga | [2] | [3] | |||||||||||||||||||||||
Wikipodaci | |||||||||||||||||||||||||
|
Dužina polipeptidnog lanca je 1.984 aminokiseline, a molekulska težina 224.321 Da.[9]
10 | 20 | 30 | 40 | 50 | ||||
---|---|---|---|---|---|---|---|---|
MELTPGAQQQ | GINYQELTSG | WQDVKSMMLV | PEPTRKFPSG | PLLTSVRFSN | ||||
LSPESQQQDV | KSLEFTVEPK | LQSVKHVKLS | SVSLQQTIKS | VELAPGSLPQ | ||||
RVKYGEQTPR | TNYQIMESSE | LIPRPGHQFA | KYAEMIPQPK | YQIPKSANLI | ||||
SIPIYHATES | SEMAQGLAYK | GIDTVEKSVG | LTPKLTGRAK | ESLGMLLQPD | ||||
LQVPKFVDLT | PMVRDQGSKF | LGLTPEKSYQ | ILETMELLSQ | SRPRVKDVGE | ||||
LYMKPLQQTV | EYEGITPELK | HYFTEAMGLT | AEARIQANEF | FGMTPKPTSQ | ||||
ATGFAERSPR | LCPQNLECVE | VISEKRLQGE | ESVVLIPKSL | HHVPDSASGM | ||||
TPGLGHRVPE | SVELTSKSGV | QVEKTLQLTP | KPQHHVGSPG | IISGLGHQVP | ||||
ESVNLTCKQW | LQMEESLEVP | LKQTSQVIGH | EESVELTSEA | RQHREVSMGL | ||||
TKSKNQSMKS | PGTTPGPLGR | IVEFMRISPE | PLDQVTESAR | TQLQVAQSEE | ||||
VILIDVPKVV | QSVKVTPGPP | FQIVKSVTIP | RPTPQMVEYI | ELTPKLQYVR | ||||
PSEHHTGPCL | QDVKSTKLIT | KPKHQILETV | ELTGFQIVKT | MLIPGPSLQI | ||||
VKSEELAPGP | IPQVVEPIGV | ALESGIEAIN | CVDLLPRPHL | QELIVPAELT | ||||
PSPCTQVKSA | ELTSPQTSPF | EEHTILTHKQ | GLQAVKSTVI | KTEPPKVMET | ||||
EDLNLGHVCQ | NRDCQKLTSE | ELQVGTDFSR | FLQSSSTTLI | SSSVRTASEL | ||||
GGLWDSGIQE | VSRALDIKNP | GTDILQPEET | YIDPTMIQSL | TFPLALHNQS | ||||
SDKTANIVEN | PCPEILGVDV | ISKETTKRKQ | MEELENSLQR | HLPQSWRSRS | ||||
RTFQAESGVQ | KGLIKSFPGR | QHNVWESHAW | RQRLPRKYLS | TMLMLGNILG | ||||
TTMERKLCSQ | TSLAERATAD | TCQSIQNLFG | IPAELMEPSQ | SLPEKGPVTI | ||||
SQPSVVKNYI | QRHTFYHGHK | KRMALRIWTR | GSTSSIIQQY | SGTRVRIKKT | ||||
NSTFNGISQE | VIQHMPVSCA | GGQLPVLVKS | ESSLSIFYDR | EDLVPMEESE | ||||
DSQSDSQTRI | SESQHSLKPN | YLSQAKTDFS | EQFQLLEDLQ | LKIAAKLLRS | ||||
QIPPDVPPPL | ASGLVLKYPI | CLQCGRCSGL | NCHHKLQTTS | GPYLLIYPQL | ||||
HLVRTPEGHG | EVRLHLGFRL | RIGKRSQISK | YRERDRPVIR | RSPISPSQRK | ||||
AKIYTQASKS | PTSTIDLQSG | PSQSPAPVQV | YIRRGQRSRP | DLVEKTKTRA | ||||
PGHYEFTQVH | NLPESDSEST | QNEKRAKVRT | KKTSDSKYPM | KRITKRLRKH | ||||
RKFYTNSRTT | IESPSRELAA | HLRRKRIGAT | QTSTASLKRQ | PKKPSQPKFM | ||||
QLLFQSLKRA | FQTAHRVIAS | VGRKPVDGTR | PDNLWASKNY | YPKQNARDYC | ||||
LPSSIKRDKR | SADKLTPAGS | TIKQEDILWG | GTVQCRSAQQ | PRRAYSFQPR | ||||
PLRLPKPTDS | QSGIAFQTAS | VGQPLRTVQK | DSSSRSKKNF | YRNETSSQES | ||||
KNLSTPGTRV | QARGRILPGS | PVKRTWHRHL | KDKLTHKEHN | HPSFYRERTP | ||||
RGPSERTRHN | PSWRNHRSPS | ERSQRSSLER | RHHSPSQRSH | CSPSRKNHSS | ||||
PSERSWRSPS | QRNHCSPPER | SCHSLSERGL | HSPSQRSHRG | PSQRRHHSPS | ||||
ERSHRSPSER | SHRSSSERRH | RSPSQRSHRG | PSERSHCSPS | ERRHRSPSQR | ||||
SHRGPSERRH | HSPSKRSHRS | PARRSHRSPS | ERSHHSPSER | SHHSPSERRH | ||||
HSPSERSHCS | PSERSHCSPS | ERRHRSPSER | RHHSPSEKSH | HSPSERSHHS | ||||
PSERRRHSPL | ERSRHSLLER | SHRSPSERRS | HRSFERSHRR | ISERSHSPSE | ||||
KSHLSPLERS | RCSPSERRGH | SSSGKTCHSP | SERSHRSPSG | MRQGRTSERS | ||||
HRSSCERTRH | SPSEMRPGRP | SGRNHCSPSE | RSRRSPLKEG | LKYSFPGERP | ||||
SHSLSRDFKN | QTTLLGTTHK | NPKAGQVWRP | EATR |
C2orf16 izoforma 2 gena ima 6,2 kb, jedan egzon na lokusu 2p23.3, i sadrži P-S-E-R-S-H-H-S ponavljanja na C-terminalnoj strani gena od 1.559. do 1.903. aminokiseline. Čini se da su ova ponavljanja nastala kao transpozibilni elementi. Primati pokazuju više ponavljanja P-S-E-R-S-H-H-S nego drugi sisarskii ortolozi.[6]
Utvrđeno je da je C2orf16 visoko eksprimiran u sjemenicima[10] i retinojsloj kiselini i mitogen-tretiranoj liniji ljudskih embriondkih matičnijh ćelija,[11] ali nije poznato da se drugačije fenotipski izražava po dobima ili bolestima.[12] Također se vidi da C2orf16 ima visoku ekspresiju u preImplantaciji ljudskih embriona od 4-ćelijskog supnja embriona do stadija blastocista.[13]
Ne vidi se da C2orf16 ima ekspresiju osjetljivu na rapamicin.[14] Takođe se vidi da C2orf16 značajno povećava ekspresiju u c-MYC nokdauniranim ćelijama raka dojke.[15]
Postoje dvije izoforme C2orf16. Izoforma 1 je dugačka 5.388 aminokiselina kodiranih u pet egzona sa preko 16.401 parova baza. Izoforma 2 koristi alternativno početno mjesto transkripcije i znatno je kraća sa 1.984 aminokiseline kodirane u egzonu 1sa preko 6.200 baznih parova.[8]
Predviđa se da se jedna miRNK veže za 3' UTR C2orf16, pristupni broj MI0005564.[16][17]
C2orf16 ima predviđenu molekulsku težinu od 224 kD i predviđenu izoelektričnu tačku od 10,08,[18] koje vrijednosti su relativno konstantne između ortologa. Protein uključuje veći od prosječnog sastava serina, histidina i arginina i niži od prosječnog sastava alanina.[19]
Klaster pozitivnog naboja pronađen je od aminokiselinskih ostataka 1.274 do 1.302.[19]
Regija bogata arginin omnalazi se od aminokiselina 1.545 do 1.933, bogata serin od aminokiselina 1.568 do 1.934, a regija bogata histidin omnalazi se od aminokiselina 1.630 do 1853.[19]
Matrična analiza[20] otkriva jako ponovljeno područje od približno od 1.500 do 1.984 ostatka, što je ponavljanje P-S-E-R-S-H-H-S. mala traka tačaka na približno 1.200 aminokiselina označava polovinu ponavljanja PSERSHHS sekvence.
C2orf16 izoforma 2 nema transmembranski domen,[21] i predviđa se da se nakon translacije nalazi na jedru zbog dvije sekvence jedarne lokalizacije predviđene na ostacima 1,233 i 1,281.[22] Među ortolozima nije nađena ni jedna konzervirana eksportna jedarna sekcvenca,[23] što sugerira da C2orf16 nije namijenjen da nakon importa napusti jedro. Nisu predviđene modifikacije N- ili C-terminala.[24][25][26][27]
Predviđeno je nakon transkripcije C2orf16 lokaliziran u jedru.[8]
Predviđa se da 3D struktura C2orf16 ima tri glavna domena. Domen 1 je od aminokiselina 1 do 662, domen 2 je od aminokiselina 674 do 1.487, a domen 3 je od aminokiseline 1.488 do 1.984.[28] Predviđeno je da će domen 1 i 2 biti povezani preko niza od 12 aminokiselina koje inače nisu organizirane u sekundarnu strukturu, što omogućava fleksibilnost između domena 1 i 2. Predviđeno je da domen 2 ima domene u interakciji s proteinima za transkripcijske faktore.[28] Predviđeno je da domen 3 slijedi strukturu "loptice na niti"[28] i ima mnogo mjesta za moguću fosforilaciju.[29]
Pokazalo se da C2orf16 ima fizičku interakciju sa protoonkogenom Myc pomoću tandemskog afinitetnog prečišćavanja.[30]
Poznato je 68 ortologa za C2orf16.[8] Čini se da se protein pojavio u evolucionoj istoriji sisara prije 320 miliona godina, oko divergencije sisara od reptila. Ova historija bi objasnila zašto ortolozi ne postoje kod vodozemaca, gmizavaca, ptica, niti drugih daljih srodnih vrsta.[31]
Bilo koji ortolozi iz vrsta koje su udaljenije od ljudi od drugih sisara vjerovatno nisu povezani u funkciji, međutim, PSERSHHS ponavljanje je prisutno u koščljoriba, rakova, stramenopilima uključujući Phytophthora infestans (krompirska plamenjača), biljke i prokariote.[31]
Transpozonsko ponavljanje je možda ponovo uvedeno kod sisara pomoću virusnog vektora.
Vidi se da je sekvenca ponavljanja P-S-E-R-S-H-H-S konzervirana u ortolozima za C2orf16 i u organizmima koji su tako udaljeni kao Oomycete (sluzave plijesni)[32] i biljke, uključujući hloroplaste Acacia ashbyae.[33] Dio ponavljanja S-P-S-E-R je najkonzerviraniji što se može uočiti i na poravnavanju sekvenci uklučenih u njihov prikazani logo.[34]
Konzervacijska analiza ponavljanja pokazuje da je početni SPS visoko konzerviran, vjerovatno za fosforilaciju(S) i strukturu (P), a R je gotovo potpuno konzerviran, mutirajući u lizin u nekim ortolozima,[33] što implicira da je za ponavljanje neophodan pozitivan naboj.
3D oblik sekvence ponavljanja je nejasan jer se predviđa da će biti ili kuglice na žici[35] ili stukturno antiparalelni beta-list [6].
Predviđa se da izoforma 2 C2orf16 ima moguću funkciju u regulaciji mitoza zbog svoje jedarne lokalizacije,[8][22] predviđeno mjesto vezanja faktora transkripcije,[28] fizička povezanost sa Myc,[30] i povećana ekspresija u c-MYC nokdaun ćelijama raka dojke.[15]
Postoje četiri zabilježena patenta za C2orf16, po jedan koji uključuje: kancerogene mutacije PPP2RIA i ARID1A,[36] predidpoziciju zaAlzheimerovu bolest,[37] diverzitet virusne vakcine[38] i varijacije broja kopija odnos prema uobičjenoj varijabli imunodeficijencije.[39] Također se pokazalo da C2orf16 ima povećanu ekspresiju u nekim linijama raka dojke,[15] kao i da je uključen u Myc[30] uobičajeni onkogen, što čini C2orf16 mogućim onkogenom za ciljanje u liječenju raka.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.