From Wikipedia, the free encyclopedia
Tetratrikopeptid-ponavljajući protein 39B je protein koji je kod ljudi kodiran genom TTC39B, poznatim i kao C9orf52 ili FLJ33868. Glavno obilježje unutar tetratrikopeptidnog ponavljanja 39B je domen nepoznate funkcije 3808 (DUF3808), koji obuhvata većinu proteina.
TTC39B | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifikatori | |||||||||||||||||||||||||
Aliasi | TTC39B | ||||||||||||||||||||||||
Vanjski ID-jevi | OMIM: 613574 MGI: 1917113 HomoloGene: 25228 GeneCards: TTC39B | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ortolozi | |||||||||||||||||||||||||
Vrste | Čovjek | Miš | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ensembl | |||||||||||||||||||||||||
UniProt | |||||||||||||||||||||||||
RefSeq (mRNK) | |||||||||||||||||||||||||
RefSeq (bjelančevina) | |||||||||||||||||||||||||
Lokacija (UCSC) | Chr 9: 15.16 – 15.31 Mb | Chr 4: 83.14 – 83.24 Mb | |||||||||||||||||||||||
PubMed pretraga | [3] | [4] | |||||||||||||||||||||||
Wikipodaci | |||||||||||||||||||||||||
|
Dužina polipeptidnog lanca je 682 aminokiseline, а molekulska težina 76.956 Da.[5]
10 | 20 | 30 | 40 | 50 | ||||
---|---|---|---|---|---|---|---|---|
MDAVLACRLR | GRGNRVAALR | PRPRPGGSAG | PSPFALLCAG | LSPEPRAGVG | ||||
SEFPAWFLGG | SSQRRNMALL | GSRAELEADE | DVFEDALETI | SISSHSDMAT | ||||
SSLHFASCDT | QQAPRQRGAS | TVSSSSSTKV | DLKSGLEECA | VALNLFLSNK | ||||
FTDALELLRP | WAKESMYHAL | GYSTIVVLQA | VLTFEQQDIQ | NGISAMKDAL | ||||
QTCQKYRKKY | TVVESFSSLL | SRGSLEQLSE | EEMHAEICYA | ECLLQKAALT | ||||
FVQDENMINF | IKGGLKIRTS | YQIYKECLSI | LHEIQKNKLQ | QEFFYEFEGG | ||||
VKLGSGAFNL | MLSLLPARII | RLLEFIGFSG | NRELGLLQLR | EGASGRSMRS | ||||
ALCCLTILAF | HTYISLILGT | GEVNVAEAER | LLAPFLQQFP | NGSLVLFYHA | ||||
RIELLKGNLE | EAQEVFQKCI | SVQEEWKQFH | HLCYWELMWI | NVFQQNWMQA | ||||
YYYSDLLCKE | SKWSKATYVF | LKAAILSMLP | EEDVVATNEN | VVTLFRQVDS | ||||
LKQRIAGKSI | PTEKFAVRKA | RRYSASLPAP | VKLILPALEM | MYVWNGFSIV | ||||
SKRKDLSENL | LVTVEKAEAA | LQSQNFNSFS | VDDECLVKLL | KGCCLKNLQR | ||||
PLQAELCYNH | VVESEKLLKY | DHYLVPFTLF | ELASLYKSQG | EIDKAIKFLE | ||||
TARNNYKDYS | LESRLHFRIQ | AALHLWRKPS | SD |
Gen TTC39B nalazi se na kratkom kraku hrompsoma 9, sekvenca 9p22.3. Genomska DNK je duga 136.517 baza, sastoji se od 39 introna i 20 egzona i nalazi se na minus lancu. iRNK ima dužinu od 3,276 baza. TTC39B je okružen LOC100419056, hloridnim kanalom, osjetljivim na napon u tri pseudogena.[6]
Očekuje se da TTC39B ima funkciju molekulnog vezivanja, kao i ulogu u regulaciji lipida; fenotip kao i funkcija in vivo su nepoznati.[7]
Postoje dva poznata paraloga TTC39B: TTC39A i TTC39C. TTC39A ima dvije prerađene izoforme, a TTC39C ima tri prerađene izoforme.
TTC39A je testiran na povezanost sa bolestima kao što su neoplazme dojke i očekuje se da će imati funkciju vezivanja molekula i lokaliziran je u različitim odjeljcima (vanćelijski prostor, ćelijska membrana, jedro) ).[8]
Očekuje se da se TTC39C lokalizira u citoplazmi. Nije otkriven nijedan fenotip, a funkcija gena in vivo je nepoznata.[9]
Rod i vrsta | Uobičajeno ime | Identitet RNK | Datiranje divergencije od ljudi (milioni godina) |
---|---|---|---|
Pan paniscus | Bonobo | 99% | 6,3 |
Pan troglodytes | Čimpanze | 99% | 6,3 |
Gorilla gorilla gorilla | Gorile | 99% | 8,8 |
Nomascus leucogenys | Giboni | 98% | 20,4 |
Papio anubis | Babun | 97% | 29,0 |
Pongo pygmaeus | Orangutan | 97% | 15,7 |
Callithrix jacchus | Marmozet | 96% | 42,6 |
Saimiri boliviensis boliviensis | Vjeveričasti majmun | 94% | 42,6 |
Canis lupus familiaris | Pas | 91% | 94,2 |
Otolemur garnettii | Žbunasti lemur | 90% | 74,0 |
Felis catus | Mačka | 89% | 94,2 |
Bos taurus | Govedo | 88% | 94,2 |
Cricetulus griseus | Hrčak | 92,3 | |
Ovis aries | Ovca | 85% | 94,2 |
Rattus norvegicus | Pacov | 85% | 92,3 |
TTC39B je konzerviranan u organizmima od ljudi do Platyhelminthes i nije konzerviran u kvascima i gljivama.
Gen TTC39B ima pet različitih varijanti transkripta, od kojih svaka kodira različite proteine. Ovaj članak fokusira se na ponavljajući protein tetratrikopeptidne izoforme 139B, najduži od svih proteina. Kada se prevede, protein TTC39B sastoji se od 682 aminokiseline i ima molekulsku masu 76.955,64 kDa. Izoelektrična tačka proteina je 7,16 pH.[10]
Bliski ortolozi:
Rod i vrsta | Uobičajeno ime | Identitet RNK | Datiranje divergencije od ljudi (milioni godina) |
---|---|---|---|
Pan troglodytes | Čimpanza | 99% | 6,3 |
Pan paniscus | Bonobo | 99% | 6,3 |
Nomascus leucogenys | Gibon | 98% | 20,4 |
Papio anubis | Babun | 98% | 29,0 |
Callithrix jacchus | Marmozet | 97% | 42,6 |
Saimiri boliviensis boliviensis | Vjeveričasti majmun | 96% | 42,6 |
Heterocephalus glaber | Goli krtičasti pacov | 92% | 92,3 |
Canis lupus familiaris | Pas | 91% | 94,2 |
Cricetulus griseus | Hrčak | 90% | 92,3 |
Ovis aries | Ovca | 89% | 94,2 |
Cavia porcellus | Zamorac | 86% | 92,3 |
Udaljeni ortolozi:
Rod i vrsta | Uobičajeno ime | Identitet RNK | Datiranje divergencije od ljudi (milioni godina) |
---|---|---|---|
Sarcophilus harrisii | Tasmanijski đavo | 73% | 162.6 MYA |
Taeniopygia guttata | Zebrasta zeba | 72% | 296.0 MYA |
Pteropus alecto | Šišmiš | 55% | 94,2 |
Bos taurus | Govedo | 54% | 94,2 |
Rattus norvegicus | Pacov | 54% | 92,3 |
Gallus gallus | Kokoš | 54% | 296,0 |
Danio rerio | Zebrica | 54% | 400,1 |
Crassostrea gigas | Ostriga | 50% | 782,7 |
Camponotus floridanus | Mrav | 43% | 782,7 |
Nasonia vitripennis | Vaš | 42% | 782,7 |
Ciona intestinalis | Urochordata | 40% | 722,5 |
Clonorchis sinensis | Jetreni metilj | 35% | 792,4 |
Domen nepoznate funkcije 3808 (DUF3808) je konzerviran od gljiva do ljudi i ima još nepoznatu funkciju. Nalazi se od aminokiselina 142 do 568 (dužine 427 aminokiselina). Proteini ove porodice na svom C-terminalu također sadrže domen TPR_2, koji također ima nepoznatu funkciju.[11]
Još jedno konzervirano područje u proteinu TTC39B je ponavljanje tetratrikopeptida TPR_12. Nalazi se od aminokiseline 600 do 658 (dužina 59 aminokiselina).[12] TPR domeni nalaze se u mnogim proteinima koji olakšavaju specifične interakcije s partnerskim proteinom. Trodimenzijski strukturni podaci pokazali su da TPR regija formira dvijs antiparalelna alfa-heliksa. TPR motivi koji su raspoređeni jedan ispred drugog stvaraju spiralnu strukturu desne ruke s amfipatskim kanalom koji bi mogao prihvatiti komplementarnu regiju ciljnog proteina. Većina proteina koji sadrže TPR povezani su s multiproteinskim kompleksima, a postoje opsežni dokazi koji ukazuju da su TPR motivi važni za funkcioniranje kompleksa šaperona, ćelijskog ciklusa, transkripcije i transportnih proteinskih kompleksa.[13] u proteinu TTC39B protein nađena su više dva TPR domena: TPR1 se proteže od aminokiseline 393 do 426 (dug 34 aminokiseline) i TPR2, između aminokiselina 626 i 659 (također dug 34 aminokiseline).[14]
TTC39B sadrži tri transmembranske regije, sve unutar regije DUF3808.[15] Budući da postoje tri transmembranske regije, N– i C-terminal proteina su na suprotnim stranama plazmamembrane.
Mjesta fosforilacija:[16]
Aminokiselina | Položaj |
---|---|
Serin (S) | 28, 32, 42, 51, 61, 62, 72, 91, 93, 94, 96, 101, 102, 107, 120, 123, 124, 125, 126, 127, 134, 148, 165, 173, 194, 215, 217, 218, 221, 224, 229, 270, 279, 305, 313, 329, 344, 347, 350, 365, 393, 421, 454, 461, 464, 477, 500, 509, 524, 526, 548, 551, 557, 573, 578, 580, 614, 634, 638, 660, 663, 680, 681 |
Treonin (T) | 89, 100, 110, 121, 128, 152, 174, 183, 202, 211, 250, 269, 356, 362, 370, 467, 487, 493, 512, 563, 628, 651 |
Tirozin (Y) | 167, 172, 206, 210, 239, 271, 274, 295, 363, 398, 434, 451, 452, 453, 468, 523, 542, 608, 620, 623, 636, 656, 659 |
Vjerovatnoća mjesta sumoilacija [17] (bolded):
Broj | Položaj | Grupa | Rezultat |
---|---|---|---|
1 | 619 | ESEKL LKYD HYLVP | 0,91 |
2 | 262 | NMINF IKGG LKIRT | 0,77 |
3 | 302 | EFEGG VKLG SGAFN | 0,76 |
4 | 133 | STKVD LKSG LEECA | 0,73 |
Postoji jedno moguće mjesto N-glikozilacija na aminokiselini 391; međutim, budući da protein TTC39B ne sadrži signalni peptid, malo je vjerovatno da se ta glikozilacija zaista događa.
Prema analizi sekundarne strukture proteina, TTC39B će se najvjerovatnije eksprimirati u endoplazmatskom retikulumu, mitohondrijama i Golgijevom aparatu.[15]
Protein TTC39B se savija u alfa-alfa superspiralu. Oko 40% njegove strukture podudara se s d1w3ba, superheliksnim domenom o-vezane GlcNAc transferaze. O-GlcNAc povezuje metabolički status s regulacijom širokog spektra ćelijskih signalnih puteva, djelujući kao senzor hranjivih tvari.[18]
Promotor za TTC39B počinje od baznog para 15,307.109 i završava pri baznom paru 15,307,858. Ima dužinu od 750 parova baza. Početno mjesto transkripcije za izoformu 1 proteina TTC39B nalazi se od parova baza 15,307.340 do 15,307.389 i ima dužinu od 50 bp.
TTC39B je dobro eksprimiran u mišićima, unutrašnjim organima, sekretornim organima, reproduktivnim organima, imunskom i nervnom sistemu.[7] TTC39B je eksprimiran u mnoštvu tkiva: sjemenici, pluća, Langerhansovi otočići, gušterača, bubrezi, pridruženi timori zametnih ćelija , karcinom dojke itd.[7]
Postoji pet različitih varijanti transkripta za gen TTC39B. Izoforma 1 je najduži transkript i kodira najduži aminokiselinski lanac. Izoforma 2 koristi mjesto alternativne prerade uokvirena u centralnom kodirajućem području, u usporedbi s varijantom 1, što rezultira kraćim proteinom. Izoforme 3 i 4 imaju višestruke razlike u središnjem kodirajućem području, ali održavaju otvoreni okvir čitanja u usporedbi s izoformom 1. Izoforma 5 razlikuje se u 5 'UTR i ima više razlika u regijama kodiranja, u usporedbi s varijantom 1. Ove razlike uzrokuju započinjanje translacije u okviru u nizu nizvodno AUG i rezultira time da izoforma 5 ima kraći N-kraj u usporedbi s izoformom 1.[19]
Mjesta vezanja za faktor transkripcije:[20]
Matriksna porodica | Detaljnije informacije o porodici | Od | Do | Lanac | Sličnost sekvence | Sekvenca (CAPITALS: jezgrena sekvenca) |
---|---|---|---|---|---|---|
V$PLAG | Gen za pleomorfni adenom | 51 | 73 | (+) | 1.000 | taGGGGgaagtagaggagttcca |
V$TALE | TG motivna klasa prepoznavanja TALE homeodomena | 157 | 173 | (+) | 1.000 | ggtggtgtGTCAgaggc |
V$ZF02 | Transkripcijski faktori C2H2 cinkovog prsta 2 | 294 | 316 | (-) | 1.000 | cagcgCCCCacctggggtccgtg |
V$MIZ1 | Myc-interaktivni protein cinkovog prsta 1 | 417 | 427 | (–) | 1.000 | cacgcCCTCtg |
O$TF2B | Transkripcijski faktor IIB RNK-polimeraze II | 517 | 523 | (–) | 1.000 | ccgCGCC |
TTC39B stupa u interakciju sa ubikvitinom C (UBC), prekursorom poliubikvitina. Konjugacija ubikvitinskih monomera ili polimera dovodi do različitih učinaka unutar ćelije. Ubikvitinacija je povezana sa razgradnjom proteina, popravkom DNK, ćelijskim ciklusom regulacijom, modifikacijom kinaza, endocitozom i regulacijom drugih puteva ćelijske signalizacije.[21]
Na lokusu na hromosomu 9p22 za koji je utvrđeno da je povezan s lipoproteinom velike gustoće (HDL-C), TTC39B je jedini od nekoliko gena u lokusu koji ima eQTL u jetri, s alelom povezanim sa smanjenom ekspresijom u korelaciji s povećanjem HDL-C. Nokautiranje ortologa miša TTC39B, putem virusnog vektora (oboreno 50%) rezultiralo je značajno većim nivoima HDL-C u plazmi nakon četiri i sedam dana. Podaci ukazuju da je TTC39B uzročni gen za regulaciju lipida.[22]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.