From Wikipedia, the free encyclopedia
Os ARNs non codificantes longos (ARNncl ou, en inglés, long ncRNA ou lncRNA) son un tipo de ARN, xeralmente definidos como transcritos de máis de 200 nucleótidos que non son traducidos a proteínas.[2] Este límite arbitrario serve para distinguir os ARNs non codificantes longos dos curtos, como serían o microARN, o ARN interferente pequeno, o ARN que interacciona con Piwi, o ARN nucleolar pequeno e outros ARNs curtos.[3] Os chamados ARNs non codificantes intercalados/interxénicos longos (ARNncil ou, en inglés, lincRNA) son secuencias de ARN non codificante longo que non se solapan con xenes codificantes de proteínas.[4]
Os ARN non codificantes longos comprenden os interxénicos, os intrónicos e os de sentido e antisentido, cada un dos cales mostra ter diferentes posicións xenómicas en relación cos xenes e os exóns.[1][5]
En 2007 un estudo atopou que só unha quinta parte das transcricións no xenoma humano estaban asociadas con xenes codificantes de proteínas,[6] o que indica que polo menos hai catro veces máis secuencias de ARN non codificante longo que de ARN codificante. Os proxectos de secuenciación de ADN complementario (ADNc) a grande escala como FANTOM revelaron a complexidade desta transcrición.[7] O proxecto FANTOM3 identificou ~35.000 transcritos non codificantes que levan moitas sinaturas de ARN mensaxeiro, incluíndo a caparuza cinco prima (5' cap), o empalme e a poliadenilación, pero que teñen pouco ou ningún marco aberto de lectura (ORF).[7] Esta cifra representa unha estimación baixa conservadora, xa que se omitiron moitos transcritos solitarios e transcritos non poliadenilados (os datos de tiling array mostran que máis dun 40% dos transcritos non están poliadenilados).[8] Identificar os ARN non codificantes nas bibliotecas de ADN complementario é todo un reto porque pode ser difícil distinguir os transcritos codificantes de proteínas dos non codificantes. Suxeriuse despois de múltiples estudos que o testículo,[9] e o tecido nervioso expresan a maior cantidade dos ARN non codificantes longos de entre todos os tecidos do corpo.[10] Usando FANTOM5, identificáronse 27.919 ARNnc longos en varias fontes humanas.[11]
Cuantitativamente, os ARNnc longos teñen unha abundancia 10 veces menor que os ARNm,[12][13] o que se explica pola maior variación entre células dos niveis de expresión de xenes de ARNnc longo nas células individuais, cando se comparan cos xenes codificantes de proteínas.[14] En xeral, a maioría (~78%) dos ARNnc longos caracterízanse como específicos de tecidos, en contraste con só o ~19% dos ARNm.[12] Ademais da súa maior especificidade de tecido, os ARNnc longos caracterízanse por unha maior especificidade do estado de desenvolvemento,[15] e a especificidade de subtipo celular en tecidos como o do neocórtex humano[16] e outras partes do cerebro, que regulan o funcionamento e desenvolvemento correcto do cerebro.[17] En 2018, unha integración completa dos ARNnc longos das bases de datos existentes, publicou a literatura e novas ensamblaxes de ARN baseándose en análise de datos de RNA-Seq, e revelou que en humanos hai 270.044 transcritos de ARNnc longos.[18]
En comparación cos mamíferos, nas plantas relativamente poucos estudos estiveron enfocados a estudar a prevalencia dos ARNnc longos. Porén, un amplo estudo sobre 37 especies de plantas superiores e seis de algas identificou ~200.000 transcritos non codificantes usando unha estratexia in silico,[19] e tamén creou a Green Non-Coding Database (GreeNC) asociada, un repositorio dos ARNnc longos de plantas.
En 2005 a paisaxe dos xenomas de mamíferos describiuse como numerosos "focos" de transcrición que están separados por longos tramos de espazo interxénico.[7] Aínda que algúns ARN non codificantes longos están localizados dentro dos tramos interxénicos, a maioría deles son transcritos solapantes senstido e antisentido que adoitan incluír xenes codificantes de proteínas,[6] dando lugar a unha complexa xerarquía de isoformas solapantes.[20] As secuencias xenómicas dentro destes focos transcricionais están con frecuencia compartidos dentro de varios transcritos codificantes e non codificantes en direccións sentido e antisentido[21] Por exemplo, 3-012 dun total de 8.961 ADNs complementarios anotados previamente como secuencias codificantes truncadas en FANTOM2 foron máis tarde designadas como variantes xenuínas de ARN non codificante de ADNs complementarios codificantes de proteínas.[7] Aínda que a abundancia e conservación destas disposicións suxire que teñen relevancia biolóxica, a complexidade destes focos frustra unha doada avaliación.
O consorcio GENCODE recompilou e analizou un conxunto completo de anotacións de ARNnc longos humanos e as súas organizacións xenómicas, modificacións, localizacións celulares e perfís de expresión nos tecidos.[10] As súas análises indican que os ARNnc longos humanos mostran un nesgo cara aos transcritos de dous exóns.[10]
Nome | Grupo taxonómico | Servidor web | Repositorio | Entrada de ficheiros | Modelo principal / algoritmo | Training set | Ano de publicación | Referencia |
---|---|---|---|---|---|---|---|---|
DeepPlnc | Plantas | DeepPlnc Server | DeepPlnc | FASTA | Rede neural | Si | 2022 | [22] |
RNAsamba | Todos | RNAsamba | RNAsamba | FASTA | Rede neural | Si | 2020 | [23] |
LGC | Plantas, animais | LGC | FASTA, BED, GTF | Relación entre a lonxitude de ORF e o contido GC | Non | 2019 | [24] | |
CPAT | Humanos, moscas, ratos, peixes cebra | CPAT | CPAT | FASTA/BED | Regresión loxística | Si | 2013 | [25] |
COME | Plantas, humanos, ratos, mocas, vermes | COME Arquivado 03 de abril de 2019 en Wayback Machine. | COME | GTF | Random Forest | Si | 2017 | [26] |
CNCI | Plantas, animais | NA | FASTA, GTF | Máquina de vector de soporte | Non | 2013 | [27] | |
PLEK | Vertebrados | NA | PLEK | FASTA | Máquina de vector de soporte | Non | 2014 | [27] |
FEELnc | Todos | NA | FEELnc | FASTA, GTF | Random Forest | Si | 2017 | [28] |
PhyloCSF | Vertebrados, moscas, mosquitos, lévedos, vermes | NA | FASTA | Modelo de codón filoxenético | Si | 2011 | [29] | |
slncky | Todos | NA | slncky | FASTA, BED | Conservación evolutiva | Si | 2016 | [30] |
Houbo unha considerable discusión sobre se os ARNnc longos foran anotados incorrectamente e en realidade si codificaban proteínas. Atopáronse varios ARNnc longos que, efectivamente, codificaban péptidos con funcións biolóxicas significativas.[31][32][33] Os estudos de Ribo-Seq (ribosome profiling) suxeriron que entre o 40% e o 90% dos ARNnc longos anotados son de feito traducidos,[34][35] aínda que hai desacordo sobre o método correcto de analizar os datos de Ribo-Seq.[36] Ademais, pénsase que moitos dos péptidos producidos por ARNcn longos poden sen moi inestables e sen función biolóxica.[35]
Os estudos iniciais sobre a conservación do ARNnc longo observaron que, considerados como clase, estaban enriquecidos con elementos de secuencias conservadas,[37] pero teñen menos substitucións e menor frecuencia de insercións/delecións[38] e menos variantes de pouca frecuencia,[39] o que indica selección purificante que mantén a función dos ARNnc longos. Porén, posteriores investigacións en ARNnc longo de vertebrados revelaron que aínda que os ARNnc longos están conservados en secuencia, non están conservados en transcrición.[40][41][9] Noutras palabras, incluso cando a secuencia do ARNnc longo humano está conservada noutras especies de vertebrados, a miúdo non hai transcrición dun ARNnc longo na rexión xenómica ortóloga. Algúns argumentan que estas observacións suxiren a non funcionalidade da maioría dos ARNnc longos,[42][43][44] mentres que outros sosteñen que poden ser indicativas dunha rápida selección adaptativa específica de especie.[45]
Aínda que o recambio (turnover) da transcrición dos ARNnc longos é moito maior do que inicialmente se agardaba, é importante salientar que aínda así, centos de ARNnc longos están conservados a nivel de secuencia. Houbo varios intentos de delinear as diferentes categorías de sinaturas de selección observadas entre os ARNnc longos, incluíndo: ARNnc longos con conservación de secuencias en toda a lonxitude do xene, ARNnc longos nos cales só está conservada unha porción do transcrito (por exemplo, o extremo 5′, os sitios de empalme), e ARNnc longos que se transcriben de rexións sinténicas do xenoma pero non teñen unha similitude de secuencia recoñecible.[46][47][48] Ademais, houbo intentos de identificar estruturas secundarias conservadas nos ARNnc longos, aínda que estes estudos deron lugar actualmente a resultados conflitivos.[49][50]
Malia a acumulación de evidencias de que a maioría dos ARNnc longos de mamíferos son probablemente funcionais,[51][52] só unha proporción relativamente pequena demostrou ser bioloxicamente relevante. Algúns ARNnc longos foron anotados funcionalmente en LncRNAdb (unha base de datos de ARNnc longos descritos na literatura),[53][54] coa maioría deles descritos en humanos. As funcións doutros ARNnc longos con evidencias experimentais foron revisadas pola comunidade en LncRNAWiki (unha plataforma baseada en wiki, editable publicamente e de contido aberto para a revisión pola comunidade dos ARNnc longos humanos)[55] con respecto aos mecanismos funcionais e asociación con enfermidades, ás cales tamén se pode acceder en LncBook.[18] De acordo coa revisión (ou curación) dos mecanismos funcionais dos ARNnc longos baseada na literatura, informouse amplamente de que os ARNnc longos están implicados na regulación transcricional.[18] Un estudo posterior de secuenciación a grande escala proporcionou probas de que moitos transcritos que se pensaba que eran ARNnc longos poden, de feito, ser traducidos a proteínas.[56]
En eucariotas, a transcrición de ARN é un proceso estreitamente regulado. Os ARN non codificantes actúan sobre diferentes aspectos deste proceso, afectando moduladores transcricionais, a ARN polimerase (RNAP) II e mesmo o ADN bicatenario para regular a expresión xénica.[57]
Os ARNs non codificantes modulan a transcrición por diversos mecanismos, como funcionando eles mesmos como reguladores, modificando a actividade dun factor de transcrición, ou regulando a asociación e actividade de correguladores. Por exemplo, o ARN non codificante Evf-2 funciona como coactivador do factor de transcrición homeobox Dlx2, que ten un importante papel no desenvolvemento do prosencéfalo e a neuroxénese.[58][59] Sonic hedgehog induce a transcrición de Evf-2 a partir dun elemento ultraconservado localizado entre os xenes Dlx5 e Dlx6 durante o desenvolvemento do prosencéfalo.[58] Despois, o Evf-2 recruta o factor de transcrición Dlx2 ao mesmo elemento ultraconservado por medio do cal Dlx2 induce seguidamente a expresión de Dlx5. A existencia doutros elementos ultra ou altamente conservados similares nos xenomas de mamíferos que son ambos transcritos e desempeñan funcións de potenciadores suxire que Evf-2 pode ser ilustrativo dun mecanismo xeneralizado que regula xenes do desenvolvemento con padróns de expresión complexos durante o crecemento dos vertebrados.[60][61] A transcrición e a expresión de elementos ultraconservados non codificantes similares demostrouse que é anormal na leucemia humana e contribúe á apoptose en células de cancro de colon, suxerindo a súa implicación na tumoroxénese.[62][63]
Os ARN non codificantes locais poden tamén recrutar programas transcricionais para regular a expresión de xenes codificantes de proteínas adxacentes. Por exemplo, os ARNnc longos diverxentes que se transcriben na dirección oposta de xenes codificantes de proteínas próximos (~20% dos ARNnc longos totais en xenomas de mamíferos) posiblemente regulan a transcrición de xenes regulatorios do desenvolvemento esenciais adxacentes próximos en células pluripotentes.[64]
A proteína que se une ao ARN TLS únese e inhibe a proteína que se une a CREB e as actividades da histona acetiltransferase p300 nunha diana de xene reprimido, a ciclina D1. O recrutamento de TLS no promotor da ciclina D1 é dirixido polos ARNnc longos expresados a baixos niveis e adheridos ás rexións regulatorias 5' en resposta a sinais de danos no ADN.[65] Ademais, estes ARNnc locais actúan cooperativamente como ligandos para modular as actividades da TLS. Grosso modo, este mecanismo permite que a célula aproveite as proteínas que se unen ao ARN, que constitúen unha das maiores clases do proteoma dos mamíferos, e integra as súas funcións en programas transcricionais. Os ARNnc longos nacentes incrementan a actividade da proteína que se une a CREB, que á súa vez incrementa a transcrición dese ARNnc.[66] Un estudo atopou que un ARNnc longo en dirección antisentido da apolipoproteína A1 (APOA1) regula a transcrición de APOA1 por medio de modificacións epixenéticas.[67]
Evidencias recentes apoian a posibilidade de que a transcrición de xenes que escapan da inactivación X podería ser mediada pola expresión de ARNnc longos en dominios cromosómicos de escape.[68]
Os ARNnc tamén afectan a factores de transcrición xerais necesarios para a transcrición pola RNAP II de todos os xenes.[57] Estes factores xerais inclúen compoñentes do complexo de iniciación que se ensambla nos promotores ou está implicado na elongación da transcrición. Un ARNnc transcrito dun promotor menor de augas arriba do xene da dihidrofolato redutase (DHFR) forma un tríplex ARN-ADN estable no promotor maior do DHFR para impedir a unión do cofactor transcricional TFIIB.[69] Este novo mecanismo de regular a expresión xénica pode representar un método moi estendido de controlar o uso dos promotores, xa que existen miles de tríplex ARN-ADN nun cromosoma eucariota.[70] O ARNnc U1 pode inducir a transcrición ao unirse e estimular a TFIIH para fosforilar o dominio C-terminal da RNAP II.[71] En contraste, o ARNnc 7SK pode reprimir a elongación da transcrición ao formar en combinación con HEXIM1/2 un complexo inactivo que impide que PTEFb fosforile o dominio C-terminal da RNAP II,[71][72][73] reprimindo a elongación global baixo condicións estresantes. Estes exemplos, que sortean os modos específicos de regulación en promotores individuais proporcionan un medio para causar rapidamente cambios globais na expresión xénica.
A capacidade de mediar rapidamente en cambios globais é tamén aparente na rápida expresión de secuencias repetitivas non codificantes. Os elementos nucleares intercalados curtos (SINE) Alu en humanos e os elementos B1 e B2 análogos en ratos acabaron sendo os elementos móbiles máis abundantes nos xenomas, supoñendo o ~10% do xenoma humano e o ~6% do xenoma do rato.[74][75] Estes elementos transcribíronse como ARNnc pola RNAP III en resposta aos estreses ambientais como o choque térmico,[76] circunstancia na que despois se unen á RNAP II con alta afinidade e impiden a formación de complexos de preiniciación activos.[77][78][79][80] Isto permite unha ampla e rápida represión da expresión xénica en resposta ao estrés.[77][80]
Unha disección das secuencias funcionais nos transcritos de ARNs Alu esbozou unha estrutura modular análoga á organización dos dominios proteicos en factores de transcrición de proteínas.[81] Os ARN Alu conteñen dous 'brazos', cada un dos cales pode unirse a unha molécula de RNAP II, así como dous dominios reguladores que son responsables da represión transcricional de RNAP II in vitro.[80] Estes dous dominios estruturados lixeiramente poden incluso estar concatenados a outros ARNnc como os elementos B1 para cumprir os seus respectivos papeis.[80] A abundancia e distribución de elementos Alu e elementos repetitivos similares ao longo dos xenomas de mamíferos pode deberse en parte a que estes dominios funcionais son cooptados noutros ARNnc longos durante a evolución, sendo unha característica común a presenza de dominios de secuencias repetidas funcionais en varios ARNnc longos coñecidos, incluíndo Kcnq1ot1, Xlsirt e Xist.[82][83][84][85]
Ademais do choque térmico, a expresión de elementos SINE (incluíndo os ARNs Alu, B1 e B2) increméntase durante o estrés celular, como durante unha infección viral[86] nalgunhas células cancerosas,[87] onde pode de xeito similar regular cambios globais na expresión xénica. A capacidade dos ARNs Alu e B2 de unirse directamente á RNAP II proporciona un amplo mecanismo par reprimir a transcrición.[78][80] Non obstante, hai excepcións específicas a esta resposta global nas que os ARNs Alu ou B2 non se encontran en promotores activados de xenes que experimentan indución, como os xenes de choque térmico.[80] Esta xerarquía adicional de regulación que exonera a xenes concretos da represión xeneralizada tamén implica ao ARNnc longo ARN-1 de choque térmico (HSR-1). Argumentouse que HSR-1 está presente en células de mamífero en estado inactivo, pero baixo estrés é activado para inducir a expresión de xenes de choque térmico.[88] Esta activación implica unha alteración conformacional de HSR-1 en resposta ao aumento de temperaturas, permitindo a súa interacción co activador transcricional HSF-1, que trimeriza e induce a expresión de xenes de choque térmico.[88] En senso amplo, estes exemplos ilustran un circuíto regulatorio incrustado nos ARNnc, no que os ARNs Alu ou B2 reprimen a expresión xénica xeral, mentres que outros ARNnc activan a expresión de xenes específicos.
Moitos dos ARNnc que interaccionan cos factores de transcrición xerais ou a propia RNAP II (incluíndo os ARNs 7SK, Alu e B1 e B2) transcríbeos a RNAP III,[89] desacoplando as súas expresións da RNAP II, á cal regulan. A RNAP III tamén transcribe outros ARNnc, como BC2, BC200 e algúns microARNs e ARNs nucleolares pequenos, ademais de xenes de ARNnc de mantemento (housekeeping) como os de ARNt, ARNr 5S e ARNs pequenos nucleares.[89] A existencia dun transcritoma de ARNnc dependente da RNAP III que regula a súa contraparte dependente de RNAP II está apoiada polo descubimento dun conxunto de ARNnc transcritos pola RNAP III con homoloxia de secuencias con xenes codificantes de proteinas. Isto levou aos autores a propoñer unha rede regulatoria funcional 'coxene/xene',[90] mostrando que un destes ARNnc, o 21A, regula a expresión do seu xene compañeiro antisentido, o CENP-F en trans.
Ademais de regularen a transcrición, os ARNnc tamén controlan varios aspectos do procesamento do ARNm postranscricional. Igual que os ARNs regulatorios pequenos como os microARNs e os ARNs nucleolares pequenos, estas funcións a miúdo implican o apareamento de bases complementarias co ARNm diana. A formación de dúplex de ARN entre o ARNnc complementario e o ARNm pode enmascarar elementos clave dentro do ARNm necesarios para unirse a factores que actúan en trans, afectando potencialmente calquera paso da expresión xénica portranscricional, incluíndo o empalme, o transporte, a tradución e a degradación.[91]
O empalme ou splicing do ARNm pode inducir a súa tradución e diversificar funcionalmente o repertorio de proteínas que codifica. O ARNm Zeb2 necesita a retención dun intrón 5'UTR que contén un sitio de entrada ao ribosoma interno para unha tradución eficiente.[92] A retención de intróns depende da expresión dun transcrito antisetido que complementa o sitio de empalme 5' intrónico.[92] Por tanto, a expresión ectópica do transcrito antisentido reprime o empalme e induce a tradución do ARNm Zeb2 durante o desenvolvemento mesenquimático. Igualmente, a expresión dun transcrito Rev-ErbAa2 antisentido solapante controla o empalme alternativo do ARNm ErbAa2 do receptor de hormona tiroide para formar dúas isoformas antagonistas.[93]
O ARNnc pode tamén aplicar presións regulatorias adicionais durane a tradución, unha propiedade especialmente aproveitada nas neuronas, onde a tradución dendrítica ou axonal do ARNm en resposta á actividade sináptica contribúe a cambios na plasticidade sináptica e a remodelación de redes neuronais. Os ARNnc BC1 e BC200 transcritos pola RNAP III, que previamente derivaron de ARNt, exprésanse no rato e no sistema nervioso central humano, respectivamente.[94][95] A expresión do BC1 indúcese en resposta á actividade sináptica e á sinaptoxénese e é específico para as dendritas das neuronas.[96] A complementariedade de secuencias entre o BC1 e as rexións de varios ARNm específicos das neuronas tamén suxiren un papel para o BC1 na represión traducional afectada.[97] Demostrouse recentemente que BC1 está asociado coa represión traducional nas dendritas para controlar a eficiencia da transmisión nerviosa mediada polo receptor da dopamina D22 no corpo estriado[98] e os ratos con deleción do ARN BC1 mostran cambios de comportamento cunha redución do comportamento exploratorio e un incremento da ansiedade.[99]
Ademais de enmascarar elementos clave dentro do ARN monocatenario, a formación de dúplex de ARN bicatenario pode tamén proporcionar un substrato para a xeración de ARN interferente pequeno endóxeno (endo-siRNA) en Drosophila e ovocitos de rato.[100] O emparellamento ou annealing de secuencias complementarias, como rexións antisentido ou repetitivas entre transcritos, forma un ARN dúplex que pode ser procesado por Dicer-2 en ARNs interferentes pequenos endóxenos. Ademais, os ARNnc longos que forman forquitas intramoleculares estendidas poden ser procesados en ARNs interferentes pequenos, ilustrados convincentemente polos transcritos esi-1 e esi-2.[101] Os ARNs interferentes pequenos endóxenos xerados a partir destes transcritos parecen especialmente útiles para suprimiren o espallamento de elementos transposóns móbiles no xenoma e na liña xerminal. Porén, a xeración de ARNs interferente pequenos endóxenos a partir de transcritos antisentido ou pseudoxenes poden tamén silenciar a expresión das súas contrapartes funcionais por medio de complexos efectores RISC, actuando como un importante nodo que integra varios modos de regulación de ARNs longos e curtos, como se exemplifica por Xist e Tsix (véxase máis arriba).[102]
As modificacións epixenéticas, incluíndo a metilación de histonas e de ADN, acetilación de histonas e sumoilación, afectan moitos aspectos da bioloxía dos cromosomas, como principalmente a regulación de gran número de xenes ao remodelaren amplos dominios da cromatina.[103][104] Aínda que se sabe desde hai tempo que o ARN é un compoñente integrante da cromatina,[105][106] só recentemente se empezou a apreciar a maneira na cal o ARN está implicado nas vías de modificación da cromatina.[107][108][109] Por exemplo, Oplr16 induce epixeneticamente a activación de factores centrais de células nais ao coordinar os bucles intracromosómicos e o recrutamento da ADN desmetilase TET2.[110]
En Drosophila, os ARNnc longos inducen a expresión do xene homeótico Ubx, recrutando e dirixindo as funcións modificantes da cromatina da proteína tritórax Ash1 a elementos regulatorios Hox.[109] Propuxéronse modelos similares en mamíferos, nos que se pensa que subxacen fortes mecanismos epixenéticos nos perfís de expresión embrional dos xenes Hox que persisten durante o desenvolvemento humano.[111][108] Os xenes Hox humanos están asociados con centos de ARNnc que se expresan secuencialmente ao longo dos eixes espacial e temporal do desenvolvemento humano e definen os dominios da cromatina de metilación de histonas diferencial e a accesibilidade á ARN polimerase.[108] Un ARNnc denominado HOTAIR, que se orixina a partir do locus HOXC reprime a transcrición ao longo de 40 kb do locus HOXD alterando o estado de trimetilación da cromatina. Pénsase que HOTAIR consegue facer iso dirixindo a acción dos complexos de remodelación da cromatina Polycomb en trans para gobernar o estado epixenético da célula e a subseguinte expresión xénica. Compoñentes do complexo Polycomb, como Suz12, EZH2 ed EED, conteñen dominios de unión ao ARN que potencialmente poden unirse a HOTAIR e probablemente a outros ARNnc similares.[112][113][114] Este exemplo ilustra ben un tema máis amplo no que os ARNnc recrutan a función dun conxunto xenérico de proteínas modificadoras da cromatina en loci xenómicos específicos, subliñando a complexidade dos mapas xenomicos publicados recentemente.[104] De feito, a prevalencia dos ARNnc longos asociados con xenes codificantes de proteínas pode contribuír a padróns localizados de modificacións da cromatina que regulan a expresión xénica durante o desenvolvemento. Por exemplo, a maioría dos xenes codificantes de proteínas teñen compañeiros antisentido, incluíndo moitos xenes supresores de tumores que son frecuentemente silenciados por mecanismos epixenéticos no cancro.[115] Un estudo recente observou un perfil de expresión inversa do xene p15 e un ARNnc antisentido na leucemia.[115] Unha análise detallada mostrou que o ARNnc antisentido de p15 (CDKN2BAS) podía inducir cambios na heterocromatina e no status de metilación do ADN de p15 por medio dun mecanismo descoñecido, regulando así a expresión de p15.[115] Por tanto, a expresión incorrecta dos ARNnc antisentido asociados pode seguidamente silenciar o xene supresor de tumores contribuíndo ao cancro.
Moitos temas emerxentes relacionacdos coa modificación da cromatina dirixida por ARNnc foron primeiro aparentes estudando o fenómeno da impronta xenómica, na cal só se expresa un alelo dun xene que pode estar no cromosoma de orixe materna ou no de orixe paterna. En xeral, os xenes con impronta están agrupados nos cromosomas, o que suxire que o mecanismo da impronta actúa sobre dominios cromosómicos locais en lugar de sobre xenes individuais. Estes agrupamentos a miúdo están tamén asociados con ARNnc longos cuxa expresión está correlacionada coa represión do xene codificante de proteínas ligado no mesmo alelo.[116] Análises detalladas revelaron un papel crucial para os ARNnc Kcnqot1 e Igf2r/Air en dirixir a impronta.[117]
Case todos os xenes no loci Kcnq1 son de herdanza materna, excepto o ARNnc antisentido de expresión paterna Kcnqot1.[118] Os ratos transxénicos co Kcnq1ot truncado non poden silenciar xenes adxacentes, o que indica que Kcnqot1 é crucial para a impronta de xenes no cromosoma paterno.[119] Parece que Kcnqot1 pode dirixir a trimetilación na histona H3 das lisinas 9 (H3K9me3) e 27 (H3K27me3) nun centro de impronta que se solapa co promotor de Kcnqot1 e reside en realidade dentro dun exón sentido de Kcnq1.[120] De xeito similar a HOTAIR (véxase máis arriba), os complexos Polycomb Eed-Ezh2 recrútanse no loci Kcnq1 do cromosoma paterno, posiblemente por Kcnqot1, onde poden funcionar como mediadores no silenciameno de xenes por medio de metilación de histonas represiva.[120] Un centro de impronta metilado diferencialmente tamén se solapa co promotor dun longo ARNnc Air antisentido que é responsable do silenciamento de xenes veciños no locus Igf2r do cromosoma paterno.[121][122] A presenza de metilación de histonas específica de alelos no locus Igf2r suxire que Air tamén é mediador no silenciamento por modificación da cromatina.[123]
A inactivación dun cromosoma X nas femias dos mamíferos placentarios é dirixido por un dos primeiros e ben caracterizados ARNnc longos, Xist.[124] A expresión de Xist no futuro cromosoma X inactivo e o recubrimento que seguidamente realiza do cromosoma X inactivo, ocorre durante a diferenciación temperán das células nais embrionarias. A expresión de Xist é seguida por capas irreversibles de modificacións da cromatina entre as que están a perda da acetilación de histonas (H3K9) e a metilación H3K4 que están asociadas coa cromatina activa, e a indución de modificacións represivas na cromatina, incluíndo a hipoacetilación H4, trimetilación H3K27,[124] hipermetilación H3K9 e monometilación H4K20, así como monoubiquitilación H2AK119. Estas modificacións coinciden co silenciamento transcricional de xenes ligados ao X.[125] O ARN Xist tamén localiza a variante de histona macroH2A no cromosoma X inactivo.[126] Hai ARnnc adicionais que están tamén presentes no loci Xist, incluíndo o transcrito antisentido Tsix, que se expresa do futuro cromosoma X activo e pode reprimir a expresión de Xist pola xeración de ARNs interferentes pequenos endóxenos.[102] Xuntos, estes ARNnc garanten que só un dos cromosomas X estará activo nas femias de mamíferos.
Os telómeros constitúen a rexión terminal dos cromosomas de mamíferos e son esenciais para a estabilidade e envellecemento e exercen un papel central en doenzas como o cancro.[127] Os telómeros foron considerados desde hai moito tempo complexos ADN-proteína inertes transcricionalmente ata que se observou a finais da década de 2000 que as repeticións teloméricas poden ser transcritas como ARNs teloméricos (ARNTel ou TelRNA)[128] ou ARN que contén repeticións teloméricas.[129] Estes ARNnc son heteroxéneos en lonxitude, transcritos de varios loci subteloméricos e localízanse fisicamente nos telómeros. A súa asociación coa cromatina, que suxire unha implicación na regulación de modificacións da heterocromatina específica do telómero, é reprimida por proteínas SMG que protexen os extremos do cromosoma da perda do telómero.[129] Ademais, os ARNs teloméricos bloquean a actividade da telomerase in vitro e poden, por tanto, regular a actividade da telomerase.[128] Aínda sendo estudos iniciais, estes descubrimentos sinalan unha implicación dos ARNnc teloméricos en varios aspectos da bioloxía do telómero.
Os ARNs autosómicos que se replican asincronicamente (ASARs) son ARNnc moi longos (~200kb) que non sufriron empalme, non están poliadenilados e son necesarios para unha temporalización da replicación do ADN normal e estabilidade cromosómica.[130][131][132] A deleción de calquera dos loci que conteñen ASAR6, ASAR15 ou ASAR6-141 ten como resultado o mesmo fenotipo de retardo no tempo da replicación e da condensación mitótica do cromosoma completo. O retardo do tempo da replicación e o retardo na condensación mitótica dan lugar a erros na segregación cromosómica que levan a un incremento da frecuencia de rearranxos secundarios e a un cromosoma inestable. Igual que Xist, ASARs mostra expresión monoalélica aleatoria e existe en dominios de replicación de ADN asíncrona. Aínda que os mecanismos polos que funciona ASAR aínda se están a investigar, hipotetízase que operan por mecanismos similares aos do ARNnc longo de Xist, pero en dominios autosómicos máis pequenos, o que ten como resultado cambios alélicos específicos na expresión xénica.
A reparación incorrecta de roturas de dobre febra no ADN que ocasionan rearranxos cromosómicos é unha das causas primarias de oncoxénese. Varios ARNnc longos son esenciais en diferentes estadios das principais vías da reparación de roturas de dobre febra en células eucariotas: a reparación por unión de extremos non homólogos (NHEJ) e a reparación dirixida por homoloxía (HDR). As mutacións xénicas ou variacións nos niveis de expresión de ditos ARNs poden causar defectos na reparación do ADN local, incrementando a frecuencia de aberracións cromosómicas. Ademais, demostrouse que algúns ARNs poden estimular rearranxos cromosómicos de longo rango.[133]
O descubrimento de que os ARNnc longos funcionan en varios aspectos da bioloxía celular levou aos investigadores a estudar o seu papel en enfermidades. Decenas de miles de ARNnc longos están potencialmente asociados con enfermidades baseándose en evidencias multiómicas.[18] Algúns estudos implicaron os ARNnc longos en diversos estados de enfermidades e apoian a súa intervención e cooperación en enfermidades neurolóxicas e no cancro.
O primeiro informe publicado dunha alteración na abundancia de ARNnc longos no envellecemento e enfermidades neurolóxicas humanas fixérono Lukiw et al.[134] nun estudo no que usaron tecidos con curto intervalo post-mortem de pacientes de enfermidade de Alzheimer e demencia non-Alzheimer ; este traballo inicial estaba baseado na previa identificación dun transcrito citoplasmático específico de cerebro de primate da familia de repeticións Alu feita por Watson e Sutcliffe en 1987 coñecido como BC200 (do inglés brain, cytoplasmic, 200 nucleotide).[135]
Aínda que moitos estudos de asociación identificaron a expresión pouco usual de ARNnc longos en estados de enfermidades, compréndese pouco o seu papel na causa das enfermidades. As análises de expresión que comparan as células tumorais e as células normais revelaron cambios na expresión de ARNnc en varias formas de cancro. Por exemplo, en tumores de próstata, PCGEM1 (un de dous ARNnc sobreexpresados) está correlacionado cun aumento da proliferación e formación de colonias, o que suxire unha implicación na regulación do crecemento.[136] Atopouse que PRNCR1 promove o crecemento tumoral en varios tumores malignos como os cancros de próstata, de mama, de células pulmonares non pequenas, de célula escamosa oral e colorrectal.[137] MALAT1 (tamén coñecido como NEAT2) identificouse orixinalmente como un ARNnc expresado abundantemente que é regulado á alza durante a metástase do estadio inicial do carcinoma de células pulmonares non pequenas e a súa sobreexpresión é un marcador de prognóstico temperán de malas taxas de supervivencia dos pacientes.[136] Os ARNnc longos como HEAT2 ou KCNQ1OT1 están regulados no sangue de pacientes de enfermidades cardiovasculares como a insuficiencia cardíaca ou a enfermidade da arteria coronaria e, ademais, serven para predicir episodios de enfermidades cardiovasculares.[138][139] Máis recentemente, atopouse que o homólogo moi conservado de rato de MALAT1 era moi expresado no carcinoma hepatocelular.[140] Tamén se informou de ARNnc antisentido intrónicos cuxa expresión estaba correlacionada a certo grao de diferenciación de tumores en mostras de cancro de próstata.[141] Malia que certo número de ARNnc longos teñen unha expresión aberrante no cancro, as súas funcións e potenciais papeis na tumouroxénese son relativamente descoñecidas. Por exemplo, os ARNnc HIS-1 e BIC foron implicados no desenvolvemento do cancro e control do seu crecemento, pero as súas funcións nas células normais non se coñece.[142][143] Ademais de no cancro, os ARNnc tamén mostran unha expresión aberrante noutros estados de enfermidades. A sobreexpresión de PRINS está asociada coa susceptibilidade á psoríase, e a súa expresión está elevada na epiderme non afectada de pacientes psoriáticos comparada tanto con lesións psoriáticas coma con epiderme de persoas sas.[144]
Os perfís de xenoma completo revelaron que moitas rexións ultraconservadas non codificantes transcritas mostran distintos perfís en varios estados de cancro humanos.[63] Unha análise de leucemia linfocítica crónica, cancro colorrectal e carcinoma hepatocelular atopou que os tres cancros presentaban perfís de expresión anormais de ARNnc ultraconservados en relación coas células normais. Posteriores análises dun ARNnc ultraconservado suxeriron que se comportaba como un oncoxene ao mitigar a apoptose e seguidamente expandir o número de células malignas en cancros colorrectais.[63] Moitos destes sitios ultraconservados transcritos que mostran sinaturas especiais no cancro encóntranase en sitios fráxiles e rexións xenómicas asociadas co cancro. Parece probable que a expresión anormal destes ARNnc ultraconservados en procesos malignos sexa o resultado das importantes funcións que exercen no desenvolvemento humano normal.
Recentemente, varios estudos de asociación que examinaban polimorfismos dun único nucleótido (SNPs) asociados con estados de enfermidades foron mapados en ARNnc longos. Por exemplo, os SNPs que identificaban un locus de susceptibilidade para o infarto de miocardio mapado nun ARNnc longo, o do xene MIAT (do inglés myocardial infarction associated transcript ou transcrito asociado ao infarto de miocardio).[145] Igualmente, estudos de asociación de xenoma completo identificaron unha rexión asociada coa enfermidade da arteria coronaria[146] que comprendía un ARNnc longo chamado ANRIL.[147] ANRIL exprésase en tecidos e tipos celulares afectados pola aterosclerose[148][149] e a súa expresión alterada está asociada cun haplotipo de alto risco para a enfermidade da arteria coronaria.[149][150]
A complexidade do transcritoma e a evolución da nosa comprensión da súa estrutura poden servir para unha reinterpretación das bases funcionais de moitos polimorfismos naturais asociados con estados de enfermidades. Moitos SNPs asociados a certas doenzas encóntranse dentro de rexións non codificantes e as complexas redes de transcrición non codificante dentro destas rexións fan especialmente difícil dilucidar os efectos funcionais dos polimorfismos. Por exemplo, un SNP tanto dentro da forma truncada de ZFAT coma do promotor dun transcrito antisentido incrementan a expresión de ZFAT non ao incrementar a estabilidade do ARNm, senón ao reprimir a expresión do transcrito antisentido.[151]
A capacidade dos ARNnc longos de regularen xenes codificantes de proteínas asociados pode contribuír a enfermidades se a expresión incorrecta dun ARNnc longo desregula un xene codificante de proteínas con importancia clínica. De maneira similar, un ARNnc longo antisentido que regula a expresión do xene BACE1 sentido, que codifica un encima crucial na etioloxía da enfermidade de Alzheimer, mostra unha elevada expresión en varias rexións do cerebro en individuos con enfermidade de Alzheimer.[152] A alteración da expresión dos ARNnc pode tamén mediar nos cambios a nivel epixenético para afectar á expresión xénica e contribuír á etioloxía da enfermidade. Por exemplo, observouse nun paciente que a indución dun transcrito antisentido por unha mutación xenética conduciu a unha metilación do ADN e silenciamento de xenes sentido, causando β-talasemia.[153]
Xunto aos seus papeis na mediación de procesos patolóxicos, os ARNnc longos xogan un papel na resposta inmune á vacinación, como os identificados para as vacinas da gripe e a da febre amarela.[154]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.