Loading AI tools
Из Википедии, свободной энциклопедии
5′-Нетранслируемая область (5′-НТО, произносится как пять-штрих-нетранслируемая область, англ. 5′-untranslated region, 5′-UTR), или лидерная последовательность[1] — некодирующий участок мРНК, располагающийся сразу после кэпа, но перед кодирующей областью. Такое же название имеет участок ДНК, соответствующий 5′-НТО транскрипта[2]. В 5′-НТО располагаются различные элементы, принимающие участие в регуляции эффективности трансляции[3].
Общая длина 5′-НТО, чаще всего, приблизительно одинакова для всех таксономических групп эукариот и составляет около 100 - 200 нуклеотидов, но может достигать и нескольких тысяч[4][5]. Так, у дрожжей Schizosaccharomyces pombe длина 5′-НТО в транскрипте ste11 составляет 2273 нуклеотида[6][7]. Средняя длина 5′-НТО у человека — около 210 нуклеотидов (в то же время средняя длина 3′-НТО — 800 нуклеотидов[8]). Наиболее длинная известная человеческая 5′-НТО — у онкогена Tre, её длина составляет 2858 нуклеотида, а длина наиболее короткой человеческой 5′-НТО составляет 18 нуклеотидов[1].
Состав оснований также различается в 3′- и 5′-НТО. Так, в 5′-НТО выше содержание G+C, чем в 3′-НТО. Особенно это различие заметно в мРНК теплокровных позвоночных, у которых содержание G+C в 5′-НТО составляет 60 %, а в 3′-НТО — 45 %[9].
Внутри участков ДНК, соответствующих 5′-НТО транскрипта, имеются интроны, как и в участках ДНК, соответствующих кодирующей области мРНК. Около 30 % генов Metazoa имеют участки, соответствующие 5′-НТО, состоящие только из экзонов[4]. У человека же около 35 % генов имеют интроны в 5′-НТО. Интроны в 5′-НТО отличаются от таковых в кодирующей области и в 3′-НТО по нуклеотидному составу, длине и плотности[10]. Известно, что отношение общей длины интронов к длине экзонов в 5′-НТО меньше, чем в кодирующей области, однако плотность интронов в 5′-НТО выше (по другим данным, наоборот, ниже[11]), при этом интроны в 5′-НТО приблизительно в два раза длиннее интронов в кодирующей области. В 3′-НТО интроны встречаются значительно реже, чем в 5′-НТО[12].
Эволюция и функции интронов в 5′-НТО остаются в значительной мере неизученными. Тем не менее, установлено, что у активно экспрессируемых генов чаще всего бывают короткие интроны в 5′-НТО, чем длинные или они отсутствуют вовсе. Хотя связи между длиной и количеством интронов и тканью к настоящему моменту не установлено, обнаружена некоторая корреляция между числом интронов в генах и их функциями. Так, особенно много интронов было выявлено в генах, выполняющих регуляторные функции[10]. Вообще, наличие хотя бы одного интрона в 5′-НТО усиливает экспрессию гена, усиливая транскрипцию (в данном случае идёт речь об участке ДНК, соответствующем 5′-НТО транскрипта) или стабилизируя зрелую мРНК. Например, экспрессия гена убиквитина С (UbC) зависит от наличия интрона в 5′-НТО. При утрате интрона активность промотора резко падает, и дальнейшие исследования показали, что в области 5′-НТО ДНК связываются транскрипционные факторы Sp1 и Sp3[11].
Структурный и нуклеотидный состав 5′-НТО имеет важное значение для регуляции экспрессии генов; более того, были показаны различия в структуре 5′-НТО мРНК генов «домашнего хозяйства» и генов, задействованных в регуляции онтогенеза. 5′-НТО генов, экспрессия которых сопровождается образованием большого количества белка, как правило, имеют небольшую длину, для них характерно низкое содержание G+C, отсутствие выраженных элементов вторичной структуры и внутренних кодонов AUG (старт-кодонов), расположенных до основного старт-кодона. Напротив, 5′-НТО генов, дающих начало небольшому количеству белка, имеют большую длину, более высокое содержание GC и обладают большим числом характерных элементов вторичной структуры. Высокоструктурированные 5′-НТО нередко присущи мРНК генов, участвующих в регуляции развития; более того, эти образование этих мРНК часто характеризуется тканевой и возрастной специфичностью[13].
Установлено, что в 5′-НТО, оказывающих подавляющее действие на трансляцию, имеются компактные структуры вокруг старт-кодона. Хотя конкретные механизмы такой репрессии неизвестны, считается, что нуклеотидные и структурные особенности 5′-НТО обусловливают связывание с ней различных белковых факторов, активирующих или подавляющих трансляцию[13].
Важными и хорошо изученными элементами вторичной структуры 5′-НТО являются G-квадруплексы. Они образуются тогда, когда последовательности, обогащённые гуанином, сворачиваются в чрезвычайно стабильную неканоническую структуру из четырёх цепей; такие структуры оказывают строго подавляющее действие на трансляцию. Биоинформатический анализ позволил установить, что G-квадруплексы нередко высококонсервативны и имеются в приблизительно 3000 мРНК человека[14]. Примерами таких мРНК человека могут служить мРНК рецептора эстрогена[15], внеклеточной металлопротеиназы[англ.][16], NRAS-протоонкогена[14]. Помимо 5′-НТО, G-квадруплексы обнаружены в промоторах, теломерах и 3′-НТО. Особенно много G-квадруплексов в мРНК белков, участвующих в регуляции трансляции и онтогенеза. Подавляющее действие G-квадруплексов на трансляцию той мРНК, на которой они находятся, может быть обусловлено как их вторичной структурой самой по себе, так и их взаимодействием с белками и другими факторами[17].
Сканирующая модель инициации трансляции предполагает, что малая субъединица рибосомы движется по мРНК («сканирует») в направлении от 5′- к 3′-концу в поисках подходящего старт-кодона AUG и с него начинает трансляцию. При этом также считалось, что наличие стабильных элементов вторичной структуры (например, шпилек) в 5′-НТО оказывает подавляющее действие на трансляцию, поскольку через них рибосома пройти неспособна. Однако недавние исследования показали, что так происходит далеко не всегда. Трансляция мРНК с длинной, высокоструктурированной 5′-НТО может идти не хуже, чем мРНК с короткой и неструктурированной 5′-НТО. Объясняется это тем, что подавляющий эффект самой по себе вторичной структуры часто не выражен, поскольку он определяется прежде всего взаимодействующими с ней белками. Господствовавшая ранее вышеописанная ошибочная точка зрения появилась из-за того, что ранее исследователи использовали систему лизата ретикулоцитов кролика (англ. rabbit reticulocyte lysate (RRL)), и эта система имела ряд недостатков и не соответствовала условиям in vivo[18].
Существует несколько механизмов образования альтернативных 5′-НТО при одной и той же кодирующей последовательности:
Наличие различных 5′-НТО в мРНК одного и того же гена даёт дополнительные возможности для регуляции его экспрессии, поскольку даже небольшие различия во вторичной структуре 5′-НТО могут коренным образом повлиять на регуляцию трансляции. Анализ транскриптомов млекопитающих показал, что экспрессия альтернативных 5′-НТО есть распространённый феномен и потенциально большая часть генов может использовать такой механизм регуляции. Белковые продукты генов, постоянно использующих альтернативные 5′-НТО, обычно задействованы в таких процессах, как транскрипция и сигнальные пути. Например, ген рецептора эстрогена β (ERβ) имеет 3 мРНК с альтернативными 5′-НТО, дающими начало изоформам одного и того же белка, и зачастую сбои в их активности наблюдаются при раковых заболеваниях[19].
Внутри 5′-НТО локализуются важные функциональные элементы, участвующие в инициации трансляции и контроле экспрессии генов. Об этом свидетельствует, во-первых, то, что скорость трансляции не зависит от длины и структуры 5′-НТО как в кэпированных, так и некэпированных мРНК, а также то, что некоторые гены способны экспрессироваться в условиях стресса[20]. К важнейшим из таких функциональных элементов относят участки внутренней посадки рибосомы (IRES), внутренние открытые рамки считывания uORFs, железозависимый элемент (IRE) и др.
Участок внутренней посадки рибосомы (англ. internal ribosome entry site, IRES) — это регуляторный мотив мРНК, осуществляющий кэп-независимый механизм инициации трансляции, при котором посадка рибосомы происходит внутри 5′-НТО, но рядом с сайтом начала трансляции. Механизм IRES используется как кэпированными, так и некэпированными мРНК в условиях, когда кэп-зависимая инициация трансляции подавлена по причине стресса, в определённой стадии клеточного цикла и при апоптозе, обеспечивая продолжительную экспрессию необходимых белков. Ряд генов, использующих IRES, например, гены c-Myc, APAF1, Bcl-2, при нормальных условиях экспрессируются мало и активируются за счёт IRES в условиях стресса. Предполагается, что IRES может также принимать участие в поддержании в нормальных условиях низкого уровня экспрессии ряда белков, забирая на себя рибосомы и не давая им начать трансляцию с основного сайта инициации. Механизм внутренней инициации трансляции пока плохо понятен, хотя точно известно, что эффективность IRES в значительной мере находится под влиянием транс'′-регуляторных белковых факторов, что даёт возможность для клеточно-специфического использования IRES в трансляции[20].
Структура эукариотических IRES очень различна, и на данный момент не было установлено никаких характерных для них консервативных мотивов. Для некоторых генов для работы IRES необходимы специфичные стабильные элементы вторичной структуры мРНК, у других генов, напротив, они оказывают подавляющее действие на трансляцию. Было высказано предположение, что IRES не являются статичными структурами и подвергаются перемещениям, значительно изменяя свою активность. Элементы IRES могут также давать начало различным изоформам белков, что даёт дополнительные возможности получения различных белковых продуктов с одного и того же гена[21].
Короткие открытые рамки считывания (англ. upstream open reading frames, uORF) располагаются в 5′-НТО и характеризуются тем, что их внутрирамковый стоп-кодон располагается после внутреннего старт-кодона (англ. upstream AUG, uAUG), но перед основным старт-кодоном, который находится уже в транслируемой (кодирующей) области. uORF обнаружены в приблизительно 50 % 5′-НТО человеческих мРНК, и их наличие обусловливает снижение экспрессии генов, уменьшая количество функциональной мРНК на 30 %, а образование белка — на 30—80 %. Рибосомы, связывающиеся с uAUG, начинают трансляцию uORF, что может отрицательно сказаться на эффективности трансляции основной рамки считывания (то есть кодирующей области). Если не происходит эффективного связывания рибосомы со старт-кодоном в кодирующей области (то есть инициации трансляции), то в результате снижается образование белка, а значит, и уровень экспрессии соответствующего гена. Может произойти и обратная ситуация: трансляция uORF продолжится в трансляцию кодирующей области, и в итоге образуется слишком длинный белок, который может быть вредоносным для организма. Снижение эффективности трансляции из-за наличия uORF в 5′-НТО является хорошо изученным эффектом; одним из примеров, иллюстрирующих его, может служить ген поли(А)-полимеразы α[англ.] (англ. poly(A)-polymerase α, PAPOLA), чья мРНК содержит две высококонсервативные uORF в 5′-НТО. Мутация проксимального uAUG вызывает повышение эффективности трансляции этой мРНК, что свидетельствует о том, что uORF значительно снижает экспрессию этого гена. Другим примером является рецептор тироидного гормона, оказывающий активирующее или репрессирующее действие на транскрипцию ряда генов-мишеней; сильная репрессия его трансляции осуществляется uORF длиной 15 нуклеотидов внутри 5′-НТО его мРНК[22].
Широко распространена точка зрения, что uORF снижают эффективность трансляции, поскольку после терминации трансляции uORF рибосома не может вновь начать трансляцию и транслировать кодирующую область (англ. coding sequence, CDS). Тем не менее, недавние исследования более чем 500 локусов генов, содержащих 5′-НТО, показали, что не существует никакой определённой связи между влиянием uORF на экспрессию нижележащего гена и расстоянием между uORF и кодирующей последовательностью. При этом авторы исследования предполагают, что в генах, содержащих единственную uORF, вероятнее всего, трансляция CDS осуществляется после сканирования uORF рибосомой без её диссоциации, а не через реинициацию трансляции. Это предположение сильно отличается от выводов Козак (1987) и вообще всех представлений о uORF. Более того, эксперименты с клетками, лишёнными Rent1 (фактора, участвующего в процессе направленного разрушения дефектных мРНК — англ. nonsense-mediated decay, NMD), показали, что в отсутствие NMD успешно шла трансляция транскриптов, содержащих uORF. Это показывает, что NMD также играет важную роль в регуляции функционирования этих транскриптов. Вероятнее всего, существует несколько вариантов развития событий после взаимодействия uORF и рибосомы: продолжение трансляции, продолжение сканирования или реинициация трансляции кодирующей области, причём то, какой из них произойдёт, зависит от ряда факторов[22].
Установлено, что, помимо AUG, в качестве сайта начала трансляции могут использоваться также кодоны, отличающиеся от AUG одним нуклеотидом, и эффективность инициации в каждом случае будет определяться окружением нестандартного старт-кодона[23].
Хотя большая часть uORF отрицательно влияет на экспрессию генов, существуют случаи, когда наличие uORF усиливает трансляцию. Примером может служить бицистронная мРНК vpu-env вируса ВИЧ-1, содержащая консервативную очень маленькую uORF. Эта uORF располагается лишь за 5 нуклеотидов до AUG vpu и вскоре заканчивается стоп-кодоном, перекрывающимся с AUG vpu. Было установлено, что эта uORF оказывает значительный положительный эффект на трансляцию env и при этом не мешает трансляции vpu. Были получены мутанты, у которых расстояние между uORF и основным AUG было увеличено на 5 нуклеотидов, и было показано, что uORF не задействована в инициации vpu. На основании этого авторами исследования было высказано предположение, что эта маленькая uORF может служить местом задержки рибосомы, в ходе которой рибосома взаимодействует с РНК-структурами, способствующими её продвижению, то есть физически преодолевает часть 5′-НТО, чтобы достичь основного инициаторного кодона[24].
Помимо вышеперечисленных, известны также следующие механизмы действия uORF:
Значение uORF как регуляторных элементов, участвующих в регуляции связывания рибосомы и трансляции, хорошо изучено, однако функция и даже судьба кодируемых uORF пептидов часто неизвестна, возможно, по причине сложностей в анализе уровня экспрессии и локализации пептидов[26].
В 5′-НТО мРНК белков, связанных с метаболизмом железа, часто имеется особый регуляторный элемент — железозависимый элемент. Он имеется в 5′-НТО мРНК таких белков, как ферритин, трансферриновый рецептор[англ.], эритроидная аминолевулинатсинтаза[англ.], митохондриальная аконитаза, ферропортин[англ.], переносчик двухвалентных металлов[англ.] (англ. divalent metal transporter 1 (DMT1))[27] (впрочем, он встречается и в мРНК белков, не связанных с метаболизмом железа, например, в мРНК белкового продукта гена CDC42BPA — киназы, участвующей в реорганизации цитоскелета[28]). IRE представляет собой шпильку, взаимодействующую с особыми регуляторными белками[англ.] — IRP1 и IRP2 (англ. iron-regulatory proteins). Когда концентрация железа мала, с IRE связываются IRP1 и IRP2, создавая преграды для рибосомы и делая трансляцию мРНК-мишени невозможной[29]. При высокой концентрации железа между этими белками и шпилькой нет жёсткого связывания, и идёт трансляция белков, задействованных в метаболизме железа. Кроме того, установлено, что трансляция белка-предшественника бета-амилоида также контролируется IRE, причём его IRE тоже способен связываться с IRP1 и IRP2, поэтому не исключено, что IRE может играть определённую роль в развитии болезни Альцгеймера[30].
В начала трансляции у эукариот на 5′-конце транскрипта в области кэпа собирается белковый комплекс eIF4F[англ.], причём две его субъединицы — eIF4E[англ.] и eIF4G[англ.] — присоединяются в области 5′-НТО, ограничивая тем самым скорость, с которой может происходить инициация трансляции[31]. Однако роль 5′-НТО в образовании преинициаторного комплекса этим не ограничивается. В некоторых случаях с 5′-НТО связываются белки, препятствующие сборке инициаторного комплекса. В качестве примера можно рассмотреть регуляцию гена msl-2 (англ. male-specific lethal 2 — мужская специфическая леталь 2), участвующего в определении пола у дрозофилы. С интроном, локализованным в 5′-НТО первичного транскрипта msl-2, связывается белковый продукт гена SXL (англ. sex lethal — половая леталь), в результате чего этот интрон не удаляется в ходе сплайсинга[29]. Он способствует одновременному связыванию с 5′-НТО и 3′-НТО белков, не позволяющих собраться инициаторному комплексу. Впрочем, SXL может подавлять трансляцию мРНК, лишённых поли(А)-хвоста или вообще 3′-НТО[32]. В мРНК орнитиндекарбоксилазы[англ.], участвующей в метаболизме полиаминов[англ.], и мРНК c-myc в 5′-НТО имеются шпилечные структуры, стабилизируемые белком-репрессором, препятствующие посадке на них рибосомы и сборке инициаторного комплекса. Варьирования в количестве белков-репрессоров обусловливают различную степень стабилизации этих шпилек и, соответственно, доступность этих 5′-НТО для инициаторных белков и рибосомы может быть различной[33].
С 5′-НТО некоторых может связываться не только белок-репрессор, препятствующей сборке инициаторного комплекса и посадке рибосомы, но и белки-репрессоры, стабилизирующие различные структурные барьеры на пути сканирующего рибосомного комплекса. Например, трансляционная репрессия мРНК тимидилатсинтазы[англ.] человека осуществляется продуктом её трансляции — тимидилатсинтазы — по принципу отрицательной обратной связи; тимидилатсинтаза взаимодействует с 30-нуклеотидной шпилькой в 5′-НТО, стабилизируя её и препятствуя продвижению рибосомы[34].
Известно, что мРНК способна замыкаться в кольцо (циркуляризация) за счёт взаимодействия специальных белков, связывающихся с поли(А)-хвостом, способствующих связыванию фактора eIF4F с кэпом. В результате мРНК приобретает замкнутую форму, стимулируется инициация трансляции и повышается эффективность трансляции. Однако в некоторых случаях связываться друг с другом могут 5′-НТО и 3′-НТО одной и той же мРНК. Так, у мРНК человеческого гена p53 имеются участки в 5′-НТО и 3′-НТО, комплементарные друг другу. Связываясь друг с другом и с трансляционным фактором RPL26[англ.], они тем самым способствуют повышению эффективность трансляции белка р53 в ответ на повреждения ДНК[35].
Анализ мРНК различных генов человека показал, что в 5′-НТО присутствует мотив, специфически взаимодействующий с 3′-концами микроРНК, при этом во многих таких микроРНК на 5′-конце имеется сайт, комплементарный 3′-НТО. Дальнейшие исследования показали, что связывание 5′-НТО и 3′-НТО с одной и той же микроРНК облегчает связь 5′-конца мРНК с 3′-концом, подобно мостику, и мРНК, активность которых значительно определяется микроРНК, имеют предсказуемые сайты связывания на обеих НТО. Такие мРНК получили название miBridge. Далее было установлено, что утрата этих сайтов связывания уменьшала репрессию трансляции транскрипта, управляемую микроРНК. Так было выяснено, что сайты связывания НТО друг с другом необходимы для подавления трансляции мРНК. Это свидетельствует о том, что комплементарное взаимодействие 5′-НТО и 3′-НТО необходимо для точной регуляции экспрессии генов[36].
В мРНК бактерий также имеются 5′- и 3′-нетранслируемые области[38][39]. Длина 5′-НТО бактерий значительно меньше таковой у эукариот и составляет обычно 3—10 нуклеотидов. Например, длина 5′-НТО транскрипта лактозного оперона Escherichia coli составляет лишь 7 нуклеотидов[40]. В 5′-НТО бактерий локализована последовательность Шайна — Дальгарно (AGGAGG
)[41], служащая для связывания рибосомы и отделённая спейсером от старт-кодона AUG. Хотя 5′-НТО бактерий и эукариот различны, было показано, что добавление нуклеотидов СС в спейсер мРНК гена Ner бактериофага Mu, хорошо экспрессирующегося в клетках Escherichia coli и Streptomyces, привело к успешной экспрессии этого гена в клетках ретикулоцитов кролика[42].
Элементы вторичной структуры, локализованные в 5′-НТО, как правило, оказывают подавляющее действие на трансляцию[43]. В частности, именно в 5′-НТО обычно располагаются аттенюаторы[англ.] — элементы оперонов, вызывающие преждевременную терминацию трансляции[44] (наиболее известным примером аттенюации является работа триптофанового оперона).
Кроме того, в 5′-НТО бактерий располагается большая часть рибопереключателей[45] — регуляторных элементов мРНК, способных связываться с малыми молекулами, что приводит к изменению образования белка, кодируемого этой мРНК[46].
Нетранслируемые области имеются и в мРНК многих архей. В частности, в 5′- и 3′-НТО мРНК метаногенной археи Methanococcus jannaschii[англ.] (как и у других представителей порядков Methanopyrales и Methanococcales) локализован элемент SECIS, ответственный за вставку аминокислоты селеноцистеина в полипептидную цепь[47].
Установлено, что мРНК большинства галоархей, а также Pyrobaculum[англ.] и Sulfolobus[англ.] лишены выраженной 5′-НТО, но у мРНК архей-метаногенов имеются длинные 5′-НТО. В связи с этим предполагается, что механизм инициации трансляции метаногенных архей может быть отличен от такового у остальных представителей этого домена[43][48].
В 5′-НТО архей располагается TPP-рибопереключатель[англ.], связывающийся с тиаминпирофосфатом (TPP) (такие рибопереключатели имеются также у бактерий и эукариот)[49].
У многих вирусов инициация трансляции происходит по кэп-независимому механизму и осуществляется через уже упоминавшиеся элементы IRES, локализованные в 5′-НТО[50]. Например, так происходит у ВИЧ, вирусов гепатита A и С[51]. Такой механизм инициации трансляции удобен тем, что в его случае нет необходимости в сканировании длинного фрагмента 5′-НТО[40].
Мутации, затрагивающие 5′-НТО, нередко приводят к появлению различных заболеваний, поскольку они нарушают работу тонкой системы регуляции тех или иных генов. В представленной ниже схеме собраны сведения о мутациях, затрагивающих различные регуляторные элементы 5′-НТО, и развивающихся при этом заболеваниях[1] (следует уточнить, что синдром наследственной гиперферритинемии/катаракты развивается при мутации в IRE[1][52]).
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.