Remove ads
Из Википедии, свободной энциклопедии
Секвени́рование РНК (англ. RNA sequencing, RNA-seq) — метод определения первичной структуры молекул РНК, представляющий собой высокочувствительный и точный инструмент для изучения транскриптома. Под этим может подразумеваться как секвенирование мРНК, так и определение последовательности некодирующих РНК. Современное полногеномное секвенирование основано на прямом секвенировании фрагментов кДНК[1].
В отличие от другого широкомасштабного метода анализа транскриптома — экспрессионных микрочипов, РНК-секвенирование позволяет получать данные об аллель-специфичной экспрессии генов, сплайсинговых вариантах транскриптов, пост- и ко-трансляционном редактировании РНК, однонуклеотидных полиморфизмах, а также химерных генах. Кроме того, РНК-секвенирование позволяет получить абсолютную количественную информацию о представленности различных транскриптов в пробе, в отличие от относительных количественных данных микрочипов[2][3].
Совершенствование технологий секвенирования РНК наряду с развитием секвенирования РНК одиночных клеток (англ. single-cell RNA-seq) позволяет более детально изучать этиологию и патогенез различных заболеваний[4][5].
Технологическая платформа для быстрого широкомасштабного секвенирования была создана в 2005 году фирмами 454 Life Sciences[6] и Illumina (ранее Solexa)[7], и сначала использовалась для секвенирования геномов[англ.]. Первые работы по секвенированию транскриптомов появились в 2008 году. В числе первых были секвенированы транскриптом дрожжей[8], арабидопсиса[9] и мыши[10].
В настоящее время РНК-секвенирование осуществляется в основном с использованием трех инструментальных платформ широкомасштабного секвенирования: Illumina, 454 Life Sciences и SOLiD[11].
В 2019 году удалось секвенировать РНК из кожи, хрящей, печени и скелетных мышц щенка Тумата (волка или собаки) возрастом 14300 лет[12].
Большинство экспериментов по секвенированию РНК проводятся на оборудовании, которое предназначено для секвенирования молекул ДНК. В связи с этим необходимым шагом для секвенирования РНК является создание библиотеки кДНК, полученной из исследуемой тотальной РНК. Каждая кДНК из такой библиотеки представляет собой фрагмент ДНК разного размера, фланкированный по обоим краям специальными адаптерами[англ.]. Наличие адаптеров необходимо для последующей амплификации образцов и секвенирования. Методы создания библиотек кДНК[англ.] варьируются в зависимости от конечной цели исследования и типа изучаемой РНК (РНК может различаться в размере, последовательности, структурных особенностях а также в концентрации). Перед созданием библиотеки кДНК, подходящей для конкретного эксперимента, необходимо ответить на следующие вопросы: 1) какие именно молекулы РНК представляют интерес; 2) как получить кДНК желаемого размера; 3) каким способом лучше присоединить адаптерные последовательности к краям кДНК для амплификации и секвенирования[13].
Секвенирование полиаденилированной РНК находит широкое применение в секвенировании РНК. У эукариот большая часть белок-кодирующих РНК (мРНК) и длинных некодирующих РНК (РНК длиной более 200 пар оснований (п. о.)) содержат поли-(А)-хвосты. Наличие поли-(А)-хвоста делает технически простым обогащение препарата суммарной РНК поли-(А)-содержащими РНК (1—5 % от всей суммарной клеточной РНК). Отбор поли-А содержащих РНК можно производить с помощью магнитных или целлюлозных бусин, покрытых праймерами, содержащими олиго-dT-участки[13]. Веб-сайт «The Protocol Online»[14] предоставляет список нескольких протоколов, относящихся к выделению мРНК.
Неполиаденилированные РНК, такие как мРНК прокариот, фрагменты мРНК, полученные из препаратов, зафиксированных формалином, и транскрипты без поли-(А)-хвостов у эукариот, зачастую являются объектами исследований. Самая большая трудность в секвенировании таких РНК заключается в необходимости очистить суммарную РНК от рибосомной РНК (рРНК), которая превалирует в образце (например, в активно делящихся клетках млекопитающих количество рРНК от суммарной РНК может доходить до 80 %[15])[13]. Существует несколько способов элиминации рРНК:
После процедуры создания библиотеки поли-(А)-транскриптов либо процедуры удаления рРНК образцы РНК подвергаются фрагментации (обычно перед проведением обратной транскрипции все образцы РНК делаются одинакового размера). Отчасти это обусловлено ограниченными возможностями секвенирующих платформ. Так например, Illumina позволяет секвенировать образцы размером до 1500 п. о. В качестве альтернативы можно не фрагментировать РНК, а сначала сделать из неё кДНК, а затем уже полученную кДНК подвергнуть фрагментации[13].
В стандартных протоколах по созданию библиотек для секвенирования РНК перед амплификацией и секвенированием к кДНК желаемого размера лигируются ДНК-адаптеры. Несмотря на простоту, в данном подходе теряется информация о том, какая из цепей ДНК соответствует смысловой цепи РНК. Особенно это критично в исследованиях для поиска и идентификации антисмысловых и новых видов РНК. В связи с этим разработаны несколько методов, которые позволяют выявить направление цепи молекул РНК в соответствующей библиотеке кДНК[13].
Перед секвенированием кДНК её необходимо амплифицировать с помощью ПЦР. Непосредственно перед проведением ПЦР можно ввести молекулярные маркеры. Эта процедура особенно актуальна, если РНК в образце изначально немного, как, например, в случае секвенирования РНК одной клетки[13].
Секвенирование DGE (от англ. digital gene expression), или Tag-seq — это метод глубокого секвенирования, полученный из SAGE[англ.] (от англ. Serial Analysis of Gene Expression). Как и в SAGE, метод включает в себя присоединение мРНК за поли-А хвост к бусинам, покрытым олиго-dT-праймерами; синтез первой и второй цепи кДНК на бусинах; расщепление двуцепочечной кДНК часто щепящей эндонуклеазой рестрикции. Оставшийся 3'-конец, который присоединен к бусинам, лигируется со своим адаптером, находящимся на 5'-конце. В адаптере есть сайт узнавания для специфической эндонуклеазы рестрикции TE (от англ. tagging enzyme). TE расщепляет кДНК, в ходе чего образуется короткий тэг длинной 21 п. о., который затем лигируется со следующим адаптером, находящимся на 3'-конце. кДНК амплифицируется с помощью ПЦР и секвенируется. Так как секвенируется только короткий тэг из целого транскрипта, секвенирование DGE является более экономичным вариантом в сравнении со стандартным секвенированием РНК. Секвенирование DGE сохраняет информацию о том, какая из цепей кДНК соответствует исходной РНК. Также этот метод находит широкое применение в случае, если полноразмерный геном или транскриптом организма недоступен для полноразмерного выравнивания с прочтениями[англ.], полученными в ходе секвенирования[13][23].
Секвенирование 3'-концов включает в себя целый ряд методов, большинство из которых было специально разработано для поиска альтернативного сплайсинга и сайтов полиаденилирования у эукариот[13].
Так как обратная транскрипция РНК с помощью обратной транскриптазы дает большое число ошибок и артефактов, которые могут препятствовать корректному качественному и количественному анализу транскриптов[24], компанией Helicos была начата разработка технологии мономолекулярного прямого секвенирования РНК (англ. Direct RNA Sequencing, DRSTM). Этот метод предполагает секвенирование РНК массово-параллельным образом, без получения кДНК, лигирования, амплификации и других процедур, которые могут изменить образец[25].
Основная проблема технологии RNA-seq заключается в том, что исходно неизвестно, какому транскрипту соответствует прочитанный фрагмент. Особенно сложно решить данную проблему в случае исследования транскриптома высших эукариот с частым альтернативным сплайсингом и присутствием в геноме большого числа паралогов. Существует два подхода для восстановления транскриптов по прочитанным фрагментам: картирование на геном отдельных прочитанных фрагментов[26] или восстановление структуры транскрипта de novo[англ.] с последующим картированием полноразмерного транскрипта на геном[27].
Метод секвенирования РНК становится основным методом определения того, какие гены и на каком уровне экспрессируются в клетке. С помощью РНК секвенирования можно определять различия в экспрессии генов на различных стадиях развития организма[28] или в разных тканях[29]. Например, разработан метод локализации in situ последовательностей РНК-транскриптов с помощью флуоресцентного секвенирования (англ. Fluorescent in situ Sequencing, FISSEQ[англ.]), который позволяет изучать фенотип клеток и регуляцию активности генов непосредственно в биологическом образце (на срезах тканей)[30][30]. Также можно определить, транскрипция каких генов изменяется при развитии болезней и рака[31]. В связи с удешевлением методов секвенирования нового поколения появилась возможность определять экспрессию генов у любого человека для диагностики заболеваний. Наряду с секвенированием РНК для измерения профиля экспрессии генов также широко используется кэп-анализ экспрессии генов[32].
Секвенирование РНК — наиболее удобный способ определения мест альтернативного сплайсинга, а также количественного соотношения различных альтернативных форм транскрипта[33][34]. Другие методы не позволяют картировать места альтернативного сплайсинга на всем протяжении генома. Также как и определение экспрессии генов, определение соотношения альтернативных форм транскриптов можно проводить на различных стадиях развития организма или в разных тканях.
РНК-секвенирование позволяет различить транскрипты с отличием в одном нуклеотиде, поэтому может быть использовано как для выявления экспрессируемых однонуклеотидных полиморфизмов в генах, так и для изучения процесса редактирования РНК[35][36].
Редактирование РНК — процесс пост- или ко- транскрипционной модификации рибонуклеотидов в молекуле РНК. В большинстве случаев редактирование РНК приводит к замене аденозина инозином[36]; катализаторами указанных изменений являются белки семейства ADAR[англ.]. В дальнейшем инозин распознаётся клеточной машинерией (например, рибосомой) как гуанозин, что приводит к возникновению различий между закодированной в геноме информацией и её интерпретацией[37].
Основным методом выявления внесённых изменений является сравнение последовательности нуклеотидов геномной ДНК и соответствующих участков РНК[38].
Важным прогностическим признаком обнаружения сайтов редактирования РНК является наличие эволюционно консервативных нуклеотидных последовательностей в окружении места редактирования[39].
Вследствие значительного прогресса в развитии методов массового параллельного секвенирования стало технически возможным проводить секвенирование полного транскриптома исследуемого организма с целью выявления связанных с редактированием РНК событий. Однако в силу генетического разнообразия наличие различий в определённой позиции между последовательностью РНК и референсным геномом[англ.] не означает присутствия сайта редактирования в этой позиции, так как идентификация сайтов редактирования РНК подразумевает секвенирование как геномной ДНК, так и кДНК, выделенных из одного и того же организма. Также необходимо принимать во внимание то, что уровни редактирования РНК различаются в разных тканях организма[40].
Для упрощения процедуры идентификации сайтов редактирования РНК предпринимаются попытки разработать программные пакеты, использующие только транскриптомные данные и не требующие секвенирования геномной ДНК. Возможным решением может послужить программное обеспечение GIREMI[41] (англ. Genome-independent Identification of RNA Editing by Mutual Information), которое способно детектировать сайты редактирования РНК, используя исключительно последовательности транскриптов[42].
РНК-секвенирование широко используется в настоящее время для исследование особенностей транскриптома раковых клеток, в том числе появление химерных транскриптов[43] и продуктов альтернативного сплайсинга, специфичных для раковых клеток[44].
Гибридизация генов происходит из-за различных структурных модификаций в геноме и может быть связана с раком[45]. Возможность анализировать весь транскриптом образца с помощью секвенирования РНК делает этот метод привлекательным для поиска подобных частых преобразований при раковой трансформации клеток[43].
Секвенирование РНК является одним из основных методов исследований, проводимых в рамках проектов ENCODE и modENCODE, направленных на создание базы данных элементов генома человека[46] и основных модельных объектов молекулярной биологии[47][48].
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.