Loading AI tools
Из Википедии, свободной энциклопедии
Секвенирование нового поколения (англ. next generation sequencing, NGS) — группа методов определения нуклеотидной последовательности ДНК и РНК для получения формального описания её первичной структуры. Технология методов секвенирования нового поколения позволяет «прочитать» единовременно сразу несколько участков генома, что является главным отличием от более ранних методов секвенирования. NGS осуществляется с помощью повторяющихся циклов удлинения цепи, индуцированного полимеразой, или многократного лигирования олигонуклеотидов. В ходе NGS могут генерироваться до сотен мегабаз и гигабаз нуклеотидных последовательностей за один рабочий цикл[1].
Первая концепция секвенирования была предложена Сенгером в 1977 году[2]. Технология получила название «метод обрыва цепи». В том же году Максам и Гилберт предложили альтернативный метод, получивший название «метод химической деградации[англ.]» — в его основе лежит расщепление меченого по одному концу фрагмента ДНК под действием специфических реагентов. Определение нуклеотидной последовательности проводится методом электрофореза в полиакриламидном геле с последующей авторадиографией. Необходимость в массовом, качественном и быстром секвенировании стимулировала многочисленные модификации и всевозможные улучшения этих методов. В той или иной степени изменениям подверглись практически все составляющие этого процесса. Переломной точкой развития технологии стало появление ПЦР (середина 1980-х) и автоматизация основных этапов «чтения» ДНК, давшие начало методам секвенирования следующего поколения. Платформы для методов нового поколения основываются на распараллеливании процесса «чтения» ДНК, и таким образом за один прогон работы секвенатора можно определить первичные структуры нескольких участков генома. Секвенаторы нового поколения стали значительно дешевле и гораздо эффективнее своих предшественников. На сегодняшний день производительность некоторых секвенаторов измеряется уже сотнями миллиардов пар оснований, что, например, позволяет подобным приборам сканировать индивидуальный геном человека всего за несколько дней[3].
Ниже приведены методы NGS в хронологическом порядке. Первые методы, например на основе пиросеквенирования, дали начало развитию NGS, однако практически не используются на данный момент. Остальные ниже рассмотренные методы широко используются на данный момент, каждый метод обладает своими преимуществами и спецификой применения[4][5][6].
метод | принцип | максимальная длина прочтения, пар оснований | стоимость секвенирования 1 млн пар оснований | стоимость секвенатора | время работы за цикл | количество прочтений за цикл | преимущества | недостатки |
---|---|---|---|---|---|---|---|---|
454 Life Sciences[9] | пиросеквенирование и люцифераза | 1000 | $10 | $500 000 | 7 часов | 1 000 000 | длина прочтённых геномных участков; скорость | стоимость; погрешность |
Illumina-SOLEXA | нуклеотиды с флуорофором и снимаемыми терминаторами | 300 | $0,05—0,15 | $1 000 000 -(NovaSeq 6000)
$100 000 -(MiSeq) |
4 часа — 55 часов | до 5 000 000 000 | эффективность, стоимость | скорость |
SOLiD | лигирование олигонуклеотидных зондов с флуорофором | 75 | $0,13 | $595 000 | до 10 дней | до 2 400 000 000 | стоимость | скорость |
Helicos | нуклеотиды с флуорофором и снимаемыми терминаторами | 2900 | $2 | $1 350 000 | 1 час | 35 000—75 000 | длина прочтённых геномных участков; скорость | низкая производительность при желаемой малой погрешности; стоимость |
IonTorrent[10] | изменение pH в процессе присоединения нуклеотидов | 600 | $1 | $100000 | 3 часа | до 5 000 000 | стоимость; скорость | погрешность |
PacBio Sequel[11] | нуклеотиды с флуорофором | 20 000 | $2 | $600 000 | 20—30 часов | До 500 000 | длина прочтений, точность | количество материала, цена |
Oxford Nanopore (MinION Mk1B)[12][13] | изменение силы тока по мере прохождения цепи через нанопору | длина всей НК, до 2 000 000 | $0,47—0,90 | $1000 | 1 мин — 2 суток | — | длина прочтений, стоимость, отсутствие амплификации и сложных химических превращений | погрешность |
В связи со стремительным развитием методов секвенирования, параметры методов, такие как стоимость секвенаторов и их работы, время и длины прочтённых участков могут меняться[5].
Массово-параллельное опознавательное секвенирование (англ. massively parallel signature sequencing, MPSS) — одна из первых технологий NGS, которая была разработана в 1990-х компанией Lynx Therapeutics для секвенирования мРНК транскриптов и оценки генной экспрессии, основываясь на индивидуальных уровнях мРНК в отдельной клетке[14]. В методе MPSS транскрипты захватываются на отдельных микрогранулах с матрицей ДНК; мРНК прочитываются гибридизацией с флуоресцентной меткой, а затем удаляются, и так несколько раз подряд. В результате получаются последовательности длиной от 17 до 20 пар оснований (п. о.). Количество транскриптов, показывающих уровень экспрессии, определяется числом транскриптов на миллион молекул. Данный метод не требует идентификации генов перед началом анализа, а его чувствительность — несколько молекул мРНК на клетку[15].
Первая эффективно используемая на коммерческой основе платформа NGS. Компания 454 Life Sciences основана в 2000 году Джонатаном Ротбергом (в производство запущена в 2005 году). Данная технология представляет собой последовательный синтез методов эмульсионного ПЦР и пиросеквенирования[16].
Амплификация ДНК проходит в каплях воды в масляной эмульсии. В каждой капле воды находится одноцепочечная матрица ДНК, связанная с праймером на бусинке. Далее, каждая бусина помещается на чип, представляющий собой оптическое волокно. Туда же помещаются необходимые для секвенирования ферменты: ДНК-полимераза, люцифераза, АТФ-сульфурилаза[англ.]. В последней сборке реакция секвенирования идёт в ячейках объёмом 3,4·106 пл, на стенках которых есть специальное металлическое покрытие, нивелирующее шум[17].
Авторы метода — британские химики Шанкар Баласубраманиан и Дэвид Кленерман. Этот метод секвенирования использует прикреплённые к микросферам единичные молекулы ДНК. В 2006 году была запущена Solexa Genome Analyzer 1G, первая платформа, генерирующая короткие участки генома. После её приобретения компанией Illumina Genome Analyzer использует оптически прозрачные ячейки с 8 индивидуальными поверхностями (иногда меньше: 4, 2 или даже 1), где связываются олигонуклеотиды. В отличие от пиросеквенирования удлинение последовательности происходит постепенно, что позволяет за раз с помощью камеры снимать большие ДНК-чипы[18].
Платформа SOLiD (Supported Oligonucleotide Ligation and Detection System 2.0), разработанная Applied Biosystems — технология секвенирования коротких чтений, основанная на лигировании. Метод был предложен в лаборатории Джорджа Черча и опубликован в 2005 году. Суть метода заключается в определении нуклеотидной последовательности небольших фрагментов (25—75 п. о.) геномной ДНК; к обоим концам предварительно фрагментированной ДНК лигируют адаптеры[англ.], необходимые для эмульсионной ПЦР на магнитных шариках и последующего секвенирования на проточной ячейке[19].
Технология NGS без электрофоретического разделения, позволяющая прочитывать миллионы коротких иммобилизованных последовательностей ДНК. Основная идея метода — генерация большого числа уникальных «полоний» (молекулярных колоний, сгенерированных полимеразой), которые секвенируются в случайном порядке. Полони-секвенирование проводится для библиотеки парных концевых тэгов (paired-end tags): каждая молекула ДНК имеет длину 135 пар оснований (п. о.), содержит два тэга длиной 17-18 п. о., разделённых и фланкированных общей последовательностью[20][21].
Первый метод секвенирования единичных молекул, разработанный HeliScope (Helicos BioSciences), имеет производительность около 1 Гб/день. Принцип работы: после клональной амплификации образца происходит фрагментация ДНК с последующим полиаденилированием на 3'-конце с дальнейшим секвенированием, чередующимся с промыванием образцов нуклеотидами с флуоресцентной меткой[22]. В 2012 году компания была признана банкротом и пректратила существование[23], однако компания SeqLL, основанная в 2013 году, получила лицензию на технологию[24].
В данном методе в секвенируемый фрагмент ДНК последовательно вносятся 4 адаптера, благодаря которым в ходе дальнейшей репликации Phi29 ДНК-полимеразой[англ.] (rolling circle replication) синтезируемая молекула ДНК сворачивается в ДНК-наношарики. Затем наношарики наносятся на субстрат, имеющий многочисленные поля размером ~300 нм для связывания ДНК, организованные в виде решётки. Организация этих полей позволяет уместить больше ДНК на субстрат и увеличить плотность информации в изображении по сравнению со случайным нанесением ДНК на субстрат (например, как в полони-секвенировании)[25]. MGI — компания, которая выспускает такие секвенаторы и развивает эту технологию.
Combinatorial probe anchor ligation — комбинированный метод секвенирования, использующий комбинацию гибридизации и лигирования пула зондов. Каждый зонд состоит из девяти оснований, которые вырождены (то есть могут быть любыми из четырёх) во всех, кроме одной позиции, которую собираются прочитать. Интересующая позиция помечена одним из четырёх красителей, соответствующие каждому азотистому основанию. На матрицу гибридизируют якорную последовательность, комплементарную адаптеру и зонды. Зонды, гибридизованные напротив одного из концов якорной последовательности, затем лигируются. После гибридизации и лигирования избыток зондов смывают и снимают изображение. Затем смывают весь якорно-зондовый комплекс и процесс повторяют, используя зонды для других позиций. После считывания 5 смежных оснований процесс повторяется с использованием якорей с пятью дополнительными вырожденными основаниями, что позволяет секвенировать до 10 оснований с каждой стороны адаптера. В общей сложности секвенируется прочтение в 70 оснований из исходного фрагмента, по 35 оснований на каждом конце адаптера. Из-за расстояния между адаптерами эти последовательности в 35 оснований не являются смежными, поскольку они содержат гэп в два основания и гэп в пять оснований[26].
Метод основан на связи между химической и цифровой информацией; эта технология также называется рН-индуцированным секвенированием. Процесс основан на детекции протонов, которые получаются при синтезе цепи ДНК как побочный продукт. Как следствие, рН раствора меняется, что и можно детектировать[27].
Платформа Ion Torrent отличается от остальных технологий секвенирования тем, что в ней не используются модифицированные нуклеотиды и оптические методы. Метод Ion Torrent позволяет исследовать транскриптомы, малые РНК, проводить ChIP-seq. Более того, с его помощью можно изучать геномы микробных сообществ[27].
Появление метода одномолекулярного секвенирования в реальном времени (англ. Single molecule real time sequencing, SMRT) дало возможность наблюдать за работой ДНК-полимеразы, наращивающей синтезируемую цепь, в реальном времени. Суть метода заключается в определении нуклеотидной последовательности фрагментов геномной ДНК с лигированными к их концам специфическими ДНК-адаптерами, необходимыми для последующего секвенирования. Смысл SMRT-секвенирования схож с описанными ранее методами NGS — ДНК-полимераза достраивает вторую цепь исследуемой молекулы ДНК, используя нуклеотиды, меченные различными флуоресцентными метками, которые регистрируют при помощи конфокальной микроскопии высокого разрешения[28].
Метод основан на измерении тока ионов через единичную нанопору в непроводящей мембране. При прохождении через эту пору нуклеотидов ток падает. Время, на которое изменяется ток ионов, и величина этого падения зависят от того, какой нуклеотид в данный момент находится внутри поры[29]. Примером компании производящие секвенаторы такого формата является Oxford Nanopore Technologies.
Быстрота и дешевизна методов NGS, недоступная ранее, спровоцировала бум в индустрии геномных исследований. Благодаря NGS появилась возможность делать ранее технически недоступные эксперименты[30][31]. Применение NGS не ограничивается определением геномных последовательностей, а распространяется до изучения траскпритома, структуры хроматина и других областей молекулярной и клеточной биологии. Ниже представлены основные примеры направлений применения методов NGS[32].
Удешевление и распространение NGS позволило определять места связывания белков с ДНК (ChIP-seq), взаимодействующие участки ДНК (определение конформации хромосом) и участки открытого хроматина на протяжении всего генома, а также осуществлять проекты ENCODE и modENCODE[33].
ChiP-seq используется для картирования сайтов связывания ДНК-связывающих белков, что раньше достигалось методами иммунопреципитации хроматина и гибридизации без секвенирования на микрочипах[англ.][34].
Стали доступны геномы разных по сложности живых систем от микроорганизмов до человека, включая геном цитогенетически находящихся в норме клеток миелоидной лейкемии. Увеличение длины чтений ускорило сборку целых геномов[35].
Секвенирование определённых регионов в геномах используется для выявления полиморфизмов (в частности однонуклеотидных полиморфизмов) и мутаций в генах, задействованных в развитии опухолевых и других заболеваний. Примером одной из таких широкомасштабных работ может служить проект «1000 геномов»[36].
NGS широко используется в исследованиях разнообразия микроорганизмов в различных образцах (например, микробные популяции в океане и почве, идентификация новых вирусов в органах, подлежащих трансплантации, описание характерной для микрофлоры ЖКТ, органов дыхания и т. д.)[37].
На основе NGS создан новый подход РНК-секвенирования (RNA-seq) для картирования и подсчёта транскриптов в биологических образцах. У этого метода есть преимущества над используемым ранее методом ДНК-микрочипов. Например, ДНК-чипы зависят от перекрытия геномных последовательностей, в то время как RNA-seq позволяет охарактеризовать транскрипцию без предварительного знания места начала транскрипции[38].
В недалёком будущем технологии секвенирования станут более быстрыми и менее дорогими, что позволит использовать их для идентификации мишеней для лекарственной терапии онкологических больных. Уже в 2013 году анализ по технологии секвенирования следующего поколения от момента биопсии до завершения NGS занимал менее 100 дней. Столько же времени занимает секвенирование всего генома (whole genome sequencing, WGS) и секвенирование всего транскриптома (whole transcriptome sequencing, WTS)[39].
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.