Авторефераты по всем темам  >>  Авторефераты по биологии РОССИЙСКАЯ АКАДЕМИЯ НАУК Институт биоорганической химии им. академиков М. М. Шемякина и Ю. А. Овчинникова

На правах рукописи

УДК 577.2 Ажикина

Татьяна Леодоровна ГИБРИДИЗАЦИОННЫЕ ПОДХОДЫ В ШИРОКОМАСШТАБНЫХ ИССЛЕДОВАНИЯХ ГЕНОМОВ

03.00.03 - Молекулярная биология

АВТОРЕФЕРАТ

диссертации на соискание учёной степени доктора биологических наук

Москва - 2009

Работа выполнена в лаборатории структуры и функций генов человека Института биоорганической химии им. М.М. Шемякина и Ю.А. Овчинникова РАН

Научный консультант:

Академик РАН, докт. хим. наук, профессор Е. Д. Свердлов

Официальные оппоненты:

Чл.-корр. РАН, докт. биол. наук С. А. Лукьянов Чл.-корр. РАН, докт. биол. наук, профессор Б. Ф. Ванюшин Докт. биол. наук П. М. Рубцов

Ведущая организация: Институт Биологии Гена РАН

Защита состоится " " 2009 г. в часов на заседании Специализированного совета Д 002.019.01 при Институте биоорганической химии им. М.М. Шемякина и Ю.А. Овчинникова РАН по адресу:

117997, г. Москва, ул. Миклухо-Маклая, 16/С текстом диссертации можно ознакомиться в библиотеке Института биоорганической химии им. М.М. Шемякина и Ю.А. Овчинникова РАН

Автореферат разослан " " _____________ 2009 г.

Учёный секретарь Специализированного совета доктор физ.-мат. наук В. А. Олейников ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Структурно-функциональные и сравнительные исследования геномов по-прежнему остаются основой молекулярной биологии и генетики. Все методы таких исследований условно подразделяют на две большие группы: методы прямого секвенирования и методы несеквенирующего сравнительного анализа. Современное секвенирование включает серию высокотехнологичных масштабных методов, позволяющих определять в короткие сроки последовательности десятков и сотен миллионов нуклеотидов. Однако полностью решить проблемы полногеномного исследования только прямым секвенированием вряд ли возможно, поскольку в геномах (особенно эукариотических) имеются локусы, недоступные для клонирования, определения первичной структуры ДНК или однозначной реконструкции протяженных фрагментов из-за наличия большого числа гомопоследовательностей, GC-богатых участков и/или повторов. Так, например, в локончательном варианте генома человека, опубликованном International Human Genome Sequencing Consortium в 2004г., оставалось более чем 340 участков, для которых не была определена первичная структура. Кроме того, полногеномное секвенирование остается очень дорогим методом, и всестороннее изучение громадной геномной вариабельности посредством секвенирования с точки зрения материальных затрат в настоящее время и в обозримом будущем нереально.

Методы, относящиеся ко второй группе, основанные на использовании свойства ДНК образовывать устойчивые двухцепочечные структуры из комплементарных одноцепочечных молекул, получили название гибридизационных. Среди гибридизационных подходов в частности активно используются различные виды микроэрреев, позволяющие в значительной степени интенсифицировать исследования при снижении временных и стоимостных затрат. Несмотря на широкое распространение в мире и успешное применение для решения самых разнообразных задач геномики, микроэррейные технологии имеют серьезные недостатки: недостаточная специфичность гибридизации на твердой подложке, а также большое количество ложнопозитивных сигналов, возникающих при взаимодействии повторяющихся элементов генома, семейств генов и других неоднозначных участков. Существенным ограничением метода является обязательность знания нуклеотидной последовательности генома-стандарта, без чего невозможно сконструировать микроэррей, а в сравниваемых со стандартом исследуемых геномах невозможно детектировать последовательности, присутствующие в исследуемом геноме, но отсутствующие в стандарте.

Таким образом, по-прежнему актуальными являются разработка и совершенствование гибридизационных методов анализа геномов, которые могли бы расширить возможности уже существующих методов, в частности, позволили бы непосредственно выделять последовательности, отличающие разные геномы или их транскриптомы.

Цель работы. Целью данной работы являлось создание и применение для решения разнообразных задач функциональной и эволюционной геномики новых гибридизационных методов выявления и выделения последовательностей, отличающихся или, наоборот, совпадающих в различных геномах и транскриптомах, в частности, с использованием олигонуклеотидов с повышенным сродством к комплементарной матрице.

Задачи исследования. В ходе работы были решены следующие задачи:

1. Предложена оптимизация метода вычитающей гибридизации для сравнения близкородственных геномов. С помощью этого метода проведено широкомасштабное сравнение и построена карта характерных делеционноинсерционных различий в геномах российских штаммов Mycobacterium tuberculosis. Проведено сравнение геномов близкородственных сиговых рыб - байкальского омуля и сига.

2. Разработан метод Coincidence Cloning (клонирование идентичных последовательностей), заключающийся в отборе фрагментов с одинаковыми нуклеотидными последовательностями, принадлежащими двум разным образцам.

Предложен новый экспериментальный подход для изучения тканеспецифического метилирования протяженных геномных участков (млн. п.о.). С использованием разработанного метода проведен сравнительный анализ метилирования участка ДНК 19-ой хромосомы в нормальных и опухолевых тканях.

3. Разработан новый экспериментальный подход для изучения транскриптома внутриклеточных патогенов в системе in vivo. С применением разработанного метода получен и охарактеризован транскриптом штамма H37Rv M. tuberculosis в инфекционной системе (легкое мыши, инфицированной M. tuberculosis).

4. Исследована возможность использования олигонуклеотидов с повышенным сродством к комплементарной матрице (содержащих 5-метил-цитозин и 2аминопурин) в качестве зондов в секвенировании и ПЦР.

Научная новизна, теоретическая и практическая значимость работы. Разработана методика экспериментального сравнительного анализа геномов - ПДРФ-вычитающая гибридизация, позволяющая сравнивать геномы близкородственных бактериальных штаммов. С ее помощью впервые проведено сравнение геномов различных штаммов M. tuberculosis, циркулирующих на территории РФ и вызывающих различные клинические формы заболевания. На основе полученных нуклеотидных последовательностей и методики геномной ПЦР разработан экспериментальный подход для изучения инсерционно-делеционного полиморфизма российской популяции Mycobacterium tuberculosis (ID-типирование). Впервые данный подход был применён для генотипирования российских клинических штаммов и последующей кластеризации популяции на генетически однородные группы. Также впервые описана делеция, строго характеристичная для высоковирулентного семейства штаммов W/Beijing.

Идентифицированные нуклеотидные последовательности могут быть использованы в качестве молекулярно-генетических маркеров для фундаментальных исследований в области микобактериальной популяционной генетики, а также для практического применения в медико-генетических и эпидемиологических целях, в частности для диагностики различных подгрупп M. tuberculosis в клинических условиях.

Методом ПДРФ вычитающей гибридизации впервые исследован геномный полиморфизм представителей байкальских сиговых рыб - озерного сига (Coregonus lavaretus baicalensis Dybovsky) и омуля (C. autumnalis migratorius Georgi), дивергировавших от общего предка 10Ц20 тыс. лет назад. Впервые найденные генетические различия между байкальскими сиговыми чрезвычайно малы и соответствуют полиморфным некодирующим участкам геномов, варьирующим в результате однонуклеотидных замен и коротких делеций.

Разработан новый метод изучения метилирования ДНК на протяженных геномных участках, который дает информацию о статусе метилирования CpG динуклеотидов вне зависимости от их расположения относительно кодирующих и регуляторных областей.

Разработан и протестирован новый методический принцип, позволяющий с минимальными затратами времени картировать сайты расщепления генома. Для ускорения обработки получаемых массивов данных создан комплекс программных продуктов, предложены несколько подходов к визуализации данных, а также разработано программное обеспечение, осуществляющее эту визуализацию максимально простым для пользователя способом. Метод был использован для анализа распределения неметилированных CpG сайтов для различных нормальных и опухолевых тканей человека в полигенном локусе 19 хромосомы FXYD5-COX7A1 размером 1,02 млн.п.о. В результате работы впервые получены подробные эпигенетические карты этого локуса.

Разработанный метод может быть применен в фундаментальных исследованиях в области молекулярной биологии и медицины для решения широкого круга проблем, связанных с эпигенетической регуляцией генома, а также для практического применения в медико генетических целях, в частности, для поиска диагностических маркеров различных патологий, а также терапевтических мишеней.

Впервые разработан метод анализа транскриптома внутриклеточных патогенов непосредственно в инфицированных тканях. С его использованием получен и проанализирован набор генов Mycobacterium tuberculosis, транскрибирующихся в легочной ткани мышей, больных туберкулезом. Разработанный метод анализа патогенной бактериальной РНК из пораженных тканей может быть использован для исследований любого бактериального инфекционного возбудителя, в том числе, поиска факторов вирулентности, мишеней лекарственной терапии, разработки стратегии эпидемиологического мониторинга заболевания.

Впервые исследована возможность использования модифицированных олигонуклеотидов с повышенным сродством к комплементарной матрице, содержащих 5метилцизозин и 2-аминоаденин, в качестве праймеров в секвенировании и ПЦР. Показана их повышенная эффективность праймирования при сохранении специфичности отжига.

Разработан вариант молекулярной дактилоскопии, RAPD, с использованием таких олигонуклеотидов.

Апробация результатов работы Основные результаты работы были представлены на научных конференциях и симпозиумах, в том числе: Международных конференциях Молекулярная медицина и безопасность (Москва, 2008,), IV съезде Российского общества биохимиков и молекулярных биологов (Новосибирск, 2008), Всероссийской научно-практической конференции с международным участием Молекулярная диагностика-2007, Москва, 5ой (1996 г.), 6-ой (1997 г.) и 9-ой (1999 г.) конференциях российской программы Геном человека, Международных Энгельгардтовских конференциях по молекулярной биологии (1994, 1999, 2005); III (1996), IV (1998), VI (2002), VIII (2006) чтениях, посвященных памяти академика Ю.А. Овчинникова, 2-ой Международной научно-практической конференции МЕДБИОТЕК Перспективы развития биотехнологий в России (Пущино, 2005), Международных конференциях Фундаментальные науки - медицине (Новосибирск, 2006, 2007, 2008), конгрессах HUGO Human Genome Meeting (Heidelberg 1996, Brisbane 1999, Vancouver 2000, Helsinki 2006), Cancer Genomics and Emerging Technologies (Boston, 2006), 3rd Congress of the International Union against Tuberculosis and Lung Diseases (Moscow, 2004), Symposium der Deutschen Akademie der Naturforscher Leopoldina DNA Methylation - An Important Genetic Signal: Its Significance in Biology and Pathogenesis (Weissenburg, 2004), 26th Annual Congress of the European Society of Microbiology (Istanbul, 2005), 10th International Symposium on the Biology and Management of Coregonid Fishes (Winnipeg 2008), и других Российских и международных симпозиумах.

Структура и объем диссертации Диссертационная работа состоит из введения, обзора литературы, описания материалов и методов исследования, изложения результатов работы и их обсуждения, заключения, выводов и списка литературы. Работа изложена на ЕЕ.странице, содержит Е.. рисунков и ЕЕ таблиц. Список литературы включает ЕЕ.источников.

ичный вклад автора Автору принадлежит решающая роль в планировании эксперимента, разработке методик и обобщении полученных результатов. Весь экспериментальный материал получен автором и руководимыми им аспирантами ИБХ РАН.

Публикации Диссертация обобщает данные 22 основных статей.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ 1. ВЫЧИТАЮЩАЯ ГИБРИДИЗАЦИЯ БЛИЗКОРОДСТВЕННЫХ ГЕНОМОВ 1. 1 МЕТОД ВЫЧИТАЮЩЕЙ ГИБРИДИЗАЦИИ И ОПТИМИЗАЦИЯ ЕГО ВАРИАНТА - ПДРФ- ВЫЧИТАЮЩЕЙ ГИБРИДИЗАЦИИ Одним из перспективных подходов к решению задачи поиска различий между двумя сравниваемыми геномами является метод вычитающей гибридизации (ВГ). Этот метод даёт возможность находить нуклеотидные последовательности (мишени), отличающие геном одного организма - так называемого трейсера, от генома другого организма - драйвера. При использовании метода вычитающей гибридизации образцы двух геномных ДНК фрагментируют на отрезки небольшой длины (300Ц2000 п.о.). Один из образцов (трейсер) смешивают с большим избытком другого (драйвер), ДНК сначала денатурируют, а затем ренатурируют. В ходе ренатурации цепи ДНК трейсера, идентичные драйверу, образуют с ним гибриды, в то время как уникальные трейсерспецифические последовательности гибридизуются сами на себя, образуя гомодуплексы трейсера или мишени. Удаление гибридов и гомодуплексов драйвер/драйвер приводит к значительному обогащению мишенями в дифференциальном продукте.

Мы оптимизировали версию ПДРФ-вычитающей гибридизации (RFLP subtraction) для сравнения близкородственных геномных последовательностей. Основной принцип метода приведён на рис. 1.

Геном 1 Геном 1 2 3 4 5 1 2 31 41 42 Геном 1 Геном Зона Зона 1.1 1.Вычитание наборов ДНК из разных зон зона 1.1 - зона 1.2 = фрагменты 3, 1 зона 1.2 - зона 1.1 = фрагмент зона 2.1 - зона 2.2 = фрагмент зона 2.2 - зона 2.1 = фрагменты 31, 41, Зона Зона 2 2.1 2.Рис. 1. Основной принцип ПДРФ-вычитающей гибридизации. Геномная ДНК обозначена горизонтальными линиями. Чёрный прямоугольник - инсерция в геномной ДНК, белый прямоугольник - делеция. Стрелками указаны сайты рестрикции; точечная мутация, приводящая к возникновению дополнительного сайта рестрикции, обозначена звёздочкой. Получаемые рестриктные фрагменты пронумерованы. Электрофореграмма рестриктных фрагментов представлена в нижней части схемы.

Фрагменты, полученные в результате расщепления двух сравниваемых геномов, можно разделить на три типа: (i) фрагменты, имеющие идентичные нуклеотидные последовательности в двух геномах и т.о. имеющие одинаковые длины (фрагменты 1 и 2);

(ii) фрагменты, произошедшие от одной нуклеотидной последовательности, но претерпевшие изменения в процессе эволюции и имеющие небольшие инсерции или делеции, их длины будут различны (фрагменты 3, 5). Такие фрагменты могут быть легко утеряны при проведении стандартной процедуры вычитания, т.к. существует возможность их совместной гибридизации. Вероятность такой гибридизации будет тем выше, чем меньше размер инсерций или делеций. Длины фрагментов третьего типа (iii) различаются из-за наличия точечных мутаций и возникновения дополнительных сайтов узнавания рестрикционными эндонуклеазами (фрагмент 4).

Параллельное электрофоретическое разделение двух наборов рестрикционных фрагментов приводит к тому, что идентичные фрагменты располагаются в идентичных положениях электрофореграммы, в то время как гомологичные фрагменты, несущие инсерции или делеции, находятся в различных положениях электрофореграммы (рис. 1).

Оба набора фрагментов делятся на зоны, содержащие фрагменты с различными длинами.

При проведении вычитающей гибридизации двух наборов ДНК одинаковой длины гомологичные фрагменты с различными длинами оказываются в разных зонах и не гибридизуются друг с другом.

Таким образом, разработанный нами подход включает предварительный этап подготовки сравниваемых геномных образцов, состоящий из следующих стадий:

- исчерпывающий гидролиз двух сравниваемых образцов ДНК частощепящей эндонуклеазой рестрикции (например, Alu I).

- лигирование к рестриктным фрагментам обеих ДНК адаптера, состоящего из длинного олигонуклеотида (20-25 нуклеотидов) и комплементарной ему короткой подложки. Адаптер конструируется таким образом, что при лигировании к фрагментам, образующимся в результате гидролиза ДНК, сайт, специфически узнающийся используемой эндонуклеазой рестрикции, восстанавливается.

- ПЦР амплификация фрагментов ДНК с лигированными адаптерами и электрофоретическое разделение продуктов ПЦР в агарозном геле. Вырезание зон, содержащих фрагменты ДНК определённой длины, элюция ДНК из геля.

Полученные наборы фрагментов ДНК далее используются для приготовления трейсера и драйвера. Проведение вычитающей гибридизации и дальнейший анализ проводится стандартным способом.

1.2. ПОЛНОГЕНОМНОЕ СРАВНЕНИЕ РАЗЛИЧНЫХ ШТАММОВ M. tuberculosis 1.2.1.Полногеномное сравнение штаммов HN878 и CDC1551, вызывающих различные клинические формы туберкулёза Нами было проведено сравнение генома штамма M. tuberculosis HN878, способного вызывать туберкулёз с внелёгочной формой локализации, и штамма CDC1551. Целью сравнения была оценка эффективности оптимизированного метода ПДРФ-вычитающей гибридизации и поиск молекулярно-генетических маркёров, характеризующих ту или иную форму протекания заболевания. Штамм HN878 принадлежит семейству W, которое выделяется на основании одинакового сполиготипа Beijing, и характеризуется в частности повышенной частотой проявления множественной лекарственной устойчивости. Штамм CDC1551 является высококонтагиозным. Последовательность его генома была полностью определена и охарактеризована (Fleischmann et al, 2002). В результате проведённого полногеномного сравнения нами были получены дифференциальные последовательности, присутствующие в геноме штамма HN878 и делетированные или изменённые в геноме штамма CDC1551.

Анализ полученных нуклеотидных последовательностей проводился с помощью международных баз данных, содержащих полногеномные последовательности штаммов M. tuberculosis H37Rv и CDC1551, а также последовательности геномов M. tuberculosis 210, M. bovis AF2122 и M. bovis BCG, определение которых не было завершено на момент проведения работы.

Было охарактеризовано 9 дифференциальных фрагментов, представляющих собой последовательности ДНК, заключённые между двумя сайтами рестрикции, узнаваемыми эндонуклеазой рестрикции Alu I, которая использовалась в работе. Все фрагменты оказались высоко подобными (97-99% идентичности) последовательностям генома штамма M. tuberculosis 210. Меньший уровень идентичности наблюдался с участками генома CDC1551. Найденные в результате сравнения отличия можно разделить на три группы.

Первая группа генетических различий между геномами HN878 и CDC1551 - это новые места интеграции транспозона IS6110. В результате вычитающей гибридизации было найдено три различных фрагмента, 5'-концевая часть которых была идентична концевой части транспозона IS6110, а 3'-концевая часть каждого фрагмента оказалась идентичной определённому гену CDC1551. В геноме CDC1551 в районе данных генов встраивания IS6110 не происходит. ПЦР ортологичных локусов в геномах HN878 и CDC1551 показала, что во всех трёх случаях в геном HN878 интегрирована полноразмерная копия транспозона. Места интеграции находятся в межгенных участках генома штамма HN878 (гены MT3269ЦМТ3270, МТ0001ЦМТ0002), а также непосредственно в кодирующей последовательности гена МТ1515, кодирущего катионтранспортирующую АТФазу.

Вторая группа дифференциальных фрагментов является результатом внутригеномных перестроек, связанных с различными повторяющимися последовательностями. Два фрагмента представляют собой комбинации участков генов семейства PPE, характерных только для микобактерий. Третий фрагмент представляет собой последовательность ДНК, идентичную участкам в составе повторов в геноме CDC1551 (clustered regularly interspaced short palindromic repeat), но содержащую небольшие мутации инсерционно-делеционной природы. Подобные различия в структуре, связанные с повторяющимися последовательностями, могли появиться в результате внутригенных рекомбинационных событий или в процессе репликации.

Характерной особенностью третьей группы генетических различий между штаммами HN878 и CDC1551 является наличие протяженных нуклеотидных последовательностей, отсутствующих в геноме CDC1551.

Все обнаруженные нами дифференциальные фрагменты, характерные для генома внелёгочного штамма M. tuberculosis HN878, оказались полностью гомологичными соответствующим локусам генома M. tuberculosis 210, вызывающего туберкулёз с классическими лёгочными симптомами течения заболевания. Это означает, что обнаруженные нами различия не связаны с внелегочной локализацией заболевания.

Возможно, выбор пригодной для штамма среды обитания обуславливается не столько его генотипическими особенностями, сколько особенностями организма хозяина и конкретными внутренними условиями во время размножения патогена. Этот вопрос требует дальнейшего изучения.

В результате проведённого геномного сравнения нами было показано, что метод вычитающей гибридизации с использованием разделения полного набора рестрикционных фрагментов по длине и последующим вычитанием полученных зон даёт возможность обнаружения небольших мутаций инсерционно-делеционной природы и геномных перестроек. Такие незначительные изменения геномной структуры невозможно детектировать при помощи обычного варианта вычитающей гибридизации. Тем не менее, они могут оказывать существенное влияние на формирование фенотипических свойств патогена, приводя к возникновению генетически близких, но фенотипически различных штаммов.

1.2.2. Полногеномное сравнение геномов российских клинических штаммов M. tuberculosis с геномом штамма H37Rv Для исследования вариабельности геномов российских штаммов M. tuberculosis было выбрано три штамма, принадлежащих семейству W/Beijing (155/6, 1643, 1462), и один штамм семейства Haarlem (1540), для которого была показана повышенная степень вирулентности по сравнению с представителями семейства W/Beijing. Отбор и культивирование штаммов M. tuberculosis, их микробиологическая характеристика и получение образцов геномной ДНК проводились в лаборатории И.Г. Шемякина (ГН - Прикладной Микробиологии, г. Оболенск). В нашей работе геномы штаммов M. tuberculosis 1540, 155/6, 1643 и 1462 сравнивались с геномом штамма H37Rv, последовательность которого определена и охарактеризована (Cole et al, 1998).

В результате сравнения было получено 12 фрагментов, присутствующих в геномах российских штаммов M. tuberculosis и делетированных в геноме H37Rv, из которых фрагментов идентичны различным участкам генома штамма CDC1551, а два - участкам генома M. tuberculosis 210. Фрагменты, найденные нами при вычитании, представляют собой геномные последовательности, заключённые между двумя сайтами рестрикции, узнаваемыми эндонуклеазой рестрикции AluI, и являются частью более протяжённых делеций. Большинство фрагментов присутствует в геномах всех сравниваемых штаммов, что может свидетельствовать об определённой степени родства между этими штаммами.

Все обнаруженные последовательности располагаются в кодирующих областях генома, это согласуется с данными о пониженной частоте возникновения мутаций в межгенных участках микобактериальных геномов. Кроме того, они не распределяются по геному случайно, а концентрируются в определённых его областях, характеризующихся повышенной степенью вариабельности среди различных штаммов M. tuberculosis..

Некоторые из генов, в состав которых входят найденные дифференциальные фрагменты, кодируют белки с известными функциями, для белковых продуктов других генов функция является лишь предполагаемой (табл.1).

Табл. 1. Дифференциальные локусы, найденные при сравнении геномов четырёх российских клинических штаммов M. tuberculosis с геномом штамма H37Rv. Серый прямоугольник - наличие локуса в геноме соответствующего штамма, белый прямоугольник - данный фрагмент делетирован в геноме штамма. Буквами МТ обозначены гены CDC1551, в состав которых входят найденные дифференциальные фрагменты, фрагменты A4 и G2 идентичны участкам генома M. tuberculosis 210.

окус Функция предполагаемая аденилатциклаза MT13предполагаемая фосфолипаза С MT17мембранный белок, семейство MmpL MT18консервативный гипотетический белок MT20предполагаемая хеликаза MT20трансмембранный нуклеотидсвязывающий белок MT25птерин-4--карбиноламин дегидратаза MT34белок А, участвующий в биосинтезе кофактора MT34молибдоптерина регулятор транскрипции, семейство AfsR/DnrI/RedD MT34белок, родственный 1-дезоксиксилулозо-5-фосфат-синтазе MT34белок - гомолог белков РРЕ семейства (идентичность Aаминокислотного состава ~ 55%) белок - гомолог белков РРЕ семейства (идентичность Gаминокислотного состава ~ 60%) 1415155/16 Большинство найденных нуклеотидных последовательностей присутствует в геномах всех исследуемых российских штаммов M. tuberculosis, однако геном наиболее вирулентного из исследуемых штаммов M. tuberculosis 1540 имеет как минимум три отличия от менее вирулентных штаммов 155/6, 1643 и 1462. Найденные нами дифференциальные фрагменты являются частью генов MT1799, MT1802 и MT2508. Ген МТ1799 (plcD) кодирует известный фактор бактериальной вирулентности - фосфолипазу С. Ген МТ1802 (mmpL8) кодирует один из мембранных белков, предположительно определяющих характер взаимодействия M. tuberculosis с клеткой хозяина. Третьим отличием генома штамма 1540 от штаммов 155/6, 1643 и 1462 является делеция размером 212 п.о. в гене MT2508. Таким образом, наличие в геноме этих трёх инсерций может обуславливать проявление штаммом 1540 более вирулентных свойств.

1.2.3. Исследование полиморфизма найденных дифференциальных локусов в российской популяции клинических штаммов M. tuberculosis Нами предложен способ генотипирования штаммов M. tuberculosis методом геномной ПЦР следующих локусов: G2, MT1360, MT1799, MT1802, MT2081, MT2082, MT2508, MT3426, MT3427, MT3428, Rv0073, Rv1762с. Локусы А4 и MT3489 оказались неполиморфными в изученной популяции, поэтому были исключены. Локусы Rv0073 и Rv1762с получены как дифференциальные в серии не описанных в диссертации экспериментов. Эффективность и достоверность предложенного нами метода, названного ID-типированием, была показана на коллекции 172 штаммов M. tuberculosis, циркулирующих в центральных регионах Российской Федерации. Данная коллекция создана в лаборатории И.Г. Шемякина (ГН - Прикладной Микробиологии, г. Оболенск), там же проводилось IS6110-RFLP-типирование, сполиготипирование и кластеризация штаммов. Согласно результатам, полученным И.Г. Шемякиным с сотр., 51 штамм из коллекции принадлежал семейству AI (сполиготип LAM), циркулирующему на территории Российской Федерации и выделенному недавно; 46 штаммов входило в состав семейства W/Beijing, 49 штаммов представляло семейство Haarlem. Остальные представители коллекции либо принадлежали редко представленному сполиготипу Т, либо для них сполиготип не был идентифицирован.

Гены, которые были использованы для ID-типирования, имеют различную степень полиморфизма (табл. 2).

Табл. 2 Инсерционно-делеционный полиморфизм в основных сполигосемействах.

Наличие исследуемого локуса в данном типе сполигосемейства обозначено цифрами (%) UEP - unique event polymorphism Делетированный Гены в Beijing Haarlem LAM/A1 Характеристика район составе (44 (49 (51 штамм) делеции делеции штамма) штаммов) RvD2 MT2508 0 100 100 UEP G2 фрагмент 100 96 MT1799 0 100 16 IS-dependent MT1802 0 100 RvD1 MT2081 100 100 94 UEP MT2082 100 88 RvD5 MT3426 100 86 98 IS-dependent MT3427 100 88 MT3428 100 88 MT1360 100 98 RD105 Rv0073 0 100 100 UEP RD152 Rv1762 0 100 12 IS-dependent Делеция гена Rv0073, входящего в состав делетированной последовательности RD105 (Region of Difference, протяженная нуклеотидная последовательность, отсутствующая в геноме штамма M. tuberculosis H37Rv), характерна только для представителей семейства W/Beijing, что уже было описано в литературе. Мы подтвердили на другой географически обособленной группе штаммов, что делеция RD105 является UEP (unique event polymorphism), строго характеризующей это семейство. Также мы установили, что ранее нигде не упоминаемая делеция в гене МТ2508 размером 212 п.о.

также характерна только для представителей семейства W/Beijing и представляет собой ещё один, до настоящего времени не описанный UEP.

Как правило, геномные локусы, связанные с интеграцией транспозона IS6110, обладают повышенной вариабельностью. Таковы гены МТ1799 и МТ1802, входящие в состав ранее описанной делеции RvD2, и МТ3426, МТ2327, МТ3428, входящие в состав делетированного участка генома RvD5. Делеции этих локусов являются результатом гомологичной рекомбинации между последовательностями IS6110 и могут возникать независимо в геномах неродственных штаммов, поэтому их нельзя назвать отдельными характеристическими признаками. Однако изучение полиморфизма данных участков генома остаётся важной задачей, так как гены, входящие в состав RvD2 и RvD5, являются либо уже доказанными, либо кандидатными факторами вирулентности, следовательно, изменчивость этих районов генома может оказывать влияние на формирование и модуляцию вирулентных свойств патогена.

Штаммы семейства W/Beijing являются генетически однородными по проанализированным 11 последовательностям, промежуточными являются штаммы семейства Haarlem и наиболее генетически гетерогенными оказались штаммы группы AI/LAM. Это соответствует картине сполиготипирования представителей данного семейства. Несмотря на то, что семейства AI/LAM и Haarlem оказались генетически гетерогенными, каждое из них характеризуется определённым набором ID-профилей, с явным доминированием одного варианта. Кроме того, следует отметить отсутствие совпадений среди ID-профилей, характерных для разных семейств M. tuberculosis.

В нашей работе был продемонстрирован высокий уровень инсерционноделеционного полиморфизма некоторых областей генома, связанный с транспозициями IS6110 элемента. Чем чаще происходит последовательная передача штамма от человека к человеку и длиннее история циркуляции, тем больше наблюдается транспозиций IS6110 и тем выше степень разнообразия геномов. Исходя из того, что в штаммах семейства AI/LAM выявлено наибольшее разнообразие кодирующих областей генома, связанных с интеграциями транспозона, можно предположить, что представители этого семейства являются эволюционно наиболее древними из трёх проанализированных семейств.

Важное преимущество используемого нами экспериментального подхода в отличие от других методов генотипирования состоит в том, что все используемые нами маркёры являются генами, то есть кодируют белковые продукты, которые в конечном итоге формируют фенотип патогена. Получаемые в ходе ID-типирования профили амплификации, отражающие геномную структуру того или иного микроорганизма, связаны с его фенотипическими чертами, включающими такое важное свойство, как вирулентность. Это открывает широкие возможности для функциональной диагностики M. tuberculosis и позволяет изучать эволюционные отношения между штаммами, базируясь не на чисто генетических, но и на функциональных различиях между ними.

Таким образом, найденные нами дифференциальные нуклеотидные последовательности могут быть использованы для выделения отдельных ветвей внутри уже известных семейств штаммов, то есть для более детальной диагностики, и изучения эволюционных отношений между ними. Профили амплификации, полученные в результате ID-типирования популяции, позволяют проследить за полиморфизмом отдельно взятых генов, потенциальных факторов вирулентности, а также проводить функциональную кластеризацию популяции, опирающуюся на значимые различия между исследуемыми геномами.

1.3. ГЕНОМНОЕ СРАВНЕНИЕ БЛИЗКОРОДСТВЕННЫХ ВИДОВ БАЙКАЛЬСКИХ СИГОВЫХ Байкальский озерный сиг (Coregonus lavaretus baicalensis Dybovsky) - глубоководный бентофаг, обитающий в основном на глубинах 30Ц100 м и нерестящийся в самом озере. Байкальский омуль (C. autumnalis migratorius Georgi) - пелагический планктофаг, обитающий на глубинах до 350Ц400 м. Долгое время по морфологическим признакам этих рыб относили к разным видам. Проведенные недавно анализ вариабельности мтДНК и изоферментный анализ показали близость байкальского омуля к истинным сигам и, прежде всего, к виду C. lavaretus L. Последующий детальный филогеографический анализ структуры мтДНК палеоарктических и неоарктических сиговых, а также генеалогические реконструкции байкальских сиговых позволили сделать окончательный вывод о принадлежности байкальского омуля к виду C. lavaretus (Sukhanova et al, 2004). Таким образом, байкальский омуль и озерный сиг являются ближайшими родственниками, их дивергенция от общего предка произошла всего 10Цтыс. лет назад, по-видимому, в связи с освоением разных трофических ниш. Довольно короткий срок дивергенции байкальского омуля и сига в масштабе эволюционного времени позволяет рассчитывать, что сравнение их геномов может выявить генетические факторы, которые в данном случае играют определяющую роль при дивергенции популяций. Целью нашей работы являлось проведение поиска элементов генома (как кодирующих, так и некодирующих), различных по структуре в геномах омуля и сига.

Для проведения геномного сравнения сига и омуля был выбран метод ПДРФ- вычитающей гибридизации. Структура геномов сиговых неизвестна, однако, по аналогии с Danio rerio и Tetraodon, полногеномные последовательности которых определены ( www.genoscope.cns.fr/externe/tetranew), можно ожидать, что в них присутствует большое количество повторяющихся элементов, которые затрудняют как саму вычитающую гибридизацию, так и последующий анализ полученных клонов. Эту проблему можно преодолеть введением предварительной стадии нормализации сравниваемых фрагментированных геномов, широко используемой в схемах ВГ кДНК. На этой стадии происходит образование быстро ренатурирующей фракции, обогащенной высокопредставленными последовательностями, в случае геномного сравнения - повторяющимися элементами генома. Далее эта фракция удаляется из последующего сравнения. Тем самым, происходит обогащение трейсера низкопредставленными, в том числе кодирующими последовательностями генома.

Помимо стадии нормализации мы также применили методическую идею, используемую в анализе полиморфизма длин рестрикционных фрагментов, полученных с помощью ВГ. Кроме того, чтобы исключить из рассмотрения гетеродуплексы, образованные гомологичными фрагментами близкой длины (и находящимися после электрофоретического разделения в одном пуле), нами введена модификация, заключающаяся в обработке смеси после вычитающей гибридизации нуклеазой золотистой фасоли.

С учетом вышеописанных модификаций нами проведено вычитание пулов геномных фрагментов длиной до 800 п.о. и получена ранжированная библиотека, обогащенная специфическими для сига геномными последовательностями. Клоны библиотеки анализировали методом дифференциальной гибридизации с радиоактивно меченными зондами, приготовленными из продуктов вычитания сигЦомуль и ломуль - сиг. Количество дифференциально гибридизующихся клонов составило 85. Для каждого клона была определена нуклеотидная последовательность и проанализирована с использованием доступных баз данных по программе BLASTn (табл. 3). Ни для одного из проанализированных фрагментов не было найдено существенного сходства с известными кодирующими последовательностями. Большинство дифференциально гибридизующихся клонов содержат фрагмент, идентичный на 84Ц88% внутреннему спейсеру гена 28S pРНК Salvelinus namaycush (клон 26A2, U17965.1).

Среди остальных проанализированных клонов библиотеки два содержат вставку мтДНК, для 11 вставок нет существенной гомологии в банке данных, 14 гомологичны различным некодирующим участкам генов иммунной системы: клеточного рецептора (TCR), IgA, MHC, а также зонадгезинподобного гена (zlg), при этом пять различных фрагментов картируются в интронах гена zlg, а семь - перед первым экзоном в 5'-области.

Геномные ПЦР с олигонуклеотидными праймерами, сконструированными на основе найденных нуклеотидных последовательностей, показали, что ни одна из проанализированных последовательностей не является сигспецифической. По-видимому, они представляют собой следствие мононуклеотидного полиморфизма в сайте узнавания рестрикционной эндонуклеазой, которая использовалась для фрагментирования сравниваемых геномов, что было подтверждено для некоторых найденных при вычитании фрагментов.

Табл. 3. Результаты сравнения геномных фрагментов сига, полученных в результате вычитания, с геномными последовательностями различных организмов.

Длина участка клонированного Положение в геноме Номер Сходство с аннотированными геномными фрагмента, идентичная геномной (локализация относительно гена) клона последовательностями последовательности, %;

(в скобках приведен процент гомологии) 31, 20 O. mykiss, локус IgH.A (AY872257.1) 100 (88) интрон O. mykiss, район гена MHC класса Ia (AB162342.1) 99 (87) ~8 т.п.о. от последнего экзона 100, 21 S. salar, ген зонадгезинподобного белка (AY785950.1) 99 (90) ~100 т.п.о. до 1-го экзона S. salar, ген CD3 гаммадельта-A (EF421418.1) 98 (86) интрон 75, 82, 86, S. salar, ген зонадгезинподобного белка, (AY785950.1) 28Ц97 (76Ц94) интроны 84, S. salar, клон 249L01, TCR-альфа/дельта локус 94-99 (76Ц86) интроны (EF467299.1) 30, 26, 29, S. salar, клон 15J19 TCR-альфа/дельта локус 62 (88) интроны 32, 27 (EF467295.1) 63 (86) интроны S. salar, ген зонадгезинподобного белка, (AY785950.1) 25 O. tshawytscha, ген инсулин-подобного фактора роста I 90 (90) интрон (IGF-I.1), (AY100012.1) S. salar, ген интерферона альфа 1 (IFNA1), 90 (88) интрон (DQ354152.1) 51 клон Salvelinus namaycush, клон 26A2, ген 28S рРНК 23Ц25 (84Ц88) внутренний транскрибируемый (U17965.1) спейсер, ITS 76, 14 C. lavaretus, митохондриальная ДНК (AB034824.1) 48 (97) митохондриальная ДНК 11 клонов Danio rerio, различные геномные последовательности 13Ц24 (91Ц98) некодирующие участки.

В полученной библиотеке более половины отобранных дифференциальных фрагментов имеют участки, гомологичные внутренним транскрибируемым спейсерам (ITS) генов 28S pРНК. Действительно, ITS-участки отличаются своей полиморфностью, а межвидовые различия по размеру транскрипционной единицы pРНК обуславливаются различиями в длине спейсерных участков.

15% найденных дифференциальных фрагментов обладают высокой степенью сходства с некодирующими участками генов иммунной системы (TCR, MHC, IgA) и зонадгезинподобного гена (zlg). Функция последнего неизвестна, однако на основании того, что он экспрессируется преимущественно в кишечнике рыб и обладает значительной гомологией с генами иммунной системы слизистой кишечника (например, с FCGBP и с геном муцина), можно предполагать его участие в формировании иммунитета рыб. Известно, что генам иммунной системы свойственны частые перестройки и большая вариабельность. В нашем случае все найденные ПДРФ располагаются в некодирующих областях гена. В 5'- и 3'UTR-областях zlg, занимающих до 90% длины локуса, возможно, расположено множество регуляторных элементов, мутации в которых способны изменять уровень транскрипции гена.

Следует отметить одну отличительную особенность найденных нами геномных фрагментов сига, картированных вблизи генов иммунной системы. Почти все они имеют участки (9Ц37% длины фрагмента), которые на 65Ц85% сходны с широко распространенными среди рыб Тс1-подобными транспозонами (у лососевых - это 5% генома). С одной стороны, известно, что у рыб эти мобильные элементы нередко экспрессируются, а после встраивания их в геном происходит быстрое накопление мутаций (Krasnov et al, 2005). С другой стороны, существует немало доказательств участия некодирующих РНК-мобильных элементов в регуляции экспрессии генов на разных уровнях.

Известно, что экспрессия Тс1-подобных мобильных элементов особенно активируется при внешних стрессовых стимулах. Возможно, что и в случае байкальских сига и омуля транспозонные последовательности играют определенную роль в активности найденных генов иммунной системы. Не исключено, что высокая фенотипическая пластичность сиговых (и вообще рыб) отчасти обеспечивается активностью многочисленных транспозонных копий в их геноме, особенно при активации их в стрессовых условиях окружающей среды, например, при резком похолодании.

В целом, полученные нами данные свидетельствуют о малых различиях в геномах сига и омуля. Это может свидетельствовать о том, что, как предполагается в настоящее время, омуль и сиг образуют две субпопуляции одного вида. Дивергенция этих популяций, по-видимому, может идти по пути регуляторной эволюции, то есть сравнительно малых изменений в регуляторных системах организма, которые, тем не менее, обуславливают значительные различия в уровнях и тканеспецифичности экспрессии генов. Вероятно в рассматриваемом нами случае пары близкородственных сиговых транскрипционная дивергенция, обусловленная однонуклеотидными заменами и короткими делециями/инсерциями в геномной ДНК, между изолированными популяциями возникает быстрее, чем масштабная дивергенция на геномном уровне.

2. МЕТОД КЛОНИРОВАНИЯ ИДЕНТИЧНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ - ОТБОР ИЗ СЛОЖНЫХ СМЕСЕЙ ПОСЛЕДОВАТЕЛЬНОСТЕЙ С ЗАДАННЫМИ СВОЙСТВАМИ В основе разработанного нами метода лежит принцип клонирования идентичных последовательностей (Coincidence Cloning, СС), заключающийся в отборе фрагментов с одинаковыми нуклеотидными последовательностями, принадлежащими двум разным образцам. Применявшиеся ранее методы основанные на использовании этого принципа оказались низкоэффективны из-за высокого фона и не получили широкого распространения (Devon and Brookes, 1996). Для решения этой проблемы мы использовали эффект селективной супрессии ПЦР (Selection Suppression of PCR, SSP (Diatchenko et al, 1996)). На рис. 2 представлена общая схема метода.

На первом этапе к двум наборам фрагментов ДНК лигируют разные по структуре супрессионные одноцепочечные адаптеры. После денатурации образцов и в процессе их последующей совместной ренатурации совпадающие последовательности способны к образованию гибридных дуплексов, содержащих на 5'-концах два разных адаптера и поэтому экспоненциально амплифицирующихся в ходе дальнейшей ПЦР. Молекулы ДНК, уникальные для одного из исходных наборов, образуют только гомодуплексы, которые имеют на концах одинаковые адаптеры и поэтому в силу эффекта SSP не способны к экспоненциальной амплификации.

ОБРАЗЕ - ОБРАЗЕ - ЛИГИРОВАНИЕ СУПРЕССИОННЫХ АДАПТЕРОВ ДЕНАТУРАЦИЯ СОВМЕСТНАЯ РЕНАТУРАЦИЯ ДОСТРОЙКА 3Т-КОНЦОВ СУПРЕССИЯ ПЦР ПЦР СУПРЕССИЯ ПЦР ЭКСПОНЕНЦИАЛЬНАЯ АМПЛИФИКАЦИЯ Рис. 2. Схема процедуры клонирования идентичных последовательностей (Coincidence Cloning, СС), основанной на эффекте селективной супрессии полимеразной цепной реакции. Фрагменты, уникальные для каждого из исходных наборов, изображены пунктирными или штрих-пунктирными линиями, общие фрагменты - сплошными линиями.

Два типа супрессионных адаптеров показаны в виде черных или белых прямоугольников;

последовательности, комплементарные им, обозначены как заштрихованные прямоугольники соответствующего цвета.

2.1 МЕТОД COINCIDENCE CLONING (КЛОНИРОВАНИЕ ИДЕНТИЧНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ) ДЛЯ АНАЛИЗА ТКАНЕСПЕЦИФИЧЕСКОГО МЕТИЛИРОВАНИЯ ПРОТЯЖЕННЫХ ГЕНОМНЫХ ЛОКУСОВ В качестве образцов для совместной гибридизации используются геномная ДНК из определенной ткани, фрагментированная с учетом тканеспецифического метилирования, и геномный локус, представленный набором клонированных последовательностей.

2.1.1. Картирование неметилированных CpG-сайтов Для картирования неметилированных CpG-сайтов на стадии подготовки образцов к СС проводится рестрикция геномной ДНК метилчувствительной эндонуклеазой (HpaII, сайты Клонированная ДНК, гомологичная Геномная ДНК изучаемому локусу Метилирована Неметилирована Рестрикция метилчувствительной рестриктазой Получение фрагментов, несущих на концах неметилированный сайт Совместная денатурация и ренатурация Амплификация фрагментов, принадлежащих изучаемому локусу и содержащих на одном из концов CpG-сайт, неметилированный в геноме. Клонирование, создание библиотеки.

Рис. 3. Схема модификации метода Coincidence Cloning для анализа распределения неметилированных CpG сайтов. Пунктирными линиями обозначены последовательности ДНК, специфичные для каждого из образцов. Сплошными линиями обозначены последовательности, общие для обоих образцов. Знаком обозначены неметилированные сайты.

узнавания CCGG). Также использовался частощепящий фермент AluI, рестрикция которым позволяет получить набор фрагментов длиной не более 1,5 тыс. п.о. (подобный диапазон длин является оптимальным для проведения последующих процедур ПЦР- амплификации). На рис. 3 представлена общая схема этой модификации метода.

Для контроля эффективности разработанного метода было оценено обогащение некоторых геномных фрагментов, расположенных в неметилированных областях До CC После CC 15 18 21 24 27 30 15 18 21 24 27 Рис. 4. Электрофоретическое А. COX7A1 (1) разделение продуктов ПЦР, полученных с использованием праймеров, специфичных к HpaIIAluI фрагментам, расположенным в B. COX7A1 (2) конститутивно неметилированных локусах.

Матрицы: до СС - смесь AluI - HpaII фрагментов, после СС - C.CKAPпродукты амплификации после СС.

Праймеры специфичные к CpGостровкам в промоторных областях генов COX7A1 (А и В) и CKAP1 (С).

исследуемого локуса (CpG-островки в промоторных областях генов домашнего хозяйства) COX7A1 (регуляторная субъединица цитохромоксидазы митохондрий) и CKAP1 (цитоскелет ассоциированный белок). Для оценки обогащения выбранных участков, достигаемого в СС, были проведены ПЦР со специфичными праймерами, в качестве матриц использовали набор HpaII-AluI геномных фрагментов и амплификат после СС. Три примера амплификации представлены на рис. 4. Число циклов ПЦР, необходимых для детекции продукта в смеси после СС, на 15 меньше, чем в случае образца до СС. Таким образом, достигнуто обогащение в не менее чем 104 раз, т. е. близкое к максимально возможному.

Для картирования найденных неметилированных CpG-сайтов и определения их положения относительно охарактеризованных генов, EST, повторяющихся элементов и CpGостровков использовалась база данных сервера UCSC Human Genome Browser ( Для статистической обработки информации, полученной после скрининга библиотеки, и для графического изображения паттерна метилирования был применен специальный пакет программ, разработанный Гайнетдиновым И.В.

2.1.2. Картирование гиперметилированных последовательностей В другой модификации метода для отбора геномных последовательностей, обогащенных CpG-метилированными сайтами, используется аффинная хроматография на колонке с иммобилизованным метилсвязывающим белком. На рис. 5 представлена схема этой модификации метода.

Геномная ДНК Клонированная ДНК, Метилирована гомологичная изучаемому локусу Неметилирована.

Рестрикция MseI Использование MBD-колонки для получения фракции гиперметилированных геномных фрагментов.

Совместная денатурация и ренатурация Амплификация фрагментов, принадлежащих изучаемому локусу ДНК и гиперметилированных в геноме. Клонирование, создание библиотеки.

Рис. 5. Схема модификации метода Coincidence Cloning для анализа распределения метилированных последовательностей. Пунктирными линиями обозначены последовательности ДНК, специфичные для каждого из образцов. Сплошными линиями обозначены последовательности, общие для обоих образцов. Знаком обозначены метилированные сайты.

0, 0,0,0,0,0,Рис. 6. Сравнение распределения неметилированных сайтов CCGG и гиперметилированных последовательностей в локусе 19 хромосомы FXYD4-COX7A1 для нормальной и опухолевой тканей яичка. Графики плотности распределения неметилированных сайтов (ось Y) для ДНК нормальной (серого цвета) и опухолевой (черного цвета) тканей относительно координат локуса FXYD4-COX7A1 (ось X). Под графиками дано схематическое изображение распределения генов (горизонтальные стрелки) локуса; вертикальными стрелками отмечены координаты картированных гиперметилированных последовательностей, серыми стрелками для нормальной ткани и черными стрелками для опухолевой ткани.

Геномную ДНК гидролизовали эндонуклеазой рестрикции Mse I. Сайт узнавания этого фермента ТТАА встречается в геномной ДНК человека со средней частотой 1 на 100Ц2п.о., однако в случае GpG-островков эта частота уменьшается до 1 на 1 000 п.о.

Полученный набор Mse I-фрагментов геномной ДНК фракционировали на аффинной колонке для получения фракции, максимально обогащенной метил-CpG-содержащими фрагментами. Для этого в качестве аффинного агента в колонке был использован белок, содержащей метил-CpG-связывающий домен белка MeCP2 крысы (MBD-домен). Работа по созданию MBD колонки и фракционированию геномной ДНК была проведена в группе мембранных биоэнергетических систем Р. Дмитриевым под руководством д.х.н. М.И.

Шахпаронова.

Обе разработанные модификации были применены для исследования метилирования локуса 19-ой хромосомы человека FXYD5 ЦCOX7A1 длиной 1,02 млн п.о. для образцов семиномы и нормальной паренхимы яичка, полученных от одного пациента.

На рис. 6 представлено графическое распределение плотности неметилированных сайтов CCGG и картирование гиперметилированных последовательностей в локусе FXYD5 - COX7A1 19-ой хромосомы для образцов ДНК нормальной и опухолевой тканей яичка, полученные описанными выше двумя модификациями метода. Как видно, в ДНК обеих тканей неметилированные сайты неравномерно распределены по всему локусу и группируются в определенных местах, т.е. наблюдается их кластеризация. Найденные гиперметилированные последовательности находятся в областях с низкой плотностью неметилированных сайтов.

2.2. RAPID IDENTIFICATION OF GENOMIC SPLITS (RIDGES) - МЕТОД БЫСТРОГО КАРТИРОВАНИЯ САЙТОВ РАСЩЕПЛЕНИЯ ГЕНОМА Для получения подробных тканеспецифических карт распределения неметилированных сайтов для протяженных локусов необходим значительный объем секвенирования. Нами разработан метод, позволяющий минимизировать затраты на секвенирование и картирование большого количества сайтов расщепления генома (в нашем случае - неметилированных CG в составе рестриктных сайтов). Для этого используются эндонуклеазы рестрикции IIS-типа, вносящие разрыв в ДНК на некотором отдалении от сайта узнавания. Искусственное введение последовательности узнавания такой эндонуклеазы около картируемого сайта геномного расщепления осуществляется посредством лигирования нуклеотидного адаптера (рис. 7).

Последующая обработка полноразмерных фрагментов этой эндонуклеазой приводит к образованию тагов. Эти короткие участки являются репрезентативными, поскольку получены однотипно, а их нуклеотидная последовательность является достаточной для однозначного картирования. Длина их определяется выбором используемого фермента IIS типа, и в нашем случае была использована эндонуклеаза MmeI, вносящая разрыв через п.о. от своего сайта узнавания.

Конкатамеризация тагов и последующее секвенирование полученных конкатамерных молекул позволяет получить информацию о сайтах расщепления генома при существенно меньших материальных и временных затратах на секвенирование Полученная в результате проведения СС смесь представляла из себя набор AluI-HpaII рестриктных фрагментов, фланкированных с двух сторон адаптерами А (фланкирующий сайт AluI) и Б (фланкирующий сайт HpaII) (рис. 8, структура I). Для введения последовательности узнавания эндонуклеазы IIS-типа в непосредственной близи от исследуемого сайта HpaII полученные фрагменты гидролизовали эндонуклеазой HpaII (рис.

8, 1), затем смесь делили на две части и к образованному липкому концу лигировали адаптеры ВД и ГД (рис. 8, 2; адаптеры содержат общую (Д) 5'-последовательность, а также сайт MmeI на 3'-конце). Для удобства дальнейшей работы проводили амплификацию продукта лигирования (рис. 8, структура II) с праймерами, идентичными последовательностям лигированных адаптеров (рис. 8, 3). После обработки амплификата эндонуклеазой MmeI (рис. 8, 4) образовавшиеся 60-ти звенные нуклеотидные фрагменты (рис. 8, структура III) изолировали с помощью ПААГ-электрофореза (рис. 8, 5), а затем смешивали друг с другом и проводили лигирование (рис. 8, 6). При этом образовывались Рис. 7. Схематическое изображение принципиальных стадий конкатамеризации фрагменты (рис. 8, IV), содержащие лигированные хвост к хвосту таги и различающиеся на концах адаптерные последовательности.

Эти фрагменты амплифицировали в два этапа: сначала с праймерами, идентичными внешней части адаптеров Д, а затем внутренней В и Г (рис. 8, 7). Стадия образования димеров (рис. 8, структура IV) вводится для последующего выявления артефактов ПЦР- селекции: поскольку вероятность образования двух идентичных димеров в силу статистических закономерностей чрезвычайно низка, то появление их объясняется именно этим эффектом, по этой причине повторяющиеся последовательности удаляются из последующего анализа. Для избавления от адаптерных последовательностей амплификат гидролизовали эндонуклеазой HpaII. Целевые таги длиной 21 п.о. выделяли в полиакриламидном геле в виде димеров (рис. 8, V), после чего для образования конкатамеров (рис. 8, VI) полученные димеры лигировали друг с другом (рис. 8, 9).

Для последующего клонирования к образовавшимся конкатамерам лигировали адаптер, лигазную смесь амплифицировали с праймером, идентичным адаптеру. Для удобства последующего секвенирования клонов в дальнейший анализ отбирали фракцию конкатамеров длиной не более 600 п.о. Эту фракцию конкатамерных молекул лигировали в вектор и клонировали.

Рис. 8. Схема метода RIDGES. ДНК обозначена горизонтальными линиями и стрелками.

Сайты узнавания рестрикционных эндонуклеаз - вертикальными линиями, адаптерные последовательности А, Б, В, Г, Д - прямоугольниками. 1Ц9 - стадии эксперимента, IЦVI - промежуточные продукты.

В результате определения нуклеотидной последовательности клонированных конкатамеров полностью подтвердилась их структура - 21-нуклеотидные таги, перемежающиеся CCGG - сайтом узнавания эндонуклеазы HpaII (структура VI на рис 8).

2.3. КОМПЬЮТЕРНАЯ АВТОМАТИЗАЦИЯ ОБРАБОТКИ ПОЛУЧАЕМЫХ РЕЗУЛЬТАТОВ И ИХ КАРТИРОВАНИЯ (совместно с Гайнетдиновым И.В.) Обработка результатов секвенирования конкатамеров и дальнейшее картирование неметилированных сайтов HpaII вручную является крайне трудоемким. По этой причине было создано компьютерное программное обеспечение, автоматизирующее обработку результатов эксперимента. Основные этапы обработки результатов представлены на рис. 9.

2.3.1. Извлечение набора тагов из конкатамеров Формирование списка всех 21-нуклеотидных тагов, полученных в результате секвенирования конкатамеров, производится в результате следующих пошаговых операций:

- поиск димеров в нуклеотидной последовательности конкатамеров с учетом максимальной и минимальной длины: димеры, образующиеся из тагов, могут иметь не только каноническую длину, но и большую, как результат ошибок при лигировании и ПЦР;

- удаление из полученного списка совпадающих по нуклеотидной последовательности димеров (появление их в результатах крайне маловероятно в силу статистической закономерности образования димеров и объясняется ПЦР-селекцией);

- выделение из димеров отдельных тагов, а также их одинаковая ориентация относительно разграничивающего сайта (для наглядности и удобства последующей обработки);

2.3.2. Создание базы данных всех присутствующих в исследуемом локусе 21нуклеотидных тагов, фланкирующих сайты HpaII Получаемый в конечном итоге набор коротких 21-нуклеотидных тагов необходимо однозначно картировать по длине исследуемого участка генома. Для этого требуется предварительно создать базу всех возможных имеющихся в локусе репрезентативных фрагментов, что осуществляется следующим образом:

- поиск в последовательности исследуемого отрезка генома всех картируемых сайтов (5'CCGG-3', содержащиеся в AluI-HpaII; параметр можно изменять в зависимости от используемой метилчувствительной эндонуклеазы);

- вычленение 21-звенных тагов, фланкирующих картируемый CCGG с обеих сторон;

- исключение из конечной базы 21-звенных тагов, которые нельзя однозначно картировать.

Как правило, это таги, расположенные в повторяющихся элементах генома.

Был проведен предварительный статистический расчет картируемости 21- звенных тагов, содержащих сайт эндонуклеазы HpaII, в локусе D19S208-COX7A1. Согласно полученным результатам около 12% всех присутствующих в локусе CCGG-сайтов невозможно картировать из-за вырожденности содержащих их тагов. Эта сравнительно небольшая фракция принадлежит, в основном, не функционально значимым, а высокоповторяющимся элементам генома, главным образом, SINE, то есть особого интереса для исследователей не представляет.

Сохраненные в текстовом файле формата FASTA результаты содержат набор полученных последовательностей. В заголовке каждой из них указан порядковый номер картируемого сайта и его относительная координата по длине исследуемого локуса генома.

2.3.3. Картирование полученных экспериментально тагов по базе данных тагов исследуемого локуса Поиск в построенной общей базе тагов исследуемого локуса тех тагов, которые содержатся в результатах реального эксперимента, производится путем сравнивания этих баз данных с помощью алгоритма BLAST, что позволяет получить относительные координаты всех картированных в эксперименте сайтов по длине исследуемого локуса генома.

Конечный результат (список) сохраняется в обычном текстовом файле с суммированными данными (с указанием общего количества точных и неточных совпадений).

2.3.4. Визуализация результатов картирования Финальным этапом любого метода является функциональный анализ полученных в ходе эксперимента результатов. В силу очевидно большого объема последних эта стадия представляется довольно сложной без выработки определенных подходов к ее решению.

Одним из таких подходов является графическая визуализация местоположения каждого картированного неметилированного сайта относительно кодирующих и регуляторных последовательностей, а также различных повторяющихся элементов исследуемого геномного локуса. За основу для реализации данной задачи был использован Геномный Браузер (UCSC Genome Browser, сервер Университета Санта-Круз, США, Для интеграции в удобный графический интерфейс Геномного Браузера данных о картированных неметилированных сайтах HpaII подготавливается файл специального формата. Кроме непосредственного отображения всех картированных сайтов имеется также возможность указания степени повторяемости каждого из них в результатах эксперимента.

2.3.5. Нормализация и последующая визуализация нормализованных результатов Как уже было указано выше, новый экспериментальный подход дает в качестве результата набор неметилированных сайтов исследуемого локуса. Однако распределение CpGдинуклеотидов в составе CCGG-сайта в геноме неравномерно и отсутствие экспериментально найденных сайтов в каких-либо участках генома может отражать всего лишь отсутствие возможности картировать сайты в этих участках. Таким образом, для правильной интерпретации результатов необходимо нормализовать их перед отображением.

Одним из способов нормализации является подсчет отношения количества сайтов, картированных в результате эксперимента, к общему количеству всех сайтов, которые можно картировать с помощью RIDGES. Подсчет этого отношения ведется внутри отрезков, содержащих равное количество последних, и отображается в соответствующем масштабе. В данном случае при отображении масштаб физической карты и получаемой карты нормализованной плотности метилированности совпадать не будут. Однако для удобства интерпретации результатов приводятся в соответствие: с помощью соединяющих их линий обозначаются общие границы отрезков, внутри которых проводится подсчет нормализованной степени метилированности. Степень метилированности каждого отрезка изображается в виде столбца соответствующей высоты.

Таким образом, для обработки и визуализации получаемых результатов был создан комплексный программный продукт с простым интерфейсом, осуществляющий все необходимые операции.

Рис. 9 Схема компьютерной обработки данных, полученных в результате секвенирования конкатамеров 2.4 АНАЛИЗ РАСПРЕДЕЛЕНИЯ МЕТИЛИРОВАНИЯ ЛОКУСА FXYD5 - COX7A1 (Chr 19) В НОРМАЛЬНОЙ И ОПУХОЛЕВОЙ ТКАНЯХ ЛЕГКОГО И КЛЕТОЧНОЙ ЛИНИИ А549 (КАРЦИНОМА ЛЕГКОГО) Разработанный нами метод был использован при исследовании метилирования локуса 19-ой хромосомы FXYD5ЦCOX7A1 для ДНК нормальной и опухолевой тканей легкого пациента с диагнозом плоскоклеточный рак легкого III стадии и ДНК клеточной линии А5(карцинома легкого). Для всех трех образцов анализировалось распределение неметилированных сайтов CCGG. Для ДНК нормальной ткани легкого в исследуемом локусе было картировано 429 неметилированных сайтов, для ДНК опухолевой ткани легкого - 352 и для ДНК клеточной линии А549 Ц165. На основании повторяемости клонов в клонотеках неметилированных фрагментов был сделан вывод о том, что такое количество найденных сайтов является достаточным для достоверного описания метилирования данного локуса в трех тканях. На рис. 10 показано распределение найденных неметилированных CCGG- сайтов, картированных с использованием геномного браузера UCSC Human Genome Browser (

Также для анализа использовался метод графического представления результатов, учитывающий неравномерность распределения CpG-сайтов в геноме - гистограмма плотности неметилированных сайтов CCGG относительно распределения всех сайтов ССGG (рис. 11). Анализ карт распределения неметилированных сайтов и их гистограмм показывает схожесть распределения метилирования для нормальной и опухолевой тканей легкого. Во всех трех случаях наблюдается ярко выраженная кластеризация неметилированных сайтов.

Несмотря на существующее мнение о тенденции гипометилирования кодирующих последовательностей генов (Antequera, 2003), полученные результаты демонстрируют, что в ДНК обеих тканей гипометилированные области находятся как в богатых генами участках, так и в обедненных (например, участок локуса с условными координатами 0,3 - 0,35, рис.

11). С другой стороны, выявлено гиперметилирование генбогатых участков (участок 0,67 - 0,7). Возможным объяснением этого явления может быть существование еще неизвестных генов или же регуляторных cis-элементов, контролирующих удаленные гены.

Сравнение полученных результатов демонстрирует схожесть распределения метилирования для нормальной и опухолевой тканей легкого, в то время как распределение метилирования в клеточной линии А549 отличается от исследованных тканей.

Рис. 10 Распределение неметилированных сайтов в локусе FXYD5ЦCOX7A1 в ДНК образцов нормальной и опухолевой тканей (плоскоклеточный рак легкого) и клеточной линии А549. На выноске приведен участок локуса с аномальным метилированием в клеточной линии А549.

Самое существенное отличие линии А549 - наличие трех расположенных рядом участков, каждый из которых имеет длину около 30 тыс п.о. (см. выноску на рис. 10). Два района, ограниченные генами USF2ЦMAG и FFAR3ЦFFAR2, являются гиперметилированными и фланкируют гипометилированный участок, ограниченный генами CD22ЦFFAR1. Подтверждение разницы в уровне метилирования между двумя районами USF2ЦMAG и CD22ЦFFAR1 было сделано с применением гибридизации по Саузерну.

Гиперметилированность участка USF2ЦMAG была также подтверждена результатами бисульфитного секвенирования некоторых фрагментов данного участка локуса*.

2.5. ИССЛЕДОВАНИЕ ВЗАИМОСВЯЗИ ТРАНСКРИПЦИИ, СТРУКТУРЫ ХРОМАТИНА И МЕТИЛИРОВАНИЯ ПРОМОТОРНОЙ ОБЛАСТИ ГЕНОВ MAG И HAMP В КЛЕТОЧНОЙ ЛИНИИ А5При анализе распределения неметилированных CpG сайтов в 1Mb локуса 19-ой хромосомы FXYD5 ЦCOX7A1 в клеточной линии А549 (карцинома легкого) было найдено аномальное гиперметилирование протяженного, около 30 тыс. п.о., генсодержащего участка.

В этом участке находятся гены MAG и HAMP, для которых известно, что их экспрессия высоко тканеспецифична. В исследованных нами тканях (нормальная и опухолевая ткани легких) и клеточной линии А549 уровень метилирования локуса MAG-HAMP различен, в тканях этот участок существенно менее метилирован, чем в клеточной линии. При этом * Результаты гибридизации и секвенирования приведены в диссертации транскрипция во всех трех образцах практически не детектируется, то есть отсутствует корреляция между транскрипцией этих генов и статусом метилирования локуса, в котором они расположены. Более того, уменьшение уровня метилирования при выращивании клеточной линии в присутствии 5-азадезоксицитидина (5-Aza-dC) не приводит к какомулибо существенному увеличению уровня транскрипции (рис. 12).

Известно, что в ряде случаев понижение уровня метилирования оказывается непосредственным или опосредованным фактором в активации транскрипции генов. Но, с другой стороны, полногеномный анализ влияния деметилирующих агентов и эффекта инактивации метилтрансфераз показывает, что они оказывают различное действие на разные группы генов, активируя часть из них и не изменяя или даже понижая транскрипцию других (Gius et al., 2004). Одна из гипотез объясняет этот двойственный эффект деметилирования зависимостью изменения активности генов от региональных особенностей структуры локализованного рядом с ними хроматина. Известны случаи, когда неметилированные молчащие гены активировались под действием ингибитора деацетилаз гистонов трихлорстатина А (TSA) (Hitchins et al, 2007).

Анализ состояния хроматина, проведенный для участков 5'-области генов MAG и HAMP, показал, что только дополнительное к деметилированию ДНК ингибирование деацетилирования гистонов приводит к ощутимому повышению активного состояния хроматина и транскрипционной активности этих генов (рис. 12). Однако, уровень транскрипции, достигаемый в линии, обработанной 5-Aza-dC и TSA одновременно, различается для MAG и HAMP почти в 3 раза, при том что уровень ацетилирования гистона H3К9 примерно одинаков. Ранее в гене MAG были картированы 2 сайта связывания транскрипционного фактора CTCF (Vetchinova et al, 2006), один из которых расположен в первом интроне гена, а второй - в третьем интроне, непосредственно перед CpG-островком.

Известно, что метилирование блокирует связывание CTCF с ДНК (Mukhopadhyay et al, 2004), поэтому можно предположить, что в случае MAG (в отличие от HAMP) снятие метилирования приводит к связыванию CTCF со своими сайтами, расположенными в гене MAG, и последующей репрессии транскрипции. Подобный механизм подавления транскрипции был описан, например, для гена hTERT (Renaud et al, 2007).

A B Рис. 12. А) Анализ уровня транскрипции генов MAG, HAMP методом ОТ-ПЦР в режиме реального времени. В) Анализ уровня ацетилирования H3K9, ассоциированного с генами MAG, HAMP методом иммунопреципитации хроматина и ПЦР в режиме реального времени.

Представленные результаты получены в трех независимых экспериментах. Данные представлены для 4-образцов клеточной линии А549: 1) выращенного в стандартных условиях (контрольный образец), 2) в присутствии 5-Aza-dC, 3) в присутствии TSA и 4) при совместном действии 5-Aza-dC и TSA Гликопротеин, ассоциированный с миелином, кодируемый геном MAG, - чрезвычайно специализированный белок, экспрессирующийся преимущественно в нервных тканях. Известно, что по мере дифференцировки и созревания олигодендритов крысы происходит повышение уровня транскрипции, которое сопровождается постепенным деметилированием CpG-сайтов промоторной области (Grubinska et al, 1994; Laszkiewicz et al, 1997). CpG-сайты, расположенные в самом гене, сохраняют свой уровень метилирования.

Таким образом, наши данные в сочетании с этими могут указывать на то, что активная экспрессия гена MAG происходит при деметилировании промоторной области и сохранении метилирования CpG-сайтов, расположенных внутри гена.

2.5. АНАЛИЗ БАКТЕРИАЛЬНОГО ТРАНСКРИПТОМА ВНУТРИКЛЕТОЧНЫХ ПАТОГЕНОВ IN VIVO Анализ специфической экспрессии генов патогенов (микроорганизмов и простейших) в инфицированном организме представляет собой широко распространенную задачу как в исследовательских лабораториях, где он нацелен на получение данных о взаимодействиях организма и патогена, так и, в перспективе, в клинике, где сведения о качественном и количественном содержании различных РНК патогена могут служить средством диагностики и прогноза течения болезни. Однако анализ транскриптома патогенной бактерии в непосредственной инфекционной среде - пораженной ткани существующими методами затруднен из-за сложностей, связанных с выделением бактериальной РНК, ее чрезвычайно малого количества и проблемы отделения бактериальной РНК от подавляющего количества тотальной РНК хозяина, в то время как изучение генной экспрессии бактерий при их выращивании в жидкой среде и имитации реальных условий инфекции не отражает реальной картины, возникающей при развитии болезни.

Мы применили разработанный нами метод Coincidence Cloning для извлечения кДНК бактериального патогена из смеси с кДНК мыши. В качестве модели была использована модель инфекции мышей линии A/Sn штаммом M. tuberculosis H37Rv на 9-ой неделе заражения, то есть модель хронической фазы микобактериальной инфекции (предоставлена А.С. Аптом, ЦНИИ Туберкулеза РАМН). В качестве двух образцов ДНК (рис. 2) использовали суммарную кДНК, синтезированную на основе тотальной РНК, выделенной из ткани легкого инфицированной мыши и геномную ДНК M. tuberculosis H37Rv. Оба образца ДНК были предварительно гидролизованы частощепящей рестриктазой RsaI. К двум наборам RsaI фрагментов лигировали супрессионные одноцепочечные адаптеры.

Полученные наборы фрагментов геномной ДНК и кДНК смешивали в равном весовом соотношении. Поскольку, по разным оценкам, содержание РНК M. tuberculosis в тотальной РНК, выделяемой из пораженного легкого, составляет менее 0,2% (Banaie et al, 2006), молярное соотношение микобактериальной геномной и кДНК в смеси составляет не менее 100 : 1. Такое избыточное количество геномной ДНК позволяет сохранить различную представленность микобактериальных транскриптов.

В результате проведения двух раундов селективной ПЦР был получен ампликон, обогащенный фрагментами бактериальной кДНК. Высокая степень обогащения клонированного ампликона подтверждена результатами сиквенса выборки из 70 клонов:

ишь 24% вставок обнаружили (фрагментарную) гомологию с мышиными транскриптами, а 76% вставок оказались идентичны по нуклеотидным последовательностям различным участкам генома M. tuberculosis H37Rv. Наличие разнотипных супрессионных адаптеров на противоположных концах вставок всех микобактериальных клонов свидетельствует о транскрибируемости найденных последовательностей M. tuberculosis в зараженных мышиных клетках.

Сравнительную оценку содержания различных типов транскриптов в исходном образце кДНК и в результирующем СС ампликоне провели для 16 генов M. tuberculosis методом полуколичественного ПЦР-анализа кДНК. Анализ выявил три группы транскриптов: слабо транскрибируемые гены (6 из 16) не детектируются в исходном образце, но достоверно представлены (28-39 цикл ПЦР) в ампликоне; умеренно- (5 генов, детектируемых на 35-36 циклах ПЦР для образца кДНК и 8-20 циклах для ампликона) и средне- (5 генов, детектируемых на 39-40 и 22-28 циклах соответственно) транскрибируемые гены приблизительно сохраняют соотношение представленности в обоих сравниваемых образцах. Таким образом, продемонстрировано, что процедура СС в целом сохраняет не только качественный, но и количественный профиль транскриптома, кроме того, чувствительность метода позволяет анализировать даже самые низкопредставленные- транскрипты (на примерах транскриптов, не детектируемых в образце кДНК).

Масштабный анализ полученного ампликона проводился проведено методом параллельного пиросеквинирования с использованием геномного анализатора GS FLX (Roche) в Центре Биоинженерии РАНЖ. Нуклеотидные последовательности были определены в 98 692 независимых реакциях. 75 436 последовательностей (76,4 %) имели гомологию с последовательностью генома M. tuberculosis. Таким образом, в результате СС произошло обогащение бактериальной кДНК более чем в 1 000 раз.

2.5.1. Анализ транскриптов M. tuberculosis, транскрибирующихся в мышиной легочной ткани В результате секвенирования получена информация о транскрипции 536 генов, что составляет около 14% от общего количества белоккодирующих генов (Приложение к диссертации). Такое небольшое количество транскрибирующихся генов можно объяснить недостаточным объемом секвенирования, что приводит к потере информации о Ж Список транскрибирующихся генов с указанием количества транскриптов приведен в Приложении к диссертации низкопредставленных транскриптах, однако, возможно, таким образом, проявляется факт общего уменьшения количества транскрибирующихся последовательностей при хронизации инфекции. Согласно (Talaat et al, 2007) и (Sohaskey, 2008) в хронической фазе туберкулеза происходит снижение общего уровня синтеза белка и РНК.

Из-за высокой степени идентичности нуклеотидной последовательности генов транспозаз не удалось провести однозначное отнесение фрагментов кДНК к генам этой функциональной категории (insertion sequences and phages), которую не учитывали в дальнейшем анализе транскриптома.

Гены, для которых были найдены кДНК, были отнесены к основным биохимическим категориям согласно ( и определена доля транскрибирующихся генов в каждой категории. Для большинства категорий доля транскрибирующихся генов не отличается достоверно от среднего по геному (табл. 4).

Исключение составляет категория генов липидного метаболизма.

Табл. 4. Аннотация транскрибирующихся генов к биохимическим категориям.

Категория Всего ( TubercuList) генов экспрессируется % 0 virulence, detoxification, adaptation 111 16 14,1 lipid metabolism 226 49 21,2 information pathways 223 26 11,3 cell wall and cell processes 698 105 15,6 PE/PPE 131 17 12,intermediary metabolism and 7 respiration 869 131 15,8 Unknown 242 29 12,9 regulatory proteins 184 23 12,10 conserved hypotheticals 1018 138 13,conserved hypotheticals with an 16 orthologue in M. bovis 32 2 6,З TOTAL 3734 536 14,При анализе генов M. tuberculosis, транскрибирующихся в легких инфицированной мыши, наибольший интерес вызывают следующие группы:

Гены липидного метаболизма. Существенно увеличено количество генов, вовлеченных в липидный метаболизм (экспрессируются 49 из 226 генов), при этом экспрессируются как компоненты каскадов биосинтеза жирных кислот (например 9 из 34 генов семейства fadD, кодирующих ацил-КоА-синтетазы), так и их деградации (10 из 33 генов fadЕ, кодирующих З Без учета категории insertion sequences and phages ацил-КоА-дегидрогеназы). Очень высок уровень экспрессии генов семейства pps, кодирующих ферменты синтеза фтиоцерола, необходимого для синтеза основного компонента клеточной стенки микобактерии - димикоцерозатов фтиоцерола (PDIMs). Из генов семейства ppsA-E экспрессируются 3, причем ppsC и ppsD с очень высоким уровнем экспрессии.

Среди генов семейства mmaA1-4, кодирующих синтетазы метоксимиколовой кислоты (methoxy mycolic acid synthase), экспрессируются 3 гена из 4.

В геноме M. tuberculosis выделяется кластер генов поликетидсинтаз, pks1-17, белковые продукты которого также вовлечены в процесс синтеза фтиоцерола или фенилфтиоцерола, хотя их точная функция не установлена. В нашем эксперименте получены данные об экспрессии 6 из 16 генов этого семейства.

Чрезвычайное значение для функционирования микобактерий имеют белки, ассоциированные с поликетидсинтазами (polyketide synthase associated proteins, гены papA15), продукты которых являются ацилтрансферазами. Предполагается, что они могут осуществлять этерификацию трегалозы или её производных. В геноме эти гены существуют в виде нескольких функциональных оперонов, содержащих также гены семейства pks и семейства мембранных белков mmpL. Нами показана экспрессия 3 генов из 5, входящих в это семейство.

Гены метаболизма дыхательных путей Несмотря на то, что резкого увеличения количества транскрибирующихся генов этой категории не отмечено, наблюдается перераспределение транскрипции генов, соответствующих переходу микобактерии с аэробного дыхания на анаэробный. (Gennaro et al, 2005). Отмечается экспрессия генов, входящих в narGHIJ operon, кодирующий нитрат-редуктазы (экспрессируются гены narH, narI, narJ ), а также narX и narK3, кодирующие переносчики нитратов. Для такого сдвига в дыхании бактерии, находящейся в хронической фазе инфекционного процесса, характерно снижение активности ATФ-синтезирующего аппарата, что проявляется в снижении транскрипции генов, находящихся в кластере atpA-H, транскрибируется только ген aptD.

Гены информационных путей (вовлеченные в репликацию, репарацию и транскрипцию ДНК) Транскрипция генов, кодирующих рибосомальные белки, и вовлеченных в биосинтез ДНК, немного понижена по сравнению со средним значением, что может указывать на замедление репликации бактериальных клеток. По-видимому, этот факт отражает свойства хронической стадии инфекционного процесса, связанной с ослаблением бактериального роста. Такой факт отмечают ряд авторов, например, при сравнении транскрипции генов этой категории в дендритных клетках по сравнению с in vitro (Tailleux et al, 2008).

Таким образом, в целом, проанализированный бактериальный транскриптом действительно качественно и количественно соответствует хронической фазе инфекционного процесса и адаптации M tuberculosis к иммунной системе хозяина.

3. ИСПОЛЬЗОВАНИЕ ОЛИГОНУКЛЕОТИДОВ С ПОВЫШЕННЫМ СРОДСТВОМ К КОМПЛЕМЕНТАРНОЙ МАТРИЦЕ КАК ЗОНДОВ В МОЛЕКУЛЯРНОЙ БИОЛОГИИ Принципиальной основой использования олигонуклеотидов как зондов в молекулярной биологии является образование стабильного дуплекса с комплементарной последовательностью ДНК. Возможность варьирования, то есть увеличения или уменьшения стабильности таких дуплексов позволяет существенно увеличить их потенциал в исследованиях структуры и функций генетического материала.

Существует много возможностей модифицировать углеродно-фосфатный остов, фосфатные группы или гетероциклические основания. В нашей работе использован опыт синтеза олигонуклеотидов с модифицированными гетероциклическими основаниями, полученный в группе проф. В.К. Потапова.

Нами исследованы олигонуклеотиды, содержащие 5-метилцизозин (me5C) и 2аминоаденин (am2A) вместо цитозина и аденина соответственно. Известно, что стабильность пары диаминопурин-тимидин увеличивается за счет появления дополнительной водородной связи (Cheong et al,1988), а пары 5-метилцитозин-гуанин - за счет гидрофобных взаимодействий метильной группы в большой бороздке спирали ДНК (Hoheinsel et al, 1990), при этом происходит увеличение температуры плавления комплементарного дуплекса примерно на 1С на модифицированное звено в обеих случаях (рис. 13).

Нами было впервые осуществлена характеристика таких олигонуклеотидов (Strongly Binding Oligonucleotides, SBO) с точки зрения их сродства к комплементарной ДНК матрице в матричном синтезе. При этом было показано, что:

а) модифицированные олигонуклеотиды более эффективно праймируют матричный синтез ДНК по сравнению с немодифицированными олигонуклеотидами той же структуры, при этом сохраняется специфичность синтеза.

б) определена минимальная длина олигонуклеотида, способного эффективно праймировать синтез. Чтобы ответить на этот вопрос, мы провели измерение эффективности синтеза ДНК, праймированного модифицированными и немодифицированными пента-и гексамерами.

Анализ включения [P32]-dATP во вновь синтезированную цепь продемонстрировал, что пентамеры, как нормальной структуры, так SBO, не эффективны в качестве праймеров, гексамеры продемонстрировали достаточно хорошую эффективность затравки, однако, SBO более эффективны, даже при повышенных температурах (данные приведены в тексте диссертации) А Рис. 13 Модифицированные гетероциклические основания 5-метилцитозин (А), 2-аминоаденин (Б) и их взаимодействие с комплементарной матрицей Б 3.1. Комбинации SBO в качестве объединенных праймеров для секвенирования Полученные результаты позволили нам пользовать SBO как компоненты длинного праймера в упорядоченном секвенировании primer walking (рис. 14). В 1992 г. группой W. StudierТa было продемонстрировано, что вместо длинного 15-17-ти звенного олигонуклеотида можно использовать комбинацию трех 6-ти звенных составляющих его олигонуклеотидов.

Праймирование подобным составным праймером происходит в присутствии белка SSB, специфически связывающего одноцепочечные ДНК. Стэкинг-взаимодействия концевых звеньев коротких олигонуклеотидов, прилегающих друг к другу, приводят к повышенной стабильности образуемых ими дуплексов. Нами показано, что использование SBO в качестве коротких модулей составного праймера приводит к существенному увеличению эффективности праймирования в случае гексамеров и даже праймированию комбинацией пентамеров, что невозможно при использовании немодифицированных олигонуклеотидов (рис. 15) Рис. 14. Primer walking (А) и стратегия составных праймеров (В) Рис. 15. Определение первичной структуры ДНК бактериофага М13 с помощью комбинированного праймера, состоящего из немодифицированных (1+2+3) и модифицированных (1м+2м+3м) пентамеров.

Модифицированные основания выделены подчеркиванием.

5Т- GTAAAACGACGGCCAGT 1 CCAGT 1м CCAGT 2 GACGG 2м GACGG 3 AAAAC 3м AAAAC ss- одноцепочечная матрица; ds - двуцепочечная матрица Данный подход был успешно применен для определения первичной структуры областей 19-й хромосомы человека, содержащих длинные концевые повторы (LTR) в рамках проекта Геном Человека.

3.2. Использование модифицированных олигонуклеотидов в ПЦР Нами были исследованы преимущества SBO в ПЦР-амплификации, а именно:

а) влияние температуры отжига на ПЦР (рис. 16). Использование SBO позволяет проводить амплификацию при более высоких температурах отжига. Как немодифицированные, так и SBO праймеры были эффективны при температуре отжига 57С (данные не приведены), однако, только SBO были эффективны при температурах 65С и выше. Полученные результаты демонстрируют преимущество SBO в условиях амплификации матриц со сложной вторичной структурой, требующих повышенных температур амплификации.

Рис. 16. Зависимость эффективности ПЦР амплификации от температуры отжига при использовании немодифицированных (N) и модифицированных (М) олигонуклеотидных праймеров. Олигонуклеотиды M13dir (GTAAAACGGCCAGT) и M13rev (CAGGAAAACAGCTATGAC) были использованы для амплификации вставок длиной 1.1. kb и 2.5.kb при различных температурах отжига.

б) SBO позволяет преодолевать эффект супрессии ПЦР на матрицах со вторичной структурой (рис. 17). Известно, что такие структуры подавляют амплификацию с обычных олигонуклеотидных праймеров независимо от температуры отжига (Lukyanov,1996). Мы использовали две ДНК-матрицы, различающиеся длиной и структурой центральных участков, и для обоих случаев было показано, что модифицированные олигонуклеотиды способны вытеснять немодифицированную цепь из дуплекса, тем самым обеспечивая амплификацию.

5Т GTAAAACGACGGCCAGT a 528 bp 5Т GTAAAACGACGGCCAGT a 528 bp 5Т GTAAAACGACGGCCAGTTTTTTTTTTTTTNN 5Т GTAAAACGACGGCCAGTTTTTTTTTTTTTNN NNAAAAAAAAAAAAACTGGCCGTCGTTTTAC 3Т NNAAAAAAAAAAAAACTGGCCGTCGTTTTAC 3Т 3Т CATTTTGCTGCCGGTCAAAAAAAAAAAAANN NNTTTTTTTTTTTTTGACCGGCAGCAAAATG 5Т 3Т CATTTTGCTGCCGGTCAAAAAAAAAAAAANN NNTTTTTTTTTTTTTGACCGGCAGCAAAATG 5Т b 312 bp TGACCGGCAGCAAAATG 5Т b 312 bp TGACCGGCAGCAAAATG 5Т Melting, annealing Melting, annealing N N 5Т GTAAAACGACGGCCAGT 5Т GTAAAACGACGGCCAGT УFrying panФ structure УFrying panФ structure N N 5Т GTAAAACGACGGCCAGTTTTTTTTTTTTT 5Т GTAAAACGACGGCCAGTTTTTTTTTTTTT 3Т CATTTTGCTGCCGGTCAAAAAAAAAAAAA 3Т CATTTTGCTGCCGGTCAAAAAAAAAAAAA N N N N 20 cycles 25 cycles 20 cycles 25 cycles 528 bp 528 bp 312 bp 312 bp Na Nb Ma Mb Na Nb Ma Mb Na Nb Ma Mb Na Nb Ma Mb Рис. 17. ПЦР амплификация фрагментов ДНК, образующих вторичную структуру в месте посадки праймера. А - структура ДНК Б - Разделение продуктов ПЦР в агарозном геле после 20 (слева) и 25(справа) циклов амплификации. N и M - результаты, полученные для немодифицированных и модифицированных праймеров, соответственно.

Эти свойства SBO могут быть использованы в случаях, если ограничено количество нуклеотидного материала; чрезвычайно желательно уменьшение количества циклов ПЦР, в частности для уменьшения накопления артефактов, связанных с ПЦР-селекцией, а также в тех случаях, когда сайт посадки праймера для ПЦР находится в области со стабильной вторичной структурой.

3.3. Использование модифицированных олигонуклеотидов в случайно праймированной полимеразной цепной реакции (RAPD) Случайно праймированная ПЦР нашла широкое применение для молекулярной дактилоскопии геномов различных уровней сложности (Williams et al, 1990; Akopyants et al, 1992). Использование максимально коротких олигонуклеотидных праймеров дает возможность увеличивать информативность получаемой картины случайного праймирования за счет большей частоты встречаемости коротких последовательностей в геноме. Однако уменьшение длины праймера должно приводить к уменьшению его эффективности, что может быть компенсировано увеличением прочности связывания праймера с матрицей путем введения в него модифицированных звеньев.

Для сравнения эффективности нормальных и модифицированных праймеров в условиях RAPD нами был использован 10-тизвенный праймер в модифицированном и нормальном вариантах (рис.18 ). RAPD проводили на различных бактериальных геномных 932 bp 932 bp 77bp bp Рис. 18. RAPD с использованием немодифицированного (ACGGTACACT) или модифицированного (ACGGTACACT) праймеров. а, б - температура отжига 37С; - 50С.

Дорожки: 1 - маркер длин. В качестве матриц использованы бактериальные геномные ДНК дорожки 2, 3 - S. typhimurium, 4, 5 - E. coli K802, 6, 7- H. pylori NTCT11638. Образцы 2, 4, получены с помощью немодифицированного праймера, образцы 3, 5, 7 - с помощью его модифицированного аналога.

ДНК в качестве матрицы и разных температурах отжига (рис.18). При сравнительно низкой температуре отжига (рис 18, а) видно, что оба праймера дают полосы амплификации. При повышении температуры отжига праймера (рис. 18, б) только модифицированные праймеры сохраняют способность к амплификации, при этом увеличивается резкость полос и меняется их распределение. Различные паттерны в случае модифицированных и немодифицированных праймеров могут отражать сложную систему взаимодействий праймеров с матрицей ДНК.

Эти взаимодействия могут, в частности, включать конкуренцию праймеров с собственной вторичной структурой одноцепочечных ДНК, в результате которой более прочно связывающиеся праймеры могут взаимодействовать с ДНК в областях существующих внутримолекулярных шпилек. Этот результат показывает принципиальную возможность использования модифицированных праймеров в RAPD.

ВЫВОДЫ 1. Для проведения полногеномного сравнения близкородственных бактериальных штаммов разработан оптимизированный метод ПДРФ-вычитающей гибридизации. Эффективность метода продемонстрирована на примере сравнения геномов штаммов M. tuberculosis HN8и CDC1551, вызывающих различные клинические формы заболевания туберкулезом.

Идентифицировано и охарактеризовано 9 нуклеотидных последовательностей, отличающих геном штамма HN878 от генома штамма CDC1551. Проведено сравнение геномов четырёх российских клинических штаммов M. tuberculosis с геномом штамма H37Rv.

Идентифицировано и охарактеризовано 12 нуклеотидных последовательностей, отличающих геномы российских штаммов от секвенированного генома штамма H37Rv.

2. Предложен способ генотипирования штаммов M. tuberculosis методом геномной ПЦР локусов (ID-типирование). Эффективность и надежность метода показана на коллекции из 172 штаммов M. tuberculosis, циркулирующих в центральных регионах Российской Федерации. Обнаружен новый характеристический геномный локус, присутствующий только в геномах штаммов M. tuberculosis семейства W/Beijing. Концепция ID-типирования носит универсальный характер и может использоваться как стандартный подход при проведении эпидемиологических исследований и анализа популяций любых бактериальных патогенов.

3. Методом ПДРФ-вычитающей гибридизации впервые полногеномном уровне исследованы различия близкородственных представителей байкальских сиговых рыб - озерного сига (C.

lavaretus baicalensis Dybovsky) и омуля (C. autumnalis migratorius Georgi). Показано, что данным методом не обнаруживаются устойчивые межвидовые различия. Все найденные нуклеотидные последовательности соответствуют полиморфным некодирующим участкам геномов, варьирующим в результате однонуклеотидных замен и коротких делеций. Многие из них картируются вблизи генов иммунной системы и имеют участки, идентичные широко распространенным среди рыб Тс1-подобным транспозонам, транскрипционная активность которых может влиять на экспрессию близлежащих генов. Отсутствие устойчивых различий между геномами этих сиговых свидетельствует об их высокой близости, возможно связанной с их недавней эволюционной дивергенцией.

4. Разработана концепция анализа паттернов метилирования протяженных областей геномов. Концепция предполагает возможность влияния на экспрессию генов метилирования протяженных участков генома, включающих эти гены, а не только метилирования их регуляторных участков. Усовершенствован метод клонирования последовательностей, идентичных в двух сравниваемых геномах или транскриптомах, на его основе разработан новый метод анализа распределения тканеспецифического метилирования на протяженных участках геномной ДНК. Предложен принципиально новый методический подход к экспресс-картированию сайтов расщепления протяженных фрагментов генома (на примере картирования сайтов расщепления метилчувствительной эндонуклеазой рестрикции HpaII).

5. Впервые проведен подробный анализ распределения метилирования в локусе FXYD5 - COX7A1 19-ой хромосомы человека длиной 1,02 млн. п.о. для различных образцов геномной ДНК (паренхимы и семиномы яичка, нормальной и опухолевой тканей легкого, клеточной линии A549). Показано, что различия между паттернами метилирования локуса FXYD5 - COX7A1 в исследованных нормальных и опухолевых тканях минимальны. Показано, что для клеточной линии А549 характерно гиперметилирование протяженной, содержащей гены, области длиной 30 тыс. п.о., не обнаруженное в других исследованных тканях.

Сравнительный анализ транскрипционной активности генов MAG и HAMP, содержащихся в данной области, в разных тканях продемонстрировал ее независимость от метилирования ДНК. Полученные данные ставят под вопрос универсальность принятой точки зрения о роли метилирования в регуляции генов.

6. Разработан метод получения кДНК, представляющей полный транскриптом бактериального патогена, из пораженной ткани организма хозяина. Применение метода позволяет получать новые данные о механизмах патогенеза инфекционного заболевания и изменении регуляции экспрессии геномов патогенов при инфекции организмов Эффективность метода продемонстрирована на примере получения кДНК M. tuberculosis из легочной ткани инфицированных мышей. Проведен анализ последовательностей, транскрибирующихся в легочной ткани мыши на 9-ой неделе развития инфекции. Показано, что для исследованных генов наблюдается качественное и количественное соответствие паттерна экспрессии паттерну, наблюдаемому при хронической фазе туберкулеза.

7. Предложены новые способы применения модифицированных олигонуклеотидов, содержащих 5-метилцизозин и 2-аминоаденин, и обладающих повышенным сродством к комплементарной матрице, в качестве праймеров для секвенирования и ПЦР.

Продемонстрирована их повышенная эффективность праймирования при сохранении специфичности гибридизации. Разработан метод определения первичной структуры с использованием набора коротких модифицированных олигонуклеотидов в качестве праймера. Разработан вариант молекулярной дактилоскопии, RAPD, с использованием таких олигонуклеотидов.

Список литературы Обзоры:

1. Гайнетдинов, И. В., Ажикина, Т.Л., Свердлов Е.Д. (2007). Короткие репрезентативные последовательности в геномных исследованиях. Биохимия 72(11): 1179 - 86.

2. Ажикина, Т.Л., Свердлов, Е.Д. (2005). Изучение тканеспецифического CpG метилирования ДНК в протяженных геномных локусах. Биохимия 70(5): 596Ц603.

3. Ажикина, Т.Л., Монастырская, Г.С., Свердлов, Е.Д. (2004). Полногеномные несеквенирующие анализы патогенов - неотъемлемый компонент мероприятий биобезопасности. Молекулярная медицина 3: 33Ц4. Sverdlov, E. and Azhikina Т. (2005). Primer Walking. Encyclopedia of Life Sciences: DOI:

10.1038/npg.els.000535. Azhikina, T. (2000). Sequencing Strategies and Tactics in DNA and RNA Analysis.

Encyclopedia of Analytical Chemistry. R. A. Meyers. Chichester, John Wiley&Sons Ltd.

6. Potapov, V., T. Azhikina, Demin, V.V., Limborskaja, S.A. and Sverdlov E.D. (1996).

Modified oligonucleotides as a tool for DNA sequencing, fingerprinting and mapping. Pure&Appl Chem 68 (6): 1315Ц1320.

Статьи:

7. Быченко, О.С., Суханова, Л.В., Уколова, С.С., Скворцов, Т.А., Потапов, В.К., Ажикина, Т.Л., Свердлов, Е.Д. (2009) Геномная близость байкальского омуля и сига.

Биоорганическая Химия, 35, 95Ц102.

8. Gvozdevskiy, N.A., Azhikina, T.L., Botvinnik, A.O., Evsyukova, I.Y., Shemyakin, I.G. and Sverdlov, E.D. (2006) New approach aimed at investigation of genomic polymorphism of the Russian M. tuberculosis population. FEBS Journal, 273, 29. Гвоздевский, Н.А., Ажикина, Т.Л., Свердлов, Е.Д. (2006) Делеционно-инсерционные различия геномов высоковирулентного штамма HN878 Mycobacterium tuberculosis и менее вирулентного штамма CDC1551. Журнал Микробиологии Эпидемиологии и Иммунологии, 1, 10Ц10. Azhikina, T., Gvozdevsky, N., Botvinnik, A., Fushan, A., Shemyakin, I., Stepanshina, V., Lipin, M., Barry, C., 3rd and Sverdlov, E. (2006) A genome-wide sequence-independent comparative analysis of insertion-deletion polymorphisms in multiple Mycobacterium tuberculosis strains. Res Microbiol, 157, 282Ц290.

11. Azhikina, T., Gainetdinov, I., Skvortsova, Y. and Sverdlov, E. (2006) Methylation-free site patterns along a 1-Mb locus on Chr19 in cancerous and normal cells are similar. A new fast approach for analyzing unmethylated CCGG sites distribution. Mol Genet Genomics, 275, 615 - 622.

12. Azhikina, T., Gainetdinov, I., Skvortsova, Y., Batrak, A., Dmitrieva, N. and Sverdlov, E.

(2004) Non-methylated Genomic Sites Coincidence Cloning (NGSCC): an approach to large scale analysis of hypomethylated CpG patterns at predetermined genomic loci. Mol Genet Genomics, 271, 22Ц32.

13. Kurdyukov, S.G., Lebedev, Y.B., Artamonova, II, Gorodentseva, T.N., Batrak, A.V., Mamedov, I.Z., Azhikina, T.L., Legchilina, S.P., Efimenko, I.G., Gardiner, K. and Sverdlov, E.D.

(2001) Full-sized HERV-K (HML-2) human endogenous retroviral LTR sequences on human chromosome 21: map locations and evolutionary history. Gene, 273, 51Ц61.

14. Kostina, M., Azhikina, T., Gorodentseva, T., Berg, D. and Sverdlov, E. (2000) Contiguous strings of strongly binding short oligonucleotides as a useful tool for completing sequencing experiments. DNA Seq, 10, 355Ц364.

15. Kurdjukov, S., Azhikina, T., Lebedev, Y., Gardiner, K. and Sverdlov, E. (1999) Mapping of endogenous retroviral LTRs on Chr21-concentration of the regulatory elements within the geneenriched 21q22 region. Cytogenet Cell Genet, 86, 17.

16. Чернов, И.П., Поляков, А.С., Акопов, С.Б., Николаев, Л.Г., Ажикина, Т.Л., Костина, М.Б., Свердлов, Е.Д. (1999) Идентификация и картирование на хромосоме 19 человека хромосомспецифического повторяющегося элемента, предпочтительно связывающегося с ядерным матриксом. Биоорганическая Химия, 25, 242Ц247.

17. Хиль, П.П., Костина, М.Б., Ажикина, Т.Л., Колесник, Т.Б., Лебедев, Ю.Б., Свердлов, Е.Д. (1997) Структурные характеристики четырех длинных концевых повторов (LTR) эндогенных человеческих ретровирусов и особенности участков их интеграции.

Биоорганическая Химия 23, 434Ц440.

18. Lebedev, Y., Akopyants, N., Azhikina, T., Shevchenko, Y., Potapov, V., Stecenko, D., Berg, D. and Sverdlov, E. (1996) Oligonucleotides containing 2-aminoadenine and 5methylcytosine are more effective as primers for PCR amplification than their nonmodified counterparts. Genet Anal, 13, 15Ц21.

19. Azhikina, T., Kostina, M., Skaptsova, N., Potapov, V., Berg, D. and Sverdlov, E. (1996) Factors affecting the priming efficiency of short contiguous oligonucleotide strings in the primer walking strategy of DNA sequencing. DNA Seq, 6, 211Ц216.

20. Azhikina, T., Veselovskaya, S., Myasnikov, V., Potapov, V., Ermolayeva, O. and Sverdlov, E. (1993) Strings of contiguous modified pentanucleotides with increased DNA-binding affinity can be used for DNA sequencing by primer walking. Proc Natl Acad Sci USA, 90, 11460Ц11462.

21. Ажикина, Т.Л., Шевченко, Ю.О., Лебедев, Ю.Б., Веселовская, С.В., Мясников, В.А., Потапов, В.К., Свердлов, Е.Д.(1993) Олигонуклеотиды, образующие высокостабильные дуплексы, их использование в качестве праймеров при секвенировании и в полимеразной цепной реакции. Докл Акад Наук 330, 642Ц645.

22. Ажикина, Т.Л., Потапов, В.К., Веселовская, С.В., Мясников, В.А., Свердлов, Е.Д.(1993) Комбинации коротких олигонуклеотидов с повышенной прочностью образования дуплексов в качестве объединенных праймеров в секвенировании. Докл Акад Наук, 331, 751 - 753.

Работа выполнена при финансовой поддержке российской программы Геном человека, программы Президиума РАН Молекулярная и клеточная биология, программы Ведущие научные школы РФ, Российского Фонда Фундаментальных Исследований, программы INTAS, программы МНТЦ, гранта HHMI.

Авторефераты по всем темам  >>  Авторефераты по биологии