На правах рукописи
УДК 577.214.6 Николаев
ев Григорьевич ЭКСПЕРИМЕНТАЛЬНЫЕ ПОДХОДЫ К ИДЕНТИФИКАЦИИ И КАРТИРОВАНИЮ ЦИС-РЕГУЛЯТОРНЫХ ЭЛЕМЕНТОВ В ПРОТЯЖЕННЫХ ОБЛАСТЯХ ГЕНОМА ЧЕЛОВЕКА
03.00.03 - молекулярная биология
Автореферат диссертации на соискание ученой степени доктора биологических наук
МОСКВАЦ2008
Работа выполнена в Институте биоорганической химии им. академиков М.М.
Шемякина и Ю.А. Овчинникова РАН.
Научный консультант: академик РАН Е.Д. Свердлов
Официальные оппоненты:
чл.-корр. РАН, докт. хим. наук С.Н. Кочетков чл.-корр. РАН, докт. хим. наук А.Г. Габибов докт. биол. наук Г.Е. Сулимова
Ведущая организация:
Институт биологии гена РАН
Защита диссертации состоится " " 2008 г. в "10" часов на заседании специализированного совета Д 002.019.01 при Институте биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН по адресу:
117997, Москва, ул. Миклухо-Маклая 16/10.
С диссертацией можно ознакомиться в библиотеке Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН.
Автореферат разослан 2008 г.
Ученый секретарь специализированного совета, доктор физ.-мат. наук В.А. Олейников ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы. Сейчас, когда закончено определение нуклеотидных последовательностей нескольких геномов млекопитающих (Lander et al. 2001; Venter et al.
2001; Waterston et al. 2002), главной задачей геномики становится изучение регуляторных механизмов, определяющих фенотипическое разнообразие живых организмов. Считается, что в геноме млекопитающих имеется 20000-30000 генов, кодирующих белки; однако последние данные указывают на то, что транскрибируется существенно большая часть генома (Carninci 2006). Не кодирующие белки транскрипты играют важную роль в регуляции генома, что существенно увеличивает сложность строения геномной машины.
Вся совокупность генов и транскрибируемых областей генома многоклеточных организмов связана в сложнейшую регулируемую сеть, определяющую существование многочисленных типов специализированных клеток. Транскрипция генов и некодирующих последовательностей регулируется на нескольких уровнях: линейной архитектуры генома, представленной цис-регуляторными элементами ДНК, модификации ДНК, структуры хроматина, структурной компартментализации ядра и др.
Следует признать, что, несмотря на серьезные достижения в изучении организации отдельных регуляторных систем (Maston et al. 2006), мы все еще далеки от полного понимания механизмов, управляющих геномом как целым. Даже в относительно простых случаях идентификации геномных элементов, играющих роль цис-регуляторов, мы встречаем серьезные затруднения, требующие для их преодоления длительных усилий большого числа исследователей. Согласно теоретическим предсказаниям геном человека может содержать до 100000 энхансеров и сайленсеров, однако к настоящему времени охарактеризована лишь небольшая их часть (Pennisi 2004).
Понятно, что для полной функциональной характеристики организма необходимо знать положение и функциональное состояние всех регуляторных последовательностей его генома во всех типах клеток на всех этапах его жизни. Хотя эта грандиозная задача пока далека от решения, разработка подходов для этого уже началась, в частности, в рамках предлагаемого исследования.
Регуляторные элементы генома даже одного и того же типа (например, энхансеры) в общем случае не обладают заметной гомологией первичных структур. Это связано в первую очередь со специфичностью их действия. Определенный цис-элемент должен оказывать свое действие (связывать регуляторные белки) в определенном месте и в определенное время, и поэтому не может быть близок по первичной структуре к подобному по активности элементу, действующему в другом типе клеток и на другой стадии развития организма. Эта особенность цис-регуляторных элементов не позволяет идентифицировать их по сходству первичных структур методами биоинформатики, и приводит к необходимости разработки экспериментальных методов их идентификации, причем эти методы должны быть различны для различных типов регуляторов.
За последнее время было предложено большое число различных экспериментальных подходов для идентификации регуляторных последовательностей внутри генома. Во всех этих подходах используется один и тот же ключевой элемент - получение высокообогащенных клонотек фрагментов ДНК, содержащих соответствующие регуляторные элементы. После конструирования таких клонотек нахождение их места в геноме становится чисто технической задачей и может быть осуществлено при помощи различных технологий, таких как гибридизация с геномными микрочипами, массированное секвенирование, технологии, сходные с SAGE (Serial Analysis of Gene Expression) и др. Эти подходы можно разделить на две группы. В первую входят методы, которые можно назвать структурными, т.е. методы, основанные на взаимодействии ДНК с белками или субклеточными структурами, а также на структурных особенностях ДНК. Вторую группу составляют функциональные подходы, обычно использующие Уметод репортерного генаФ.
Построение функциональных карт генома можно вести по двум основным направлениям. Во-первых, можно картировать один или небольшое число элементов внутри полного генома или достаточно большой его части (полногеномный подход). Такого рода технологии в основном применяются в последние несколько лет. Во-вторых, можно определить положение достаточно большого числа (в перспективе - всех) регуляторных элементов внутри относительно небольшой области генома, с перспективой объединения этих областей в полногеномную функциональную карту.
В нашей работе были использованы оба упомянутых выше подхода. На ранних этапах работы (1995-2000 г.), когда последовательность генома человека не была еще известна, мы использовали полнохромосомный (на примере хромосомы 19) подход.
Полученный опыт показал, что технические ограничения такого подхода не позволяют построить функциональные карты, содержащие все или основную часть регуляторных элементов, и, по мере накопления экспериментальных данных, мы перешли к детальному картированию относительно небольшого (1 млн. п.о.) фрагмента хромосомы 19 человека, расположенного между генами FXYD5 и COX7A1, который и стал основной моделью для отработки методов идентификации различных регуляторных элементов.
Цели и задачи исследования. Цель настоящей работы заключалась в разработке подходов, идентификации и функциональном картировании ряда цис-регуляторных элементов внутри протяженных областей генома человека.
В ходе работы были решены следующие задачи:
1. Предложен метод идентификации и картирования участков прикрепления ДНК к ядерному матриксу. С помощью этого подхода реконструирована доменная структура областей хромосом 19 и 16 человека длиной соответственно 1 млн.п.о. и 2.9 млн.п.о.
2. Разработан метод двумерного EMSA, при помощи которого составлена карта расположения участков связывания ядерных белков и фактора транскрипции CTCF в протяженной области хромосомы 19 человека.
3. Предложен метод EMSA-дисплея и продемонстрирована его пригодность для идентификации и картирования тканеспецифичных сайтов связывания белков в геномных последовательностях.
4. Предложен метод идентификации сайтов связывания факторов транскрипции на основе иммуномагнитной сепарации, который позволил идентифицировать, картировать и охарактеризовать ряд участков связывания фактора c-Myc в последовательности хромосомы 19 человека.
5. Предложен метод идентификации и картирования потенциальных инсуляторов.
Внутри области хромосомы 19 человека длиной 1 млн.п.о. идентифицировано, картировано и охарактеризовано 8 таких последовательностей.
Научная новизна, теоретическая и практическая значимость работы. В настоящей работе сформулирован подход к функциональному картированию геномов, заключающийся в построении подробных карт, включающих все или большую часть цисрегуляторных элементов, для относительно небольших (несколько млн. п.о.) областей генома. В дальнейшем подобные частичные карты могут быть объединены в функциональные карты целых хромосом и полных геномов. Для осуществления предложенной концепции разработан ряд оригинальных методов, позволяющих экспериментально идентифицировать ряд цис-регуляторных элементов, получить клонотеки этих элементов, и определить их положение относительно друг друга и относительно генов внутри протяженных областей генома.
На основании полученных нами в данной работе и имеющихся литературных данных мы построили первый вариант интегрированной карты регуляторных последовательностей для области хромосомы 19 человека длиной 500 т.п.о. Полученная карта, хотя и является наиболее полной из имеющихся в настоящее время карт геномных областей высших эукариот, пока далека от завершения, особенно в части тканеспецифичности действия приведенных регуляторных последовательностей. Тем не менее, она дает представление о сложности регуляторной системы генома и о трудности их исследования. Мы надеемся, что предложенные в настоящей работе методы позволят в обозримом будущем создать более исчерпывающие функциональные карты как отдельных областей, так и полных геномов.
Апробация результатов работы. Основные результаты работы были представлены на научных конференциях и симпозиумах, в том числе: 5-й (1996 г.), 6-й (1997 г.) и 9-й (1999 г.) конференциях российской программы "Геном человека"; 4-й международной Энгельгардтовской конференции по молекулярной биологии (1999 г.); III (1996 г.), IV (19г.), VI (2002 г.), VIII (2006 г.) чтениях, посвященных памяти академика Ю.А. Овчинникова, конгрессах HUGO Human Genome Meeting (Гейдельберг 1996 г., Эдинбург 2001 г., Хельсинки 2006 г.).
Работа выполнена при финансовой поддержке российской программы "Геном человека", Программы Президиума РАН УМолекулярная и клеточная биологияФ, Программы УВедущие научные школы РФФ, Российского фонда фундаментальных исследований, программы INTAS и грантов НАТО и министерства энергетики США.
Структура и объем диссертации. Диссертационная работа состоит из введения, обзора литературы, описания материалов и методов исследования, изложения результатов работы и их обсуждения, заключения, выводов и списка литературы. Работа изложена на 191 странице, содержит 46 рисунков и 16 таблиц. Список литературы включает 3источников.
Публикации. Диссертация обобщает данные 20 основных статей.
РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ 1. ИДЕНТИФИКАЦИЯ, ГЕНОМНОЕ КАРТИРОВАНИЕ И ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ УЧАСТКОВ ПРИКРЕПЛЕНИЯ ДНК К ЯДЕРНОМУ МАТРИКСУ (S/MARS) Одним из важных структурно-функциональных элементов клеточного ядра, ответственным за образование и регуляцию активности хроматина, являются участки прикрепления ДНК к ядерному матриксу.
Скелетная структура интерфазного ядра - ядерный матрикс - имеет повышенное сродство к последовательностям определенного типа (scaffold/matrix attachment regions, S/MARs), что делает ядерный матрикс уникальным инструментом, позволяющим отобрать те фрагменты ДНК, которые осуществляют прикрепление интерфазного хроматина к ядерному матриксу и образуют его петельно-доменную структуру. Гены, расположенные в различных доменах, физически изолированы друг от друга связанными с ядерным матриксом S/МАR-элементами, и способны регулироваться независимо.
Указанное свойство ядерного матрикса было использовано нами для отбора и идентификации фрагментов ДНК, предпочтительно связывающихся с ядерным матриксом, в различных областях генома человека, что позволило, как картировать все отобранные элементы, так и сделать выводы о взаимном расположении S/MAR элементов и генов и их возможной функциональной взаимосвязи.
Картирование последовательностей, предпочтительно связывающихся с ядерным матриксом, на хромосоме 19 человека Конструирование библиотеки коротких фрагментов Общая схема конструирования хромосом-специфической библиотеки последовательностей, предпочтительно связывающихся с ядерным матриксом, показана на Рис. 1. Смесь коротких (200-800 п.о.) фрагментов ДНК хромосомы 19, полученных расщеплением ДНК исходной геномной библиотеки хромосомы 19 человека, клонированной в лямбда-векторе, рестриктазами и присоединением к обоим концам адаптеров, была использована для отбора матрикс-связываюшихся фрагментов (S/MAR) путем связывания с ядерным матриксом in vitro. К суспензии ядерных матриксов после блокирования неспецифического связывания избытком ДНК E. coli добавляли смесь коротких фрагментов ДНК, инкубировали, интенсивно промывали для удаления не связавшейся ДНК, и связавшиеся с матриксом фрагменты ДНК выделяли после разрушения матриксов обработкой SDS и протеиназой К. Связавшуюся ДНК хромосомы 19 затем амплифицировали и использовали для второго раунда связывания с ядерным матриксом.
Процесс связывания с ядерным матриксом был повторен пять раз. Результаты каждого этапа связывания показаны на Рис. 2. Исходная ДНК (дор.1) выглядит как набор полос, соответствующих фрагментам, полученным при расщеплении рестриктазами плеч векторной ДНК фага лямбда. Гетерогенный набор фрагментов, полученный при расщеплении вставки, дает лишь незначительный фон. При последующих циклах связывания дискретные полосы исчезают, и появляется зона, состоящая из большого числа разных по длине фрагментов (Рис. 2, дор. 4, 6, 8, 10). Гибридизация с меченой ДНК фага лямбда (Рис. 2, дор. 3, 5, 7, 9, 11) показывает, что уже после 4-го цикла связывания среди амплифицированных фрагментов практически не остается фрагментов фага лямбда. Этот факт служит указанием на то, что библиотека обогащается последовательностями, имеющими повышенное сродство к ядерному матриксу.
После 5-го раунда связывания с ядерным матриксом ПЦР-амплифицированная смесь фрагментов была расщеплена рестриктазой Xho I, сайт узнавания которой содержался в последовательности адаптера, и клонирована в плазмидный вектор. После трансформации клетки 384 были отобраны и ранжированы.
Характеристика клонов библиотеки Наличие и размеры вставок во всех клонах библиотеки были проверены с помощью ПЦР. Все проверенные клоны содержали вставку. 40 клонов со вставкой длиной 250-5п.о. были отобраны для секвенирования. Нуклеотидные последовательности вставок сравнивали с банком данных нуклеотидных последовательностей GenBank с использованием BLAST (Altschul et al. 1997).
Для проверки их способности связываться с ядерным матриксом, клоны были радиоактивно мечены 32Р с помощью ПЦР. Фрагменты ДНК фагов лямбда и Т7 были использованы как отрицательные (не связывающиеся с матриксом) контроли, в качестве положительного контроля была использована вставка плазмиды pUCMAR10, содержавшей в векторе pUC19 вставку длиной 250 п.о., представляющую собой 10-кратный повтор последовательности синтетического S/MAR, идентичного локализованному на 3'-конце энхансера гена IgH.
Меченые вставки клонов библиотеки и pUCMAR10 были смешаны с равным количеством каждого из отрицательного контролей и ядерными матриксами. После инкубации смесь была разделена на фракции осадка и супернатанта. Очищенную ДНК из обеих фракций анализировали с помощью денатурирующего гель-электрофореза в полиакриламидном геле (Рис. 3). Как видно на рисунке, все вставки клонов библиотеки, кроме одной (M0A6), то есть около 90%, предпочтительно связываются с ядерным матриксом, хотя эффективность связывания варьирует для различных клонов.
Для количественной оценки эффективности связывания исследуемых клонов с ядерным матриксом полосы, соответствующие ДНК S/MARs и контрольной ДНК были вырезаны из геля, уровни радиоактивности полос в обеих фракциях измерены с помощью сцинтилляционного счетчика, и на основании этих данных были рассчитаны коэффициенты связывания для каждого из клонов по следующей формуле: B=(Sc x Pm)/(Pc x Sm), где В - коэффициент связывания, Pm - радиоактивность (имп/мин) ДНК S/MAR в осадке, Pc - радиоактивность (имп/мин) контрольной ДНК в осадке, Sm -радиоактивность (имп/мин) ДНК S/MAR-клона в супернатанте, Sc - радиоактивность (имп/мин) ДНК контролей в супернатанте.
Анализ первичной структуры S/MAR-клонов Для характеристики особенностей первичной структуры S/MARs мы использовали пакет программ PC/GENE. Результаты анализа показали, что 12 из 21 S/MAR-клонов содержат достаточно протяженные участки, обогащенные А+Т (более 75% А+Т), что характерно для одного из классов этих элементов (Boulikas 1995). В то же время другие S/MARs с высоким сродством к ядерному матриксу вообще не содержали А+Т обогащенных участков длиннее 20 п.о. Число обращенных повторов, способных образовывать шпилечные или крестообразные структуры (Boulikas 1995), также не коррелировало со способностью клонов связываться с ядерным матриксом. По-видимому, объяснением этого факта может служить наличие разных типов S/MAR-элементов, из которых обогащенным А+Т и обращенными повторами является лишь один.
Картирование S/MAR-клонов на хромосоме До появления полной первичной структуры генома человека метрическая карта хромосомы 19, построенная в Ливерморской национальной лаборатории (США) (Ashworth et al. 1995), была одной из самых подробных и надежных карт хромосом человека. Для привязки S/MAR-последовательностей к этой карте мы использовали схему, приведенную на Рис. 4. Клоны, принадлежащие хромосоме 19 человека и предпочтительно связывающиеся с ядерным матриксом, были радиоактивно мечены при помощи ПЦР и гибридизовались с космидными библиотеками F и R хромосомы 19 (Carrano et al. 1989), ранжированными на фильтрах высокой плотности (около 3000 космидных клонов на фильтр) (Olsen et al. 1993). Всего гибридизация была проведена примерно с 15000 космид для каждого S/MAR. Наличие S/MAR-последовательности в космидных клонах было затем подтверждено при помощи ПЦР, с использованием положительно гибридизующихся космид в качестве матрицы и клон-специфичных пар праймеров. Локализацию космид проводили с использованием базы данных Ливерморской национальной лаборатории.
Привязку космид к физической карте осуществляли, основываясь на отнесении космид к космидным контигам, образованным на основании рестриктного фингерпринтинга и последующего расположения их на хромосоме при помощи флюоресцентной гибридизации in situ (FISH) (Ashworth et al. 1995). Результаты картирования представлены на Рис. 5 и занесены в базу данных Ливерморской национальной лаборатории, доступную через Internet (
Принимая, что размер хромосомы 19 составляет около 6х107 п.о. и средняя длина хроматиновых доменов равна 60 т.п.о., можно оценить, что общее количество фрагментов ДНК хромосомы 19, связывающихся с ядерным матриксом в интерфазе должно быть около 1000. Однако число последовательностей хромосомы 19, способных связываться с ядерным матриксом, может оказаться существенно больше, так как значительная часть потенциальных сайтов связывания может и не быть присоединенной к матриксу в течение всего клеточного цикла. В связи с этим максимальное количество S/MAR-элементов хромосомы может составить несколько тысяч.
Нами был выбран подход, позволяющий получить хромосом-специфичную и высоко представительную библиотеку. Из 40 проанализированных нами клонов 21 (>50%) содержали вставку, специфичную для хромосомы 19 человека, а 20 из них (95%) связывались с ядерным матриксом in vitro существенно сильнее, чем контрольная ДНК.
Таким образом, полученная нами библиотека оказалась высоко представительной и значительно обогащенной матрикс связывающими фрагментами.
Анализ библиотеки показал, что ранжированная ее часть может содержать до 1независимых S/MAR-клонов. Это число в несколько раз больше, чем общее количество эукариотических S/MAR-элементов, охарактеризованных до начала этой работы.
Необходимо отметить, что это количество может быть увеличено путем ранжирования и анализа дополнительного числа клонов.
Описанные выше эксперименты позволили нам картировать на хромосоме человека значительное количество участков ДНК, предпочтительно связывающихся с ядерным матриксом. В то же время, эти эксперименты обладали двумя недостатками. Вопервых, полная нуклеотидная последовательность хромосомы 19 на тот момент не была определена, что создавало трудности при точном картировании S/MARs и, в особенности, при идентификации и анализе близлежащих генов. Во-вторых, ввиду большого числа S/MARs на всей хромосоме 19 (более тысячи), представляло значительные трудности идентифицировать и картировать все или подавляющую часть S/MAR-элементов, что необходимо для корректной реконструкции доменной структуры хромосомы.
Идентификация и картирование S/MARs в локусе FXYD5-COX7A1 хромосомы человека Публикация первого варианта полной нуклеотидной последовательности генома человека (Lander et al. 2001) открыла возможность подробного функционального анализа геномных последовательностей значительной длины - сотен тысяч и миллионов пар оснований, которые могут включать в себя ряд согласованно работающих генов. На следующем этапе работы мы сосредоточились на относительно небольшом (1 млн. п.о.) локусе хромосомы 19, расположенном между маркерами FXYD5-COX7A1, полная нуклеотидная последовательность которого была определена к началу работы. Этот локус содержит более 40 идентифицированных генов и ряд гипотетических кодирующих последовательностей, что делает его привлекательным объектом для функциональных исследований.
Конструирование библиотеки фрагментов ДНК, предпочтительно связывающихся с ядерным матриксом Для идентификации S/MAR-элементов мы модифицировали разработанный ранее метод, использовав ядерные матриксы, приготовленные методом LIS-экстракции, и сконструировали библиотеку S/MARs из локуса FXYD5-COX7A1. В качестве источника ДНК для селекции S/MARs мы использовали набор из 30 космид, полностью перекрывающих локус FXYD5-COX7A1 19 хромосомы человека, любезно предоставленный Ливерморской Национальной лабораторией (США). Общая схема получения библиотеки матрикс-связывающих последовательностей не отличается от приведенной на Рис. 1. На первом этапе необходимо было исчерпывающе расщепить ДНК, выделенную из 30 космид, на фрагменты, достаточно длинные, чтобы содержать полный S/MAR (200-1000 п.о.) и достаточно короткие, чтобы эффективно амплифицироваться при помощи ПЦР. Для расщепления использовались рестриктазы Sau3А и Csp6-1, образующие липкие концы.
Применение двух различных ферментов необходимо для того, чтобы избежать потери потенциальных S/MARs из-за образования слишком длинных или коротких фрагментов, которые в дальнейшем могут быть утрачены при селекции и ПЦР. Для последующей ПЦРамплификации и клонирования к полученному набору фрагментов присоединялись синтетические адаптеры. На следующем этапе был использован метод связывания ДНК с ядерным матриксом in vitro.
К суспензии ядерных матриксов, полученных методом LIS-экстракции, добавляли большой избыток фрагментированной ДНК E. coli, не содержавшей S/MAR-элементов, для блокирования неспецифического связывания. Далее связывание проводили аналогично тому, как описано в предыдущем разделе. Всего было проведено пять последовательных связываний. На электрофореграмме (Рис. 6) видно, что исходная смесь, содержащая около 4000 фрагментов ДНК, имеет вид мазка, состоящего из большого числа разных по длине фрагментов. К пятому циклу выявляется ряд фрагментов определенной длины, предпочтительно связывающихся с ядерным матриксом. Это указывает на обогащение библиотеки последовательностями, имеющими повышенное сродство к ядерному матриксу.
Этот набор фрагментов ПЦР-амплифицировали и клонировали, 184 белых колонии были ранжированы.
Плазмидную библиотеку, обогащенную последовательностями, способными к специфическому связыванию с ядерным матриксом, проверяли на наличие и размер вставок. Далее фрагменты ДНК переносили на нейлоновый фильтр и гибридизовали с меченой смесью фрагментов после пятого цикла связывания. Этот этап позволил исключить клоны, дающие слабый сигнал при гибридизации, из последующей работы. Слабо гибридизующиеся клоны, мало представленные в библиотеке, с большой вероятностью не являются S/MAR-элементами и в дальнейшем не анализировались.
По результатам гибридизации было отобрано 29 клонов и определена их первичная структура. После сравнения первичных структур клонов между собой было выявлено независимых последовательностей.
Для определения числа независимых клонов в библиотеке мы предположили, что каждый клон представлен в библиотеке равным количеством копий. Рассмотрим библиотеку, содержащую N клонов, по m копий каждого клона. Поскольку вероятность выбора клона конкретного типа равна 1/N и достаточно мала, то можно считать, что число k появлений клона данного типа подчиняется распределению Пуассона. Размер библиотеки при этом можно оценить как N=(число клонов, выбираемых в одной серии опытов)/q, где q - параметр пуассоновского распределения. Число независимых клонов для нашей библиотеки, полученное таким образом, оказалось близким 20. Таким образом, обнаруженных клонов представляют собой если не все, то большую часть потенциальных S/MARs в нашей библиотеке.
Определение коэффициента связывания клонов библиотеки с ядерным матриксом in vitro Матрикс-связывающие свойства отобранных последовательностей были проверены при помощи связывания их с ядерным матриксом in vitro. Для них был определен коэффициент связывания с ядерным матриксом тем же методом, что и для S/MARs хромосомы 19 (см. выше). Все полученные клоны связывались с матриксом значительно лучше, чем контрольные фрагменты ДНК, хотя эффективность этого связывания варьировала в зависимости от клона (не показано).
Для всех этих клонов был определен коэффициент их связывания с ядерным матриксом в %% по отношению к положительному контролю - вставке плазмиды pUCMAR10 по следующей формуле: В(%)= 100%х(E(MAR)/E(pUCMAR10)).
Следует отметить, что абсолютная величина коэффициента связывания, и, в меньшей степени, его нормированное значение, могут достаточно сильно изменяться в зависимости от того, какой препарат ядерного матрикса используется для его определения. Таким образом, эти данные являются лишь полуколичественными. Тем не менее, все тестированные S/MAR-элементы обладали повышенным сродством к ядерному матриксу во всех проведенных экспериментах.
Анализ первичной структуры S/MAR клонов Первичные структуры S/MARs анализировали так, как указано выше (стр. 9).
Результаты показали, что 10 S/MAR-клонов содержат протяженные участки (20 п.о. и более), обогащенные А+Т (более 75% А+Т). Некоторые S/MARs, также, как и S/MARs охарактеризованные ранее, не содержали А+Т-обогащенных участков длиннее 20 п.о.
Аналогично другим S/MARs хромосомы 19 (стр. 9), число найденных в них обращенных повторов не коррелировало со способностью клонов связываться с ядерным матриксом.
Компьютерный анализ секвенированных клонов и их картирование Последовательности 16 независимых клонов были проверены на гомологию с последовательностями из нуклеотидной базы данных GenBank. Как и ожидалось, все последовательностей оказались на 99-100% совпадающими с последовательностями, соответствующими локусу FXYD5-COX7A1 хромосомы 19 человека. Расположение S/MARэлементов относительно генов приведено на геномной карте (Рис. 7).
Таким образом, используя метод специфического связывания фрагментов ДНК с ядерным матриксом in vitro, мы идентифицировали и картировали в данном локусе S/MAR-элементов, коэффициент связывания которых колебался от 10 до 120% по сравнению с хорошо охарактеризованным S/MAR из локуса IgH мыши. По оценке, локус содержит около 20 S/MARs, и, таким образом, нами было идентифицировано и картировано представительное большинство S/MAR-элементов, хотя и нельзя исключить, что небольшая их часть была потеряна в процессе селекции.
Большая часть (11 из 16) обнаруженных S/MARs расположены в межгенных областях, и их можно отнести к структурным элементам, разграничивающим хроматиновые домены. Эти 11 S/MAR- элементов подразделяют локус на 10 доменов длиной от 6 до 2т.п.о. Средний размер домена составляет 88 т.п.о., что хорошо согласуется с более ранними оценками среднего размера петель хроматина (Boulikas 1995; Iarovaia et al. 1996). В то же время 4 из 10 доменов не содержат ни охарактеризованных, ни гипотетических генов. Три из этих УпсевдодоменовФ являются очень короткими (от 6 до 16 т.п.о.), и возможно, имеют в своем составе протяженные регуляторные элементы генома, содержащие внутренние S/MAR-элементы, подобно LCR (locus control region) (Maston et al. 2006). Возможно, что наиболее протяженный домен, содержит в своем составе пока не идентифицированные гены.
Как видно из карты, в одном и том же домене могут находиться гены, имеющие существенно разную тканеспецифичность. Так, например, в одном домене расположены ген COX6B, кодирующий 6В субъединицу цитохромоксидазы С, экспрессирующуюся во всех тканях (Carrero-Valenzuela et al. 1991), и ген уроплакина 1А, который преимущественно экспрессируется в уротелии (Sun et al. 1996). Этот результат может объясняться различными, но не обязательно взаимоисключающими способами:
1. Поскольку мы использовали ядерный матрикс из клеток HeLa, карта распределения S/MAR-элементов является тканеспецифичной. Это означает, что в библиотеке помимо конститутивных S/MAR-элементов, которые функционируют во всех типах клеток, присутствуют и тканеспецифичные S/MARs, связанные с матриксом только в данном типе клеток.
2. Другим объяснением может служить то, что часть S/MARs, расположенных между генами с различной тканеспецифичностью, могла быть потеряна в процессе эксперимента.
Это может происходить потому, что используемый нами метод приводит прежде всего к обнаружению УсильныхФ S/MARs, со сравнительно высокой аффинностью к ядерному матриксу.
3. Для формирования функционального домена необходимы не только S/MAR-элементы, но и участки связывания различных регуляторных факторов, которые расположены в активных областях хромосомы.
S/MAR-элементы внутри генов Расположение S/MARs в интронах не является необычным и было обнаружено в генах легкой и тяжелой цепей иммуноглобулинов мыши (Cockerill et al. 1987), в генах бетаглобина и топоизомеразы I человека (Jarman and Higgs 1988; Romig et al. 1994), и в ряде других генов (Bode et al. 1998). В большинстве случаев эти S/MARs ассоциированы с важными цис-регуляторными элементами.
Пять из 16 S/MAR-элементов локуса FXYD5-COX7A1 были локализованы нами в интронах известных генов - гена белка, сходного с предшественником бета-амилоида (amyloid beta precursor-like protein 1, APLP1) (Bayer et al. 1999), пролиноксидазы 1 печени и почек (kidney and liver proline oxidase 1, PRODH2), гликопротеина, ассоциированного с миелином (myelin associated glycoprotein, MAG), принадлежащего к суперсемейству иммуноглобулинов (Konat 1996; Schachner and Bartsch 2000), и нефрина (nephrin, NPHS1) (Lenkkeri et al. 1999), что позволяет предположить участие S/MARs в регуляции этих генов.
Вызывает большой интерес, что 4 из 5 генов, содержащих S/MARs в интронах, экспрессируются строго тканеспецифично, в нервных тканях (MAG, APLP1), и тканях почки (PRODH2 и NPHS1). Более того, все 4 гена связаны с возникновением различных наследственных заболеваний.
Наличие S/MAR-элементов в интронах генов позволяет предположить, что эти S/MARs являются регуляторными элементами, ответственными за тканеспецифичность и уровень их экспрессии.
S/MAR-элементы, находящиеся в интронах, должны обладать особыми свойствами.
Во-первых, они не должны мешать прохождению РНК-полимеразы II (Bode et al. 1998; PhiVan and Stratling 1990). Для этого их взаимодействие с ядерным матриксом должно быть тканеспецифичным и/или реализовываться только в течение некоторых периодов жизненного цикла клетки. Эти S/MARs, таким образом, представляются наилучшими кандидатами на роль УдинамическихФ или УфункциональныхФ S/MAR-элементов (Jackson et al. 1992). Такая их роль хорошо согласуется с тканеспецифичностью экспрессии генов, в которых они обнаруживаются.
4.5.7. Функционирование идентифицированных S/MARs in vivo Для того чтобы проверить, действительно ли идентифицированные нами S/MARэлементы лежат в основании петель ДНК, совместно с О.В. Яровой и С.В. Разиным (Институт биологии гена РАН) были проведены эксперименты по флюоресцентной гибридизации in situ с ядерными гало (Gerdes et al. 1994). Для этого использовали ДНК космидных клонов, перекрывающих область в 170 т.п.о. между S/MARs 3 и 4 (см. Рис. 7) и ядерные гало, приготовленные из клеток HL-60 экстракцией 2М NaCl. Результаты гибридизации этой области генома с ядерными гало показывают, что в большинстве клеток наблюдаются две петли ДНК, закрепленные на ядерном матриксе. Эти петли представляют собой изучаемую область генома, присутствующую в двух гомологичных хромосомах.
Можно заключить, что S/MAR-элементы, фланкирующие данную область, располагаются на ядерном матриксе, тогда как область между S/MARs 3 и 4 входит в состав ядерного гало.
Полученные результаты подтверждают, что идентифицированные S/MARs действительно прикреплены к ядерному матриксу, а находящаяся между ними ДНК образует выступающую петлю.
2. ИДЕНТИФИКАЦИЯ И КАРТИРОВАНИЕ УЧАСТКОВ СВЯЗЫВАНИЯ ЯДЕРНЫХ БЕЛКОВ Метод двумерного сдвига электрофоретической подвижности (2D-EMSA) Для отбора и идентификации фрагментов ДНК, способных связываться с транскрипционными факторами, нами был предложен подход, основанный на двумерном сдвиге электрофоретической подвижности фрагментов ДНК в геле (Рис. 8). В качестве исходного материала для селекции используется библиотека коротких фрагментов, перекрывающих интересующую нас область генома, приготовленная тем же методом, что и для селекции S/MARs. В качестве источника ДНК-связывающих белков используется ядерный экстракт. Библиотеку коротких фрагментов радиоактивно метят, смешивают с ядерным экстрактом в присутствии неспецифических конкурентов (ДНК Cot1 и/или полиdI:dC-поли-dI:dC), инкубируют и наносят на неденатурирующий полиакриламидный гель первого направления, аналогичный используемому в стандартном методе EMSA. После разделения комплексов белок-ДНК в первом направлении соответствующую дорожку вырезают, инкубируют в SDS-содержащем буфере для разрушения комплексов ДНК-белок, и разделяют во втором, перпендикулярном направлении в присутствии SDS. При таком подходе фрагменты ДНК, не связывающиеся с белками, имеют одинаковую электрофоретическую подвижность в обоих направлениях, и после электрофореза образуют диагональ. В то же время, связывающиеся с белками фрагменты ДНК в первом направлении имеют подвижность меньшую, чем во втором, и располагаются ниже диагонали ("тени" ДНК-белковых комплексов). Таким образом, если вырезать часть геля, находящуюся ниже диагонали, и элюировать из нее ДНК, то эта фракция ДНК будет обогащена фрагментами, связывающимися с белками ядерного экстракта из данного типа клеток, то есть будет отражением содержащихся в данных клетках пула белков, специфически связывающихся с ДНК. Для понижения уровня фона описанную выше процедуру двумерного электрофореза можно повторять.
Метод 2D-EMSA позволяет отбирать, клонировать и картировать фрагменты ДНК, специфически связывающиеся с белками. Результаты двумерного EMSA зависят от белкового состава используемого ядерного экстракта, и характеризуют всю совокупность ядерных белков данной линии клеток или ткани, то есть тканеспецифичность связывания ядерных белков. Применение метода 2D-EMSA не требует никаких сведений о белках, и с его помощью можно идентифицировать участки связывания до сих пор не идентифицированных ядерных белков.
Мы использовали 2D-EMSA для идентификации сайтов связывания ядерных белков внутри области генома длиной 563 т.п.о., находящейся между генами FXYD5-TZFP хромосомы 19 человека. Область содержит более 20 охарактеризованных генов, что позволяет сделать выводы о взаимном расположении белок-связывающих элементов и генов и их возможной функциональной взаимосвязи.
Получение и анализ библиотеки участков связывания белков из области FXYD5-TZFP хромосомы 19 человека В качестве источника ДНК для селекции связывающих белки фрагментов использовали набор космидных клонов, полностью перекрывающих локус FXYD5-TZFP длиной 563 т.п.о. хромосомы 19 человека. ДНК была обработана рестриктазами Sau3А и Csp6-1, в результате чего был получен набор фрагментов со средней длиной ~500 п.о., имеющих липкие концы. Для последующей ПЦР-амплификации и клонирования к полученному набору фрагментов присоединяли синтетические адаптеры и радиоактивно метили смесь фрагментов. На следующем этапе методом двумерного EMSA из полученной смеси отобрали фрагменты, содержащие участки связывания с белками ядерного экстракта клеток Jurkat. Результаты двумерного EMSA приведены на Рис. 9. Зона, обозначенная пунктирной линией, была вырезана из геля, и ДНК элюирована.
Набор фрагментов, полученных в результате двух циклов селекции, амплифицировали и клонировали. Около 200 колоний были ранжированы, вставки 120 клонов метили 32P и при помощи стандартного метода EMSA проверяли их способность специфически связываться с ядерными белками. Результаты проверки для части клонов приведены на Рис.
10А. Было показано, что 98 из 120 вставок (~80%) способны связываться с белками ядерного экстракта, что подтверждает высокую эффективность процедуры двумерного EMSA. Кроме того, для 6 случайно выбранных клонов была подтверждена специфичность их связывания с белками методом конкуренции с немеченым зондом (Рис. 10Б).
Общее число участков связывания ядерных белков в области FXYD5-TZFP.
Все фрагменты ДНК, способные связываться с белками, секвенировали, и их последовательности сравнивали с базой данных последовательностей генома человека. В целом, было идентифицировано 78 последовательностей, принадлежащих области FXYD5TZFP. Сравнение последовательностей между собой выявило 52 уникальные последовательности.
Для оценки общего числа независимых клонов библиотеки мы использовали то же приближение, что и при оценке числа S/MARs, что позволило оценить общее число участков связывания белков в изучаемой области в 120. Таким образом, найденные нами участка связывания белков составляют около половины всех участков, которые могут быть идентифицированы методом 2D-EMSA в клетках Jurkat. Если экстраполировать полученные нами данные на весь геном, то общее число участков связывания белков в геноме можно оценить в ~600000 для одного типа клеток 120х[3000 (длина генома в млн.п.о.)]/[0,56 (длина изученной области)]. Это число не кажется слишком большим, учитывая недавние оценки числа участков связывания отдельных факторов транскрипции - 12000 сайтов Sp1, 250сайтов c-myc, 1600 сайтов p53 (Cawley et al. 2004) и около 12000 сайтов NF-kB (Martone et al. 2003).
Расположение в геноме участков ДНК, способных связываться с белками Все идентифицированные участки связывания белков были разделены на две почти равные группы - уникальные и повторяющиеся. К последней группе отнесены последовательности, более чем на 25% состоящие их повторяющихся элементов генома, чаще всего Alu и LINE-последовательностей и длинных концевых повторов (LTR) эндогенных ретровирусов человека. Оба типа участков связывания были нанесены на физическую карту области FXYD5-TZFP (Рис. 11).
Участки связывания белков по их расположению относительно генов можно подразделить на интронные, 3'- и 5'-участки (расположенные не далее, чем в 1 т.п.о. от соответственно 3'- и 5'-концов генов) и межгенные. Как видно из Табл. 1, уникальные участки связывания имеют тенденцию располагаться вблизи или внутри генов - только 2 из 25 уникальных сайтов находятся на расстоянии более 1 т.п.о. от соответствующих генов.
Напротив, более 50% (14 из 27) участков связывания белков, содержащих повторы, располагаются в межгенных областях.
ишь небольшая часть (15%) идентифицированных сайтов связывания была найдена в промоторных (5'-) областях генов, что подтверждает наблюдения, сделанные при картировании участков связывания конкретных факторов транскрипции (Cawley et al. 2004;
Martone et al. 2003). Основная часть (70%) располагается в интронах или межгенных областях (Табл. 1). Можно предположить, что эти сайты принадлежат регуляторным элементам, не связанным непосредственно с генами, таким как энхансеры, инсуляторы или локус-контролирующие области (LCR).
Таблица 1. Статистика расположения сайтов связывания белков.
Положение Сайты с Уникальные Всего относительно генов повторами сайты 3' от гена 3 4 5' от гена 2 6 Интронный/экзонный 8 13 Межгенный 14 2 Всего 27 25 Идентификация и картирование тканеспецифичных участков связывания белков Активность основной части цис-регуляторных элементов генома, определяющих структурные и функциональные свойства высших организмов, зависит от типа клеток или тканей, то есть тканеспецифична (Maston et al. 2006). Тканеспецифичность этих элементов, в свою очередь, определяется тканеспецифичным связыванием с этими элементами ядерных белков, в частности, факторов транскрипции. Присутствие или отсутствие в клетке комплекса регуляторного элемента с соответствующим фактором транскрипции может быть следствием присутствия или отсутствия этого фактора транскрипции в клетке, посттрансляционной модификации фактора, облегчающей или нарушающей его связывание с ДНК, либо модификации (например, метилирования) самого регуляторного элемента.
Последовательности ДНК, связывающие регуляторные белки тканеспецифично, играют важную роль в регуляции активности генома, и их идентификация, клонирование и картирование весьма важно для изучения функциональной активности генома. Учитывая огромное количество цис-регуляторных элементов в геноме, эта задача не может быть решена существующими методами. Для идентификации тканеспецифичных сайтов связывания белков в геномных последовательностях мы разработали метод дифференциального EMSA-дисплея, основанный на процедуре двумерного EMSA, и применили его к анализу участка хромосомы 19q13.1 человека длиной 137 т.п.о.
Процедура двумерного EMSA-дисплея Схема двумерного EMSA-дисплея приведена на Рис. 12. На первой стадии используется техника двумерного EMSA, описанного в предыдущем разделе. Процедуру двумерного EMSA проводили с меченой библиотекой коротких фрагментов, полученной при расщеплении ДНК космид, перекрывающих область хромосомы 19 человека длиной 137 т.п.о., находящуюся внутри области FXYD5-COX7A1, использованной нами ранее для картирования S/MARs, и ядерными экстрактами из трех типов клеток - Jurkat, PANC-1 и HepG2. Отобранные после двух циклов селекции фрагменты, связывающиеся с белками каждого из ядерных экстрактов, после мечения 32P наносили на соседние дорожки денатурирующего ПААГ. Полосы, присутствующие в реакционной смеси из одной линии клеток, и отсутствующие в другой, либо имеющие существенно разную интенсивность, вырезали, амплифицировали при помощи ПЦР и клонировали для дальнейшего анализа.
Таким образом, дифференциальный EMSA-дисплей позволяет выявить и клонировать фрагменты ДНК, образующие различные комплексы с белками при использовании ядерных экстрактов из различных типов клеток или тканей.
Результаты второго цикла 2D-EMSA для трех клеточных линий человека приведен на Рис. 13. Области, ограниченные пунктирной линией, были вырезаны из геля, и фрагменты ДНК из них элюированы. После мечения, эти фрагменты разделяли в денатурирующем ПААГ (Рис. 14А). Как видно из рисунка, картины распределения фрагментов ДНК различны для разных типов клеток. Отдельные дифференциальные полосы (обозначены стрелками) вырезали из геля, их ДНК амплифицировали и клонировали.
Некоторые из полос, из-за неидеального разделения в геле, либо неточности при вырезании, могли содержать более одного фрагмента ДНК. В связи с этим для каждой из полос секвенировали по три клона. В результате секвенирования выяснилось, что полосы 2, 7 и 10 (Рис 14А) были представлены единственной последовательностью, полоса 11 - двумя последовательностями (обозначены как 11.2 и 11.3), а полосы 4 и 8 - тремя различными последовательностями (обозначены соответственно 4.1, 4.2, 4.6 и 8.1, 8.2, 8.4. Всего было идентифицировано 11 последовательностей, и их способность связывать ядерные белки тканеспецифично проверена одномерным EMSA с ядерными экстрактами из всех трех типов клеток (Рис. 14Б-Ж).
Анализ дифференциальных участков связывания В соответствии с Рис. 14Б-Ж, идентифицированные последовательности можно разделить на три типа. Первый из них, представленный последовательностью 7, не проявляет тканеспецифичности связывания, и был отнесен к ложноположительным фрагментам. Второй тип последовательностей (фрагменты 2, 4.1, 4.2,4.6, 10 и 11.3) образует единственный тканеспецифичный комплекс с белками. Для этих комплексов характерна низкая электрофоретическая подвижность в случае экстрактов из клеток Jurkat и PANC-1, и высокая - для экстракта из клеток HepG2. Наконец, для последовательностей 8.18.4 и 11.2 (третий тип) наблюдалась более сложная картина. Последовательности 8.1 и 8.образуют сходные комплексы - единственный с ядерным экстрактом из клеток Jurkat, два комплекса с экстрактом из клеток PANC-1, и единственный комплекс с высокой электрофоретической подвижностью с экстрактом клеток HepG2. Наблюдалось также несколько минорных комплексов. Фрагмент 11.2 образует дополнительно два не тканеспецифичных комплекса. Фрагмент 8.4 образует ДНК-белковые комплексы с одинаковой подвижностью с ядерными экстрактами из клеток Jurkat и PANC-1, и несколько комплексов с более высокой и низкой подвижностями с экстрактом из клеток HepG2. В целом, как видно из Рис. 14, ядерные экстракты клеток Jurkat и PANC-1 дают начала сходным по типу комплексам (кроме фрагмента 8.1), тогда как картина разделения ДНКбелковых комплексов, образуемых экстрактом клеток HepG2, существенно отлична.
В большинстве наблюдавшихся случаев дифференциального связывания белков (7 из 10), различие состояло не в присутствии или отсутствии соответствующего ДНК-белкового комплекса, а в изменении его электрофоретической подвижности. Это изменение может объясняться различным белковым составом комплекса. По-видимому, тканеспецифичное связывание белков различных ядерных экстрактов одной и той же последовательностью довольно редко подчиняется принципу "есть или нет". Гораздо чаще ДНК-белковые комплексы образуются во всех случаях, но их состав различен.
Примечательно, что совершенно различные последовательности ДНК (11.2 и 11.3, 4.2, 4.3 и 4.6) образуют ДНК-белковые комплексы с практически идентичной электрофоретической подвижностью со всеми тремя ядерными экстрактами. Этот факт можно объяснить двумя способами - во-первых, эти фрагменты ДНК могут иметь короткие гомологичные участки, которые связываются с одним и тем же белковым фактором. Вовторых, эти фрагменты могут связываться с различными белками, но получившиеся комплексы обладают одинаковой подвижностью.
Чтобы различить две эти возможности, мы провели эксперименты по конкурентному EMSA - в реакционную смесь для EMSA добавляли 30-кратный молярный избыток немеченых той же или других последовательностей (Рис. 15). Как видно из рисунка, фрагменты 4.2, 4.3 и 4.6 связывают один и тот же белковый фактор (факторы). Фрагменты же 11.2 и 11.3 связываются с различными белками (Рис. 15) и совпадение электрофоретических подвижностей образуемых ими ДНК-белковых комплексов случайно.
Все идентифицированные фрагменты были картированы внутри области хромосомы 19 человека длиной 137 т.п.о. (Рис. 16). Эта область содержит как свободный от генов участок, так и участок, содержащий три близко расположенных гена. Как видно из Рис. 16, участки связывания белков распределены вдоль изучаемой области неравномерно. Пять из 12 участков картируются внутри небольшой (7,6 т.п.о.) области, расположенной на расстоянии около 25 т.п.о. с 5'-стороны от гена LSR, активно экспрессирующегося в печени (Yen et al. 1999). Более того, 2 тканеспецифичных участка связывания располагаются во втором интроне этого гена. ДНК-белковые комплексы, образуемые этими 7 участками с ядерными экстрактами клеток Jurkat и PANC-1, обладают сходной электрофоретической подвижностью и отличаются от комплексов, образуемых с ядерным экстрактом клеток HepG2, что предполагает их участие в регуляции экспрессии гена LSR в печени. Пять участков связывания, расположенных вдали от промоторной области гена LSR могут относиться к не связанным структурно с геном регуляторным последовательностям, таким как энхансеры или локус-контролирующие области (LCR).
Шесть из 10 дифференциальных участков связывания белков располагаются внутри или частично перекрываются с повторяющимися последовательностями, в частности Alu, LINE и LTR эндогенных ретровирусов человека. Такое же распределение уникальных и повторяющихся сайтов связывания было обнаружено нами и для недифференциальных сайтов (см. Табл. 1). Эти данные указывают на то, что повторяющиеся элементы могут играть более важную роль в регуляции активности генома, чем предполагалось ранее (Buzdin 2004).
Идентификация и картирование участков связывания фактора транскрипции CTCF Нами была разработана модификация метода двумерного EMSA, позволяющая картировать сайты связывания in vitro для конкретных транскрипционных факторов.
Модификация заключалась в том, что в эксперименте (см. схему на Рис. 8) вместо ядерного экстракта был использован конкретный белок. С помощью этого метода мы идентифицировали и картировали участки связывания фактора транскрипции CTCF в FXYD5-COX7A1 хромосомы 19 человека, и впоследствии подтвердили наличие данных функциональных сайтов in vivo с помощью метода иммунопреципитации хроматина (СhIP).
Разработанный нами метод позволяет выявлять и картировать участки связывания транскрипционных факторов на протяженных (несколько млн. п.о.) участках ДНК.
Фактор транскрипции CTCF представляет собой многофункциональный белок, найденный у высших эукариот (Ohlsson et al. 2001), а недавно и у дрозофилы и других насекомых (Gray and Coates 2005; Moon et al. 2005). Первоначально он был идентифицирован как белок, связывающийся с последовательностью CCCTC в промоторе гена c-myc курицы (Lobanenkov et al. 1990). CTCF состоит из трех доменов, один из которых включает 11 мотивов "цинковых пальцев". Различные комбинации этих мотивов обеспечивают узнавание различных сайтов связывания и выполнение различных функций (Ohlsson et al. 2001). В частности, его связывание необходимо для проявления активности большинства инсуляторов (Bell et al. 1999).
Получение белка CTCF и его функциональный анализ Синтез белка CTCF проводили in vitro в сопряженной системе транскрипции/трансляции. В качестве конструкции, несущей полноразмерную кДНК CTCF человека, использовали плазмиду pET7.1, любезно предоставленную З. Абдуллаевым и В.
обаненковым (NIH, США).
Отбор фрагментов, связывающихся с CTCF В качестве источника ДНК для выявления участков связывания транскрипционного фактора CTCF мы использовали ту же библиотеку коротких фрагментов области FXYD5COX7A1 хромосомы 19 человека, что и для идентификации и картирования S/MARэлементов этой области. Отбор фрагментов, связывающихся с CTCF, проводили в два цикла с применением двумерного электрофореза. Для этого ПЦР-меченые фрагменты анализируемой библиотеки инкубировали с синтезированным в системе in vitro CTCF в тех же условиях, что и белки ядерного экстракта, и разделяли электрофорезом в неденатурирующих условиях. Полосу геля первого направления, содержащую комплексы ДНК-CTCF, инкубировали в SDS-содержащем буфере для освобождения ДНК из комплексов, а затем проводили электрофорез во втором направлении в денатурирующих условиях. Гель экспонировали с рентгеновской пленкой в течение двух суток, по истечении которых проводили анализ полученных радиоавтографов. На Рис. 17 показан радиоавтограф геля второго направления. Участок, обведенный пунктирной линией, (отсутствующий в том случае, если не добавлять синтезированный СTCF в реакционную смесь перед первым направлением) вырезали, элюировали, и проводили второй раунд селекции по той же схеме.
Амплифицированный при помощи ПЦР набор фрагментов ДНК, полученных в результате двух циклов отбора, клонировали. Для дальнейшего анализа было отобрано колоний. Полученную библиотеку, обогащенную последовательностями, способными к специфическому связыванию с белком CTCF, проверяли на наличие и размер вставок. Из проанализированных 84 клонов 13 содержали двойную вставку, 7 не содержали вставок и далее не анализировались. Остальные 64 клона, которые содержали вставку необходимой длины) были секвенированы. При сравнении нуклеотидных последовательностей между собой было выявлено 10 уникальных последовательностей, которые далее анализировали на их способность связываться с белками клеток HeLa.
Проверка способности обнаруженных фрагментов ДНК связываться с белком CTCF методом иммунопреципитации хроматина C помощью метода иммунопреципитации хроматина мы проверили способность выявленных нами десяти последовательностей связывать транскрипционный фактор CTCF in vivo в клетках линии HeLa. Выбор клеточной линии обусловлен тем, что, согласно литературным данным в клетках этой линии достаточно высокий уровень экспрессии CTCF (Docquier et al. 2005).
Для иммунопреципитации хроматина мы использовали антитела к транскрипционному фактору CTCF (анти-CTCF), полученные к N-концевому фрагменту белка. В качестве отрицательного контроля проводили преципитацию ДНК-белковых комплексов c неспецифическими антителами, полученными к растительному белку тауматину (любезно предоставлены Е.А. Стукачевой, ИБХ РАН). Для анализа выделенной ДНК проводили ПЦР-амплификацию со специфическими парами праймеров всех десяти последовательностей. Результаты СhIP представлены на Рис. 18А. Как видно, все фрагментов, обнаруженные ранее по способности связываться с CTCF in vitro, амплифицируются с матрицы выделенной ДНК, полученной в результате сшивания геномной ДНК с белками хроматина и последующей преципитации антителами к CTCF (панель "ChIP"). Амплификации фрагментов не наблюдается при использовании неспецифических антител к растительному белку тауматину (панель "Контроль"). Панель "Input" представляет собой результат амплификации со специфическими парами праймеров фрагментированной геномной ДНК.
В качестве положительного контроля мы амплифицировали фрагмент промотора гена с-myc длинной 150 п.о., способный специфически связываться с CTCF (Filippova et al.
1996). Как видно на Рис. 18Б, при этом образуется продукт ожидаемой длины, в то время, как амплификации фрагмента кодирующей части гена бета-актина (отрицательный контроль) не наблюдается. Можно сделать вывод, что все десять обнаруженных фрагментов связываются с транскрипционным фактором CTCF in vivo в клетках линии HeLa.
Наши данные по связыванию CTCF подтверждают гипотезу о том, что белок, способный связываться с данной последовательностью in vitro, будет способен связываться с этой последовательностью и в составе хроматина. По-видимому, вследствие своей динамической природы, структура хроматина представляет собой лишь относительное препятствие для связывания факторов транскрипции (см. обсуждение в работе Morse 2003).
Картирование и анализ расположения фрагментов, связывающихся с CTCF, в локусе FXYD5-COX7A1 19 хромосомы человека Анализ нуклеотидных последовательностей не выявил каких-либо консенсусных участков в первичной структуре локуса. Несмотря на то, что белок СTСF называют CCCTCсвязывающим фактором, он также взаимодействует с последовательностями, не содержащими мотив СССТС (Vostrov and Quitschke 1997). Поиск мотива CCCTC в обнаруженных нами фрагментах выявил шесть фрагментов, содержащих, по крайней мере, по одному такому мотиву. В общей сложности во всех десяти последовательностях с общей протяженностью 3984 п.о. найдено 17 мотивов СССТС, то есть в этих последовательностях СССТС-мотив встречается в четыре раза чаще, чем ожидается для случайно выбранной последовательности, имеющей такую же длину (1 мотив/1024 п.о.). В четырех последовательностях, в которых отсутствует участок СССТС, найдены похожие мотивы, такие как, СССТТСС и ССТССС.
Если предположить, что частота встречаемости сайтов связывания CTCF в области FXYD5-COX7A1 характерна для всего генома, то суммарное количество мест связывания белка в геноме составит ~30 тыс. Полученное значение согласуется с экспериментально установленным средним размером доменов хроматина, значение которого колеблется в пределах от 80 до 300 т.п.о. (Heng et al. 2001), что соответствует 10-40 тысячам пограничных элементов (инсуляторов) в геноме млекопитающих. Следует учитывать, что CTCF - это многофункциональный фактор, и может помимо инсуляторов связываться и с другими регуляторными элементами. Кроме того, за счет добавления в реакцию связывания ДНК Cot1, нами были в основном выведены из рассмотрения сайты связывания, расположенные в повторяющихся элементах генома, которые могут играть определенную функциональную роль, включая формирование независимых транскрипционных доменов (Willoughby et al. 2000) Все десять обнаруженных нами, фрагментов были нанесены на карту области FXYD5-COX7A1 хромосомы 19 человека (Рис. 19). Семь идентифицированных последовательностей локализованы внутри генов, три в межгенных областях. Чаше всего участки связывания CTCF располагаются в интронах (в некоторых случаях частично перекрываются с небольшими экзонами) генов GAPDS (глицеральдегид-3фосфатдегидрогеназа, специфичная для яичек), WDR62, кодирующий гипотетический белок с неустановленной функцией; MAG (гликопротеин, ассоциированный с миелином); и CD(изоформа В-клеточного рецептора), а также в 3'-нетранслируемой области гена ATP4A (каталитическая -субъединица H+/K+-АТФ-азы, ответственная за поддержание определенной кислотности в желудке). Все указанные гены характеризуются различной тканеспецифической экспрессией.
Так как CTCF связывается с последовательностями, обладающими функциями инсуляторов, некоторые из найденных участков (в основном фрагменты, локализованные в межгенных участках) могут выполнять функции инсуляторных элементов, разграничивая функционально-независимые домены хроматина. Нами были определены три гена, фланкированные с каждой стороны сайтами связывания CTCF, которые могут выполнять роль пограничных элементов: ген, кодирующий -субъединицу H+/K+-АТФ-азы, ограниченный фрагментами 2 и 8; ген MAG (myelin-associated glycoprotein), кодирующий гликопротеин, ассоциированный с миелином, фланкированный фрагментами 4 и 5, и ген TMEM147, кодирующий белок, содержащий семь трансмембранных доменов, ограниченный фрагментами 1 и 8. По крайней мере, два из указанных генов характеризуются тканеспецифичностью экспрессии, отличающейся от тканеспецифичности экспрессии окружающих их генов. Ген ATP4A, например, экспрессируется преимущественно в слизистой желудка и поджелудочной железе (Oshiman et al. 1991), а ген MAG - преимущественно в нервных тканях (Konat 1996). Можно предположить, что фрагменты, фланкирующие эти гены, способны выполнять роль инсуляторов, образующих петлевые домены хроматина.
Область FXYD5-COX7A1 содержит кластер из четырех генов, кодирующих рецепторы, сопряженные с G-белками: FFAR3, GPR41, GPR42 и FFAR2. Ранее было обнаружено, что гены GPR41 и FFAR2 имеют различные профили экспрессии (Brown et al.
2003). Обнаруженный нами фрагмент 9, расположенный между генами GPR42 и FFAR2, потенциально способен обеспечивать независимую экспрессию этих генов.
Две обнаруженные нами последовательности, связывающиеся с белком CTCF, содержат фрагменты повторяющихся элементов, схожих с Alu-элементами и способные к транспозициям. В литературе нет данных о расположении сайтов связывания CTCF в мобильных элементах генома, однако у некоторых Alu-элементов обнаружены свойства инсуляторов (Willoughby et al. 2000).
Разработанный нами метод позволяет выявлять последовательности, способные связываться и с другими транскрипционными факторами, что чрезвычайно актуально при создании функциональных карт геномов.
3. ИДЕНТИФИКАЦИЯ И КАРТИРОВАНИЕ ПОТЕНЦИАЛЬНЫХ ИНСУЛЯТОРОВ Ранее мы рассмотрели идентификацию и картирование в геноме человека участков связывания ядерных белков и S/MAR-элементов. В данной главе мы предлагаем подход к идентификации и картированию еще одного класса регуляторных элементов генома - инсуляторов. Инсуляторы - это последовательности ДНК, способные предотвращать нежелательные взаимодействия между регуляторными элементами генома, например между промотором и энхансером, а также, будучи помещенными по краям генетической конструкции (трансгена), вводимой генно-инженерными способами в клетки, образовывать независимый домен и тем самым защищать экспрессию трансгена от эффекта положения (Gaszner and Felsenfeld 2006; Valenzuela and Kamakaka 2006; West and Fraser 2005). В частности, одним из основных свойств инсуляторов является их способность блокировать действие энхансера на промотор только в том случае, если инсулятор располагается между этими элементами. На основе этого свойства мы разработали систему для поиска инсуляторов в длинных геномных последовательностях.
Отбор потенциальных инсуляторов Для идентификации и картирования потенциальных инсуляторов мы применили эффект блокирования энхансера (Kellum and Schedl 1992) и позитивно-негативную селекцию (Borrelli et al. 1988). Общая схема метода представлена на Рис. 20А. Библиотеку коротких фрагментов изучаемой области генома клонируют между промотором и энхансером гена тимидинкиназы вируса простого герпеса (HSV-tk). Вставка фрагмента ДНК, обладающего активностью инсулятора, между промотором и энхансером гена HSV-tk существенно ингибирует экспрессию этого гена в клетках, стабильно трансфицированных приведенной на Рис. 20А конструкцией, что придает этим клеткам устойчивость к ганцикловиру. Геномная ДНК этих клеток используется как матрица для ПЦР с праймерами 1L и 1R, полученные фрагменты ДНК далее клонируют и анализируют.
Для селекции потенциальных инсуляторов нами был сконструирован вектор pPNT/EmP. При конструировании вектора использованы плазмиды pGTN8 и pPNT, любезно предоставленные Е.В.Снежковым. За основу конструкции была взята плазмида pPNT (Tybulewicz et al. 1991), содержащая ген устойчивости к неомицину (NeoR) и ген тимидинкиназы вируса простого герпеса (HSV-tk), придающий экспрессирующим его клеткам чувствительность к ганцикловиру (GANC), позволяющие проводить позитивнонегативную селекцию. Промотор фосфоглицераткиназы (PGK), управляющий геном тимидинкиназы, был заменен на регуляторную область из плазмиды pGTN8, содержащую минимальный промотор цитомегаловируса (CMV) и энхансер CMV. В результате этой и других модификаций была получена плазмида pPNT/EmP (Рис. 20Б).
В дальнейшем pPNT/EmP была использована в качестве негативного контроля при негативной селекции, придавая содержащим ее клеткам чувствительность к GANC. В качестве положительного контроля была изготовлена плазмида pPNT/mP, содержащая в регуляторной области перед геном тимидинкиназы только минимальный промотор CMV и придающая клеткам фенотип GANCR.
Источником ДНК для идентификации инсуляторов в области FXYD5-COX7Aхромосомы 19 человека служила та же библиотека коротких фрагментов этой области, что и для идентификации и картирования S/MAR-элементов этого локуса. Библиотека была амплифицирована при помощи адаптера, содержавшего сайт узнавания Xho I.
Продукты ПЦР, расщепленные Xho I, лигировали с обработанным Sal I вектором pPNT/EmP. В результате лигирования вектора со вставкой утрачивались сайты для рестриктаз Xho I и Sal I. Для предотвращения трансформации клеток векторами, не содержащими вставки, лигазная смесь предварительно была обработана Sal I.
Последовательность области FXYD5-COX7A1 длиной 1 млн. п.о. при расщеплении образует около 2000 фрагментов со средней длиной 500 п.о. Учитывая то, что для повышения представительности библиотеки исходная ДНК была расщеплена независимо двумя различными ферментами (Sau3A и Csp6-1, см. Материалы и методы), число различных фрагментов возросло до 4000. Следовательно, для получения представительной библиотеки с не менее чем трехкратным перекрыванием изучаемой области необходимо было получить не менее 12000 независимых клонов. Для получения такой представительности библиотеку выращивали на чашках Петри, после чего ~12000 колоний были суспендированы в жидкой среде LB. Из этой суспензии и был выделен пул плазмид pPNT/EmP, содержащих короткие вставки, перекрывающие изучаемую область генома.
Далее этим пулом трансфицировали клетки CHO. Параллельно были проведены контрольные трансфекции плазмидами pPNT/EmP (без вставки) и pPNT/mP, не содержащей энхансера. Последняя плазмида использовалась как положительный контроль на инсуляторную активность.
Клетки с интегрированными в геном конструкциями были отобраны селекцией на устойчивость к генетицину (G-418), и из устойчивых к генетицину клеток далее проводили отбор при помощи ганцикловира. Селекция ганцикловиром приводила к 100% гибели клеток, содержащих придающую им чувствительность к этому антибиотику плазмиду pPNT/EmP (без вставок). В то же время большинство клеток, содержащих контрольную плазмиду pPNT/mP, оказалось устойчивой к ганцикловиру. Наблюдавшееся все же незначительное число погибших клеток является, по всей видимости, следствием интеграции pPNT/mP в области генома, подверженные активации эндогенными энхансерами.
Анализ отобранных клонов После селекции клеток, трансфицированных pPNT/EmP с лигированным пулом коротких фрагментов, выделяли геномную ДНК из устойчивых к ганцикловиру клеток и использовали ее как матрицу для ПЦР с праймерами 1L и 1R (Рис. 20А). Результаты ПЦР приведены на Рис. 21А. Можно видеть, что исходный набор фрагментов ДНК (дор. 1) после клонирования в pPNT/EmP, трансфекции и позитивно-негативной селекции переходит в ограниченный набор фрагментов (дор. 2). При использовании для ПЦР ДНК-матрицы, полученной из контрольных клеток, трансфицированных плазмидой pPNT/EmP (без селекции ганцикловиром) получается единственная полоса, соответствующая фрагменту ДНК, амплифицируемому праймерами 1L и 1R на плазмиде без вставки (дор. 3). При использовании ДНК-матрицы из клеток, трансфицированных pPNT/mP, продукта не наблюдается, т.к. эта конструкция не содержит последовательности праймера 1L.
Отобранные фрагменты ДНК (Рис. 21А, дор. 2) были клонированы, и полученные клоны проверены на наличие и размер вставок при помощи ПЦР с праймерами 1L и 1R (Рис. 21Б). Можно видеть, что все проверенные клоны содержали вставки. 20 вставок были секвенированы, при этом было получено 8 независимых последовательностей.
Нужно отметить, что ген тимидинкиназы в процессе отбора мог подвергнуться мутациям, нарушающим активность белка. Кроме того, экспрессия тимидинкиназы в некоторых клетках могла быть селективно ингибирована за счет регуляторных элементов генома, расположенных вблизи интегрированной конструкции. В обоих случаях клетки могли стать устойчивыми к ганцикловиру, и последовательности ДНК, полученные из таких клеток, ошибочно идентифицированы как инсуляторы. Чтобы устранить такую возможность, мы провели дополнительный цикл селекции, в котором все 8 полученных потенциальных инсуляторов были поодиночке клонированы в pPNT/EmP и вновь трансфицированы в клетки CHO. Все трансфицированные клетки оказались устойчивыми к ганцикловиру, что доказывает правильность отбора данных последовательностей.
Экспрессия гена HSV-tk может быть ингибирована и в тех случаях, когда клонированный в pPNT/EmP геномный фрагмент обладает не инсуляторной, а сайленсерной активностью (Brand et al. 1985; Laimins et al. 1986). Так как активность сайленсера, в отличие от инсулятора, не зависит от положения и ориентации относительно промотора, то при конструировании вектора мы предположили, что сайленсер будет подавлять активность не только тимидинкиназы, но и находящегося неподалеку гена устойчивости к неомицину, и такие клетки будут погибать на стадии селекции G-418. Для проверки эффективности этого процесса мы клонировали три из идентифицированных последовательностей (№ 2, 5 и 8, см. ниже) в плазмиду pGL3-promoter vector с 5'-стороны от промотора SV-40 и измерили люциферазную активность такой конструкции при транзиентной трансфекции в клетки HeLa относительно исходного вектора. Во всех трех случаях сайленсерной активности не наблюдалось.
Хорошо известно, что большинство инсуляторов высших организмов способны связывать фактор транскрипции CTCF, принимающий участие в блокировании энхансера (Ohlsson et al. 2001). Для проверки способности потенциальных инсуляторов связывать CTCF, мы провели эксперименты по иммунопреципитации хроматина для 7 из отобранных нами последовательностей. Последовательность 8 состоит в основном из повторяющегося элемента Alu, что делает практически невозможным подбор к ней качественных праймеров для ПЦР. Как видно из Рис. 22, все 8 фрагментов с потенциальной инсуляторной активностью, амплифицируются с матрицы ДНК, полученной в результате сшивания геномной ДНК с белками хроматина и последующей преципитации антителами к CTCF (панель "ChIP"). Амплификации фрагментов не наблюдается при использовании неспецифических антител к растительному белку тауматину (панель "Контроль"). Панель "Input" представляет собой результат амплификации со специфическими парами праймеров фрагментированной геномной ДНК. Положительный и отрицательный контроли аналогичны Рис. 18Б (не показано).
Можно сделать вывод, что все фрагменты связываются с транскрипционным фактором CTCF in vivo в клетках линии HeLa.
Если допустить, что содержание потенциальных инсуляторов в изученной области типично для всего генома человека, можно оценить количество инсуляторов в геноме в 20000. Эта цифра вполне согласуется со средней длиной хроматинового домена, определенной из эксперимента как 80-300 т.п.о. (Heng et al. 2001), что соответствует примерно 10000-40000 пограничных элементов на геном млекопитающих.
4.13.3. Расположение инсуляторов в геномной последовательности Восемь фрагментов ДНК со свойствами потенциальных инсуляторов были картированы в области FXYD5-COX7A1 хромосомы 19 человека (Рис. 23). Из них последовательностей были найдены в межгенных областях, две - в интронах, и одна последовательность перекрывала два коротких экзона и один короткий интрон. Было обнаружено, что два гена фланкированы инсуляторами с обеих сторон - ген альфаполипептида H+/K+ ATP-азы (ATP4A) ограничен инсуляторами 5 и 1, а ген белка, сходного с предшественником бета-амилоида (APLP1) ограничен инсуляторами 4 и 8 (Рис. 23). Для обоих генов характерна строгая тканеспецифичность экспрессии - ATP4A экспрессируется в слизистой оболочке желудка (Oshiman et al. 1991), а APLP1 - в нервных тканях (Wasco et al.
1992). Эти данные согласуются с представлением о том, что инсуляторы подразделяют геномную ДНК на петлевые домены, содержащие гены со сходными профилями экспрессии (Bell et al. 2001).
Область FXYD5-COX7A1 содержит также кластер генов, кодирующих рецепторы, ассоциированные с G-белком - FFAR2, FFAR3, GPR41 и GPR42. Ранее было обнаружено, что GPR41 и FFAR2 имеют различные профили экспрессии, а GPR42 предположительно является неактивным псевдогеном GPR41 (Brown et al. 2003). Положение потенциального инсулятора 6, находящегося между GPR41 и FFAR2, согласуется с независимой экспрессией этих генов.
Пять из восьми найденных инсуляторов содержат фрагменты повторяющихся последовательностей, в основном ретротранспозонов. Так, инсулятор 1 содержит фрагмент длинного диспергированного элемента LINE (Kazazian and Goodier 2002), а инсулятор 8 - длинный концевой повтор эндогенного ретровируса человека ERV1 (Renan and Reeves 1987). Последовательности 2, 4 и 7 частично перекрываются с Alu-элементами. Было показано, что некоторые Alu-элементы обладают активностью инсуляторов. Например, был описан Alu-элемент, расположенный в 5'-некодирующей области гена кератина 18 мыши и способный защищать трансген от эффекта положения (Recillas-Targa et al. 2004).
Ретротранспозиция элементов Alu и LINE, таким образом, может быть одним из механизмов перестройки доменной структуры хроматина (Arnold et al. 2000). Можно предположить, что одной из регуляторных функций ретроэлементов является их участие в образовании функциональных доменов. Подобное предположение высказывалось нами ранее для ретроэлементов, содержащих S/MARs.
Нужно отметить, что изученная область может содержать и другие инсуляторы, которые не были идентифицированы из-за ограниченных возможностей использованного подхода. Идентифицируемые при данном подходе инсуляторы должны быть активны в клетках CHO и по отношению к промоторно-энхансерной паре цитомегаловируса, таким образом некоторые ткане- или энхансер-специфичные инсуляторы могли быть пропущены.
Эти недостатки, однако, могут быть преодолены путем использования других клеточных линий и промоторно-энхансерных конструкций. Таким образом, несмотря на перечисленные недостатки, предложенный подход может стать важным инструментом функциональной геномики.
4. ЗАКЛЮЧЕНИЕ. ПЕРВЫЙ ВАРИАНТ ИНТЕГРАЛЬНОЙ КАРТЫ ФУНКЦИОНАЛЬНЫХ ЭЛЕМЕНТОВ Основной задачей при экспериментальном картировании цис-регуляторных элементов генома является получение достаточно полной библиотеки фрагментов ДНК, содержащих эти элементы. В идеале такая библиотека должна содержать все активные в данном типе клеток регуляторные элементы и не содержать ничего кроме них. В этом случае построение карты расположения данных элементов в секвенированном геноме может быть сведено к массированному секвенированию (Barski et al. 2007; Bentley 2006) этой библиотеки с последующей привязкой полученных сиквенсов к последовательности генома, либо же к картированию этих же фрагментов при помощи гибридизации с геномными микрочипами (Mockler et al. 2005; Shields 2006).
Нами предложен ряд экспериментальных подходов для получения высокообогащенных клонотек фрагментов ДНК, содержащих регуляторные элементы генома - участки прикрепления ДНК к ядерному матриксу, инсуляторы и участки связывания факторов транскрипции и других ядерных белков.
Описанные подходы можно разделить на две группы. В первую группу входят методы, которые можно назвать структурными, т.е. из генома или его части отбираются и клонируются фрагменты, способные к структурным взаимодействиям с белками (картирование сайтов связывания белков с ДНК) либо субклеточными структурами (картирование S/MARs). Вторую группу составляют функциональные подходы, обычно использующие Уметод репортерного генаФ, т.е. отбираются фрагменты ДНК, обладающие функциональной активностью при клонировании их в систему, после трансфекции придающую клеткам какой-либо легко обнаруживаемый признак - устойчивость к антибиотику либо способность к флюоресценции. Таким методом можно отобрать из генома и клонировать фрагменты ДНК, обладающие промоторной, энхансерной, инсуляторной и другими активностями. Мы продемонстрировали пригодность разработанных подходов для построения функциональных карт на примере длинных мультигенных участков хромосомы 19 человека.
Важнейшей особенностью распределения регуляторных элементов в геноме является его тканеспецифичность. Очевидно, что картина распределения регуляторных элементов одного и того же генома может быть различной для различных типов клеток и тканей, стадий дифференцировки клеток и даже различных состояний ткани и организма. В рамках данной работы нами предложен метод сравнения двух или более типов клеток по распределению в их геномах участков связывания белковых факторов (метод EMSAдисплея).
На основании полученных нами в данной работе и имеющихся литературных данных мы построили первый вариант интегрированной карты регуляторных последовательностей для области хромосомы 19 человека длиной 500 т.п.о., расположенной между генами FXYD5 и TZFP (Рис. 23). Полученная карта пока далека от завершения, особенно в части тканеспецифичности действия приведенных регуляторных последовательностей. Тем не менее, она дает представление о сложности регуляторной системы генома и о трудности их исследования. Мы надеемся, что предложенные в настоящей работе методы позволят в обозримом будущем создать более исчерпывающие функциональные карты как отдельных областей, так и полных геномов.
5.
ОСНОВНЫЕ ВЫВОДЫ 1. Cформулирован подход к функциональному картированию геномов, заключающийся в построении подробных карт, включающих все или большую часть цис-регуляторных элементов относительно небольших (несколько млн. п.о.) областей генома.
2. Разработан универсальный метод идентификации участков прикрепления ДНК к ядерному матриксу (S/MARs). При помощи этого метода идентифицировано и картировано 22 S/MARs, находящихся на хромосоме 19 человека, а также повторяющийся S/MAR-элемент, связанный с семейством генов карциноэмбриональных антигенов (CEA-MAR). Высказано предположение о том, что дупликация генов семейства может происходить по границам петлевых доменов хроматина.
3. В области FXYD5-COX7A1 хромосомы 19 человека длиной 1 млн.п.о. идентифицировано и картировано 16 S/MAR-элементов, а в области потери гетерозиготности при раке легких q22.1 хромосомы 16 человека длиной 2,9 млн.п.о. - 40 S/MAR-элементов.
4. Выявлен подкласс S/MAR-элементов, не обогащенных АТ-парами оснований и обращенными повторами и показано, что S/MARs могут располагаться не только в межгенных областях, но и в интронах генов, а также в их 3'-нетранслируемых областях.
5. Показано, что некоторые представители повторяющихся элементов семейства LINE обладают предпочтительным сродством к ядерному матриксу.
6. Разработан метод двумерного сдвига электрофоретической подвижности (EMSA), с помощью которого в области FXYD5-TZFP хромосомы 19 человека длиной 560 т.п.о.
идентифицированы и картированы 52 участка, специфически связывающих ядерные белки. Показано, что участки связывания белков не располагаются преимущественно в 5'-областях генов, а могут с большой частотой обнаруживаться в интронах и 3'некодирующих участках.
7. Разработан метод EMSA-дисплея, способный идентифицировать тканеспецифичные участки связывания белков. С его помощью идентифицированы 10 фрагментов ДНК, образующие различные комплексы с ядерными белками в разных типах клеток.
8. Разработан метод идентификации участков связывания ядерных белков на основе иммуномагнитной сепарации. При помощи этого метода выявлено и картировано последовательностей хромосомы 19 человека, способных связываться с белком Max.
9. Разработана система поиска инсуляторов в протяженных геномных последовательностях.
В области FXYD5-COX7A1 хромосомы 19 человека идентифицированы и картированы восемь потенциальных инсуляторов. Методом иммунопреципитации хроматина показано, что семь из восьми потенциальных инсуляторов способны связываться с фактором транскрипции CTCF.
10. С помощью двумерного EMSA выявлены 10 участков области FXYD5-COX7Aхромосомы 19 человека длиной 1 млн.п.о., способных специфически связываться с фактором транскрипции CTCF in vitro и in vivo. Показано, что семь из десяти последовательностей расположены внутри генов (преимущественно в интронах), три расположены в межгенных участках локуса.
11. Построен прототип карты функциональных элементов для области хромосомы человека длиной ~600 т.п.о.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ Обзоры 1. Nikolaev, L.G., S.B. Akopov, I.P. Chernov, E.D. Sverdlov. 2007. Maps of cis-regulatory nodes in megabase long genome segments are an inevitable intermediate step toward whole genome functional mapping. Current Genomics 8:137-149.
2. Акопов, С.Б., И.П. Чернов, А.С. Ветчинова, С.С. Буланенкова, Л.Г. Николаев. 2007.
Идентификация и картирование цис-регуляторных элементов внутри длинных геномных последовательностей. Молек. биология 41:787-792.
3. Акопов, С.Б., И.П. Чернов, С.С. Буланенкова, Ю.В. Скворцова, А.С. Ветчинова, Л.Г.
Николаев. 2007. Методы идентификации эпигенетических элементов млекопитающих в длинных мультигенных геномных последовательностях. Биохимия 72:725-732.
4. Чернов, И.П., С.Б. Акопов, Л.Г. Николаев. 2004. Структура и функции участков прикрепления ДНК к ядерному матриксу (S/MARs). Биоорганич. химия 30:1-11.
Статьи 5. Shaposhnikov, S.A., S.B. Akopov, I.P. Chernov, P.D. Thomsen, C. Joergensen, A.R. Collins, E.
Frengen, L.G. Nikolaev. 2007. A map of nuclear matrix attachment regions within the breast cancer loss of heterozygosity region on human chromosome 16q22.1. Genomics 89:354-361.
6. Chernov, I.P., K.A. Timchenko, S.B. Akopov, L.G. Nikolaev, E.D. Sverdlov. 2007.
Identification of tissue-specific DNA-protein binding sites by means of two-dimensional electrophoretic mobility shift assay display. Anal. Biochem. 364:60-66.
7. Vetchinova, A.S., S.B. Akopov, I.P. Chernov, L.G. Nikolaev, E.D. Sverdlov. 2006. Twodimensional electrophoretic mobility shift assay: identification and mapping of transcription factor CTCF target sequences within an FXYD5-COX7A1 region of human chromosome 19.
Anal. Biochem. 354:85-93.
8. Chernov, I.P., S.B. Akopov, L.G. Nikolaev, E.D. Sverdlov. 2006. Identification and mapping of DNA binding proteins target sequences in long genomic regions by two-dimensional EMSA.
BioTechniques 41:90-96.
9. Akopov, S.B., V.M. Ruda, V.V. Batrak, A.S. Vetchinova, I.P. Chernov, L.G. Nikolaev, J. Bode, E.D. Sverdlov. 2006. Identification, genome mapping, and CTCF binding of potential insulators within the FXYD5-COX7A1 locus of human Chromosome 19q13.12. Mamm. Genome 17:10421049.
10. Сасс, А.В., В.М. Руда, С.Б. Акопов, Е.В. Снежков, Л.Г. Николаев, Е.Д. Свердлов. 2005.
Регуляторный потенциал S/MAR-элементов при транзиентной экспрессии. Биоорганич.
химия 31:77-81.
11. Iarovaia, O.V., S.B. Akopov, L.G. Nikolaev, E.D. Sverdlov, S.V. Razin. 2005. Induction of transcription within chromosomal DNA loops flanked by MAR elements causes an association of loop DNA with the nuclear matrix. Nucleic Acids Res. 33:4157-4163.
12. Chernov, I.P., S.B. Akopov, L.G. Nikolaev, E.D. Sverdlov. 2002. Identification and mapping of nuclear matrix attachment regions in a one megabase locus of human chromosome 19q13.12:
Long-range correlation of S/MARs and gene positions. J. Cell. Biochem. 84:590-600.
13. Bode, J., T. Schlake, M. Iber, D. Schubeler, J. Seibler, E. Snezhkov, L. Nikolaev. 2000. The transgeneticist's toolbox: novel methods for the targeted modification of eukaryotic genomes.
Biol. Chem. 381:801-813.
14. Чернов, И.П., А.С. Поляков, С.Б. Акопов, Л.Г. Николаев, Т.Л. Ажикина, М.Б. Костина, Е.Д. Свердлов. 1999. Идентификация и картирование на хромосоме 19 человека хромосомспецифического повторяющегося элемента, предпочтительно связывающегося с ядерным матриксом. Биоорганич. химия 25:355-361.
15. Николаев, Л.Г., С.Б. Акопов, И.П. Чернов, Б.О. Глотов, Л.К. Эшворт, Е.Д. Свердлов.
1998. Расположение 19 участков связывания ДНК с ядерным матриксом (MARs) на хромосоме 19 человека. Доклады РАН 361:409-411.
16. Акопов, С.Б., Л.Г. Николаев, О. Тырсин, А.С. Рузов, Е.Д. Свердлов. 1997.
Идентификация и характеристики 14 последовательностей генома китайского хомячка, предпочтительно связывающихся с ядерным матриксом. Биоорганич. химия 23:727-731.
17. Nikolaev, L.G., T. Tsevegiyn, S.B. Akopov, L.K. Ashworth, E.D. Sverdlov. 1996.
Construction of a chromosome specific library of human MARs and mapping of matrix attachment regions on human chromosome 19. Nucleic Acids Res. 24:1330-1336.
18. Николаев, Л.Г. 1996. Идентификация и выделение белков, узнающих последовательность энхансера HIV-1. Молек. биология 30:714-720.
19. Volik, S., Y. Lebedev, L. Nikolaev, Y. Shevchenko, T. Vinogradova, E. Kopantzev, T.
Kolesnik, G. Monastyrskaya, U. Kunz, K.H. Grzeschik, E.D. Sverdlov. 1995. Mapping of transcribed sequences on human chromosome 19. DNA Seq. 6:13-26.
20. Николаев, Л.Г., Ц. Цогтхишиг, С.Б. Акопов, Е.Д. Свердлов. 1995. Картирование на хромосоме 19 человека последовательностей, предпочтительно связывающихся с ядерным матриксом. Биоорганич. химия 21:959-963.