Главная / Категории / Типы работ

Инструментальное средство поиска регуляторных мотивов в геномах

Дипломная работа - Компьютеры, программирование

Другие дипломы по предмету Компьютеры, программирование



я транскрипционных факторов

Палиндром

- GACTGCGCAGTC-3

3 - GACTGCGCAGTC-5Прямой повтор

- GACTGCagtGACTGC-3

3 - GCAGTCactGCAGTC-5Инвертированный повтор

- GACTGCagtGCAGTC-3

3 - GACTGCactGCAGTC-5алгоритм поиск мотив марковский модель

Палиндром - это сайт, полностью соответствующий своему обратному комплементу (например, CACGTG). Сайты прямых и инвертированных повторов состоят из двух плеч, разделенных промежутком - спейсером. Длина спейсера часто постоянна, но иногда может варьироваться на несколько нуклеотидов. Плечи прямых повторов имеют совпадающую последовательность. Плечи инвертированных повторов обратно комплементарны. Если длина спейсера инвертированного повтора равна нулю, этот сайт можно назвать палиндромом.

.1.2 Различные структуры сайтов связывания

Рассмотрим различные структуры сайтов связывания на примере рецепторов стероидных гормонов. Это внутриклеточные рецепторы, чаще всего локализованные в ядре и осуществляющие передачу сигнала от стероидных гормонов [7].

ДНК-связывающий домен стероидных рецепторов содержит аминокислоты, специфично связывающиеся с гормон-чувствительнным элементом (сайтом связывания) на последовательности ДНК. Этот участок состоит из 66-68 высоко консервативных аминокислот, из которых 8 цистеинов образуют 2 структуры типа цинковых пальцев, которые взаимодействуют с ДНК. Остальные аминокислоты ДНК-связывающего домена определяют специфичность связывания различных стероидных рецепторов (рис. 2).

Рис. 2. Структура ДНК-связывающего домена ядерных рецепторов. Синими кружками обозначены остатки цистеина, образующие координационные связи с цинком (Zn), оранжевыми - аминокислотные остатки, непосредственно контактирующие с нуклеотидами, зелеными - аминокислотные остатки, участвующие в димеризации рецепторов

Общая схема взаимодействия такова: два рецептора связываются с гормоном, а затем образуют гомодимер. Этот гомодимер связывается с гормон-чувствительным элементом. Затем в процесс транскрипции включаются другие транскрипционные факторы и РНК полимераза II, что стабилизирует преинициативный комплекс и запускает синтез мРНК (рис. 3).

Рис. 3. Общая схема механизма работы рецепторов стероидных гормонов. HRE - гормон-чувствительный элемент, pol II - РНК полимераза II

Сайт связывания чаще всего расположен в промоторной области или на расстоянии нескольких килобаз до TATA и CAAT боксов, которые находятся рядом с сайтом начала транскрипции. Предполагают, что в последнем случае позиционирование нуклеосомы может усиливать стимулирующее действие рецепторов на транскрипцию за счет образования петли (рис. 4).

Рис. 4. Участие нуклеосомы в образовании петли для усиления действия рецептора на процесс транскрипции. NR - ядерный рецептор, HRE - гормон-чувствительный элемент, TF - транскрипционный фактор, TFBS - его сайт связывания, Pol - РНК полимераза II

Гомодимеры рецепторов I типа связываются с сайтами, имеющими структуру типа палиндром или инвертированный повтор со спейсером длиной в 3 нуклеотида. Гомодимеры рецепторов II типа связываются с сайтами, имеющими структуру типа прямой повтор с вариабельным спейсером длины 0-5 нуклеотидов (рис. 5).

Рис. 5. Взаимодействие связанных с гормоном (черные треугольники) гомодимеров рецепторов стероидных гормонов с гормон-чувствительным элементом (HRE)

Размер спейсера между полусайтами гормон-чувствительных элементов определяет взаимодействие с ДНК димерных ядерных рецепторов. Чем больше длина спейсера, тем более специфичен гормон-чувствительный элемент [8] (рис. 6).

Рис. 6. Зависимость специфичности сайтов связывания транскрипционных факторов от длины спейсера на примере различных гетеродимеров RXR

1.2 Способы представления регуляторных элементов

Наиболее распространенными способами представления последовательностей сайтов связывания белков с ДНК являются консенсус (регулярное выражение) и позиционная весовая матрица (PWM - position weight matrix, или PSSM - position-specific scoring matrix). Консенсус представляет собой общий вид последовательности сайта - слово, составленное из нуклеотидов, наиболее часто встречающихся в конкретных позициях сайта. Часто для учета вариаций в некоторых позициях консенсуса помимо основных четырех букв используют обозначения вырожденных нуклеотидов в соответствии с нормами IUPAC. Консенсусы хорошо подходят для описания сайтов связывания белков, которые связываются со строго консервативной последовательностью (например, белки системы рестрикции-модификации II-ого типа).

Однако консенсус не позволяет хорошо описать сайты в том случае, если последовательность сайта сильно варьируется. PWM, которые впервые были введены для характеристики сайтов инициации транскрипции и трансляции у E.coli [9, 10], значительно лучше подходят для описания сайтов связывания факторов транскрипции, так как способны количественно охарактеризовать частые и редкие вариации в последовательности сайтов, что невозможно в случае регулярных выражений.

PWM представляют собой матрицу L 4 (L - длина сайта), каждый элемент которой отражает частоту встречаемости данного нуклеотида в данной позиции сайта. Вес, порождаемый матрицей при выравнивании с данным участком последовательности, обычно вычисляется как сумма элементов матрицы, соответствующих нуклеотидам, стоящим в каждой позиции рассматриваемого участка (рис. 7).

Рис. 7. Конст?/p>