Разработка алгоритмов для оптимизации пространственных структур РНК

Дипломная работа - Биология

Другие дипломы по предмету Биология



?лярной цепи.

Будем поочерёдно производить минимизацию каждого конечного элемента (об их задании сказано в пункте 4.1), начиная от элемента, содержащего в себе точку-начало отсчёта натурального параметра s (для всей молекулярной цепи). Для этого при минимизации построенного в пункте 3.3 функционала упругой энергии W будем использовать метод наискорейшего спуска (см. [4]), но также нам необходимо учесть граничные условия, возникающие в точках перегиба:

непрерывность молекулярной цепи: координаты X, Y и Z начальной точки (N+1)-го элемента должна совпадать с координатами конечной точки N-го элемента;

гладкость молекулярной цепи: значения кривизн на конце N-го элемента и на начале (N+1)-го элемента должны совпадать.

Таким образом, всего будет 4 граничных условия. Эти условия мы будем учитывать с помощью метода множителей Лагранжа (см. [4]), реализовав, таким образом, градиентный метод с ограничениями типа равенств, которые для данного метода будут иметь следующий вид:

где xN-1, yN-1, zN-1 - полученные на предыдущем (то есть (N-1)-ом) шаге значения координат, s соответствует последней точке конечного элемента. В качестве стартовой точки для метода Лагранжа возьмём точку {1;1;...;1}. Таким образом, мы будем проводить минимизацию для всех конечных элементов, пока не дойдём до последнего. У каждого из них будут свои параметры ?i и ?i, вычислив которые, мы сможем определить координаты x, y, z для любой точки в молекулярной цепи как:

Эти интегралы, как и интегралы в ограничениях из метода Лагранжа, не вычисляются аналитически, но их значения в заданных точках можно получить с помощью численных методов. В данной работе был использован метод Симпсона (см. [4]). Для вычисления антиградиента в методе наискорейшего спуска был использован метод неопределённых коэффициентов (см. [4]).

Таким образом, мы находим минимум функционала упругой энергии для всей молекулярной цепи, а также координаты всех образующих её нуклеотидов. По найденным данным мы можем также найти координаты концов перемычек, соответствующих Уотсон-Криковским связям:

Рис. 8: Нахождение координат перемычек

Исходя из входных параметров задачи, а также значений, полученных в результате минимизации упругой энергии, для конструкции на рисунке 8 нам будут известны координаты точек A, N и B - они являются координатами соответствующих нуклеотидов, а также значения углов ? и ? и длина перемычки NM (из входных параметров). Тогда значение точки M очевидным образом находится из формул для скалярного произведения векторов NA и NM, а также NB и NM. Таким образом, мы вычисляем значения координат концов всех перемычек, соответствующих Уотсон-Криковским связям, и подставляем их в программу-конвертер в формат PDB.

6. Расчёт третичной структуры РНК со шпилечными и многозвенными петлями

Определим оптимальную по упругой энергии пространственную структуру молекулы РНК, вторичной структурой которой является шпилечная петля. Зададим количество нуклеотидов в каждом конечном элементе вторичной структуры РНК (23 всего, из них 7 в петле), длины Уотсон-Криковских связей и длину одного нуклеотида в цепи, механические параметры конечных элементов свободного состояния молекулы, а также характеристики свободного состояния молекулы (радиус и шаг витка винтовой линии).

После применения построенного алгоритма минимизации и конвертации полученных значений в формат PDB, полученная в результате ~10 минут вычислений третичная структура выглядит так (вид с разных ракурсов):

Рис. 9 Искомая третичная структура молекулы

Теперь произведём расчёты для молекулы тРНК Phenilalanine Yeast, содержащей 72 нуклеотида, пространственная структура которой была найдена в работе [1] (стр. 29). Она содержит три шпилечные и одну многозвенную петли, её вторичная структура имеет вид:

Рис. 10 : Вторичная структура молекулы (всего 72 нуклеотида)

Полученная в результате ~3 часов вычислений третичная структура выглядит так (вид с разных ракурсов):

Рис. 11а. Искомая третичная структура молекулы

Рис. 11б Искомая третичная структура молекулы

Для сравнения, в работе [1] для данной молекулы тРНК была получена такая пространственная структура:

Рис. 12. Найденная ранее третичная структура молекулы

Заключение

В рамках данного проекта была произведена следующая работа:

изучены основные принципы строения молекулярной цепи РНК;

построена математическая модель свободного и напряжённого состояний молекулы РНК;

разработан и реализован алгоритм расчёта упругой энергии напряжённого состояния молекулы РНК;

разработан и реализован алгоритм минимизации функционала упругой энергии напряжённого состояния молекулы РНК;

реализован конвертер, переводящий полученные данные в формат PDB;

построены пространственные структуры для шпилечной петли и тРНК Phenilalanine Yeast.

В результате работы были разработаны программные средства для нахождения координат нуклеотидов, входящих в состав молекулы РНК с заданной вторичной структурой, и для преобразования полученных данных в формат Protein Data Bank.

Литература

молекулярный цепь нуклеотид

1.Н.Н. Козлов, Е.И. Кугушев, Д.