Разработка алгоритмов для оптимизации пространственных структур РНК

Дипломная работа - Биология

Другие дипломы по предмету Биология



Введение

В настоящее время одной из важных задач молекулярной биологии является математическое моделирование пространственных структур нуклеиновых кислот: дезоксирибонуклеиновых кислот (ДНК) и рибонуклеиновых кислот (РНК). Важность этой задачи обуславливается тем, что основные параметры и процессы функционирования клетки какого-либо организма в первую очередь зависят именно от пространственной структуры её молекул.

Под пространственной структурой РНК (ДНК) понимается третичная структура молекулы, у которой задана вторичная структура. Вторичная структура молекулы РНК (ДНК) - это структура Уотсон-Криковских связей, попарно связывающих нуклеотиды в молекулярной цепи. В постановке данной задачи вторичная структура заданной молекулы предполагается заранее известной из молекулярной биологии. Третичная структура для РНК (ДНК) - это какая-то форма в трёхмерном пространстве, которую принимает её молекулярная цепь под действием Уотсон-Криковских и более слабых связей. Число потенциально возможных третичных структур у молекулы РНК (ДНК) с заданной вторичной структурой очень велико и практически ничем не ограничено.

Для определения пространственной структуры молекулы, на практике чаще всего используется рентгеноструктурный анализ. Однако этот физический метод является довольно длительным и затратным, в связи с чем и возникает потребность в менее трудоёмких методах определения пространственной структуры. В работе [7] был предложен способ моделирования сворачивания молекулы РНК на полноатомном уровне. Такой подход позволяет добиться высокой точности результатов, но требует длительного времени для расчёта необходимой пространственной структуры. Одним из менее точных, но зато более быстрых способов является математическое моделирование третичной структуры молекулы в виде набора тонких упругих стержней, который и будет рассмотрен в данной работе.

Из молекулярной биологии нам известно, что молекулярная цепь РНК (ДНК) составляется из нуклеотидов четырёх видов: A - аденин, G - гуанин, C - цитозин, а также U - урацил. Среди поперечных связей, которые образуются при сворачивании молекулярной цепи в пространственную структуру, наиболее сильными являются водородные Уотсон-Криковские связи, возникающие между основаниями некоторых нуклеотидов (между A и U, между C и G и между G и U).

Все нуклеотиды в молекулярной цепи можно разбить на два класса: спаренные и неспаренные. Нуклеотид называется спаренным, когда он образует Уотсон-Криковскую связь с каким-либо другим нуклеотидом той же молекулы. Поэтому молекулу можно разбить на некоторое количество участков, каждый из которых содержит несколько идущих подряд нуклеотидов, среди которых либо только спаренные, либо только неспаренные. Участки молекулы, состоящие из спаренных нуклеотидов, образуют двухнитевые (или двуспиральные) участки во вторичной структуре РНК (ДНК). Участки же, состоящие из неспаренных нуклеотидов, однонитевые участки во вторичной структуре молекулы. Однонитевые участки называются петлями, а двухнитевые - стеблями. Таким образом, вторичная структура молекулы - это совокупность её стеблей и петель.

Каждый стебель будем рассматривать как участок винтовой лестницы, где "ступеньки" - поперечные Уотсон-Криковские связи - имеют одинаковую длину и ориентацию относительно этой лестницы. Длиной стебля называется число пар нуклеотидов в нём.

Петлю можно рассматривать как замкнутую последовательность однонитевых участков РНК (ДНК), концы которых соединены Уотсон-Криковскими связями. Начало каждого следующего участка петли соединено с концом предыдущего, а конец последнего участка соединен с началом первого. Однонитевые участки, входящие в состав петли, называются ее ветвями, или звеньями. Длиной петли называется число свободных нуклеотидов, входящих в ее состав. Выделяют следующие типы петель:

) Шпилечная петля c) Боковая петля

b) Внутренняя петля d) Многозвенная петля

Рис. 1: типы петель

  • Шпилечная петля: соединяет первую и вторую нить в одном стебле. Это простейшая однозвенная петля (она состоит из одного однонитевого участка). Считается, что шпилечная петля всегда содержит не менее трех нуклеотидов.
  • Внутренняя петля: содержит два однонитевых участка. Длины этих участков являются параметрами, определяющими петлю.
  • Боковая петля: это внутренняя петля, один из участков которой вырожден. Длина невырожденного участка является параметром, определяющим петлю.
  • Многозвенная петля: содержит несколько однонитевых участков. Число этих участков и их длины являются параметрами, определяющими петлю.

1. Постановка задачи

.1 Свободное состояние молекулы

Молекулярная цепь рассматривается как тонкий упругий однородный стержень, имеющий в свободном состоянии форму винтовой линии (рис. 2). Так как по сравнению с длиной молекулы (до нескольких сантиметров) её толщина (~20 А) незначительна, то поэтому такое представление можно считать вполне допустимым. Длины участков нуклеотидов, которые составляют молекулярную цепь (расстояния между Уотсон-Криковскими связями), предполагаются равными. С шагом, равным длине одного нуклеотида, в стержень вставлены жёсткие перемычки, равные по длине половине Уотсон-Криковской связи.

Рис.2. Тонкий упругий стержень в свободном состоянии

Геометрическ