На правах рукописи
ДЕРЮШЕВА ЕВГЕНИЯ ИГОРЕВНА
ПЕТЛИ И ПОВТОРЫ В БЕЛКАХ КАК ОТПЕЧАТКИ МОЛЕКУЛЯРНОЙ ЭВОЛЮЦИИ
Специальность 03.01.02 - биофизика
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
Пущино - 2012
Работа выполнена на кафедре физики Федерального государственного бюджетного образовательного учреждения высшего профессионального образования УТульский государственный университетФ, а также в группе физики нуклеопротеидов Федерального государственного бюджетного учреждения науки Института белка Российской академии наук, г. Пущино.
Научные руководители: доктор физико-математических наук, профессор Сердюк Игорь Николаевич доктор физико-математических наук, профессор Левин Даниил Михайлович
Научный консультант: доктор физико-математических наук Галзитская Оксана Валериановна
Официальные оппоненты: доктор биологических наук, профессор Пермяков Евгений Анатольевич (ИБП РАН, Пущино) кандидат физико-математических наук Есипова Наталья Георгиевна (ИМБ РАН, Москва)
Ведущая организация: Федеральное государственное бюджетное учреждение науки Институт математических проблем биологии Российской академии наук, г. Пущино
Защита диссертации состоится л_5__декабря_ 2012 г. в 13-30 на заседании совета Д 002.093.01 по защите диссертаций на соискание ученой степени кандидата наук, на соискание ученой степени доктора наук, созданном на базе Федерального государственного бюджетного учреждения науки Института теоретической и экспериментальной биофизики Российской академии наук по адресу: 142290, г. Пущино Московской обл., ул. Институтская, 3, ИТЭБ РАН.
С диссертацией можно ознакомиться в Центральной библиотеке НЦБИ РАН по адресу: 142290, г. Пущино Московской обл., ул. Институтская, 3.
Автореферат разослан л_____ _________________ 2012 г.
Ученый секретарь диссертационного совета, кандидат физ.-мат. наук Ланина Н. Ф.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. Диссертационная работа посвящена выявлению взаимосвязи между функциональностью белков и количеством и спецификой гибких участков (петель) и структурных повторов в них.
В работе предложен новый взгляд на роль гибких участков в процессе функционирования белков и их эволюционного развития. В его основе лежит обнаруженная корреляция между числом петель в факторах элонгации и сложностью организма. Для обоснования выводов используются как данные о присутствии той или иной петли, так и о специфике, содержащейся в ней последовательности аминокислот. В работе сформулирована гипотеза об эволюционном развитии факторов элонгации EF1 и EF2.
Исследование семейства рибосомных белков S1 позволило рассматривать число структурных доменов как стабильный признак принадлежности микроорганизма к тому или иному таксономическому отделу, а также судить о УнаправленииФ эволюции между этими отделами. В работе также проведено исследование центрального РНК-связывающий домена в семействе рибосомных белков S1.
Идея о том, что уникальная третичная структура белка необходима для его функционирования, берет свое начало из более чем столетней давности экспериментов Э. Фишера с экстрактом пивных дрожжей. На основании этих экспериментов он высказал гипотезу, согласно которой взаимодействие между молекулами можно представить подобно взаимодействию Уключ-замокФ, при котором строгое стереохимическое узнавание между молекулами является ключевым элементом взаимодействия. Позже на основе его экспериментов, а также экспериментов Л. Полинга, К. Анфинсена и Д. Эдсалла, была сформулирована центральная догма молекулярной биологии, согласно которой один ген, посредством транскрипции и трансляции, кодирует один белок, аминокислотная последовательность которого определяет одну уникальную трехмерную структуру и, как следствие, одну выполняемую им функцию.
Однако последующие исследования ряда белков доказали, что этот принцип не всегда выполняется. Первое сомнение в строгости гипотезы УключзамокФ появилось в 1950 г., когда Ф. Каруш обратил внимание на то, что бычий сывороточный альбумин проявляет универсальную способность связываться со многими малыми гидрофобными молекулами. Он полагал, что гипотеза Фишера должна быть дополнена представлением о конфигурационной приспособляемости. Однако его предсказание о конфигурационных изменениях в белках в процессе взаимодействия с лигандами и, как следствие этого, множественность функций белка долгое время игнорировались.
Тем не менее, первые сравнения структуры лизоцима в двух функциональных состояниях (с лигандом и без него) показали, что в белках действительно имеют место пространственные смещения отдельных атомов.
Эти изменения носили локальный характер и не превышали 1 . Однако в ряде случаев изменения такого рода могли принимать более масштабный характер, как это было в случае дрожжевой гексокиназы при ее связывании с глюкозой, или в случае прокариотического фактора элонгации EF1 при замене ГДФ на ГТФ. Намного позже был открыт ряд белков, которые при высокой идентичности последовательностей образовывали разные структуры, а для ряда амилоидогенных белков данные электронной и атомно-силовой микроскопии показывают, что часто один и тот же белок образует в растворе полиморфные структуры.
Кроме того, в отдельный класс белков стали выделять природнонеструктурированные белки. УПриобретаемаяФ структура для таких белков часто зависит от вида лиганда и при этом может сильно меняться. Такое структурное разнообразие и своеобразная Уструктурная гибкость (пластичность)Ф определяет полифункциональность таких белков. Таким образом, центральная догма молекулярной биологии для этих специфических белков преобразуется в следующую: один ген кодирует один белок, окончательную трехмерную структуру которого определяет партнер по взаимодействию или особенности окружающей его среды. Сформированная структура и определяет функцию или функции данного белка. Несмотря на то, что уже открыто около 600 природно-неструктурированных белков, часть из которых является биологически значимыми (например, белки аппарата биосинтеза), до сих пор не была четко установлена связь между количеством и спецификой подобных участков и функциональной активностью этих белков.
Отметим тот факт, что полифункциональность не всегда является следствием наличия в белках дополнительных гибких участков структуры. Для ряда белков характерным является множественное копирование собственной доменной структуры. При этом, в таких белках каждый домен, несмотря на одну и ту же структуру, выполняет различную функцию. До сих пор не найдено объяснение принципов такого копирования и, как следствие, полифункциональности таких многодоменных белков.
В данной работе предлагается новый взгляд на роль гибких участков (петель) в семействе факторов элонгации, а также на число структурных доменов (повторов) в семействе рибосомных белков S1, в процессе их эволюционного развития и, как следствие, в их функционировании. Эти семейства являются типичными представителями полифункциональных белков с разным числом неструктурированных участков. Отметим, что рибосомный белок S1 к тому же содержит различное количество структурных повторяющихся доменов в разных организмах. Обнаруженная в этих белках корреляция между числом петель и повторов и сложностью организма позволила нам рассматривать их число как стабильный признак принадлежности организма к определенному таксономическому отделу. Кроме того, выявленные закономерности позволили судить о УнаправленииФ эволюции как этих белков, так и содержащих их организмов, что говорит об уникальности выявленных признаков с точки зрения молекулярной эволюции.
Цель и задачи работы. Цель данной работы - выявление взаимосвязи между функциональностью белков и количеством и спецификой гибких участков и структурных повторов в них. Для достижения этой цели были поставлены следующие задачи:
1. Выявить возможности программы FoldUnfold для характеристики белков, содержащих неструктурированные участки.
2. Установить взаимосвязь между количеством гибких участков в белках Gсемейства и принадлежностью организма к тому или иному семейству Живого мира. Сформулировать альтернативный признак для классификации Живого мира.
3. Охарактеризовать семейство прокариотических рибосомных белков S1, в том числе:
проанализировать с помощью специализированных пакетов биоинформатических программ аминокислотные последовательности семейства рибосомных белков S1;
провести количественный и качественный анализ числа структурных доменов с целью выявления эволюционных закономерностей.
4. Установить роль петель и повторов в исследуемых белках.
Научная новизна диссертации.
1. Установлено, что суммарное число аминокислотных остатков в факторах элонгации EF1 отражает разделение Живого мира на три Надцарства;
аналогичная закономерность прослеживается и для белков EF2.
2. Высказана гипотеза об эволюционном развитии факторов элонгации EF1 и EF2.
3. Выявлен уникальный консервативный домен в семействе рибосомных белков S1, обладающий РНК-связывающими свойствами.
4. Найдено, что число структурных доменов в семействе рибосомных белков S1 отражает разделение прокариот на основные таксономические отделы.
5. Предложена гипотеза, согласно которой Природа оперирует различными вставками (петлями или повторами), приспосабливая их число и положение таким образом, чтобы белок мог выполнять ряд специализированных функций: одну в простейших организмах и несколько в высших или более сложных организмах.
Практическая значимость. Предложен новый взгляд на роль гибких участков (петель) в семействе факторов элонгации, а также на число структурных доменов (повторов) в семействе рибосомных белков S1, в процессе их эволюционного развития и, как следствие, в их функционировании.
Он отличается от всех принятых признаков систематики и открывает новые возможности для исследования белковых последовательностей с точки зрения молекулярной эволюции.
Основные положения, выносимые на защиту 1. В качестве альтернативного признака для классификации Живого мира может быть взята способность аминокислотных последовательностей белков образовывать неструктурированные участки, которые проявляются в их трехмерной структуре в виде петель.
2. В семействе прокариотических рибосомных белков S1, содержащих разное количество доменов, выявляется один консервативный домен, мигрирующий по цепи и локализующийся в белках с определенной закономерностью. Этот домен рассматривается как центральный РНКсвязывающий домен в семействе рибосомных белков.
3. Число структурных доменов прокариотических рибосомных белков Sявляется стабильным признаком принадлежности микроорганизма к тому или иному отделу.
4. Изменения числа структурных доменов прокариотических рибосомных белков S1 является следствием латерального переноса гена белка S1 в ходе редукционной эволюции между основными отделами Эубактерий.
5. Наряду с другими признаками, структурные петли и повторы в белках аппарата биосинтеза могут рассматриваться как уникальные отпечатки молекулярной эволюции.
Апробация работы. Основные результаты диссертационной работы были изложены в докладах на следующих российских и международных конференциях: Вычислительная филогенетика и геносистематика, Москва, 1619 ноября 2007; International EMBO workshop, Intrinsically unfolded proteins:
biophysical characterisation and biological significance, Budapest, Hungary, 20-May 2007; Conference for young scientists, PhD students and students on Molecular Biology and Genetics, Ukraine, Kyiv, 20-22 September 2007; Mathematical Biology and Bioinformatics, Russia, Moscow region, Pushchino, 7-13 September 2008;Четырнадцатая Всероссийская Научная Конференция Студентов Физиков, Россия, г. Уфа, 27 марта - 3 апреля 2008; Международная научная конференция студентов, аспирантов и молодых учёных УЛомоносов-2009Ф, Россия, Москва, 13-18 апреля 2009; Third International Conference on Mathematical Biology and Bioinformatics, Russia, Moscow region, Pushchino, 10-15 October 2010; на семинаре в Национальном Институте здоровья (NIH, Bethesda), Америка, 2007.
Работа прошла апробацию на научных семинарах Института белка РАН (Пущино) и в Институте теоретической и экспериментальной биофизики РАН (Пущино).
Публикации. По теме диссертации опубликовано 11 работ, из них статей [A1-A5], включая 4 статьи в реферируемых журналах, входящих в список ВАК [A1-A3, А5], и 5 тезисов докладов на конференциях.
Структура и объем диссертационной работы. Диссертация состоит из введения, 5 глав, выводов и списка литературы, включающего ___ наименований. Работа изложена на ___ страницах и содержит 26 рисунков и таблиц.
Список сокращений. а.о. - аминокислотный остаток; G-семейство - семейство ГТФ-связывающих белков (GTP); ГТФ - гуанозинтрифосфат; PNPase - полинуклеотидфосфорилаза, ЯМР - ядерный магнитный резонанс.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы диссертационной работы, сформулирована цель работы, обсуждается новизна и практическая значимость полученных результатов.
В главе 2 представлен обзор литературы по теме диссертационной работы. В обзоре описаны общие физические и биофизические свойства белков, выполняющих одну и несколько функций. Особое внимание уделено свойствам природно-неструктурированных белков и белков со структурными повторами, а также основным проблемам идентификации в них границ функционально-значимых участков и доменов. [1, 2, 3]. Рассмотрены структурные и функциональные особенности исследуемых в работе белков с разной степенью внутренней неупорядоченности (семейство G-белков) и числом структурных доменов (семейство рибосомных белков S1).
В главе 3 предлагается новый взгляд на роль неструктурированных участков в семействе факторов элонгации.
Первая часть главы 3 посвящена описанию специализированных программ по предсказанию неструктурированных участков, таких как PONDR, RONN, DisEMBL, PreLINK, IUPred, GlobPlot 2, FoldIndex. Особое внимание уделено описанию принципа работы программы FoldUnfold, разработанной в Институте белка РАН [4, 5], отличительной особенностью которой является возможность выбора ширины усредняемого окна, что дает возможность идентифицировать даже короткие гибкие участки, соединяющие элементы вторичной структуры. На примере анализа аминокислотных последовательностей белков G-семейства и убиквитин-подобного домена hPLIC-2 нами было показано, что программа FoldUnfold лучше предсказывает как короткие, так и длинные гибкие участки, положение которых находится в хорошей корреляции с данными рентгеноструктурного анализа и данными ядерного магнитного резонанса (ЯМР). Кроме того, проведенное сравнение результатов предсказания программы FoldUnfold с результатами предсказаний других программ (на примере RONN, DisEMBL, PreLink, IUPred, Globplot 2, FoldIndex, PONDR) для выбранных белков показало, что программа FoldUnfold намного лучше предсказывает как совсем короткие (3 а.о.), так и относительно короткие неструктурированные участки (11 а.о.).
Во второй части главы 3 дается ответ на вопрос: УСуществует ли взаимосвязь между количеством гибких участков (петель), выявляемых программой FoldUnfold, в семействе факторов элонгации и принадлежностью организма к тому или иному таксономическому отделу?Ф.
Для этого, с помощью программы FoldUnfold были проанализированы более 300 аминокислотных последовательностей этих белков. Нами было найдено, что суммарное число аминокислотных остатков в факторах элонгации EF-1 отражает разделение живого мира на три Надцарства. Длины полипептидной цепи факторов элонгации растут при усложнении организмов.
Надцарство Эубактерий занимает интервал 393- 406 а.о., Надцарство Архей - интервал 422 - 444 а.о., а Надцарство Эукариот - интервал 458-464 а.о. Анализ обнаруженных дополнительных петель в факторах элонгации показал, что их максимальное число (кроме эффекторной) равно шести, из которых три петли (А, B, C) выявляются в первом домене, одна петля (D) - во втором и две петли (E и F) - в третьем домене. Дополнительные предсказанные петли для EF-1 из S. cerevisiae показаны на рисунке 1.
Рис. 1. Пространственная структура эукариотического фактора элонгации EF1 из S.
cerevisiae в комплексе с фрагментом EF-1B (последний не показан) (PDB-код 1F60). Черным выделены предсказанные петли и перетяжки между доменами.
Факторы элонгации бактерий Надцарства Эубактерий содержат минимальное число петель. У E. coli нет ни одной дополнительной петли кроме эффекторной, тогда как у термофильных бактерий (T. aquaticus и T.
thermophilus) выявляется одна термофильная петля. Сине-зеленые водоросли содержат одну или две дополнительные петли. Одна выявляется на месте термофильной петли (петля C), а другая выявляется в третьем домене фактора (петля Е как у S. platensis). Для факторов эукариотического Надцарства предсказывается существование дополнительных петель, число которых равно трем или четырем. Так, факторы элонгации у животных содержат две петли (А и B) в первом домене фактора и две петли (Е и F) в третьем домене. Несколько особняком располагается отдел членистоногих: у них выявляется петля D. У Царства растений не выявляются петли B и D. У всех эукариотических факторов на C-конце всегда присутствует полностью неупорядоченная область F длиной около 20 аминокислот. Длины перетяжек, соединяющих первый и второй домены, в среднем одинаковы как в прокариотических, так и в эукариотических факторах элонгации. Однако длины петель между вторым и третьим доменами в среднем на 8-10 аминокислот больше в эукариотических факторах. Этот факт мы рассматриваем как аргумент в пользу того, что эукариотические факторы элонгации обладают бльшей междоменной подвижностью, чем прокариотические.
Принципиально новым результатом для понимания структуры эукариотических факторов элонгации является предсказание наличия у них на C-конце неструктурированной области длиной около 20 а.о. (петля F). Длина этой области не зависит от источника выделения. Дополнительные петли внутри каждого из доменов, большая неструктурированная петля на С-конце и высокая междоменная подвижность в эукариотических факторах элонгации могут служить объяснением того факта, что до сих пор ни один из факторов эукариотического Надцарства не закристаллизован в изолированной форме.
Факторы элонгации Надцарства архей выглядят как специализированные белковые структуры, число петель в которых (две или три) и их расположение по доменам фактора определяются их функцией. Так, исключительным признаком серных бактерий является наличие петли А. Кроме того, у них предсказываются еще две петли (D и E). Гипертермофилы содержат петлю B, которой нет у остальных архей. Галлофилы не содержат петель А, B и C в первом домене, но всегда содержат петлю D во втором домене и петлю Е в третьем домене. Общей чертой, объединяющей архейные факторы элонгации с прокариотическими факторами, является отсутствие петли F. Таким образом, данные, полученные при сопоставлении свойств белковых факторов элонгации, служат еще одним подтверждением того, что Археи представляют собой самостоятельное Надцарство, свойства которого сильно отличны от таковых Надцарства Эубактерий.
Предсказываемые для архейного фактора элонгации две дополнительные петли длиной 14 и 18 а.о. в районе 283-296 и 364-381 а.о. имеют суммарную длину, близкую к разности между средней длиной архейных и прокариотических факторов. Этот факт означает, что дополнительное удлинение полипептидной цепи архейных факторов элонгации по сравнению с прокариотическими связано с появлением новых петель (Рисунок 2).
Рис. 2. Схематическое представление предсказываемых петель в факторах элонгации EFдля трех Надцарств Живого мира.
Аминокислотный состав некоторых петель весьма консервативен и удивительно совпадет для факторов элонгации из разных источников. Так, структурный мотив петли А для всех факторов внутри Надцарства Эукариот почти не отличается (GEFEAGISKNGQTR - у животных, GGFERGISKDGQTR - у растений, и GEFEAGISKDGQTR - у грибов), тогда как та же петля А у типа кренархеоты Надцарства Археи имеет совершенно другой мотив (KGEYEAGMSAEG). Также консервативна и петля Е у эукариот (DRR(Т)SGK).
Интересно, что структурный мотив петли B у гипертермофилов архей (MDATEPPFSEK) напоминает таковой петли B у животных (MDSTEPPYS), а мотив петли D у серных бактерий и гипертермофилов (PGDNIGF) близок к мотиву такой же петли для некоторых представителей эукариот (PGDNVGF).
Протисты содержат петли А и Е, типичные для Царства Животных и Грибов. Это подтверждает возможность существования такой супергруппы как Opisthokonta [6]. Однако ситуация не так проста: петля F, которая является отличительной чертой эукариот, отсутствует в Протистах.
Анализ дополнительных петель, предсказанных в белке EF2, показывает, что их максимальное число равно десяти: четыре обнаруживаются в первом домене, по одной во втором и третьем, и четыре в четвертом домене. Как и для белка EF1 Надцарство Эубактерий содержит минимальное число петель, в то время как у представителей Эукариот число петель колеблется от пяти (растения) до восьми (грибы и членистоногие). Надцарство Архей условно можно поместить посередине между ними с тремя и четырьмя дополнительными петлями.
Таким образом, в рассмотренных белковых последовательностях факторов элонгации EF отличие одного организма от другого сводится к присутствию той или иной петли, а также специфики их аминокислотного состава. В простейших организмах их число оказалось минимальным, тогда как в высших - максимальным.
К сожалению, имеющиеся в литературе данные пока недостаточны для установления четкой связи между всеми петлями и функцией белка, за исключением эффекторной и термофильной петель. Кроме того, подробное исследование G-доменов семейства ГТФ-связывающих белков позволило нам установить функцию петли В в факторах элонгации EF1. Петля В в факторах элонгации EF1, предсказанная при ширине окна в 11 а.о. соответствует одной из пяти петель формирующих нуклеотид-связывающий сайт гуанина в Gдомене. Эта петля имеет консервативный состав NKXD (X - любая аминокислота) и частично участвует в распознавании гетероцикла гуанина.
Также отметим, что во всех дополнительных петлях присутствует лизин - аминокислота, специфичная для факторов элонгации.
Глава 4 посвящена выяснению возможной роли структурных повторов в семействе рибосомных белков S1. Проведенное в первой части этой главы теоретическое исследование белка S1 позволило нам по ряду признаков отнести его к белкам, содержащим неструктурированные участки.
Вторая часть данной главы посвящена выявлению особенностей структурных характеристик семейства рибосомных белков S1. Согласно существующим данным, этот белок идентифицирован только в прокариотах и не найден в архебактериях и в эукариотах. Число аминокислотных остатков рибосомного белка S1 у разных представителей бактерий меняется в большом диапазоне, от 111 а.о. у S. kunkelii до 863 а.о. у T. pallidum. Известно, что белок полинуклеотидфосфорилаза (PNPase) из E. coli на С-конце содержит один S1домен, имеющий высокую идентичность с первоначально выделенными четырьмя S1-повторами. Полученная методом ЯМР трехмерная структура SРНК-связывающего домена из PNPase E. coli представляет собой бочкообразную укладку с дополнительной -спиралью между третьим и четвертым -листами. Именно такую OB-укладку (oligonucleotide binding fold) вторичной структуры принято рассматривать как основной структурный элемент семейства рибосомных белков S1. Схематично архитектуру семейства принято изображать в виде повторяющихся S1 доменов (S1 РНК-связывающим мотивом), число которых зависит от длины белка [7].
Большинство остатков на поверхности бочонка S1 домена PNPase консервативны, что говорит о его РНК-связывающей роли. Однако, во многих доменах белков S1 некоторые из них консервативны (Phe-19, Phe-22, His-34, Asp-64 и Arg-68) и собраны в кластер на поверхности домена. Они расположены в петле между первым и вторым -листами (Phe-19), в середине второго -листа (Phe-22), в конце третьего -листа (His-34) и в петле между последними двумя -листами (Asp-64, Arg-68). Эти остатки пространственно сближены, располагаются с одной стороны бочонка и формируют участок, который рассматривается как РНК-связывающий сайт всего семейства рибосомных белков [7].
При выравнивании последовательностей прокариотических белков S1, содержащих разное количество доменов, с S1 РНК-связывающим доменом PNPase из E. coli, было обнаружено, что в семействе выявляется один домен, имеющий максимальную идентичность с доменом S1 из PNPase (Рисунок 3).
Рис. 3. Белки S1, содержащие разное количество доменов. Прямоугольником выделен уникальный консервативный домен.
Этот консервативный домен мигрирует по цепи, локализуется в белках с разным количеством доменов с определенной закономерностью. Для двух-, трех- и четырехдоменных белков он локализуется в последнем домене. Для пятидоменных белков с общей длиной до 500 а.о. таковым является второй домен, тогда как для этих же белков с длиной больше 500 а.о. - третий. Для шестидоменных белков длиной от 550 а.о. роль такого домена играет третий домен. Кроме того, именно в этом консервативном домене располагаются остатки Phe-19, Phe-22, His-34, Asp-64 и Arg-68 (в ряде случаев меняющиеся на взаимозаменяемые остатки), что еще раз подтверждает уникальность этого повтора, а также дает возможность рассматривать его как центральный РНКсвязывающий домен в семействе рибосомных белков.
Третья часть главы 4 описывает возможность использования числа структурных S1-доменов в качестве признака классификации основных отделов эубактерий. Как было отмечено выше, число структурных S1-доменов в прокариотических организмах меняется в ограниченном диапазоне: от одного до шести. Длина одного S1 домена около 70 а.о. Учитывая длину перетяжек между структурными доменами, легко вычислить число структурных доменов бактериальных белков различной длины. Однако, белок S1 из T. pallidum длиной 863 а.о. содержит также как и белок из E. coli длиной 557 а.о. только шесть структурных доменов. Увеличение размера белков длиной свыше 600 а.о.
происходит либо за счет удлинения его концов, либо за счет появления других структурных доменов.
На рисунке 4 представлены все исследуемые отделы бактерий и количество обнаруженных в них S1 доменов.
Рис. 4. Филогенетическое дерево, отражающее деление исследуемых бактерий на отделы, классы, отряды, семейства (от центра к периферии). Дерево построено по данным определителя Bergey и Taxonomy Browser. Оттенками серого объединены бактерии, содержащие одинаковое число доменов рибосомного белка S1 (от одного до шести).
Наименьшая длина белка S1 наблюдается у представителей семейства Mycoplasmataceae (M. mobilie 116 а.о) и Spiroplasmataceae (Sp. kunkelii 111 а.о).
Рибосомный белок этих бактерий содержит один S1 домен. Цианобактерии (Cyanobacteria), с длиной белка S1 в среднем около 350 а.о., содержат три Sдомена, а представители отдела Firmicutes с длиной белка 390 а.о. содержат в зависимости от класса три (для Clostridia) или четыре S1 (для Bacillaceae) домена. Все рассмотренные бактерии, относящиеся к отделу Актиномицетов, имеют четыре S1 домена. Бактерии малочисленного монотипичного (состоит из одного класса Deinococci) отдела Deinococcus-Thermus имеют длину S1 белка в среднем около 530 а.о. и всегда содержат пять S1 доменов. Также пять Sдоменов обнаруживаются в бактериях отдела Nitrospirae. К грамотрицательным, содержащим шесть S1 доменов, бактериям относятся Spirochaetes, Bacteroidetes, Chlamidiae и Proteobacteria (, , , , ). Длина рибосомного белка S1 у всех этих бактерий в среднем около 570 а.о. Также шестидоменными являются и рибосомные белки S1 бактерий отделов Chlorobi (зеленые сульфурные бактерии) и Planctomycetes. Интересным является тот факт, что во всех исследуемых отделах было обнаружено всего несколько бактерий, содержащих два S1 домена. Все остальные представители различных отделов и классов четко сохраняют фиксированное число структурных Sдоменов. Таким образом, число структурных доменов является стабильным признаком принадлежности микроорганизма к тому или иному отделу.
В заключительной части главы 4 приведены результаты исследования семейства рибосомных белков S1 с эволюционной точки зрения.
Так как S1 домен является одним из УдревнейшихФ белковых доменов, его наличие в прокариотах в различных сочетаниях, скорее всего, является прямым следствием эволюционного развития организмов. Возможны два пути эволюционного развития белковых молекул организмов - УвверхФ и УвнизФ.
Принцип прогрессивной эволюции базируется на представлениях о Дарвиновской дивергенции: ветви филогенетического дерева расходятся, чтобы никогда не сойтись. Построенные описанным выше способом деревья отражают только вертикальную, направленную УвверхФ, эволюцию, при которой наследуется базовый геном, часто подверженный различным рекомбинациям и мутациям, приводящим в итоге к фенотипическим изменениям организмов. Однако, известны и случаи влияния на размер и функциональность генов и белков так называемой редукционной эволюции.
При таком влиянии отсекается все УненужноеФ, т.е. со временем происходит сокращение числа генов, и, как следствие, белковых продуктов, а также утрата различных функций и даже целых клеточных органелл. Такая УзакономерностьФ особенно свойственна патогенным бактериям, так как они используют для своей жизни метаболические системы клетки УхозяинаФ и не нуждаются в собственных аналогичных системах [8]. Еще одним важным ключевым направлением эволюции является УспособностьФ горизонтального, или, как его принято называть, латерального переноса генов между организмами. Горизонтальный перенос генов - один из главных механизмов видообразования в мире прокариот. На сегодняшний день уже доказано, что не менее 80% генов в каждом прокариотическом геноме участвовали в процессе горизонтального переноса на том или ином этапе эволюции, а множественные данные геномики подтверждают факт переноса массивных генов между организмами не только внутри различных царств, но также и между ними.
Кроме того, доказан тот факт, что у прокариот возможен обмен целыми геномами, что ведет к мгновенному превращению одного вида бактерий в другой. О УчужеродномФ происхождении гена говорит высокая степень его сходства с гомологичным геном из отдаленного таксона при отсутствии подобного гена у близких УродственниковФ [9].
В нашем случае УвверхФ означает что более УдревнимиФ являются бактерии отдела Tenericutes (микоплазмы) с наименьшим количеством Sдоменов, а развитие УвнизФ подразумевает эволюционное развитие от шестидоменных протеобактерий.
В литературе по данному вопросу развитие класса Mollicutes принято рассматривать с двух точек зрения. Согласно одной из них микоплазмы являются выжившей ветвью примитивных микроорганизмов, из которых впоследствии произошли прокариоты и эукариоты. Они появились как продукт прогрессивной эволюции еще до образования присущей бактериям клеточной стенки. Другая точка зрения состоит в том, что микоплазмы являются регрессивной ветвью эволюции некоторых или грамположительных бактерий, или клостридий (отдел Firmicutes). Для последней гипотезы находится экспериментальное подтверждение. Она рассматривается в двух возможных вариантах: все микоплазмы происходят либо от предка, общего с грамположительными бактериями, либо от разных бактерий. На основании проведенного сравнения последовательностей олигонуклеотидов 16S рРНК нескольких видов микоплазм и грамположительных бактерий из родов Clostridium, Bacillus, Lactobacillus, Streptococcus, было высказано обоснованное предположение об их эволюционном родстве с отделом Firmicutes. Более детальный анализ последовательностей 16S РНК показал, что филогенетически микоплазмы ближе всего к клостридиям. В свою очередь наиболее вероятными предками клостридий считаются грамположительные бактерии с низким содержанием G-C пар в ДНК.
В нашей работе анализ структурных особенностей семейства рибосомных белков S1, принадлежащих разным отделам, также подтверждает второй (УвнизФ) эволюционный путь развития прокариот. Это подтверждают несколько фактов. Во-первых, микоплазмы являются наиболее простыми самостоятельно воспроизводящимися живыми организмами, выполняющими все необходимые им функции. Во-вторых, биохимические эксперименты по изучению фрагментов шестидоменного белка S1 из E. coli (обрезание доменов на концах последовательности) показали, что функциональность белка при этом сохраняется, а снижается лишь эффективность выполняемых белком функций [10]. Кроме того, S1 домен УпереходитФ в другие белки (как прокариотические, так и архейные) чаще всего одной УкопиейФ (фактор инициации, рибонуклеаза).
В составе эукариотических клеток белок S1 не был обнаружен, однако в некоторых эукариотических белках было обнаружено множественное УкопированиеФ S1 домена (от девяти до двенадцати копий). Например, дрожжевой белок Rrp5p, участвующий в процессинге пре-рРНК и созревании 40S и 60S субчастицы, содержит двенадцать тандемно повторяющихся Sдоменов [11]. Такое большое количество S1 доменов может объясняться латеральным переносом в эукариотический химерный геном УчужихФ, кодирующих белок генов, приобретенных сравнительно недавно и еще не подвергшихся амелиорации в составе генома. При этом партнерами для латерального переноса генов часто являются филогенетически отдаленные организмы. Такие случаи в большей степени свойственны белкам, ответственным за белок-белковые и ДНК-белковые взаимодействия, т.е.
участвующие в сборке сложных комплексов или в регуляции действия генов.
Напомним, что S1 домен является РНК-связывающим.
Как уже было отмечено ранее, проведенные исследования семейства рибосомных белков S1 эубактерий позволили выявить в нем уникальный консервативный домен, обладающий РНК-связывающими свойствами, который мигрирует по цепи, локализуется в белках с разным количеством доменов с определенной закономерностью. Суммируя все вышесказанное можно утверждать, что именно этот домен и являлся конечным продуктом действия эволюции: при минимальном размере белка - выполнение им всех необходимых функций.
В главе 5 подводятся основные итоги проведенного исследования.
Факторы элонгации были одними из первых белков, используемых для построения филогенетического дерева живых организмов. Исследование этих белков с эволюционной точки зрения продолжается и сейчас. В нашей работе мы обнаружили, что в качестве нового признака и отпечатка молекулярной эволюции для данного семейства белков может выступать количество гибких петель. Как было показано выше, в простейших организмах их число оказалось минимальным, тогда как в высших - максимальным. Это дало основание высказать гипотезу об эволюционном развитии факторов элонгации: УПрирода, придерживаясь принципа бережливой изобретательности, оперирует разными универсальными вставками (в данной работе петли), комбинируя их число и положение в факторах таким образом, чтобы белок мог выполнять ряд специализированных функций: одну - в простейших микроорганизмах и несколько - в высшихФ.
Длина белка увеличивается с увеличением сложности организма, что является характерной особенностью прогрессивной эволюции. Однако при этом вторичная структура и доменная организация прокариотических, архейных и эукариотических факторов элонгации EF1 и EF2 оставалась весьма консервативной. Различие же в длине факторов обусловлено появлением дополнительных гибких участков в трехмерной структуре белка, а также увеличением длины междоменных перетяжек, приводящих к большей подвижности доменов относительно друг друга в пространстве. Кроме того, наличие дополнительных петель со специфической последовательностью в эукариотических факторах элонгации может служить возможным объяснением полифункциональности этих белков. Как мы указывали, в дополнении к основной функции, взаимодействие с тРНК, эукариотические факторы образуют комплексы с различными лигандами, начиная от кальмодулина и заканчивая РНК. Столь разная природа лиганда требует наличия разных функциональных участков, в роли которых могут выступать обнаруженные нами петли.
При исследовании семейства рибосомных белков S1 было обнаружено, что число структурных доменов (повторов) может рассматриваться как стабильный признак принадлежности организма к тому или иному таксономическому отделу.
Обнаруженные закономерности позволили нам судить о УнаправленииФ эволюции этих белков. Так, для семейства факторов элонгации, без сомнения, это действие прогрессивной эволюции, приведшей к появлению дополнительных петель в эукариотических организмах и, как следствие, их полифункциональности. Для семейства рибосомных белков S1 - это изменение числа структурных доменов, являющееся результатом латерального переноса гена белка S1 в ходе редукционной эволюции между основными отделами Домена эубактерий с сохранением в качестве УконечногоФ продукта эволюции белка минимального размера. Это позволило паразитическим организмам класса Mollicutes, несмотря на маленькие по отношению к другим бактериям размеры, выполнять все необходимые им функции.
Таким образом, проведенное исследование дало нам основание рассматривать петли и повторы в белках аппарата биосинтеза как уникальные отпечатки молекулярной эволюции.
В приложении 1 приведены аминокислотные последовательности всех рассматриваемых в данной работе факторов элонгации.
В приложении 2 приведены примеры результатов обработки программой FoldUnfold аминокислотных последовательностей.
Выводы 1. Показано, что программа FoldUnfold по сравнению с результатами предсказаний других программ (на примере RONN, DisEMBL, PreLink, IUPred, Globplot 2, FoldIndex, PONDR) лучше предсказывает как короткие, так и длинные гибкие участки в белках G-семейства Положение предсказанных участков хорошо согласуется с данными рентгеноструктурного анализа и данными ЯМР.
2. Сформулирован альтернативный признак для классификации Живого мира, основанный на способности аминокислотной последовательности белка образовывать неструктурированные участки, которые проявляются в его трехмерной структуре в виде петель.
3. Установлено, что для рибосомных белков S1, содержащих разное количество S1-доменов, существует уникальный консервативный домен, который может рассматриваться как функциональный центр всего семейства рибосомных белков S1.
4. Установлено, что число структурных доменов семейства рибосомных белков S1 является стабильным признаком принадлежности микроорганизма к тому или иному таксономическому отделу; изменение числа структурных доменов семейства рибосомных белков S1 является результатом латерального переноса гена белка S1 в ходе редукционной эволюции между основными отделами Домена эубактерий.
Список публикаций по теме диссертации:
[A1] Е.И. Дерюшева, О.М. Селиванова, И.Н.Сердюк УПетли и повторы в белках как отпечатки молекулярной эволюцииФ// Успехи биологической химии.
Ц т. 52. - стр. 177-202. - 2012.
[A2] E.И. Дерюшева, А.В. Мачулин, О.М. Селиванова и И.Н. Сердюк.
УСемейство рибосомных белков S1 содержит уникальный консервативный доменФ// Молекулярная биология. - т. 44. - 4. - стр. 728-734. - 2010.
[A3] Дерюшева E.И., Левин Д.М., Сердюк И.Н. УПоиск и анализ гибких участков в белкахФ // Известия ТуГУ. Естественные науки. - вып. 3. - стр. 229.
Ц 2009.
[A4] O.V. Galzitskaya, E.I. Deryusheva, I.N. Serdyuk УPhylogenetic Analyses of the Loops in Elongation Factors EF1A: Stronger Support for the Grouping of Animal and FungiФ // Journal of Computer Science & Systems Biology (JCSB). - v.1. - pp. 7380. - 2008.
[A5] Дерюшева Е.И., Галзитская О.В., Сердюк И.Н. УПредсказание коротких петель в белках с внутренней неупорядоченностьюФ// Молекулярная биология.
Ц т. 42. - 5. - стр. 1067-1078. - 2008.
[A6] A Timchenko, I Serdyuk, B Negrutskii, A Novosylna, E Prituzhalov, E Deryusheva, K Kimura, H Kihara УComparative analysis of solution structure of two isoforms of rabbit elongation factor eEF1-A by SAXS techniqueФ // High Energy Accelerator Research Organization (KEK). Photon Factory Acivity Report 2007. - Part B25. - p.246. - 2008.
[A7] E.I. Deryusheva, O.V. Galzitskaya, I.N. Serdyuk УNovel criteria for protein phylogeny: application to elongation factorsФ// Ukraine, Kyiv, Conference for young scientists, PhD students and students on Molecular Biology and Genetics, 20-September 2007, Book of abstracts, p. 307.
[A8] E.I. Deryusheva, O.V. Galzitskaya, I.N. Serdyuk УG-proteins Family and Three Overkingdom of the Living WorldФ// Russia, Moscow region, Pushchino, Mathematical Biology and Bioinformatics, 7-13September 2008, Book of abstracts, pp. 142-144.
[A9] Е.И. Дерюшева УПредсказание петель в белках с внутренней неупорядоченностьюФ// Россия, г. Уфа, Четырнадцатая Всероссийская Научная Конференция Студентов Физиков, 27 марта - 3 апреля 2008, Сборник тезисов, стр. 399.
[A10] Е.И. Дерюшева УПредсказание гибких участков в белкахФ // Россия, Москва, Международная научная конференция студентов, аспирантов и молодых учёных УЛомоносов-2009Ф, 13-18 апреля 2009, секция Биоинженерия и биоинформатика, Сборник тезисов, стр.15.
[A11] A.V. Machulin, E.I. Deryusheva, O.M. Selivanova, I.N. Serdyuk УFamily of ribosomal proteins S1 contain unique conservative domainФ// Russia, Moscow region, Pushchino, Third International Conference on Mathematical Biology and Bioinformatics, 10-15 October 2010, Book of abstracts, pp. 169-170.
Список цитируемой литературы:
1. Tompa P. Intrinsically unstructured proteins//Trends Biochem.Sci.- 2002.- Vol. 27.- p. 527-533.
2. Dunker A. K., Brown C.J., Lawson J.D. Intrinsic disorder and protein function//Biochemistry.- 2002.- Vol.41.- p.6573-6582.
3. Сердюк И.Н. Структурированные белки и белки с внутренней неупорядоченностью//Молекулярная биология. -2007.- Том 42 - с. 287-34. Галзитская О.В., Гарбузинский С. А., Лобанов М. Ю. Предсказание нативно-развернутых участков белковой цепи//Молекулярная биология.- 2006.- Том 40 - №2 -c. 341-348.
5. Galzitskaya O.V., Garbuzynskiy S.O., Lobanov M.Yu. FoldUnfold: web server for the prediction of disordered regions in protein chain//Bioinformatic.- 2006.- Vol.22.- p.2948-2949.
6. E. Steekman, J. Wright, S. L Baldauf. The protistan origins of animal and fungi //Mol. Biol. Evol.- 2006- Vol.23. -p. 93-106.
7. Bycroft M., Hubbard T., Proctor M., Freud S., Murzin G. The solution of the S1 RNA binding domain: a member of an ancient nucleic acid-binding fold//Cell. - 1997- Vol.24. - p. 235-242.
8. W. Martin and R.G. Herrmann. Gene Transfer from Organelles to the Nucleus:
How Much, What Happens, and Why?//Plant Phisiology.- 1998 - Vol.118. -p.
9-17.
9. T. Dagan, Y. Artzy-Randrup, W. Martin. Modular networks and cumulative of lateral transfer in prokaryote genome evolution // Proc. Natl. Acad. Sci. USA.
-2008- Vol.105. -p. 10039-10044.
10. I. Boni, V. Artamonova, M. Dreyfus. The last RNA-binding repeat of the Escherichia coli ribosomal protein S1 is specifically involved in autogenous control // Journal of bacteriology. -2000 -Vol. 182.- p. 5872-5879.
11. M. Gribskov. Translational initiation factors IF-1 and eIF-2 share an RNAbinding motif with prokaryotic ribosomal protein S1 and polynucleotide phosphorylase //Gene.- 1992 - Vol.119.- p.107-111.