На правах рукописи
УЧРЕЖДЕНИЕ РОССИЙСКОЙ АКАДЕМИИ НАУК ИНСТИТУТ БИООРГАНИЧЕСКОЙ ХИМИИ ИМ. АКАДЕМИКОВ М.М. ШЕМЯКИНА И Ю.А. ОВЧИННИКОВА РАН
Козлов Сергей Александрович
Тема: НОВЫЕ ПОДХОДЫ К ИЗУЧЕНИЮ СТРУКТУРНО-ФУНКЦИОНАЛЬНОГО РАЗНООБРАЗИЯ ПОЛИПЕПТИДНЫХ ТОКСИНОВ
Специальность 02.00.10 - Биоорганическая химия
АВТОРЕФЕРАТ
диссертации на соискание ученой степени
доктора химических наук
Москва - 2010
Работа выполнена в лаборатории нейрорецепторов и нейрорегуляторов Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова
Предполагаемые официальные оппоненты:
- чл.-корр. РАН, доктор биологических наук, профессор Рысков Алексей Петрович Лаборатория организации генома Института биологии гена
- доктор химических наук, профессор Юрий Николаевич Уткин Лаборатория молекулярной токсинологии Института биоорганической химии
- доктор биологических наук Лисица Андрей Валерьевич Лаборатория биоинформационных технологий Института биомедицинской химии
Предполагаемая Ведущая организация:
Институт молекулярной генетики РАН
Предполагаемая дата защиты диссертации 30 марта 2011 г. на заседании Диссертационного совета Д 002.019.01 при Учреждение Российской академии наук институте биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН
по адресу: 117997 Москва, ул. Миклухо-Маклая, 16/10.
С диссертацией можно ознакомиться в научной библиотеке Института биоорганической химии
Автореферат разослан л___ _________ 2010 г.
Ученый секретарь
диссертационного совета В.А. Олейников
- Общая характеристика работы
Актуальность проблемы
Современная биологическая наука характеризуется мощными технологическими прорывами, благодаря чему возросли темпы сбора и обработки биоинформации, ускорились процессы расшифровки структур новых биомолекул, активно разрабатываются и внедряются постгеномные технологии. Практическую ценность приобретает не просто накопление массивов данных о новых структурных единицах, но и их дальнейший анализ с использованием различных алгоритмов поиска функционально-значимых структур. Очевидно, что время ручных анализов безвозвратно ушло, поэтому, активно разрабатываются и внедряются многочисленные автоматизированные методы по работе с биоинформацией, в частности по анализу баз данных случайных нуклеотидных последовательностей - dbEST.
Настоящая работа посвящена изучению биологически активных молекул полипептидной природы, которые могут быть использованы в медицине, ветеринарии или агропромышленном комплексе. Интенсивный поиск новых активных белковых молекул проводится во всем мире с применением различного арсенала исследовательских средств. Для анализа собранных результатов существуют общие схемы обработки данных, отдельные приложения и автоматизированные программные комплексы. Однако, эффективность неспециализированных приложений очень низкая. Основываясь на общедоступных ресурсах белковых последовательностей ( и баз данных EST, полученных самостоятельно или загруженных с сетевого ресурса NCBI ( предложен новый эффективный алгоритм анализа, специализированный для поиска полипептидных токсинов.
Для поиска новых лекарственных средств идеально подходит яд животных - сложная многокомпонентная смесь различных биоактивных молекул. Созданный по принципу комбинаторной библиотеки яд одного вида животного может содержать от 10 до 500 различных компонентов. Таким образом, актуальными задачами исследования природных ядов являются, во-первых, характеристика структурного разнообразия различных компонентов, во-вторых, поиск соединений, которые обладают специфическим действием на представляющую интерес биологическую мишень.
- Цели работы
Основной задачей работы является разработка и практическая апробация новых подходов для направленного поиска полипептидных структур.
Данные о новых структурах могут быть получены при проведении прямых исследований собранных образцов природных ядов. В этом случае используется техника постадийного фракционирования компонентов или протеомика цельного яда. Эффективным также является применение комбинации обеих технологий.
Более перспективный метод, дающий одновременно выверенные полипептидные последовательности компонентов яда, основан на анализе нуклеотидных последовательностей баз данных EST. Этот метод изучает транскриптом изучаемого образца и при наличии специально разработанных алгоритмов анализа позволяет идентифицировать большинство из имеющихся в яде полипептидов. Одной из основных целей работы является разработка специализированного алгоритма анализа EST банков последовательностей и методов предсказания зрелых полипептидных структур из ядов пауков.
В рамках работы проводился направленный поиск активных компонентов, имеющих (1) выраженную токсичность к насекомым, (2) способных эффективно подавлять рост микроорганизмов и (3) модулировать проводимость ионотропного ваниллоидного рецептора 1 (TRPV1).
- Научная новизна и практическая значимость
Разработанные алгоритмы по эффективности поиска полипептидных токсинов в базах структурных данных показали большую эффективность по сравнению с традиционными методами анализа. Они могут быть успешно применены, как для систематизации уже собранных данных, так и для аннотирования вновь создаваемых банков последовательностей.
Полученные в ходе выполнения данной работы инсектотоксины и антимикробные пептиды представляют значительный практический интерес для сельского хозяйства, поскольку могут быть использованы для повышения устойчивости культурных растений.
Охарактеризованные в ходе выполнения этой работы антимикробные пептиды имеют определенный потенциал использования в медицинских целях в качестве антибиотиков нового типа.
Впервые обнаруженные природные полипептидные молекулы, обладающие ингибирующей активностью в отношении TRPV1 рецептора, могут быть использованы для создания лекарственных анальгетических средств нового поколения.
- Апробация работы
Основные положения диссертационной работы были доложены и обсуждены на российских и международных конференциях:
- VI Чтения, посвященные памяти академика Ю.А. Овчинникова (Москва, 2002);
- III Съезд биохимического общества (Санкт-Петербург, 2002);
- 14 Мировой конгресс по животным, растительным и микробным токсинам (Аделаида, 2003);
- Российский симпозиум по химии и биологии пептидов (Москва, 2003);
- Научная конференция Нейрохимия: фундаментальные и прикладные аспекты (Москва, 2005);
- 15 Мировой конгресс по животным, растительным и микробным токсинам (Глазго, 2006);
- VIII чтения, посвященные памяти академика Ю.А.Овчинникова (Москва, 2006);
- 2 Симпозиум по биофизике мембрано-активных пептидов (Лиссабон, 2007);
- Симпозиум Нейрорецепторы: структура, механизм действия и роль в патологиях (Москва, 2007);
- III Российский симпозиум Белки и пептиды (Пущино, 2007);
- XX Зимняя международная молодежная научная школа Перспективные направления физико-химической биологии и биотехнологии (Москва, 2008);
- IV Съезд Российского общества биохимиков и молекулярных биологов (Новосибирск, 2008);
- 16 Собрание Европейской секции международного общества токсинологии (Лёвен, 2008);
- международная конференция УНейрохимические механизмы формирования адаптивных и патологических состояний мозга (Санкт-Петербург, 2008);
- 12 Международная Пущинская школа-конференция молодых ученых УБиология - наука XXI века. (Пушино, 2008);
- Международный форум по нанотехнологиям Rusnanotech08 (Москва, 2008);
- 34 Конгресс федерации Европейский биохимических обществ (Прага, 2009);
- IV Российский симпозиум Белки и пептиды (Казань, 2009);
- Международная научная конференция по биоорганической химии, биотехнологии и бионанотехнологии посвященная 75-летию со дня рождения академика Юрия Анатольевича Овчинникова (Москва-Пущино, 2009);
- Конгресс по TRP рецепторам (Стокгольм, 2009).
- Публикации
Материалы диссертационной работы отражены в 14 научных статьях, 3 обзорных статьях и 3 главах научных сборников.
- Патенты
В рамках выполнения диссертационной работы получено 7 патентов Российской Федерации и 1 международный патент.
- Объем и структура диссертации
Диссертационная работа изложена на 167 страницах машинописного текста, включает 15 таблиц, 36 рисунков. Работа состоит из введения, обзора литературы, материалов и методов исследования, результатов и обсуждения, выводов, 3 приложений с аминокислотными последовательностями обсуждаемых в работе полипептидов, и списка литературы, включающего 258 источников.
- Объекты и методы исследования
- Объекты исследования
Природные яды животного происхождения по своему качественному составу можно условно разделить на: структурно ограниченные, структурно разнообразные и функционально ориентированные. Одними из самых интересных представителей ядовитой фауны являются пауки. Количество описанных биологических видов пауков огромно - более 41000. Число компонентов в их ядах в среднем более 100, что предполагает наличие нескольких миллионов структур активных молекул с чрезвычайно широким спектром действия.
Практически на уровне каждого вида паука реализовано широкое разнообразие синтезируемых структур за счет комбинаторики в распределении аминокислотных остатков на основании нескольких общих структурных матриц. Такая организация позволяет эффективно подбирать УключиФ к самым различным УзамкамФ клеточных рецепторов, поэтому поиск потенциальных лекарств на основе структур полипептидных токсинов считается одним из наиболее перспективных. Под термином токсины в данной работе (и не только) подразумеваются все полипептидные молекулы, обнаруживаемые в природных ядах или выводимые из баз данных кДНК ядовитых желез. При этом полипептиды яда могут обладать или не обладать токсичностью, а также влиять или не влиять на состояние живых организмов.
Помимо пауков комбинаторные принципы построения полипептидных библиотек широко распространены в ядах морских животных, наиболее известные из них - улитки конусы и морские анемоны. Полипептидные токсины морских анемон так же стали объектом исследования данной работы. Экстракт из тел одного вида тропической анемоны фракционировали для выделения специфических полипептидных токсинов, для другого вида Средиземноморской анемоны изучали многообразие токсинов, анализируя опубликованные данные библиотеки EST.
- Основные реализованные в работе подходы
Развитие новых технологий и совершенствование инструментальной базы привело к появлению новых течений и тенденций в биохимии. Основной упор в работе сделан на внедрение таких новаторских технологий в процесс поиска новых полипептидных структур, представленных в природных ядах животных. Разработанные уникальные программы математического анализа массивов полипептидных последовательностей позволили сформулировать новые структурные мотивы и восстановить последовательность формирования активных полипептидов из неактивного препробелка. В свою очередь, для подтверждения правильности расчетов и предсказаний проводились протеомные исследования различных образцов ядов животных, а также использовались традиционные хроматографические методы выделения активных полипептидов.
В данной работе продемонстрирована неотъемлемая связь в исследовании белков и кодирующих их генов. Доказано, что для получения полной информации о структуре всевозможных вариантов имеющихся в ядах полипептидов надо подтверждать протеомные исследования геномными, а геномные исследования протеомными.
- Использованные информационные ресурсы
Аминокислотные последовательности белков для проведения анализов были получены из депозитария национального центра биотехнологической информации ( Для выбора нужных последовательностей использовали различные специализированные запросы, сужающие поиск. Были получены с сервера, преобразованы в нужный формат и проанализированы следующие выборки аминокислотных последовательностей:
- 39903 аннотированные белковые последовательности с детализированной информацией о координатах активного полипептида для анализа созревания всевозможных белков предшественников многоклеточных организмов (январь 2008 года);
- 231 аминокислотная последовательность токсинов анемон (февраль 2010);
- 10903 последовательности для проверки эффективности работы разработанных алгоритмов и запросов для поиска полипептидных токсинов (апрель 2010).
Для поиска токсинов морских анемон использовали готовый банк EST, созданный для Средиземноморской морской анемоны Anemonia viridis. Весь объем исходных данных в количестве 39939 EST был загружен с сервера NCBI ( .
Структуру сигнального пептида устанавливали с помощью сетевого ресурса SignaP ( по двум предлагаемым методикам расчета, на основе нейрональной сети и Hidden Markov модели. Для определения новизны найденных структур проводили поиск гомологии их первичной структуры против не вырожденной базы белковых последовательностей методами blastp и PSI-BLAST (
- Результаты и обсуждение
- Разработка алгоритмов для анализа банков нуклеотидных последовательностей
Эффективный поиск полипептидных последовательностей в геномах неразрывно связан с определением всех возможных посттрансляционных модификаций и вычленением зрелой структуры. Структурное сходство у отдельных классов белков существует не только между зрелыми последовательностями, но, частично, и между удаляемыми при созревании препрофрагментами, которые тоже можно использовать при анализе. Разработку методов поиска полипептидных токсинов начинали с создания способа предсказания зрелой цепи для токсинов пауков.
При созревании разнообразные белки помимо удаления сигнального пептида на входе в эндоплазматический ретикулум претерпевают дальнейшие превращения в аппарате Гольджи. Эти превращения могут заключаться в одиночной или последовательной фрагментации исходной полипептидной цепи, гликозилировании, фосфорилировании и ацилировании аминокислотных остатков. Помимо этого также могут осуществляться и другие менее распространенные посттрансляционных модификаций. Однако, наиболее важной и ответственной процедурой в формировании зрелой активной молекулы белка является, так называемый, ограниченный протеолиз белка под действием специфических эндопептидаз, часто именуемых конвертазами.
Изначально наличие пары положительно-заряженных аминокислотных остатков перед местом протеолитического расщепления полипептидной цепи считалось необходимым условием для ограниченного протеолиза. Первый фермент, способный разрушать такой тип связи, был открыт в 1984 году в дрожжах, он был назван кексином. Затем у млекопитающих удалось найти фермент из семейства субтилизин-подобных сериновых эндопротеиназ со сходной субстратной специфичностью, названный фурином. Позднее обнаружено было еще много сходных по биологической активности ферментов млекопитающих, получивших общее название субтилизин-подобные пропротеин конвертазы (СППК).
В общепринятых координатах ферментативного процессинга Шехтера и Бергера P4-P3-P2-P1P1Т-P2Т-P3Т положение P1 является наиболее консервативным и всегда соответствует остатку Arg, очень редко остатку Lys. Специфичность гидролиза пептидной связи определяется наличием еще одного положительно заряженного аминокислотного остатка преимущественно в положение P2, реже в положениях P6 или P4. Для формализации поиска места фрагментирования полипептида по двум положительно-заряженным аминокислотным остаткам ввели обозначение этого структурного мотива как УArginine cleavage by basic controlФ или сокращенно R(K)toR. По этому мотиву происходит процессинг множества важных сигнальных молекул, например, нейропептидов и гормонов, таких как энкефалины, кортикотропины, эндорфины, инсулин, гастрин и т.п.
Полипептидные токсины пауков в основном Arg/Lys богатые молекулы, поэтому наложение субстратной специфичности известных СППК приводила к тому, что при моделировании процесса созревания белков предшественников нарушалась структура их зрелой цепи. То есть, эти ферменты не могли участвовать в процессе созревания полипептидных токсинов пауков. Для определения специфического места ограниченного протеолиза, была проведена статистическая обработка всех данных о структуре белков предшественников токсинов пауков. На основе проведенного анализа удалось идентифицировать новый мотив ограниченного протеолиза, который получил название УProcessing Quadruplet MotifФ (ПКМ). Изначально мотив ПКМ описывал только особенности аминокислотного состава фрагмента из 4 аминокислотных остатков. Последующий анализ первичных структур различных белков предшественников выявил, что мотив узнавания более обширен и находится в интервале P6-P1. Мотив описывает взаимное расположение одного или нескольких регуляторных аминокислотных остатков Glu (интервал Р6-Р2) перед расщепляемой пептидной связью Arg-Xaa. По аналогии с мотивом СППК новый структурный мотив получил название УArginine cleavage by Glutamic acid controlФ или сокращенно EtoR.
Белки предшественники с наличием двух или более подобных последовательностей, следует рассматривать как сложные или комплексные белки. В результате их созревания из одной исходной полипептидной цепи получается не менее двух зрелых компонентов. Это часто проявляется при синтезе небольших пептидов, особенно нейропептидов и мембрано-активных пептидов (МАП). Однако, если в каждой из последовательностей есть аминокислотные остатки Cys, то может происходить замыкание дисульфидных связей (например, синтез инсулина), что приводит к синтезу многоцепочечного белка.
Анализ комплексных белков предшественников пауков привел к открытию еще одного нового структурного мотива ограниченного протеолиза. Мотив по своей сути симметричен мотиву ПКМ. Расщепление пептидной связи происходит по С-концу аминокислотного остатка Arg. Специфичность разрываемой связи также задается аминокислотным остатком Glu, располагающимся после расщепляемой связи в положениях P1Т-P5Т. Этот структурный мотив получил название inversed Processing Quadruplet Мотив (иПКМ), или EafterR. Мотивы EtoR и EafterR имеют характерное симметричное расположение в последовательности пробелка. Мотив EtoR всегда располагается с N-концевой части активного пептида, а мотив EafterR всегда с C-концевой.
Для выяснения роли новых мотивов EtoR и EafterR в процессах созревания каких-либо других активных полипептидов потребовалось дополнительное исследование. Была сделана выборка 39903 аминокислотных последовательностей белков предшественников полипептидов, относящихся к многоклеточным организмам. Из них была отобрана 6571 последовательность белка предшественника, в состав которой входил хотя бы один выщепляемый профрагмент. Для каждой последовательности реконструировали этапы ферментативных превращений от белка предшественника до зрелой молекулы и определяли мотив ограниченного протеолиза. Результаты сведены в Таблица 1
Таблица 1 Белки предшественники из группы аннотированных последовательностей, для которых были определены мотивы ограниченного протеолиза конвертазами.
Тип предшественника | Количество последовательностей | R(K)toR | Оба мотива | EtoR/EafterR |
Простой | 5168 | 872 (16.9%) | 240 (4.6%) | 174 (3.4%) |
Комплексный (2 активных фрагмента) | 908 | 446 (49.1%) | 69 (7.6%) | 19 (2.1%) |
Комплексный (более 2 активных фрагментов) | 495 | 203 (41.0%) | 39 (7.9%) | 9 (1.8%) |
ВСЕГО | 6571 | 1521 (23.1%) | 348 (5.3%) | 202 (3.1%) |
Из результатов проведенного анализа строения белков предшественников следует, что их ограниченный протеолиз для большинства известных активных полипептидов происходит под действием СППК. Как видно из таблицы почти четверть анализированных последовательностей созревает с участием ферментов этого типа. В случае комплексных предшественников участие СППК возрастает почти до 50%. Для части белков предшественников подходит расщепление как по EtoR/EafterR, так и по R(K)toR мотиву.
При рассмотрении функционально отличных групп белков выясняется, что преимущественная роль СППК осуществляется не всегда. Так, открытые мотивы EtoR/EafterR, хотя и уступают по частоте встречаемости мотиву R(K)toR , но составляют заметную конкуренцию в случае цитотоксинов и нейротоксинов (см. Рисунок 1).
Интересно отметить, что у предшественников токсинов разных ядовитых животных (Рисунок 2А) мотив EtoR/EafterR заметно доминирует у паукообразных, где он встречается почти у всех проанализированных последовательностей. При созревании антимикробных пептидов и поро-образующих токсинов ряда ядовитых животных распространенность мотива EtoR/EafterR выше встречаемости традиционного мотива R(K)toR (Рисунок 2Б).
Рисунок 1 Зависимость типа ограниченного протеолиза белков предшественников от функции активного полипептида. Белые столбики - мотив R(K)toR, черные - EtoR/EafterR, серые столбики - оба мотива равновероятны. По оси ординат приведено количественное значение в рассматриваемой выборке.
Рисунок 2 Распространенность мотивов созревания пробелков в зависимости от класса животных: A Ц для предшественников нейротоксинов и Б Ц для предшественников антимикробных пептидов и цитотоксинов. Белые столбики - мотив R(K)toR, черные - EtoR/EafterR, серые столбики - оба мотива равновероятны. По оси ординат приведено количественное значение в рассматриваемой выборке.
Практическим итогом этого этапа работы стала разработка алгоритма анализа основных этапов деградации белков предшественников, с помощью которого можно предсказывать зрелые полипептидные последовательности секретируемых белков. Зрелые структуры определяются за 4 последовательные стадии (см. Рисунок 3).
Рисунок 3 Алгоритм анализа аминокислотных последовательностей белков предшественников, для поиска закодированных зрелых цепей активных молекул.
На первой стадии важно выделить последовательность сигнального пептида. Далее полученный пробелок необходимо анализировать на наличие мотивов R(K)toR (большинство активных полипептидов) и EtoR/EafterR (токсины и МАП). Если пробелок содержит оба мотива следует выбрать наиболее подходящий или рассмотреть оба возможных варианта. При выборе наиболее подходящего мотива следует учитывать также статистические данные по типу белка и видовой принадлежности белков предшественников (Рисунок 1, Рисунок 2). На 3 этапе анализируется возможный гидролиз полипептидных цепей с обоих концов эндопептидазами. Наконец, на последней стадии для всех полученных продуктов, содержащих C-концевой аминокислотный остаток Gly, отбрасывают этот остаток и приписывают амидирование предшествующему аминокислотному остатку. Итогом анализа, проводимого по предложенной схеме, является изначально задуманная природой зрелая полипептидная последовательность.
Для поиска и идентификации в базе данных структур токсинов был разработан метод Single Residue Distribution Analysis (SRDA), который позволяет анализировать большие банки аминокислотных последовательностей и может быть легко автоматизирован. Принципиальное отличие предлагаемого метода в том, что анализ проводится по особенностям первичной структуры белка, то есть анализируются аминокислотные последовательности, а не исходные нуклеотидные последовательности. При этом объем анализируемого материала увеличилось в 6 раз за счет транслирования по всем возможным рамкам считывания.
SRDA служит для формализации белковых последовательностей и основан на анализе взаиморасположения ключевых аминокислотных остатков. Ключевые остатки остаются в УупрощеннойФ последовательности без изменения, а все остальные остатки между ключевыми заменяются на цифру, равную их количеству (см. Рисунок 4).
Рисунок 4 Пример преобразования некой аминокислотной последовательности в упрощенную форму по различным ключевым остаткам. SRDA(УCФ) Ц преобразование по ключевому остатку Cys, выделенному стрелками над исходной аминокислотной последовательностью, здесь же приведен пример цифрового интервала между ключевыми остатками; SRDA(УC .Ф) Ц преобразование по Cys и символу терминации трансляции, обозначенному точками в исходной аминокислотной последовательности; SRDA (УK .Ф) Ц преобразование по ключевому остатку Lys, выделен звездочкой над исходной аминокислотной последовательностью, и символу терминации.
Для удачного анализа необходимо определиться с выбором ключевого аминокислотного остатка. Для большинства полипептидных токсинов закономерно распределяются аминокислотные остатки Cys, в случае других типов белков, возможно, более выраженным будет взаиморасположение других аминокислотных остатков, например Lys (см. третий вариант на Рисунок 4). С практической точки зрения важно иметь представление о разрывах в анализируемых аминокислотных последовательностях, соответствующих стоп кодонам по гену (обозначаемые знаком точка). Так на Рисунок 4 распределение в анализируемой последовательности только по ключевому остатку Cys - SRDA(УCФ) (6 равномерно распределенных аминокислотных остатков) сильно отличается от данных по ключевым остаткам Cys и терминации - SRDA(УC .Ф) (два фрагмента, где 2 остатка Cys расположены на значительном расстоянии друг от друга).
Область, доступную для анализа присутствия того или иного мотива, ограничивали фрагментами, начинающимися с начала последовательности или после одного из терминальных кодонов и заканчивающимися терминальными кодонами. Если фрагмент не оканчивался терминальным кодоном, последовательность отбрасывали, как частично определенную. Это ограничение значительно сократило объем ложноположительных данных, так как исключило совпадение с последовательностями, оттранслированными по неправильной рамке считывания.
Поиск полипептидных токсинов в банках данных можно разделить на несколько последовательных операций. Последовательность операций входящих в общий алгоритм поиска полипептидных токсинов в банках нуклеотидных последовательностей приведена на Рисунок 5.
Рисунок 5 Алгоритм поиска полипептидных токсинов в банках данных EST.
Необходимо иметь две отдельные базы последовательностей. Первая из них - анализируемая база, после трансляции по 6 возможным рамкам считывания, переводится в упрощенную форму SRDA по ключевым аминокислотным остаткам и символу терминации полипептидной цепи.
Какие ключевые остатки следует выбрать, и как правильно сформулировать поисковые запросы определяется при анализе второй базы данных, которая формируется из аминокислотных последовательностей известных полипептидов с искомой функцией (токсинов животного этого вида). Запросы (в виде упрощенной формы записи) могут быть созданы в любом количестве для перекрытия всех возможных моделей распределения ключевых остатков по структурам. Для более гибкого формирования запросов допускается вместо указания точной цифры использовать символы подстановки:
? - любой одиночный символ,
# - любая одиночная цифра (0Ц9),
* - разрыв поисковой строки от 0 до любого количества символов.
С помощью разработанных запросов вначале находятся в анализируемом банке соответствующие упрощенные структуры, далее осуществляется переход к конкретным клонам в исходной базе нуклеотидных последовательностей. Повторяющиеся аминокислотные последовательности удаляются с учетом идентичности зрелых цепей выводимых полипептидов без учета возможных вариаций в области сигнальных пептидов и профрагментов.
Достоверность выведенных структур проверяется по наличию сигнального пептида сервисом SignalP. Для определения новизны найденных структур и возможной оценке предполагаемых биологических свойств, проводится поиск гомологии против неповторяющейся базы белковых последовательностей по алгоритмам blastp или PSI-BLAST.
Практическая значимость разработанных алгоритмов поиска была проверена на базах данных нуклеотидных последовательностей, полученных для ядовитых животных.
- Разработка запросов для проведения анализа баз данных пауков
Характерные мотивы первичной структуры для токсинов пауков разрабатывали на основе предварительного анализа описанных в литературе токсинов пауков. Большинство токсинов имеет характерное распределение остатков Cys по полипептидной цепи и схему замыкания дисульфидных связей, известную как цистеиновый узел. Упрощение их структур по ключевым аминокислотным остаткам цистеина позволяет сформулировать два наиболее распространенных мотива.
N-концевой Принципиальный Структурный Мотив (ПСМ):
ПСМ CXXXXXXCЧ5-10 а.о.ЧCC или C6C(# / ##)CC
И С-концевой Дополнительный Структурный Мотив (ДСМ:
ДСМ CXC-----CXC или C1C*C1C
На основании этих формализованных мотивов были сформулированы: универсальный поисковый запрос, охватывающий только мотив ПСМ, который выглядит как УC#C*CC*С*С#.Ф , запрос для нахождения токсинов с обоими мотивами УC#C*CC*C1C*C1C#.Ф и запрос для поиска токсинов с укладкой, отличной от цистеинового узла - УC1C*C1C#.Ф
Для проверки эффективности разработанных мотивов токсинов пауков был проведен анализ проверочной базы животных токсинов. Среди токсинов членистоногих по трем мотивам было идентифицировано более половины структур из 3053 представленных в банке. Если рассматривать только структуры, найденные у пауков, то все мотивы в сумме обнаруживают 1634 последовательности и еще 354 остаются неопределенными. Среди этих пропущенных последовательностей большинство относится к ферментам и высокомолекулярным компонентам яда. Только 60 полипептидных токсинов, половина из которых является предсказанными по общей гомологии, не узнаются разработанными обобщенными мотивам, это соответствует 5% токсинам пауков в проверочной базе.
- Разработка запросов для проведения анализа баз данных анемон
Структуры токсинов морских анемон намного разнообразнее. Для поиска мотивов из 231 известной аминокислотной последовательности токсинов отобрали 104 неповторяющихся. После анализа упрощенных последовательностей по ключевому остатку цистеина можно выделить 15 мотивов, полностью перекрывающих всю проанализированную выборку (см. Таблица 2). Первые четыре мотива перекрывали максимальное количество известных токсинов морских анемон из выборки данных и разрабатывались как наиболее селективные.
Таблица 2. Мотивы распределения аминокислотных остатков Cys в полипептидных токсинах анемон. Поисковый запрос отражает синтаксис, применяемый для поиска в банках EST методом SRDA. Точка обозначает символ терминации, # - любой цифровой символ, * - допустимый разрыв в поисковой строке. Количество соответствует числу аминокислотных последовательностей известных токсинов анемон, использованных для формулирования мотива, примеры некоторых из них приведены в последней графе.
Поисковый запрос | кол-во | пример (код в базе данных) | |
мотив 1 | C1C##C6C#CC | 44 | гангитоксин (P82803), AETX-1 (P69943) |
мотив 2 | C1C##C9C#CC#. | 8 | BDS-II (P59084), APETx2 (P61542) |
мотив 3 | C8C#C*C3C#C. | 8 | калисептин (Q9TWG1), ShK (P29187) |
мотив 4 | C8C*C#C*C3C | 9 | AsKC1 (Q9TWG0), APHC1 (B2G331) |
мотив 5 | C8C#C*C1C#C#. | 2 | SHTX-5 (B1B5J0), гигантоксин-1 (BAD01579) |
мотив 6 | CC#C#CC*C1C*C. | 2 | AETX-2 (P69944) |
мотив 7 | CC1C*C*C*C*C1C#. | 1 | PA-TX (P09949) |
мотив 8 | CC1C#C5C*C#. | 1 | нейротоксин 3 (1ANS) |
мотив 9 | C6C*C*C*C6C#. | 2 | акрорхагин II (BAE46983) |
мотив 10 | C8C3C#C. | 1 | метридин (P11495) |
мотив 11 | C#C#C#C#C#C#C#C#. | 2 | акрорхагин-1 (BAE46981) |
мотив 12 | C6C#C#C1C*C1C | 3 | AvTX-60A (BAD04943), PsTX-60B (P58912) |
мотив 13 | C#C#C#C#. | 1 | SHTX-1/SHTX-2 (P0C7W7) |
мотив 0 | ###. | 18 | Эквинатоксин II (P61915), цитолизин-3 (Q9U6X1) |
мотив 14 | ##C | 2 | Up-1 (P0C1G1), бандапорин (BAH80315) |
мотив K | K>=6 AND C<=2 | ||
ВСЕГО | 104 |
Особенностью компонентного состава яда анемон является наличие крупных молекул без остатков цистеина с сильным цитолитическим действием. Общепринятое название таких цитолитических компонентов анемон - цитолизины. Для цитолизинов мотивы структур оказались слишком простыми (0 и 14 в Таблица 2), и как оказалось в дальнейшем, слишком вырожденными для поиска. Вместо этих двух мотивов был создан новый мотив К, который совмещал два условия: наличие не более 2 остатков Cys при SRDA (УC .Ф) и не менее 6 остатков Lys при SRDA (УK .Ф).
Анализ эффективности разработанных мотивов токсинов анемон на проверочной базе животных токсинов показал, что среди всех мотивов специфичными к токсинам анемон оказались только два - мотив 1 и 2. Мотивы 3 и 4, хотя и разрабатывались, как высокоспецифичные, оказались характерными для токсинов других видов животных, в основном нематод и змей. Эффективность общей выборки по первым 13 мотивам оказалась приличной. Все вместе они не обнаружили в анализированной проверочной базе 154 из 374 представленных последовательностей токсинов анемон, 108 из них относились к предсказанным структурам или фрагментам последовательностей, а оставшиеся 46 к цитотоксинам (мотив К). Среди цистеин содержащих полипептидных токсинов найдены были все последовательности.
- Анализ баз данных нуклеотидных последовательностей
Разработанные запросы (мотивы упрощенных структур) применяли для поиска полипептидных токсинов. Использовали, как вновь созданные базы нуклеотидных последовательностей из ядовитых желез различных видов пауков, так и опубликованную, но не до конца аннотированную базу EST морской анемоны. Из полученных 12 баз EST ядовитых желез пауков в работу вошли результаты анализа только двух видов.
- Результаты анализа базы данных EST последовательностей паука Agelena orientalis
Транслированная база данных EST последовательностей паука Agelena orientalis была проанализирована на наличие полипептидных последовательностей, обладающих тремя структурными мотивами токсинов пауков (ПСМ, ДСМ, ПКМ). Для всех отбираемых по выше разработанным запросам последовательностей проверяли также наличие сигнального пептида. Выделяли пять основных групп токсинов в зависимости от найденных мотивов: (1) - структуры с ПКМ, ПСМ; (2) - структуры с ПКМ, ПСМ и ДСМ; (3) - структуры с ПКМ, ДСМ; (4) - структуры без ПСМ и ДСМ, но с ПКМ; (5) структуры, не содержащие остатков Cys, но имеющие ПКМ. Зрелые последовательности определяли по алгоритму, представленному на Рисунок 3.
Распределение кодированных структур в банке EST из ядовитых желез паука A. orientalis наглядно представлено на Рисунок 6.
Рисунок 6 Разбивка на группы выведенных последовательностей из банка данных EST паука A. orientalis. Группа 1 - компоненты в первичной структуре которых имеются ПКМ, ПСМ с ОСМ; группа 2 Ц компоненты, где имеются ПКМ, ПСМ и ДСМ; группа П содержит последовательности без структурных мотивов; группа Ф состоит из фрагментов больших белков. Группа УошибкиФ содержит бессмысленные и неправильно определенные последовательности EST.
Из всех возможных 5 групп полипептидных токсинов присутствуют только две - сильно преобладающая группа 1 и группа 2. Вместе обе группы токсинов представлены в банке более чем на 70%, что является показателем хорошего качества сборки банка. Наблюдаемый 21% ошибочных последовательностей включал, как ошибки определения нуклеотидных последовательностей (сбой рамки или нечитаемый нуклеотид), так и неудачные результаты клонирования. Не столь многочисленными были две группы выведенных последовательностей: полноразмерных полипептидных компонентов, не относящихся к токсинам (группа П 2.7%); и фрагментов больших клеточных белков (группа Ф 3.1%).
В группе 1 лидировала подгруппа из 26 последовательностей, содержащая нейротоксин агеленин, ранее выделенный из близкородственного вида паука Agelena opulenta. В этой подгруппе наиболее представлен среди последовательностей токсин Agel 01 (38% от всех структур токсинов в банке), уже известный агеленин (21%) и токсин Agel 02 (14%). По-видимому, транскрипция этих трех генов идет наиболее интенсивно и, следовательно, в природном яде они должны быть одними из основных компонентов. Во второй группе присутствовали две основные подгруппы, гомологичные ранее известным белкам μ-агатоксин 2 и ω-агатоксином-IIIA из яда паука Agelenopsis aperta. Их распределение в банке последовательностей было более равномерным.
Всего было определено 45 различных последовательностей белков предшественников токсинов, из которых только одна относилась к ранее известным.
- Результаты анализа базы данных EST последовательностей Lachesana tarabaevi
Отличия различных видов пауков проявляется не только на уровне морфологии, но и на компонентном составе их яда. Выведенные полипептидные последовательности из банка EST второго исследованного паука вида L. tarabaevi показали абсолютно другое распределение кодированных структур. На 5 групп полипептидных токсинов в общей сложности пришлось менее половины всех клонов (см. Рисунок 7).
Рисунок 7 Разбивка на группы EST последовательностей из банка данных L. tarabaevi. Группа 1 компоненты в первичной структуре которых имеются ПКМ, ПСМ с ОСМ; группа 2 где имеются ПКМ, ПСМ и ДСМ; группа 3 где имеются ПКМ и ДСМ; группа 4 где имеется только ПКМ; группа 5 линейные белки без цистеинов где имеется ПКМ; группа П содержит последовательности без структурных мотивов; группа Ф состоит из фрагментов больших белков. Группа ошибки содержит бессмысленные EST и неправильно определенные последовательности.
В яде L. tarabaevi с большим перевесом преобладают линейные токсины 5 группы. Токсины в группе 1 представлены совсем незначительно, как количеством клонов, так и количеством различных полипептидов (4 полипептида и 19 клонов). Представители второй группы более разнообразны по количеству кодированных структур и представленности в транскриптоме (22 полипептидных токсина). Распределение структур более равномерное, по сравнению с банком EST последовательностей из яда паука A. orientalis. Нет одного весьма распространенного семейства, все семейства с приблизительно равной представленностью (порядка 40 клонов). Следовательно библиотека более нормализована, что проявляется не только в группах токсинов, но и по представленности фрагментов клеточных белков в группах П и Ф. Всего было выведено 98 последовательностей белков предшественников полипептидных токсинов. Гомология первичных структур зрелых последовательностей с известными токсинами пауков была незначительная, поэтому все полученные токсины относятся к абсолютно новым.
- Результаты анализа базы данных последовательностей морской анемоны A.аviridis
Морская анемона A. viridis, ранее известная как Anemonia sulcata - один из средиземноморских видов, наиболее часто подвергавшаяся вниманию исследователей. Более 20 различных по структуре и функции полипептидных токсинов выделено и охарактеризовано за время ее исследования. На каждый разработанный поисковый запрос был проведен поиск совпадений в анализируемом банке EST, статистические результаты представлены в Таблица 3.
Таблица 3. Постадийные результаты поиска полипептидных токсинов в банке EST A. viridis. Общее количество последовательностей, отобранных из банка по каждому разработанному запросу, указано, как EST найдено. В колонке SignalP указано количество индивидуальных последовательностей после удаления повторов и подтверждения наличия сигнального пептида. Количество ближайших структурных гомологов по алгоритму blastp и количество найденных известных токсинов приведены в соответствующих столбцах.
EST найдено | SignalP подтверждено | blastp совпадения | Известные последовательности из A. viridis | |
мотив 1 | 7 | 4 | 4 | 3 |
мотив 2 | 51 | 13 | 13 | 1 |
мотив 3 | 162 | 11 | 11 | 0 |
мотив 4 | 211 | 16 | 16 | 3 |
мотив 5 | 26 | 2 | 2 | |
мотив 6 | 2 | 0 | - | |
мотив 7 | 10 | 0 | - | |
мотив 8 | 8 | 0 | - | |
мотив 9 | 59 | 2 | 2 | |
мотив 10 | 19 | 0 | - | |
мотив 11 | 81 | 5 | - | |
мотив 12 | 20 | 0 | - | |
мотив 13 | 5466 | 11 | - | |
мотив K | 133 | 25 | - | |
ИТОГО | 6222 | 89 | 46 | 7 |
Количество обнаруженных клонов на каждый мотив сильно отличалось. Так, для наиболее вырожденного мотива 13, описывающего расположение 4 остатков Cys c интервалами менее 10 остатков, было обнаружено совпадение с 5466 EST. Почти все эти совпадения происходили с последовательностями в неправильной рамке считывания, но все они эффективно отсекались на стадии поиска сигнального пептида. Перед стадией проверки сигнального пептида все EST группировали по гомологии. Успешно этот этап преодолели только 89 выведенных структур предполагаемых белков предшественников полипептидных токсинов. А последний этап поиска гомологии с известными белками преодолели 46 последовательностей.
Все найденные полипептидные токсины и подобные им структуры процессировались по мотиву R(K)toR, который и был признан как основной мотив ограниченного протеолиза для токсинов анемоны, хотя мотив EtoR иногда сопутствовал R(K)toR мотиву. По алгоритму поиска зрелых последовательностей были найдены зрелые формы токсинов.
По мотиву 1 было найдено четыре полноразмерные структуры белков предшественников, три из которых полностью совпадали с ранее известными токсинами блокаторами натриевых каналов, обнаруженными ранее у этого вида анемон. Это нейротоксин 2, токсин 2-1 и нейротоксин 8. Четвертый полипептид, получивший имя нейротоксин 1-1, имел всего две аминокислотные замены по сравнению с еще одним известным полипептидом - нейротоксином 1.
Для полипептидных токсинов BDS-1/BDS-2 - специфических блокаторов быстро инактивирующихся К+ каналов Kv3.4 в банке (на мотив 2) была обнаружена неизвестная ранее структура белка предшественника BDS-1 и еще 12 близких структурных гомологов, которые получили порядковые номера с BDS -3 по BDS -14.
Следующий известный блокатор калиевых каналов калисептин (по мотиву 3) не был найден в библиотеке, но были обнаружены 11 подобных по структуре полипептидов (avtx-1 - avtx-11). По гомологичности с известными структурами эта группа токсинов наименее похожа на изученные белки.
Полипептиды, имеющие характерный мотив укладки Кунитца, были обнаружены по мотиву 4. В отличие от других полипептидов анемон они не имели профрагмента между сигнальным пептидом и зрелой частью, но содержали короткие выщепляемые С-концевые последовательности. В этой группе самыми представленными являются ранее известный каликлюдин-3 и новый гомолог каликлюдин-4 (AsKC4). Также были идентифицированы структуры гомологичные каликлюдину-1 (AsKC1a) и пептидному ингибитору протеаз 5 II.
Несколько полипептидов было найдено с мотивом 5. Две новые структуры были названы Gigt 4 и Gigt 5 за высокое родство к гигантоксину I из другого вида морской анемоны Stichodactyla gigantean, который является слабым паралитическим токсином, способным связываться с EGF рецептором.
Две интересные последовательности белков предшественников пептидных токсинов AV-1, AV-2 были найдены по мотиву 9. Четыре зрелых полипептида из каждого белка предшественника были умеренно гомологичны пептидным токсинам Am-1 из морской анемоны Antheopsis maculata. Особенность белка предшественника Am-1 состоит в том, что в процессе своего созревания он расщепляется на 6 активных компонентов по специфическим сайтам ограниченного протеолиза, ранее описанным как R(K)toR. В структуре новых найденных последовательностей гомологичны не только зрелые цепи, но и удаляемые фрагменты.
Последовательности, найденные по мотивам 11 и 13, были названы как токсин подобные из-за отсутствия гомологии к известным белкам. Среди них были 8 коротких цистеин-содержащих последовательностей. Кроме того, две последовательности (Tox-like av-1 и 5) по результатам поиска гомологии совпадали с предсказанными ранее структурами. Помимо этого были обнаружены длинные цистеин-содержащие последовательности, названные Tox-like av-9 av-16. Они имели интересную особенность первичной структуры - наличие протяженного профрагмента сразу за сигнальным пептидом, в котором преобладают отрицательно заряженные аминокислотные остатки, тогда как в зрелой цепи расположено много аминокислотных остатков аргининов и лизинов, подобно тому, как это было найдено для некоторых предшественников антимикробных пептидов.
На мотив К было обнаружено несколько явных цитотоксинов, не содержащих аминокислотных остатков цистеинов и сильно обогащенных лизинами, названных цитолизин-подобными структурами Cyt-like av-1 - av-11. Кроме того были идентифицированы еще 12 коротких последовательностей, не имеющих большой положительный заряд. Все они, кроме одной последовательности, хорошо группировались в 4 гомологичных пептидных семейства с пока неизвестной функцией. Для них было предложено название гипотетические полипептиды av-1 - av-12.
Весьма интересные белки, найденные по мотиву К, являются близкими гомологами белков предшественников нейрональных пептидов (см. Рисунок 8). При ограниченном протеолизе каждый из этих белков генерирует по пять небольших пептидов с предположительно нейрональной активностью.
Рисунок 8. Сравнение аминокислотных последовательностей белков предшественников LWамид нейропептидов (Q16998), N-концевого фрагмента Antho-RFамида (Q01133) и двух белков предшественников RPамид нейропептидов, полученных на мотив К. Активные нейропептиды подчеркнуты, жирным цветом выделены совпадающие места процессинга полипептидной цепи.
Для анемон, полипов и медуз известны примеры белков предшественников нейропептидов. Характерная особенность получаемых пептидов - одинаковая C-концевая последовательность, заканчивающаяся амидированным аминокислотным остатком. Для LWамид семейства белков это Gly-Leu-Trp-NH2, для RFамид семейства белков - Gly-Arg-Phe-NH2. Гомология строения новых белков предшественников отсутствует, сходны только мотивы, расположенные между получаемыми нейропептидами - мотивы R(K)toR и мотив амидирования С-концевого остатка. Точное местоположение N-концевого аминокислотного остатка определить было затруднительно, поэтому предположили, что активный нейропептид должен иметь длину в 4-6 аминокислотных остатков. Четыре из пяти получаемых при созревании пептидов оканчиваются на последовательность Arg-Pro-NH2, поэтому они получили название RPамид нейропептиды.
В результате анализа к ранее известным 23 полипептидным токсинам из морской анемоны A. viridis нам удалось добавить еще 42 новые последовательности токсинов, для 5 известных токсинов были определены структуры белков предшественников, а всего в результате анализа базы данных по 14 мотивам упрощенных структур было обнаружено 89 белков предшественников.
- Протеомный анализ ядов пауков
Применяемые методы анализа банков нуклеотидных последовательностей позволяют получить сразу большое количество структурной информации, но это не соотносится с реальным составом активных ядов. Выведенные последовательности из баз данных EST ядовитых животных нуждаются в экспериментальной проверке. Такая проверка, с одной стороны, необходима для сопоставления качественного и количественного содержания токсинов с уровнем содержания их мРНК в железах пауков, и, с другой стороны, подтверждает правильность установления структуры зрелой цепи для токсинов.
Исследования компонентного состава природных ядов проводили на образцах, полученных из нескольких видов пауков. Использовали протеомный подход, включавший комбинацию ВЭЖХ и МАЛДИ масс-спектрометрии.
- Компонентный анализ яда паука A. orientalis
Масс-спектрометрический анализ образца природного яда позволил достоверно детектировать 9 основных компонентов в диапазоне масс от 1 до 10 кДа (см. Рисунок 9А). Для детального определения молекулярных масс всех возможных компонентов проводили анализ фракций после разделения яда ВЭЖХ на обращено-фазной колонке (см. Рисунок 9Б). В этом случае был идентифицирован 21 полипептидный компонент, что в два раза меньше, чем было найдено при анализе базы данных EST последовательностей.
Рисунок 9 Исследование компонентного состава природного яда паука A. orientalis. (А) Масс-спектр цельного яда в линейном режиме измерения. (Б) Результаты хроматографического разделения 20 мкг смесевого яда на обращено-фазной колонке Jupiter C5 2x150 мм (Phenomenex). Линейный градиент концентрации ацетонитрила 1% в минуту создавали в присутствии 20 мМ триэтиламина, титрованного уксусной кислотой до pH 10.0, скорость потока 300 мкл/мин.
Для наиболее представленных 12 компонентов были определены аминокислотные последовательности частичным N-концевым секвенированием по Эдману и масс-спектрометрическим анализом пептидов, полученных после ферментативного расщепления полипептидной цепи. Отличие экспериментально определенных масс от расчетных во всех случаях составило менее 1 Да.
Было найдено соответствие между 12 предсказанными структурами полипептидов по базе EST и компонентами природных ядов. Девять компонентов, содержали С-концевой амидированный аминокислотный остаток, 3 компонента яда содержали свободную карбоксильную группу. Все предсказанные модификации при созревании токсинов были подтверждены протеомным анализом.
Рисунок 10 Сравнение процентного содержания компонентов яда по данным протеомных исследований с данными исследования транскриптома. порядковый номер соответствует последовательности элюирования с обращено-фазной колонки: P3242, P4237, P4160, P3125, P6530, P3180, P3737, P3772, P3795, P4145, P1442, P3491, P3509, P4115, P5192, P4273, P4214, P4146, P3762, P3820, P3848.
Расчетное количественное содержание различных полипептидов яда было далеко от предполагаемого по уровню мРНК (см. Рисунок 10). Только восемь компонентов в природном яде присутствовало в сравнительно большом количестве (более 3%) - P4237, P4145, P4273, P4214, P4146, P3762, P3820 и P3848. Одно из вероятных объяснений этого несоответствия заключается в том, что при клонировании EST в клетках E. coli существуют некоторые структурные предпочтения. Второе вероятное объяснение заключается в том, что образцы яда и желез пауков были получены от различных особей, которые, в свою очередь, могут иметь некоторые фенотипические различия.
Для проверки последнего предположения были получены 20 образцов яда от отдельных особей паука A. orientalis, обитающих на одной территории. Качественный и количественный анализ этих образцов был проведен комбинацией методов ВЭЖХ и масс-спектрометрии в тех же условиях, что и анализ смесевого яда (см. сводный результат на Рисунок 11).
Рисунок 11. Качественный и количественный состав ядов двадцати индивидуальных особей паука A. orientalis. По вертикальной оси в логарифмической шкале отмечено процентное содержание компонентов яда относительно УстандартногоФ компонента P4273, отмеченного черным цветом. Серым цветом показаны конститутивные компоненты, присутствующие в каждом яде, белым Ц мобильные компоненты, присутствие которых в яде непостоянно.
Значительных различий в профилях элюции пиков между образцами индивидуальных ядов не наблюдали, однако, по содержанию компонентов образцы существенно отличались как от смесевого яда, так и между собой. В то время как в смесевом яде был обнаружен 21 компонент, отдельные особи продуцировали от 8 до 15 полипептидных компонентов яда, причем, наибольшее количество ядов (двенадцать образцов) содержало 12 - 14 компонентов. Таким образом, число детектированных компонентов в индивидуальных ядах оказалось существенно меньше числа компонентов в смесевом яде.
Анализируя состав индивидуальных ядов, выделили группу основных, названных конститутивными компонентами, присутствующих во всех проанализированных образцах и характеризующихся сравнительно высоким относительным содержанием. Остальные компоненты, получили название мобильных, их присутствие детектируется от особи к особи, и в целом, распределение мобильных компонентов по ядам носило случайный характер.
Сопоставление результатов анализа смесевого яда с индивидуальными показало, что все соединения, найденные в 20 проанализированных образцах ядов индивидуальных особей, обнаруживаются также и в смесевом яде. Таким образом, предполагается, что существует закрепленный набор полипептидных структур, ограничивающий возможное разнообразие полипептидов внутри одного вида. Но каждая особь подходит к процессу создания многокомпонентного яда по принципу синтеза разрешенных полипептидов вероятностным выбором или под действием направляющих факторов внешней среды. Найденная вариабельность состава яда пауков внутри одного вида представляет огромный интерес с точки зрения понимания механизмов, лежащих в основе формирования структурного разнообразия токсинов.
- Компонентный анализ яда паука L.аtarabaevi
В отличие от подробного протеомного анализа яда паука A. orientalis, в случае яда L.аtarabaevi детальных исследований с определением первичных структур компонентов не проводили. Яд паука L.аtarabaevi с более сложным, компонентный составом, судя по обзорному масс-спектру (см. Рисунок 12А), в котором можно заметить 4 группы полипептидов. Это хорошо представленные короткие полипептиды 2-3 кДа, далее идут компоненты 3-5 кДа, и еще две выраженные группы 6-7, 7-8.5 кДа. Как и в случае паука A. orientalis количество индивидуальных компонентов яда в действительности много больше, чем представлено на обзорном спектре. При разделении аликвоты природного яда методом ВЭЖХ на носителе с обращенной фазой было получено 34 фракции (см. Рисунок 12Б), их последующий масс-спектрометрический анализ выявил присутствие чуть менее 100 компонентов. Практически столько же структур токсинов было выведено из банка последовательностей EST.
Рисунок 12 Масс-спектр - панель (А) и профиль хроматографического разделения Ц панель (Б) природного яда паука L.аtarabaevi. на обращено-фазной колонке Jupiter C5 2x150 мм (Phenomenex). Линейный градиент концентрации ацетонитрила 2% в минуту создавали в присутствии 0.1% ТФУ, скорость потока 300 мкл/мин.
Сравнение молекулярных масс природных соединений и зрелых молекул выведенных токсинов позволило установить соответствие 76 компонентов. Так как все фракции были многокомпонентными, произвести расчет представленности каждого компонента природного яда оказалось невозможным. Все наиболее представленные компоненты по транскрипотому (20 и более клонов в банке) соответствовали самым высоким сигналам в масс-спектрах фракций и масс-спектре цельного яда на Рисунок 12А, кроме одного токсина LaTx_31 с расчетной молекулярной массой 9526.8 Да.
Суммируя все выше представленные результаты следует отметить, что разработанный алгоритм хорошо предсказывает токсины. Выводимые с его помощью структуры соответствуют последовательностям природных токсинов, что было продемонстрировано на образцах природных ядов пауков. Разработанный инструментарий позволяет расшифровывать большое количество структур токсинов в сжатые сроки, в результате чего, в ближайшее время можно получить исчерпывающие знания о принципах комбинаторики и попытаться перейти к предсказанию функции кодированных последовательностей.
Вместе с тем показано, что нет прямого соответствия между уровнем представленности мРНК в банке и реальным содержанием токсина в природном яде. Более того, часть токсинов природного яда не обнаруживается по геному, поэтому полное структурное разнообразие природного яда можно определить, вероятно, только суммируя результаты, получаемые при изучения геномов ядов, с результатами протеомики ядов (лучше от нескольких особей).
Разнообразие полипептидов в ядах пауков по совместным данным геномики и протеомики велико. Всего существует несколько структурных семейств внутри которых насчитывается множество отдельных представителей, несущих единичные аминокислотные замены. Пока не удается достоверно выбрать специфичного активного токсина на определенный тип клеточного рецептора. Поэтому до разработки стройных теорий предсказаний, следует использовать традиционный подход, основанный на измерении функциональной активности в специализированных тестах. В этом случае токсин с искомой активностью постадийно выделяется из цельного яда, после чего определяется его строение. В данной работе было использовано несколько типов функциональных тестов и модельных систем для поиска специфичных полипептидов.
- Выделение инсекто-специфических токсинов
В первом функциональном тесте проводилось изучение токсического действия полипептидов на насекомых. Для удобства работы использовали не взрослых насекомых, а их личинки. С точки зрения представленности различных типов рецепторов, личинки могут иметь несколько другой профиль рецепторов, однако с практической точки зрения наибольший урон сельскому хозяйству наносят личинки, а не взрослые насекомые. В плане устойчивости к действию инсектотоксинов личинки превосходят взрослых особей, что было показано для некоторых исследуемых полипептидов в наших экспериментах (данные не приводятся). Использовали личинки обыкновенной комнатной мухи Musca domestica и личинки табачной листовертки Heliothis virescens, являющейся одной из распространенных сельскохозяйственных вредителей. Специфичность действия проверяли в экспериментах на млекопитающих, вводя мышам в хвостовую вену или внутрибрюшино физиологический раствор с тестируемыми соединениями.
- Инсектотоксины из яда паука Segestria florentina
Первым объектом стал небольшой плетущий паутину паук S. florentina, распространенный в средиземноморском регионе. Начальное фракционирование яда проводили на гель-фильтрационном сорбенте для отделения активной фракции полипептидов от высокомолекулярных белков. После чего единственная активная фракция, полученная на первом этапе, подвергалась обращено-фазной ВЭЖХ. В результате были получены три фракции, обладавшие инсектицидной активностью против личинок H. virescens (см. Рисунок 13).
Рисунок 13 Выделение полипептидных токсинов с инсектицидным действием из природного яда паука S. florentina. 1этап гель-фильтрация на колонке TSK 4000SW (10 μм 7.5 x 600 мм), мобильная фаза 50 мM Tris-HCl (pH 7.0), 150 мM NaCl, скорость элюции 0.5 мл/мин. 2 этап ВЭЖХ на колонке Delta Pak C4 (3.9 x 150 мм, 100 ) в линейном градиенте концентрации ацетонитрила, мобильная фаза 0.1% ТФУ, скорость элюции 0.7 мл/мин. Фракции, проявившие активность в тестах, подчеркнуты.
Для выделения гомогенных компонентов проводили дополнительную очистку на том же сорбенте с измененными условиями разделения, после чего подтверждали чистоту фракций масс-спектрометрическим анализом. Измеренные средние молекулярные массы активных компонентов составили 5159, 4973 и 4993 Да. После предварительного восстановления полипептидов и алкиллированния по остаткам Cys были определены первые 18 N-концевых аминокислотных остатков всех активных компонентов:
f5.5 aecmvdetvcyihnxnnc;
f5.6 kecmtdgtvcyihnxndc;
f5.7 kecmadetvcyihnxnnc.
Для установления полных структур активных компонентов были синтезированы два вырожденных олигонуклеотидных праймера Psfi-1 и Psfi-2 на основе информации о N-концевой аминокислотной последовательности выделенных инсектотоксинов. С помощью этих праймеров была получена информация о 35 независимых клонах: 5 клонов, содержащих продукты ПЦР на праймер Psfi-1, и 30 клонов - на Psfi-2. После множественного выравнивания всех полученных нуклеотидных последовательностей была установлена структура 8 генов, кодирующих единственное семейство гомологичных белков, первичная структура всех выведенных полипептидных токсинов (SFI-1 - SFI-8) приведена на Рисунок 14. Молекулярная масса и N-концевая аминокислотная последовательность полипептида SFI-1 соответствовала основному инсектотоксичному компонету яда f5.6.
Рисунок 14 Высокогомологичное семейство инсектотоксинов из яда паука S. florentina. Точечные замены в структуре полипептидной цепи выделены жирным шрифтом.
Инсектоспецифичность токсинов, выделенных из яда, была проверена на мышах. В дозах 1.1 -1.5 мг/кг веса все токсины не вызывали изменений в поведении или в самочувствии контрольных животных. В этих концентрациях токсический эффект на личинках обнаруживался уже через 1-5 минут после введение токсинов, но значение расчетной половинной летальной дозы (ЛД50) было выше, оно составило 4, 10 и 7 мг/кг веса личинки для токсинов f5.5, f5.6, f5.7 соответственно.
Таким образом, в результате исследования яда паука S. florentina удалось обнаружить семейство гомологичных инсектоспецифичных токсинов, определить полную структуру 8 отдельных представителей этого семейства и функционально охарактеризовать три полипептидных токсина.
- Инсектотоксины из яда паука L.аtarabaevi
Для получения индивидуальных полипептидов из природного яда паука L.аtarabaevi использовали на первой стадии также гель- фильтрационную хроматографию (см. Рисунок 15). При этом обнаружили единственную инсектотоксичную фракцию в диапазоне элюирования стандартных белков массой от 30 до 5 кДа. После второй стадии фракционирования на обращено-фазном сорбенте на хроматографическом профиле обнаружили две области, в которых элюировались полипептидные компоненты с интересующей активностью. Они были разделены на пять частей, каждая из которых была подвергнута дальнейшему разделению на компоненты.
Рисунок 15 Выделение полипептидных токсинов с инсектицидным действием из природного яда паука L.аtarabaevi. 1этап гель-фильтрация на колонке TSK 2000SW (10 μм 7.5 x 600 мм), мобильная фаза 50 мM Tris-HCl (pH 7.0), 150 мM NaCl, скорость элюции 0.5 мл/мин. 2 этап ВЭЖХ на колонке Jupiter C5 (4.6 x 150 мм, 300 ) в линейном градиенте концентрации ацетонитрила от 0% до 40% за 60мин, далее от 40% до 65% за 10 мин, мобильная фаза 0.1% ТФУ, скорость элюции 1 мл/мин. 3 этап разделение пяти фракций (за 5 отдельных инжекций 2+3) из предыдущей хроматографической стадии на обращено-фазной колонке Jupiter C5 (2 x 150 мм, 300 ), инейный градиент концентрации ацетонитрила 15-45% за 60 мин, мобильная фаза 0.1% ТФУ, скорость элюции 0.3 мл/мин.
В итоге из первой группы с меньшим временем удерживания на колонке Jupiter C5 (4.6 х 150) выделили два токсина:
токсин 54B1 с измеренной средней молекулярной массой 7670 Да и частичной N-концевой аминокислотной последовательностью ECVPLENDCTKL;
токсин 659 с измеренной средней молекулярной массой 6570 Да и частичной N-концевой аминокислотной последовательностью ECIPTLHDCTND.
Из второй группы выделили четыре токсина:
токсин 93 с измеренной средней молекулярной массой 7887 Да и частичной N-концевой аминокислотной последовательностью GFFGNAWKKIKGKAE;
токсин 916 с измеренной средней молекулярной массой 7904 Да и частичной N-концевой аминокислотной последовательностью GFFGNTWK;
токсин 933 с измеренной средней молекулярной массой 7893 Да и частичной N-концевой аминокислотной последовательностью GFFGNTWKKIKG;
токсин 934 с измеренной средней молекулярной массой 7866 Да и частичной N-концевой аминокислотной последовательностью GFFGNTWKKIKG.
По данным частичной аминокислотной последовательности и измеренным молекулярным массам природных белков были найдены полные аминокислотные последовательности инсектотоксинов по банку EST (см. Результаты в Таблица 4). Для подтверждения соответствия выведенных и природных структур, дополнительно проводили фрагментирование полипептидной цепи токсинов трипсином и сравнение массы получаемых и расчетных пептидов, которое подтвердило правильность определения первичной структуры.
Таблица 4 Свойства инсектотоксинов из яда паука L.аtarabaevi и их соответствие выведенным последовательностям из базы данных.
В природном яде | В банке EST | Разница | |||
Полипептид яда | Д50 (мг/кг веса) | % в яде | структура | кол-во клонов | мол. масс |
токсин 54B1 | 11.1 | 3.4 | LaTX_21 | 36 | 0.8 |
токсин 659 | 11.5 | 8.4 | LaTX_17 | 33 | 0.3 |
токсин 93 | 14.2 | 9.4 | LaTX_01 (CIT 1h) | 70 | 1.5 |
токсин 916 | 13.57 | 3.5 | LaTX_05 (CIT 1a) | 142 | -1.7 |
токсин 933 | н/д | 0.75 | LaTX_03 (CIT 1c) | 10 | 1.4 |
токсин 934 | н/д | 0.7 | LaTX_07 (CIT 1g) | 57 | 0.4 |
Токсичность на насекомых была проверена для всех индивидуально полученных полипептидов. Для двух наименее представленных в яде не удалось рассчитать значение ЛД50, для остальных полипептидов измеренная активность составила 11-14 мг/кг веса (см данные в Таблица 4).
Токсины из первой группы принадлежат к семейству цистеин-содержащих полипептидов, состоящему из семи полипептидных молекул. Активность на насекомых была измерена только для двух наиболее представленных компонентах, остальные, предположительно, также обладают искомой активностью.
Инсектотоксины второй группы оказались представителями линейных полипептидов, относящихся к 5 структурной группе (16 индивидуальных последовательностей по геному). Из пяти наиболее представленных в банке данных EST последовательностей в яде было идентифицировано четыре. Еще 4 токсина удалось найти в близлежащих фракциях при анализе масс пептидов, полученных после селективного протеолиза по остаткам метионина, аргинина и глутаминовой кислоты с использованием бромциана и эндопротеиназ Arg-C и Glu-C, и по de novo последовательностям пептидов, определенным с помощью тандемной масс-спектрометрии (МС/МС). Выделенные из яда токсины помимо токсичности на насекомых обладали цитолитическим действием на клетки грам(+) и грам(-) бактерий, поэтому за ними было закреплено окончательное название цито-инсектотоксины (CIT). Поскольку цито-инсектотоксины обладали паралитическим действием, можно предположить, что основной их мишенью являются мембраны нейронов и/или мышечных клеток насекомых.
Для тестирования на млекопитающих использовали только один синтезированный твердофазным методом полипептид CIT 1a, который вводили мышам внутрибрюшино. При дозе в 5 мг/кг веса исследуемый полипептид не проявлял признаков парализации или других проявлений острой токсичности. Наблюдали только мелкие конвульсии и признаки недержания мочи и кала, эти же симптомы без летального эффекта вызывало введение других веществ с мембранолитическими свойствами. Из экспериментов следует, что, возможно, все новые токсины этого семейства обладают большей специфичностью к насекомым, чем к млекопитающим.
Всего три непохожих семейства было обнаружено при проведении целенаправленного поиска инсектотоксинов в ядах двух видов пауков S. florentina и L. tarabaevi, которые в общей сложности содержат 31 последовательность новых токсинов.
- Поиск полипептидов с антимикробными свойствами
Во второй тест-системе с помощью которой проводили целенаправленный поиск активных компонентов в ядах изучался бактериостатический эффект. Для более широкого охвата изучали эффекты природных ядов, фракций и отдельных компонентов на несколько различных культурах грам(+) и грам(-) микроорганизмов, но первоначальное тестирование проводили на одном лабораторном штамме E. coli DH5. Среди протестированных ядов лидером снова оказался яд паука L. tarabaevi. При анализе хроматографического профиля образца природного яда, разделенного на обращено-фазной колонке, искомая антимикробная активность присутствовала в половине собранных фракций (см. Рисунок 16).
Рисунок 16 Разделение природного яда паука L.аtarabaevi ВЭЖХ на обращено-фазной колонке Vydac C18 (4.6 250 мм, 218TP54) в 0.1% ТФУ, в градиенте концентрации ацетонитрила 0-60% за 90 мин, скорость элюции 0.7 мл/мин. Активные фракции с антимикробной активностью в отношении E.аcoli выделены прямоугольником.
Среди компонентов активных мембранолитических фракций, были найдены представители группы цито-инсектотоксинов - 8 из 16, представленных в банке EST. Помимо них была обнаружена группа различных по аминокислотному составу гидрофобных пептидов, с большим временем удерживания на колонке и небольшой молекулярной массой 2-4 кДа. Полная аминокислотная последовательность 9 пептидов была установлена с помощью автоматического N-концевого секвенирования по методу Эдмана в комбинации с de novo определением структуры МС/МС. Вся группа этих новых полипептидов была названа латарцинами, а отдельные представители получили название: Ltcа1, Ltcа2a, Ltcа3a, Ltcа3b, Ltcа4a, Ltcа4b, Ltcа5, Ltcа6a и Ltcа7. Все выделенные из природного яда латарцины были найдены в банке данных EST в виде белков предшественников.
Для проведения развернутого биологического тестирования использовали химически синтезированные токсины, для которых были определены минимальные ингибирующие концентрации (МИК) пептидов, вызывающие полное ингибирование роста разных микроорганизмов in vitro, а также концентрации, вызывающих 50% лизис эритроцитов (ЭК50) (см. Таблица 5).
Таблица 5 Результаты биологических испытаний линейных полипептидов из яда паука L.аtarabaevi
Антимикробная активность; МИК, мкМ | Гемолитическая активность на эритроциты человека; ЭК50, мкМ | ||||
пептид | Грамположительные бактерии | Грамотрицательные бактерии | |||
Bacillus subtilis B-501 | Staphylococcus aureus 209-P | Escherichia coli DH5 | Pseudomonas aeruginosa PAO1 | ||
Ltcа1 | 1 | 16 | 1 | 4.1 | 28 |
Ltcа2a | 0.4 | 2 | 0.5 | 6.7 | 8 |
Ltcа3a | 1.2 | 16 | 2.5 | >40 | >50 |
Ltc 3b | 2.9 | 16 | 23 | >45 | >50 |
Ltcа4a | 1.1 | 8 | 4.5 | >35 | >50 |
Ltc 4b | 1.1 | 16 | 4.4 | >35 | >50 |
Ltcа5 | 0.6 | 1.1 | 0.6 | 18 | 12 |
Ltc 6a | >70 | >40 | >70 | >70 | >50 |
Ltc 7 | >70 | >40 | >70 | >70 | >50 |
CITа1a | 1 | >16 | 1 | 2 | 6 |
мелитин | 1 | 2 | 8 | >16 | 4 |
Большинство протестированных пептидов обладали высокой антибактериальной активностью, сопоставимой с наиболее эффективными мембранолитическими соединениями, например, мелитином - основным компонентом яда медоносной пчелы Apis mellifera.
Итогом изучения компонентов яда паука L.аtarabaevi с использованием традиционного подхода, основанного на измерении функциональной активности в тестах на антимикробную активность и на токсичность к насекомым, стало обнаружение 17 индивидуальных компонентов.
- Поиск селективных модуляторов TRPV1 рецептора
- Актуальность проблемы поиска модуляторов TRPV1 и первичное тестирование ядов
Третьей тест-системой, использованной для поиска функционально активных компонентов природных ядов, было электрофизиологическое исследование модуляторов ионотропоного рецептора TRPV1, активируемого капсаицином и теплом. TRPV1 выполняет чувствительно-эффекторные функции в периферической нервной системе, где он осуществляет функцию восприятия термических, химических и механических стимулов. Известно, что в ряде патологических состояний TRPV1 играет важную роль. Например, при болях воспалительного характера, раке, нейропатических и висцеральных болях, а также при воспалительных заболеваниях кишечника, интерстициальном цистите, недержании мочи, заболеваниях дыхательных путей, панкреатитах и мигренях.
Низкомолекулярные соединения такие как арванил или капсаицин, могут активировать TRPV1. Сходным действием обладают также и три полипептидных агониста из яда тарантула Psalmopoeus cambridgei. Так как для эффективного подавления боли желательно не активировать, а ингибировать проводимость этого рецептора, наибольший интерес представляют соединения, снижающие его функциональную активность. Было показано, что аргинин-богатые пептиды и низкомолекулярные соединения на основе триалкил глицина или Ruthenium red, ингибирующие проводимость TRPV1, в экспериментах in vivo проявляют анальгетический эффект. Данные о полипептидных ингибиторах TRPV1 до момента начала исследования отсутствовали.
Биологические испытания образцов ядов пауков проводили в условиях гетерологичной (овер-) экспрессии TRPV1 каналов в ооцитах лягушки Xenopus laevis. Токи через мембрану ооцитов в ответ на аппликацию селективного агониста - капсаицина измеряли методом двухэлектродной фиксации потенциала. Среди 34 образцов ядов пауков не удалось обнаружить достойного кандидата для выделения ингибитора TRPV1 каналов. В связи с этим было проведено исследование ядов других животных. Среди 3 препаратов экстрактов морских анемон был найден один, приготовленный из морской тропической анемоны H. crispa, снижавший регистрируемый ток в электрофизиологических экспериментах.
- Выделение полипептидных компонентов из яда морской анемоны H. crispa
Морские анемоны относятся к типу кишечнополостных и не имеют специализированных желез для наработки ядовитого секрета. Токсины продуцируются стрекательными клетками, расположенными по всей поверхности организма, поэтому чистого яда из анемоны не получают. Полипептидные компоненты с искомой активностью выделяли из спиртового экстракта целых организмов.
Разделение компонентов экстракта, образующих семейства высокогомологичных полипептидов, хроматографическими методами потребовало большего количества стадий, чем при работе с ядами пауков. Вероятно, это связано с тем, что комбинаторных вариантов в морских организмах, как эволюционно более древних накоплено больше. Часть операций была выполнена непосредственно после отлова животных сотрудниками лаборатории химии пептидов Тихоокеанского института биоорганической химии ДВО РАН под руководством д.х.н. Э.П. Козловской.
На первой стадии применяли гидрофобную хроматографию. Применение сорбента Полихром-1 позволило избавиться от таких представленных в экстракте балластных соединений, как липиды, пигменты, соли и низкомолекулярные соединения, а также гемолизинов, эффективно удаляемых промывкой водным буфером. Последующий ступенчатый градиент концентрации спирта позволил получить несколько фракций, среди которых одна обладала искомой активностью. Рисунок 17 отражает все основные стадии разделения экстракта анемоны H. crispa: вышеупомянутая гидрофобная хроматография, два этапа ионообменной хроматографии на колонках Bio-Rex 70 и SP-Sephadex С-25 в буферных растворах с нейтральным значением рН и, наконец, ВЭЖХ одной из двух активных фракций на обращено-фазной колонке Jupiter C5 также в слабокислой буферной системе. После каждого этапа разделения проводили измерение влияния получаемых фракций на проводимость TRPV1.
Рисунок 17 Основные стадии хроматографического выделения анальгетических полипептидов APHC1 и APHC2 из спиртового экстракта нематоцитов морской анемоны H. crispa. На первом этапе использовали гидрофобную колонку Полихром-1 (730 см), скорость элюции 1.2 л/час, ступенчатый градиент этанола к воде; на 2аэтапе использовали ионообменную колонку Bio-Rex 70 (2.560 см), 5 мM аммоний-ацетатный буфер (pH 4.5), скорость элюции 22 мл/час, линейный градиент концентрации NaCl; на 3аэтапе использовали ионообменную колонку SP-Sephadex С-25 (2.540 см), 5 мM аммоний-ацетатный буфер (pH 4.5), скорость элюции 70 мл/час, сложный градиент создавали увеличением концентрацией NaCl и далее повышением значения pH раствора с 4.5 до 6.0; на последнем 4 этапе использовали обращено-фазную колонку Jupiter C5 (4.6x150 мм), буфер содержащий 0.1% ТФУ, скорость элюции 1 мл/мин, градиент концентрации ацетонитрила. Активные фракции на каждом этапе выделены.
Итогом многостадийного разделения стало выделение двух индивидуальных компонентов с очень близкими молекулярными массами. Полипептидные токсины получили название: APHC1 - наиболее представленный компонент с массой 6187 Да (первый элюируемый на обращено-фазном сорбенте см. Рисунок 17) и APHC2 - слабо представленный токсин с массой 6185 Да.
Определение частичной N-концевой аминокислотной последовательности обоих компонентов не выявило отличий. Были идентифицированы следующие последовательности:
GSICLEPKVVGPCTA для APHC1;
GSICLEPKVVGPCTAYFRRFYFD для APHC2.
Была использована также альтернативная методика разделения экстракта, которая включала еще большее количество основных стадий фракционирования. После 1 этапа на Полихроме, применяли гель-фильтрационную и ионообменную хроматографию (см. Рисунок 18). Дальнейшие этапы разделения состояли из ВЭЖХ, где последовательно использовали обращено-фазные колонки с тремя различными фазами.
Рисунок 18 Основные стадии хроматографического выделения анальгетического полипептида APHC3 из спиртового экстракта нематоцитов морской анемоны H. crispa. На первом этапе использовали гидрофобную колонку Полихром-1 (730 см), скорость элюции 1.2 л/час, ступенчатый градиент спирта в воде; на 2 этапе использовали гель-фильтрационную колонку Biogel Р-4 (1.4×96 см), уравновешенную водой, скорость элюции 0.25 мл/мин; на 3 этапе использовали ионообменную колонку SP-Sephadex С-25 (2.550 см), 100 мM аммоний-ацетатный буфер (pH 4.5), скорость элюции 0.6 мл/мин, градиент рН рабочего буфера от 4.5 до 6.5; на 4 этапе использовали обращено-фазную колонку Delta-Pak C18-300 (4.6х250 мм), скорость элюции 2 мл/мин, 10 мМ аммоний-ацетатный буфер (рН 7.2), линейный градиент концентрации ацетонитрила 0-50% за 15 мин; на 5 этапе использовали обращено-фазную модифицированную колонку RP-amide (2х100 мм), скорость элюции 0.3 мл/мин, 10 мМ аммоний-ацетатный буфер (рН 7.2), линейный градиент концентрации ацетонитрила 17.5-54% за 70 мин; на 6 этапе использовали обращено-фазную колонку Luna C18 (2х150 мм), скорость элюции 0.15 мл/мин в буфере, содержащем 0.1% ТФУ, линейный градиент концентрации ацетонитрила 0-70% за 70 мин. Активные фракции выделены на каждом этапе.
В результате был выделен еще один активный компонент, названный APHC3, с молекулярной массой 6111 Да. Определение частичной N-концевой аминокислотной последовательности его первых 32 аминокислотных остатков подтвердило высокий уровень гомологии к ранее полученным APHC1 и APHC2:
gsiclePKVVGPCTAYFpRFYFNSETGKCTPF.
Для определения полных аминокислотных последовательностей токсинов были получены кДНК из образцов тканей и проанализированы нуклеотидные последовательности, получаемые ПЦР на специфические праймеры к N-концевым фрагментам токсинов. В результате секвенирования выборочных клонов было обнаружено множество гомологичных структур с точечными мутациями. Для оценки количества возможных вариантов токсинов были определены суммарные нуклеотидные последовательности ПЦР фрагментов, полученных при амплификации, как кДНК, так и геномной ДНК. Было обнаружено 20 положений, в которых наблюдаются точечные замены аминокислотных остатков, дающие более миллиона возможных вариантов структур (см. Рисунок 19). Так как наборы данных, полученных при анализе, как кДНК, так и геномной ДНК совпадали, можно сделать вывод о том, что в геноме H.аcrispa содержится множество гомологичных генов, появившихся, скорее всего, в результате дупликации.
Рисунок 19 Вариабельность полипептидов структурного семейства BPTI/Кунитц типа из морской анемоны H. crispa.
Полноразмерные структуры всех найденных токсинов были отобраны из последовательностей реальных клонов по молекулярным массам кодируемых продуктов. После чего подтверждали правильность выведенных структур пептидным картированием полипептидов экстракта и МС/МС анализом полученных триптических пептидов.
Рисунок 20 Выравнивание аминокислотных последовательностей анальгетических пептидов, выделенных из морской анемоны H. crispa, построенное по результатам поиска гомологии BLAST с ингибиторами протеаз: SHPI-1 (P31713) из анемоны Stichodactyla helianthus, BPTI (P00974) из поджелудочной железы быка; блокаторами К+ каналов - каликлюдином 1 (Q9TWG0) из анемоны A. viridis, дендротоксином альфа (P00980) и дендротоксином-К (P00981) из яда змей; блокатором Са++ каналов кальциклюдином (P81658) из яда змей.
АРНС1-3 имеют характерный мотив первичный структуры BPTI/Кунитц, впервые описанный для ингибитора сериновых протеаз из поджелудочной железы быка BPTI. Белок предшественник состоит только из сигнального пептида, содержащего 22 аминокислотных остатка, и зрелой цепи. Наиболее представленный в экстракте анемоны полипептид APHC1 отличается только одной аминокислотной заменой в 31 положении (VP) от второго активного полипептида APHC2. APHC3 отличается от первого полипептида четырьмя заменами (см. Рисунок 20). Наиболее значительное сходство выделенных токсинов обнаружено с 3 известными ингибиторами протеаз морских анемон: ингибитор IV (87% гомологии) из H.crispa, SHPI-1 (83% гомологии) и SHPI-2 (81% гомологии) из Stichodactyla helianthus, гомология наблюдалась также с некоторыми полипептидными токсинами (см. Рисунок 20).
- Биологическая активность новых токсинов анемон
Рекомбинантные аналоги всех трех токсинов были получены в достаточном количестве для проведения биологических испытаний. Несмотря на высокий уровень гомологии первичных структур, все они отличались по проявляемой активности. Самым слабым ингибитором TRPV1 оказался АРНС2, он обладал слабо детектируемой (10-15%) ингибирующей активностью на токи, вызываемые капсаицином, в концентрациях от 100нМ до 3мкМ. АРНС3 обладал ингибирующей активностью ~30% и наиболее активный АРНС1 ингибировал токи не более чем на 50%.
Построенная концентрационная зависимость действия APHC1 показала, что действие пептида даже в насыщающих концентрациях не вызывает полной блокады TRPV1 каналов. Скорость восстановления ответа после отмывки пептида была высокой, а его воздействие на рецептор было полностью обратимым (см. Рисунок 21). Расчетная величина половинного ингибирования индуцированных токов - EС50, составила 544 нМ, при расчетном значении коэффициента Хилла 2.120.19.
Рисунок 21 Действие APHC1 на капсаицин-индуцируемые каналы TRPV1. (А) Ц записи проводимости каналов после добавления 2 мкМ капсаицина (Caps) и 2 мкМ капсаицина совместно с рекомбинантным АРНС1 (конечная концентрация 300анМ). (Б) - кривая зависимости доза - ответ, построенная как отношение тока после совместной аппликации APHC1 c капсаицином к уровню тока возбуждения контрольного эксперимента.
Исследуемые полипептиды не оказывали никакого влияния на мембранный потенциал ооцитов. Совместная аппликация капсаицина и BPTI в концентрациях от 100 нМ до 3 мкМ не выявила никакого влияния ингибиторов протеаз на токи, индуцированные капсаицином через TRPV1. Таким образом, можно сделать вывод, что АРНС полипептиды напрямую взаимодействуют с TRPV1 и является модуляторами его активности.
Функция ингибирования протеолитических ферментов у выделенных токсинов сохранилась. В экспериментах по ингибированию трипсина и химотрипсина их активность была сравнена с двумя классическими ингибиторами протеаз (см. данные в Таблица 6). Как видно из значений констант ингибирования, активность была очень слабой.
Таблица 6 Константы ингибирования сериновых протеаз.
полипептид | Ki трипсин | Ki химотрипсин |
АРНС1 | 1.0*10-6 | 5.0*10-6 |
АРНС2 | 0.9*10-6 | 4.5*10-6 |
АРНС3 | 5.0*10-7 | 7.0*10-6 |
BPTI | 6.0*10-14 | 1.8* 10-13 |
SHPI-1 | 1.0*10-10 | 2.3*10-9 |
Анальгетическая активность токсинов анемоны была изучена в экспериментах in vivo. Пептидные модуляторы, несмотря на неполное блокирование проводимости рецептора TRPV1, достоверно снижали болевую чувствительность у мышей. Введение рекомбинантных АРНС1-3 внутривенно не приводило к каким-либо токсическим эффектам в дозах до 1 мг/кг и не влияло на нормальное поведение животных.
В моделях тепловой стимуляции боли использовали тест горячей пластины, основанном на активации TRPV1 и, возможно, некоторых других рецепторов. На Рисунок 22 приведены данные сравнения активности трех анальгетических пептидов анемоны и ингибитора трипсина быка BPTI при введении полипептидов в дозе 0.1 мг/кг веса. Наибольшим анальгетическим потенциалом обладал АРНС3, его активность в этом тесте незначительно превосходила активность АРНС1. АРНС2 был наименее активен, однако действие его как анальгетика было статистически достоверно. Ингибитор сериновых протеаз BPTI, использованный как контроль, не проявлял анальгетической активности.
Рисунок 22 Влияние АРНС1, АРНС2, АРНС3 и BPTI на время задержки облизывания задних лап при внутривенном введении в тесте горячей пластины (T=55оC). Достоверность отличий от контроля определяли анализом вариабильности ANOVA и тестом Тьюки. Статистически достоверные различия (Р<0.05) отмечены *, для каждого соединения приведены значения среднеквадратичных отклонений.
Анализ минимальной действующей дозы полипептида АРНС1 подтвердил большой анальгетический потенциал нового полипептида, который вызывал достоверно значимое увеличение латентного времени облизывания задних лап даже в дозе 0.01 мг/кг. Следует отметить, что доза морфина необходимая для достижения аналогичного эффекта в тестах отдергивания хвоста и нагретой пластины составляет около 3 мг/кг при терапевтической дозе морфина для человека 0.3 мг/кг.
В результате выполнения этого этапа работы из яда морской анемоны H. crispa были получены и охарактеризованы три новых токсина - первые ингибиторы TRPV1 рецептора полипептидной природы. Два из них обладают большим терапевтическим потенциалом для практического внедрения в медицину в качестве анальгетиков нового поколения, обладающих специфичным действием на молекулярном уровне.
- Выводы
- Предложена новая стратегия анализа структурного разнообразия полипептидных компонентов яда животного происхождения на основе обработки баз данных EST фрагментов и идентификации зрелых форм компонентов природных ядов. При использовании данной стратегии в 3 изученных банках EST обнаружено 232 полипептидные последовательности, из которых только 8 были известны ранее; достоверность предсказанных посттрансляционных модификаций подтверждена при протеомном анализе нескольких ядов.
- С помощью метода формализации белковых последовательностей для цистеинсодержащих полипептидов обнаружено два характерных мотива первичной структуры токсинов пауков и 13 мотивов токсинов морских анемон.
- Проведен протеомный анализ ядов индивидуальных пауков и найдены их различия на уровне отдельной особи. Продемонстрировано присутствие постоянных и УмобильныхФ компонентов яда пауков и доказана необходимость комбинации геномных и протеомных технологий для полной характеристики компонентного состава яда.
- На основе функциональной протеомики обнаружен и структурно охарактеризован 31 новый инсектотоксин из ядов двух видов пауков S. florentina и L.аtarabaevi.
- При изучении антимикробных полипептидных компонентов яда паука L.аtarabaevi найдено 17 новых пептидов и открыт новый функциональный класс - цитоинсектотоксины.
- Впервые обнаружены полипептиды, способные ингибировать функциональную активность ванилоидных рецепторов TRPV1. Показано, что эти пептиды обладают выраженным анальгетическим действием и могут служить основой для создания новых анальгетиков.
- Список работ, опубликованных по теме диссертации
- Научные статьи:
- Lipkin А., Kozlov S., Nosyreva E., Blake A., Windass J.D., Grishin E. 2002 Novel insecticidal toxins from the venom of the spider Segestria florentina. Toxicon, 40, 125-130.
- Kozlov S., Malyavka A., McCutchen B., Lu A., Schepers E., Herrmann R., Grishin E. 2005 A novel strategy for the identification of toxinlike structures in spider venom. Proteins, 59, 131-140.
- Kozlov S., Grishin E. 2005>
- Kozlov S.A., Vassilevski A.A., Feofanov A.V., Surovoy A.Y., Karpunin D.V., Grishin E.V. 2006 Latarcins, antimicrobial and cytolytic peptides from the venom of the spider Lachesana tarabaevi (Zodariidae) that exemplify biomolecular diversity. J Biol Chem., 281, 20983-20992.
- А.А. Василевский, С.А. Козлов, М.Н. Жмак, И.А. Куделина, П.В. Дубовский, О.Я. Шатурский, А.С. Арсеньев, Е.В. Гришин 2007 Исследование синтетических аналогов антимикробных пептидов из яда среднеазиатского паука Lachesana tarabaevi Биоорганическая химия, 33, 405-412.
- S.A. Kozlov, E.V. Grishin 2007 The universal algorithm of maturation for secretory and excretory protein precursors. Toxicon, 49, 721-726.
- Vassilevski A.A., Kozlov S.A., Samsonova O.V., Egorova N.S., Karpunin D.V., Pluzhnikov K.A., Feofanov A.V., Grishin E.V. 2008 Cyto-insectotoxins, a novel>
- Andreev Ya.A., Kozlov S.A., Koshelev S.G., Ivanova E.A., Monastyrnaya M.M., Kozlovskaya E.P., Grishin E.V. 2008 Analgesic compound from sea anemone Heteractis crispa is the first polypeptide inhibitor of trpv1 receptor. J Biol Chem., 283, 23914-23921.
- Yu.M. Shlyapnikov, Ya.A. Andreev, S.A. Kozlov, A.A. Vassilevski, E.V. Grishin 2008 Bacterial production of latarcin 2a, a potent antimicrobial peptide from spider venom. Protein Expr Purif., 60, 89-95.
- Я.А.Андреев, С.А.Козлов, Э.П.Козловская, Е.В. Гришин 2009 Анальгетическое действие пептидного ингибитора TRPV1 рецептора в моделях тепловой стимуляции боли. Доклады Академии наук. Биохимия, биофизика, молекулярная биология, 424, 688Ц691.
- С.А. Козлов, Я.А. Андреев, А.Н. Мурашев, Д.И. Скобцов, И.А. Дьяченко, Е.В. Гришин 2009 Новые полипептидные компоненты с анальгетической активностью из морской анемоны Heteractis crispa. Биоорганическая химия, 35, 789-798.
- Ю.М. Шляпников, С.А. Козлов, А.А. Федоров, Е.В. Гришин 2010 Сравнение полипептидного состава яда индивидуальных пауков Agelena orientalis Биоорганическая химия, 36, 88-95.
- Andreev YA, Kozlov SA, Vassilevski AA, Grishin EV. Cyanogen bromide cleavage of proteins in salt and buffer solutions. Anal Biochem. 2010 407: 144-146.
- Осмаков Д.И., Андреев Я.А., Козлов С.А. Получение рекомбинантных биологически активных полипептидов морских анемон. Вестник Московского государственного областного университета. Серия: Естественные науки №3 стр 7-11.
- Обзорные статьи:
- S.A. Kozlov 2007 Polypeptide toxins from animal venoms. Recent Pat DNA Gene Seq., 1, 200-206.
- A.A. Vassilevski, S.A. Kozlov, E.V. Grishin 2008 Antimicrobial peptide precursor structures suggest effective production strategies. Recent Pat Inflamm Allergy Drug Discov., 2, 58-63.
- А.А. Василевский, С.А. Козлов, Е.В. Гришин 2009 Молекулярное разнообразие яда пауков. Успехи биологической химии, 49, 211-274.
- Публикации в научных сборниках:
- Kozlov S.A., Vassilevski A.A., Grishin E.V. УPeptidomics of short linear cytolytic peptides from spider venomФ in Peptidodomics Methods and Applications 2007, pp 55-70, Edited by M. Soloviev, C. Shaw, and P. Andren, Wiley-Interscience, USA.
- Kozlov SA, Vassilevski AA, Grishin EV. УSecreted protein and peptide biosynthesis: precursor structures and processing mechanismsФ In book УProtein biosynthesisФ 2009, pp. 225-248. Edited by Toma E. Esterhouse and Lado B. Petrinos, Nova Science Publishers, Inc. USA
- Vassilevski AA, Kozlov SA, Egorov TA, Grishin EV. Purification and characterization of biologically active peptides from spider venoms. Methods Mol Biol. 2010; 615:87-100.
- Патенты:
- Blake,A.N., Windass,J.D., Lipkin,A.V., Nosyreva,E.D., Grishin,E.V., Koslov,S.A. Insecticidal compounds. Patent. WO 9949035, 30 September 1999.
- Козлов С.А., Василевский А.А., Феофанов А.В., Арсеньев А.С., Гришин Е.В. УПептиды латарцины, проявляющие антимикробную активностьФ Патент РФ №2302425 от 10.07.07.
- Козлов С.А., Василевский А.А., Феофанов А.В., Суровой А.Ю., Арсеньев А.С., Гришин Е.В. УПептиды латарцины, проявляющие антимикробную активностьФ Патент РФ №2302466 от 10.07.07.
- Козлов С.А., Василевский А.А., Феофанов А.В., Суровой А.Ю., Арсеньев А.С., Гришин Е.В. УПептиды латарцины, проявляющие антимикробную активностьФ Патент РФ №2302467 от 10.07.07.
- Козлов С.А., Василевский А.А., Воронцова О.В., Полянский А.А., Волынский П.Е., Феофанов А.В., Ефремов Р.Г., Арсеньев А.С., Гришин Е.В. УПептиды латарцины, проявляющие антимикробную активностьФ Патент РФ №2306148 от 20.09.07.
- Полянский А.А., Волынский П.Е., Василевский А.А., Воронцова О.В., Козлов С.А., Феофанов А.В., Арсеньев А.С., Гришин Е.В., Ефремов Р.Г. УСпособ получения антимикробных пептидов с пониженной гемолитической активностьюФ Патент РФ №2316336 от 10.02.08.
- Козлов С.А., Василевский А.А., Самсонова О.В., Полянский А.А., Волынский П.Е., Феофанов А. В., Ефремов Р.Г., Арсеньев А. С., Гришин Е. В. УПептиды латарцины, проявляющие антимикробную активностьФ Патент РФ №2319745 от 20.03.08.
- Козлов С.А., Андреев Я.А., Кошелев С.Г., Иванова Е.А., Лейченко Е.В., Козловская Э.П., Гришин Е.В. УПолипептид актинии, обладающий анальгетическим действиемФ Патент РФ № 2368621 от 27.09.09.