Регистрация / Вход
Прислать материал

14.584.21.0017

Аннотация скачать
Постер скачать
Общие сведения
Номер
14.584.21.0017
Тематическое направление
Науки о жизни
Исполнитель проекта
федеральное государственное автономное образовательное учреждение высшего образования "Дальневосточный федеральный университет"
Название доклада
Проведение совместных исследований по моделированию структуры, динамики и свойств протеинов в рамках калибровочной теории поля на решетке совместно с Пекинским технологическим институтом
Докладчик
Молочков Александр
Тезисы доклада
Цели и задачи исследования
Целью исследования является развитие перспективных технологий в фармакологии, медицине и материаловедении, основанных на новых методах анализа и классификации третичной и четвертичной структуры протеинов, а также на новых знаниях о связи биологической функции и физических свойств белка с его крупномасштабной структурой.
Для достижения поставленной цели последовательно были решены три основные задачи:
1) Разработать подход к моделированию структуры, основанный на фундаментальных принципах симметрии и использующий методы непертурбативной теории поля. Основой для данного подхода является солитонная модель белка, разработанная участниками проекта.
2) На основе разработанного подхода создать комплекс программ для автоматизированного моделирования, анализа и систематизации структуры белков. Новое вычислительное ядро проверено на примере белков, которые в рамках Абелевой модели Хиггса успешно описаны с экспериментальной точностью в предыдущих работах иностранного партнера, такие, например, как миоглобин. Интерфейсные модули и дизайн комплекса программ созданы с возможностью как открытого, так и коммерческого применения.
3) С помощью созданного комплекса программ провести анализ топологических особенностей третичной и четвертичной структуры ряда хорошо изученных белков и их связи с биологическими и физическими свойствами. Вычислить параметры топологического базиса для последующей классификации протеинов. Для решения этой задачи разработанный комплекс программ был применен к широкомасштабному анализу базы данных протеинов с целью вычисления параметров базисного набора топологических структур, позволяющих полно и точно параметризовать третичную структуру белка.
Актуальность и новизна исследования
В настоящее время наблюдается революционное развитие экспериментальной техники источников жесткого гамма-излучения. Сейчас применяются синхротронные источники третьего поколения, такие как ESFR и PETRA, источниками следующего поколения являются такие установки как European X-ray Free Electron Laser, обеспечивающие высокоточные исследования структуры протеинов. Однако данные исследования затруднены в силу необходимости кристаллизации белков. Существуют значительные различия в молекулярной структуре различных протеинов и получаемые кристаллы чрезвычайно хрупки. Кроме того, кристаллизация белков в большинстве случаев невозможна. Это приводит к тому, что число изученных структур протеинов на три порядка меньше, чем число известных протеиновых последовательностей. В дополнение к этому, изучение протеин-протеиновых взаимодействий, поиск причин заболеваний в неправильном фолдинге протеинов, а также исследования конформационных изменений белковых субъединиц рецетпоров при воздействии среды требует гораздо более высокой точности и не может быть решена на кристаллизованных белках. Таким образом, особую актуальность приобретает численное моделирование третичной и четвертичной структуры белка и ее динамики во внешних полях в терминах коллективных степеней свободы, полученных из первых принципов.
Для решения этой задачи необходимо применять подходы теории поля, которая позволяет естественным образом вводить коллективные степени свободы и нелинейные топологические структуры исходя из фундаментальных принципов калибровочной симметрии. Новизна предлагаемого в данном проекте подхода заключается в применении аппарата калибровочной теории поля к исследованию сложных белковых структур.
Описание исследования

В рамках развиваемого подхода протеины рассматриваются как дискретное одномерное однообразие, на котором определен функционал свободной энергии. Используя координаты Френе для данное многообразие может быть с точностью до калибровочного преобразовaния Z_2 отображено на пространство, определенное исключительно через углы кривизны и кручения. Такая геометрическая структура накладывает достаточно жесткие ограничения на топологию многообразия, которые определяют функциональную форму выражения для свободной энергии, так что в лидирующем порядке она может быть определена однозначно. 
Важным свойством этого выражения является то, что оно не содержит явной информации о конкретном выборе системы координат на ортогональной плоскости, соответственно свободная энергия не зависит от ориентации ортогональных плоскостей. 
При вращениях локальной системы координат дублет из динамических переменных преобразуется точно как двумерный Абелевый мультиплет Хиггса. Поскольку любая энергетическая функция, описывающая цепь только в терминах углов кривизны и кручения, должна оставаться неизменной при вращениях локальных систем координат, в лидирующем порядке свободная энергия протеинов должна включать Гамильтониан Абелевой модели Хиггса.  В унитарной калибровке свободная энергия зависит от четырех параметров, которые определяются конкретной последовательностью аминокислот в белке. Полученная свободная энергия позволяет вывести уравнение движения, имеющее солитонные решения, которые могут быть использованы в качестве базиса для построения третичной и четвертичной структуры протеинов. Прямое решение таких уравнений, как и вычисление минимума свободной энергии сильно затруднено. Одним из выходов является вычисление параметров функции свободной энергии отвечающим экспериментально наблюдаемой структуре белка. Такой подход позволяет с точностью более 1А параметризовать трехмерную структуру главной цепи белка. При этом число параметров на несколько порядков меньше чем в при использовании молекулярной динамики. Например, структура миоглобина описывается менее чем сотней параметров. Однако, такой подход позволяет только параметризовать структуру кристаллизованных белков, изученную в экспериментах с хорошей точностью. Для моделирования структуры некристаллизованных белков, а также ее изменений во внешней среде и полях необходимо применение подхода, позволяющего получить параметры свободной энергии протеина путем прямых вычислений.      
 С точки зрения теоретико-полевого формализма, рассмотренная выше модель структуры белка полностью аналогична вакууму калибровочной теории поля U(1) с нарушенной симметрией в двухмерном пространстве-времени размерности. Это обстоятельство позволяет применить аппарат калибровочной теории поля на решетке для поиска решений, отвечающих минимуму свободной энергии. Полученный алгоритм был использован для подготовки вычислительного ядра программного комплекса для массированного анализа и параметризации структуры белков в терминах солитонных конфигураций.     
Поскольку свободная энергия такой решетки может иметь большое количество локальных минимумов, для эффективного поиска глобального минимума свободной энергии необходимо применение быстро сходящегося алгоритма Монте-Карло в сочетании с алгоритмом имитации отжига. В рамках данного проекта применяются следующие Монте-Карло алгоритмы симуляции полимерной цепочки: 1) Метрополис; 2) тепловая баня; 3) смешанный алгоритм, где углы кривизны генерируются с помощью тепловой бани, а углы кручения - с помощью Метрополиса. Последний из алгоритмов позволяет осуществлять "тонкую настройку" Монте-Карловского процесса. Новое вычислительное ядро было проверено на примере белков, которые в рамках Абелевой модели Хиггса успешно описаны с экспериментальной точностью в предыдущих работах иностранного партнера, такие, например, как миоглобин. 

Разработанный комплекс программ был применен к широкомасштабному анализу базы данных протеинов с целью вычисления параметров базисного набора топологических структур, позволяющих полно и точно параметризовать третичную и четвертичную структуру белка. Также был проведен анализ протеинов обладающих сходными биологическими функциями или физическими свойствами с целью выявления топологических структур, отвечающих за данные свойства. Это позволило создать основу для их дальнейшей классификации по солитонным конфигурациям. 

Результаты исследования

1) Разработан новый подход к моделированию третичной и четвертичной структуры белка в терминах топологических степеней свободы, основанный на методах калибровочной теории поля на решетке. 2) Получен алгоритм определения параметров солитонной конфигурации для произвольного белка или белковых комплексов, минимизирующей свободную энергию и воспроизводящей экспериментально наблюдаемую третичную и четвертичную структуру известных белков. 3) Создан комплекс программ для моделирования топологической структуры белка и классификации белков согласно топологическму базису. Интерфейсные модули и дизайн комплекса программ будет создаваться с возможностью как открытого, так и коммерческого применения.

В настоящее время наиболее амбициозные вычислительные подходы к моделированию структуры протеинов основаны на классической молекулярной динамике (МД). Имея твердую концептуальную основу в рамках классической физики, молекулярная динамика является очень мощным методом моделирования фолдинга белков из первых принципов. Однако, такие вычисления очень требовательны к вычислительным ресурсам, особенно когда атомы воды (растворителя) также учитываются явным образом. Применение суперкомпьютеров, таких как Anton, и распределенных вычислительных проектов, таких как folding@home (http://folding.stanford.edu), позволяет описать процессы сворачивания белков только в случае коротких и быстро скручивающихся белков  ( villin headpiece (HP35)) на масштабе отрезков времени несколько миллисекунд. Однако, поскольку большинство протеинов, и тем более их комплексы, намного длиннее, а динамические процессы с ними протекают на гораздо больших временных отрезках, для реалистичного описания структур на больших пространственно-временным масштабах требуется вычислительная мощность на 5-6 порядков величины больше технически достижимой в настоящее время. Предлагаемый в данном проекте подход позволяет проводить численное моделирование структуры белка и ее динамики во внешних полях в терминах коллективных степеней свободы, полученных из первых принципов. Это позволяет моделировать протеины, протеин-протеиновые комплексы произвольной длины на больших временных отрезках.  

4) Создана онлайн библиотека солитонных структур для классификации белков.

В рамках данного проекта и в качестве дальнейшей перспективы мы планируем развивать открытую онлайн библиотеку солитонной классификации белков. Такая библиотека обеспечит систематическую основу для идентификации фрагментов, определяющих структуру белка. Данная классификация белков, основывается на предположении, что длинные белковые петли и, в частных случаях, целые белки могут быть построены путем объединения вместе несколько солитонов, как модульных блоков. В работе наших зарубежных партнеров (A. Krokhotin, A.J. Niemi, X. Peng, Phys. Rev. E85 031906 (2012))  было показано, что более 92% из конфигураций PDB с разрешением 2,0 А или лучше может быть построена в терминах 200 явных солитонных профилей, при воспроизведении главной белковой цепи с радиусом среднеквадратичного отклонения 0,65 А. Такой результат качественно соответствует таким структурным схемами классификации как  CATH (http://www.cathdb.info/) и SCOP (http://scop.mrc-lmb.cam.ac.uk/scop/), первый из которых выявил около 1400 уникальных топологий, а второй имеет около 1300.

Практическая значимость исследования
Теоретико-полевой подход к математическому моделированию структуры белка в терминах крупномасштабных топологических структур позволяет параметризовать структуру белка в сотни раз меньшим числом параметром, чем подходы молекулярной динамики, что радикально сокращает время расчетов при моделировании. Это свойство солитонной модели белка может быть использовано для разработки высокоэффективных алгоритмов анализа структуры и динамики во внешних полях фармакологических мишеней, на основе чего могут быть разработаны новые высокоэффективные технологии компьютерного фармакологического скрининга. Кроме того, исследование связи топологических особенностей белков с их биологическими свойствами, позволит развить новые технологии поиска действующих вещества. В частности, при анализе белковых молекул, обладающих противораковым и противовирусным действием, обнаружение их топологических особенностей, отвечающих за эти свойства, позволит разрабатывать более простые по молекулярному составу синтетические аналоги, которые могут стать основой создания новых лекарств. Также, исследование изменения топологии белка при воздействии внешних полей, позволит разрабатывать новые материалы, обладающие нетривиальными квантовыми свойствами, которые могут быть использованы при разработке элементной базы для квантовых компьютеров, биосенсоров и других устройств.
Постер

14.584.21.0017.ppt