Регистрация / Вход
Прислать материал

Моделирование структуры, динамики и свойств протеинов в рамках калибровочной теории поля на решетке

Номер контракта: 14.584.21.0017

Руководитель: Молочков Александр Валентинович

Должность: профессор

Организация: федеральное государственное автономное образовательное учреждение высшего образования "Дальневосточный федеральный университет"
Организация докладчика: федеральное государственное автономное образовательное учреждение высшего профессионального образования "Дальневосточный федеральный университет"

Аннотация скачать
Постер скачать
Ключевые слова:
абелева модель хиггса, топологический солитон, спонтанное нарушение калибровочной симметрии, молекулярная биофизика, нелинейные уравнения, фолдинг протеинов, теория поля на решетке, метод монте-карло, солитоны, топология, фреймы френе

Цель проекта:
Биологические свойства белка критически зависит от его трехмерной формы, которая термодинамически определяется свободной энергией. Кроме физических свойств и взаимодействия между отдельными атомами в аминокислотах, свободная энергия также зависит от факторов окружающей среды, таких как уровень pH, температура и давление. На данный момент нет единого понимания как в конкретных физических условиях третичная и четвертичная структура белка может быть выведена из последовательности ДНК. Поскольку биологические функции белка тесно связаны с его формой, проблема сворачивания белка является одной из наиболее важных нерешенных проблем в науке. Целью проекта является создание теоретического подхода, который позволяет точно предсказывать топологию и динамику протеинов во внешних полях, и развитие перспективных технологий в фармакологии, медицине и материаловедении, основанных на новых методах анализа и классификации третичной и четвертичной структуры протеинов, а также на новых знаниях о связи биологической функции и физических свойств белка с его крупномасштабной структурой

Основные планируемые результаты проекта:
В результате выполнения проекта ожидается, что будут получены следующие результаты:
1. Новый подход к моделированию третичной и четвертичной структуры белка в терминах топологических степеней свободы, основанный на методах калибровочной теории поля на решетке, в рамках которого будет сформулирована солитонная модель белка в двумерном евклидовом пространстве-времени, основанная на Абелевой модели Хиггса, воспроизводящая как основные элементы вторичной структуры белка (спирали, листы и петли), так и их комбинацию в третичную и четвертичную структуры, и отражающая динамические свойства главной белковой цепи. Разработанный подход позволит осуществлять как массированный анализ большого числа молекул, так и предсказательное моделирование трехмерной структуры белка, а также биологических и физических свойств биополимеров.
2. Алгоритм определения параметров солитонной конфигурации для произвольного белка или белковых комплексов, минимизирующей свободную энергию и воспроизводящей экспериментально наблюдаемую третичную и четвертичную структуру известных белков.
3. Комплекс программ для моделирования топологической структуры белка и классификации белков согласно топологическму базису,
состоящий из программного модуля преобразования кристаллографических данных в фреймы Френе, модуля для автоматического определения солитонной конфигурации, интерфейсного программного модуля и вычислительного ядра для определения солитонных конфигураций, минимизирующих свободную энергию главной белковой цепи.
4. Создана онлайн библиотека уникальных солитонных конфигураций главной белковой цепи, отвечающих за определенные биологические функции или физические свойства белка.

Краткая характеристика создаваемой/созданной научной (научно-технической, инновационной) продукции:
В настоящее время наиболее амбициозные вычислительные подходы к моделированию структуры протеинов основаны на классической молекулярной динамике (МД). Имея твердую концептуальную основу в рамках классической физики, молекулярная динамика является очень мощным методом моделирования фолдинга белков из первых принципов. Наиболее полные модели в рамках молекулярной динамики используют точную подгонку силовых полей, как например AMBER (http://ambermd.org) и CHARMM (http://www.charmm.org), которые направлены на всестороннее описание всех известных взаимодействий между всеми атомами в моделируемых белках. При этом Ньютоновские уравнения движения интегрируются численно с временным шагом порядка фемптосекунды. Это - характерный масштаб вариаций пептидных связей, которые являются наиболее быстрым движением в макромолекулярных системах. Такие вычисления становятся очень требовательны к вычислительным ресурсам, особенно когда атомы воды (растворителя) также учитываются явным образом. Применение суперкомпьютеров, таких как Anton, и распределенных вычислительных проектов, таких как folding@home (http://folding.stanford.edu), позволяет описать процессы сворачивания белков в случае коротких и быстро скручивающихся белков ( villin headpiece (HP35)) на масштабе отрезков времени несколько миллисекунд. Однако, поскольку большинство протеинов, и тем более их комплексы, намного длиннее, а динамические процессы с ними протекают на гораздо больших временных отрезках, чем позволяют описать существующие симуляции методами молекулярной динамики, для реалистичного описания третичной и четвертичной структур на больших пространственно-временным масштабах требуется вычислительная мощность на 5-6 порядков величины больше технически достижимой в настоящее время. Таким образом, несмотря на хороший уровень концептуального понимания силовых полей на атомном уровне, проблема полного описания структуры и динамики протеинов по прежнему остается среди выдающихся нерешенных загадок в науке.
Чтобы преодолеть вычислительные проблемы и для того чтобы сделать возможным практическое моделирование свойств протеинов и их комплексов на достаточно больших временным масштабах, был разработан ряд моделей, основанных на более грубых физических предположениях. Эти модели, увеличивая скорость расчетов, систематически исключают те вклады в полные атомносиловые поля, которые предполагаются малозначимыми. Также, вместо поатомного описания применяется упрощенная геометрия. Например, силовое поле UNRES [4] дает очень детальное, но по прежнему приближенное выражение для потенциальной энергии, включающее 15 различных членов в комбинации с упрощенной геометрией. Заметный успех различных приближенных подходов позволяет поднять вопрос о том какие факторы действительно важны для описания свободной энергии. В частности, существует ли систематический метод аппроксимировать силовые поля, основываясь на первых принципах, получая при это правильную структуру протеинов? Такие схемы классификации как CATH (http://www.cathdb.info/) и SCOP (http://scop.mrc-lmb.cam.ac.uk/scop/), которые развивают таксономический подход для описания топологии протеинов, имеющихся в базе данных PDB, обнаружили, что несмотря на различия в их аминокислотных структурах, число различных форм весьма ограниченно. Такие эмпирические данные создают концептуальную основу для новых методов предсказания структуры. В рамках этих методов свернутые протеиновые структуры собраны путем комбинации фрагментов, которые получены из гомологически связанных с ними протеинов, уже описанных в PDB. Основная идея заключается в том, что поскольку число конформаций, которые могут быть у конкретной последовательности, очень ограничено, различные фрагменты, которые уже описаны в PDB, могут быть использованы как конструктор из строительных кирпичиков для создания свернутого протеина. Вся структура может быть получена связыванием этих фрагментов в трехмерные конформации, часто с помощью энергетической функции и путем сравнения с близкими по гомологии реперными структурами из PDB. Согласно общепризнанным тестам Critical Assessment for Structural Prediction (http://www.predictioncenter.org/index.cgi), в настоящее время такого типа методы имеют наибольшую предсказательную силу для конформаций белка. Однако, недостатком этих методов является отсутствие обоснованной энергетической функции, что сильно затрудняет их применение для исследования динамических аспектов, включая процессы фолдинга, и особенно природу и причины перехода к неправильному свертыванию белка.

Кроме того, все эти подходы основываются на данных экспериментальных исследований на источниках синхротронного излучения. В настоящее время наблюдается революционное развитие экспериментальной техники источников жесткого гамма-излучения. Сейчас применяются синхротронные источники третьего поколения, такие как ESFR и PETRA, источниками следующего поколения являются такие установки как European X-ray Free Electron Laser в DESY, обеспечивающие высокоточные исследования структуры протеинов. Однако данные исследования затруднены в силу необходимости кристаллизации белков. Существуют значительные различия в молекулярной структуре различных протеинов и получаемые кристаллы чрезвычайно хрупки. Кроме того, кристаллизация белков в большинстве случаев невозможна. Это приводит к тому, что число изученных структур протеинов на три порядка меньше, чем число известных протеиновых последовательностей. Как результат, разрыв между числом известных последовательностей и изученных структур остается большим. В дополнение к этому, изучение протеин-протеиновых взаимодействий, поиск причин заболеваний в неправильном фолдинге протеинов, а также исследования конформационных изменений белковых субъединиц рецетпоров при воздействии среды требует гораздо более высокой точности и не может быть решена на кристаллизованных белках. Таким образом, особую актуальность приобретает численное моделирование третичной и четвертичной структуры белка и ее динамики во внешних полях в терминах коллективных степеней свободы, полученных из первых принципов.

Для решения этой задачи необходимо применять подходы теории поля, которая позволяет естественным образом вводить коллективные степени свободы и нелинейные топологические структуры исходя из фундаментальных принципов калибровочной симметрии. Данные методы получили мощное развитие при проведении исследований в области квантовой теории поля и физики частиц. Новизна предлагаемого в данном проекте подхода заключается в применении аппарата калибровочной теории поля к исследованию сложных белковых структур. При этом описание локальной геометрии протеинов основано на формализме дискретных координат Френе, который был развит в работах участников и иностранного партнера проекта. В рамках данного формализма протеины рассматриваются как дискретное одномерное однообразие, на котором определен функционал свободной энергии. Используя координаты Френе для данное многообразие может быть с точностью до калибровочного преобразовaния Z_2 отображено на пространство, определенное исключительно через углы кривизны и кручения. Такая геометрическая структура накладывает достаточно жесткие ограничения на топологию многообразия, которые определяют функциональную форму выражения для свободной энергии, так что в лидирующем порядке она может быть определена однозначно.
Важным свойством этого выражения является то, что оно не содержит явной информации о конкретном выборе системы координат на ортогональной плоскости, соответственно свободная энергия не зависит от ориентации ортогональных плоскостей.
При вращениях локальной системы координат дублет из динамических переменных преобразуется точно как двумерный Абелевый мультиплет Хиггса. Поскольку любая энергетическая функция, описывающая цепь только в терминах углов кривизны и кручения, должна оставаться неизменной при вращениях локальных систем координат, в лидирующем порядке свободная энергия протеинов должна включать Гамильтониан Абелевой модели Хиггса (U.H. Danielsson, M. Lundgren, A.J. Niemi, Phys. Rev. E82 021910 (2010)). В унитарной калибровке свободная энергия зависит от четырех параметров, которые определяются конкретной последовательностью аминокислот в белке. Полученная свободная энергия позволяет вывести уравнение движения, имеющее солитонные решения, которые могут быть использованы в качестве базиса для построения третичной и четвертичной структуры протеинов. Прямое решение таких уравнений, как и вычисление минимума свободной энергии сильно затруднено. Одним из выходов является вычисление параметров функции свободной энергии отвечающим экспериментально наблюдаемой структуре белка. Такой подход позволяет с точностью более 1А параметризовать трехмерную структуру главной цепи белка. При этом число параметров на несколько порядков меньше чем в при использовании молекулярной динамики. Например, структура миоглобина описывается менее чем сотней параметров. Однако, такой подход позволяет только параметризовать структуру кристаллизованных белков, изученную в экспериментах с хорошей точностью. Для моделирования структуры некристаллизованных белков, а также ее изменений во внешней среде и полях необходимо применение подхода, позволяющего получить параметры свободной энергии протеина путем прямых вычислений.
Поскольку данная модель основана на лагранжиане Абелевой модели Хиггса, представляется целесообразным использовать методы непертурбативной теории поля. С точки зрения теоретико-полевого формализма, рассмотренная выше модель структуры белка полностью аналогична вакууму калибровочной теории поля SU(2) с нарушенной симметрией в двухмерном пространстве-времени размерности. Таким образом, аппарат калибровочной теории поля на решетке может быть применен для поиска решений, отвечающих минимуму свободной энергии. Численное моделирование методами теории поля на решетке позволит избежать сложностей при решении уравнений, заменяя их численными симуляциями методами Монте-Карло. В рамках данного проекта, впервые в мире данный подход будет применен к исследованию и классификации структурных особенностей белков.

Назначение и область применения, эффекты от внедрения результатов проекта:
Возможными потребителями ожидаемых результатов могут быть фармакологические компании, занимающиеся разработкой новых видов действующих веществ, а также лаборатории и корпорации, занимающиеся разработкой элементной базы квантовых компьютеров. Кроме того результаты данного исследования могут быть востребованы экспериментальными коллаборациями, занимающиеся структурным анализом белков на источниках синхротронного излучения и рентгеновских лазерах нового поколения.


Текущие результаты проекта:
1. Разработаны теоретические основы нового подхода к моделированию третичной и четвертичной структуры белка в терминах топологических степеней свободы, основанный на методах калибровочной теории поля на решетке
2. Получен алгоритм определения параметров солитонной конфигурации для произвольного белка или белковых комплексов, минимизирующей свободную энергию и воспроизводящей экспериментально наблюдаемую третичную и четвертичную структуру известных белков.