Регистрация / Вход
Прислать материал

Разработка Интернет-доступного сервиса поисковой протеомной машины для идентификации белков живых организмов.

Докладчик: Левицкий Лев Игоревич

Должность: младший научный сотрудник

Цель проекта:
Основной задачей проекта является разработка Интернет-доступного сервиса для хранения и обработки данных хромато-масс-спектрометрических измерений, полученных в рамках высокопроизводительного панорамного протеомного анализа на содержание белков в клинических биопробах, включая экстракты клеток тканей и физиологических жидкостей. В основе сервера - протеомная поисковая машина, ППМ, предназначенная для а) автоматизированной и интеллектуальной обработки массивных данных хромато-масс-спектрометрических измерений, проводимых в рамках глубокого панорамного протеомного анализа биологических проб; б) идентификации пептидов и белков в анализируемых пробах, для которых были проведены хромато-масс-спектрометрические измерения, с контролируемым пользователем уровнем достоверности; в) отчета результатов поиска в стандартизированных форматах.

Основные планируемые результаты проекта:
Для решения основной задачи проекта будут получены следующие результаты:
а) разработана протеомная поисковая машина открытого кода доступа (далее - «протеомная машина») на высокоуровневом языке с динамической типизацией, позволяющая повысить эффективность (по числу достоверно определяемых компонент анализируемой смеси белков) и чувствительность поиска (динамический диапазон достоверно определяемых компонент анализируемой смеси белков), по сравнению с существующими коммерческими решениями;
б) интегрированы в едином программно-аналитическом комплексе основные составляющие систем обработки и анализа хромато-масс-спектрометрических протеомных данных:
- первичная обработка экспериментальных данных, представленных в стандартизированных форматах;
- поиск по геномным базам данных и идентификация белков;
- подтверждение (валидация) полученных идентификаций;
- количественный анализ полученных идентификаций белков.
В ходе реализации проекта будут разработаны новые принципы обработки данных масс-спектрометрических измерений, поиск последовательностей белковых кандидатов, ранжирование полученных хитов и их подтверждение с использованием всей совокупности получаемой экспериментальной информации.

Назначение и область применения, эффекты от внедрения результатов проекта:
Предлагаемый к созданию Интернет-доступный сервис на основе протеомной поисковой машины, предназначен для определения белкового состава биообразцов и интерпретации результатов масс-спектрометрических измерений в следующих областях:
1. лабораторной диагностики: количественное масс-спектрометрическое выявление белковых маркеров социально значимых заболеваний, которые могут быть использованы для ранней диагностики и мониторинга патологии, а также анализа эффективности фармакологического воздействия;
2. биомедицинских исследований в области протеомики и постгеномных технологий: разработка методов глубокого панорамного (в широком диапазоне молекулярных масс и концентраций) анализа белкового состав билогических проб и количественного измерения содержания целевых белков.
3. развитие методов персонализированной медицины: выявление протеомных маркеров, включая как индивидуальные белки, так и белковые «сигнатуры», заболеваний человека, а также проявлений экспрессии генов (и/или мутаций генов) на протеомном уровне.

Текущие результаты проекта:
В результате реализации первого этапа проекта в 2014 г. были получены следующие основные результаты:

1. В рамках работ по созданию программного обеспечения для протеомной поисковой машины нового поколения была разработана модульная библиотека парсеров и функций MSMS_pySearchLib на языке программирования открытого кода с динамической типизацией Питон (Python), а также локализованная техническая документация к ней. Библиотека подпрограмм и функций MSMS_pySearchLib предназначена для разработчиков прикладного программного обеспечения, используемого в протеомных исследованиях для обработки результатов хромато-масс-спектрометрических измерений, поиска пептидных идентификаций в пробах на основе протеомных баз данных, обработки результатов поиска и их представления в стандартизованных форматах. Целевым прикладным программным обеспечением библиотеки MSMS_pySearchLib являются протеомные поисковые машины (ППМ), которые используются для идентификации белков либо методом пептидных отпечатков на основе масс-спектров первого уровня, либо на основе сравнения теоретических и экспериментальных масс-спектров фрагментации (спектры МС/МС, или масс-спектры второго уровня) протеолитических пептидов.
2. В рамках работ по выбору наиболее оптимальных алгоритмических решений для обработки результатов протеомного анализа и получения идентификаций на основе сопоставления масс-спектров второго уровня для пептидов протеомной базы данных с экспериментальными был проведен сравнительный анализ работы трех наиболее широко используемых протеомных поисковых машин, Mascot, X!Tandem и OMSSA. Для проведения сравнительного анализа были получены экспериментальные данные для смесей стандартов рекомбинантных белков и клинических проб. Проведенное исследование выявило несколько критических входных параметров, задаваемых пользователем при настройке ППМ, которые оказывают наиболее существенное влияние на количество идентифицируемых пептидов в одних и тех же экспериментальных данных.