Регистрация / Вход
Прислать материал

Алгоритмы, методы и программы для автоматической функциональной и структурной аннотации геномов низших эукариот и оценки эволюционных соотношений между геномоами с использованием данных, полученных на секвенаторах нового поколения

Стадии проекта
Предложение принято
Конкурс завершен
Проект закончен
Проект
02.740.11.5008
Руководитель работ
Бебуров Михаил Юрьевич

Информация отсутствует

Участники проекта

Зам. руководителя работ
Макеев Всеволод Юрьевич

Этапы проекта

1
20.07.2009 - 30.09.2009
1.1. Создание пилотной
версии системы.
1.2.Проведение патентных
исследований.
1.3. Загрузка в систему
геномных данных
Развернуть
2
01.10.2009 - 10.12.2009
1. Наименование разрабатываемой продукции
Система автоматической функциональной и структурной аннотации геномов низших эукариот и оценки эволюционных соотношений между геномами с использованием данных, полученных на секвенаторах нового поколения. Этап 2. Включение в систему возможностей работы с данными секвенаторов нового поколения.
2. Характеристика выполненных на этапе работ по созданию продукции
2.1. Характеристика работы. В результаты работы на 2 этапе к пилотной системе, разработанной на первом этапе была добавлена система, позволяющая загружать данные, полученные с различных установок, осуществляющих получение фрагментов геномов методами секвенирования нового поколения, включая систему сборки протяженных контигов из фрагментов. Было проведено тестирование ряда программ, осуществляющих сборку контигов, и выбрана программа (MIRA) наилучшим образом отвечающая задаче сборке контигов геномов биотехнологических организмов. Кроме того были проведены лекция и ряд семинаров под руководством иностранного научного руководителя проекта. Данная работа соответствует требованиям технического задания к 2 этапу; в результате ее создана драфт-система анализа геномных данных, обладающая полной функциональностью.
•2.2. Новизна применяемых решений в сравнении с другими работами. Использованное решение является в значительной мере классическим, соответствует разработанным в последнее время аналогам, и использует программные компоненты, находящиеся в открытом доступе. Новым является тщательный выбор программы, осуществляющей сборку геномных фрагментов, а также построение параметрических портретов, позволяющих осуществлять сборку фрагментов, полученных на различных секвенаторах, с оптимальными для данного производителя параметрамию. Несмотря на то, что все компоненты известны, и представляют собой законченные программы загруженные из открытых источников, насколько нам известно такая комбинация этих программ до сих пор не применялась. В целом можно сказать, что система находится на мировом уровне.
2.3. Особенности исследования, разработки, метода или методологии проведения работы на отчетном этапе. На отчетном этапе была разработана система загрузги данных, полученных на установках секвенирования нового поколения, в частности в отчете представлен протокол загрузки данных. В созданную пилотную систему в качестве тестового исследования были загружены фрагменты геномов ряда штаммов Salmonella typhi и проведен анализ эффективности построения контигов при разных значениях параметров сборки. Написаны описание программы и аннотационный отчет.
2.4. Объекты интеллектуальной собственности, созданные на отчетном этапе. Описание программы, аннотационный отчет.
3. Области и масштабы использования полученных результатов
3.1. Области применения полученных результатов является сравнительная геномика прокариот и эукариот со слабо развитой экзон-интронной структурой. В частности разработанная система уже может применяться для аннотации геномов прокариот и низших эукариот при наличии достаточно большого покрытия. В настоящее время планируется использовать систему для анализа реальных геномных данных, предоставленных лабораторией иностранного партнера проекта.
3.2. Ход практического внедрения полученных результатов. В разработке системы участвовали студенты ФББ МГУ и ВМК МГУ, проходящие преддипломную практику в лаборатории, а также аспирант нашей лаборатории.
3.3. Оценка или прогноз влияния полученных результатов, товаров и услуг, созданных на основе полученных результатов, на подготовку и закрепление в сфере науки и образования научных и научно-педагогических кадров, достижение или превышение заданных индикаторов и показателей. Участие молодых сотрудников, в частности студентов и аспирантов в разработке сложной иформационной системы и наполнении ее геномными данными должно способствовать расширению их кругозора в междисциплинарной сфере. Аспирант нашей лаборатории Белостоцкий А.А. принял участие во Всероссийской конференции «Проведение научных исследований под руководством приглашенных исследователей в 2009 году». Подготовлена к публикации статья, характеризующая основные решения, применненые при разработке созданной информационной системы.
4. Выводы
Созданная на втором этапе работ пилотная система соответствует техническому заданию и календарному плану и является необходимым шагом к выполнению полного плана работ по Госконтракту 02.740.11.5008
Развернуть
3
10.01.2010 - 31.03.2010
В результаты работы на 3 этапе к системе, разработанной на первом и втором этапах, была добавлена подсистема, позволяющая автоматически производить аннотацию генома, в первую очередь компонеты, осуществляющей предсказание локализации генов в геномных фрагментах. Для этого использовались находящиеся в открытом доступе программы автоматического предсказания генов Glimmer и GeneMark, программа коррекции ошибок сборки ProFrame и программы автоматического поиска известных белков, кодируемых сходными последовательнотсями ДНК: Blast, Last, Blat. Был собран конвейер запускающий эти программы, и осуществляющий предсказание наличия и положения в контигах участков, кодирующих белки. Для тестового генома лактококка было проверено несколько альтернативных программ аннотации и несколько сценариев сборки. Комбинация алгоритмов сборки и аннотации должна улучшить качество как первой, так и второй процедуры. Кроме того проведена лекция иностранного руководителя проекта для сотрудников ФГУП ГосНИИгенетика и ряд семинаров в рамках лаборатории.
Данная работа соответствует требованиям технического задания к 3 му этапу; в результате ее создана система аннотации геномных данных, обладающая полной функциональностью.
•Использованное решение является в значительной мере классическим, соответствует разработанным в последнее время аналогам, и использует программные компоненты, находящиеся в открытом доступе. Новым является использование программы, осуществляющей коррекцию сдвигов рамки считывания для коррекции ошибок секвенирования системы 454. В результате, в тестовом геноме было найдено несколько сот предполагаемых ошибок секвенирования, что позволяет надеяться на то, что создаваемая система будет строить последовательности более высокого качества, чем существующие аналоги. Несмотря на то, что все компоненты известны, и представляют собой законченные программы загруженные из открытых источников, насколько нам известно такая комбинация этих программ до сих пор не применялась. В целом можно сказать, что система находится на мировом уровне.
На отчетном этапе была разработана система аннотация последовательностей, собранных из данных, полученных на установках секвенирования нового поколения. В созданную на этапе 1 и 2 пилотную систему в качестве тестового исследования на реальных геномных данных были загружены фрагменты генома оенококка, предоставленные французским партнером. Написаны описание программы и аннотационный отчет.
Развернуть
4
01.04.2010 - 30.06.2010
4.1 Создание инструмента
досупа к системе через
Интернет.
4.2. Подготовка
завершающего отчета и
научно-методических
материалов к публикациям
результатов в
реферируемых журналах
4.3. Разработка программы
внедрения результатов НИР
в образовательный процесс.
Развернуть

Программа

Программа "Научные и научно-педагогические кадры инновационной России" на 2009 - 2013 годы

Программное мероприятие

1.5 Проведение научных исследований коллективами под руководством приглашенных исследователей
Продолжительность работ
2009 - 2010, 12 мес.
Бюджетные средства
0,76 млн
Организация
ИППИ РАН
профинансировано
Продолжительность работ
2011 - 2012, 17 мес.
Бюджетные средства
0,4 млн
профинансировано
Продолжительность работ
2010 - 2012, 23 мес.
Бюджетные средства
3,6 млн
профинансировано
Продолжительность работ
2017 - 2019, 34 мес.
Бюджетные средства
90 млн
Организация
ИМГ РАН
профинансировано
Тема
Разработка, внедрение и применение интегрированного программного обеспечения, реализующего методы сравнительной геномики для функциональной аннотации генов, анализа регуляторных взаимодействий, реконструкции и моделирования метаболизма бактерий.
Продолжительность работ
2005 - 2006, 23 мес.
Бюджетные средства
6 млн
Количество заявок
2
Тема
Научно-методическое и организационно-техническое сопровождение проведения 6-й Международной конференции «Биоинформатика регуляции и структуры генома» и Международной школы молодых ученых «Эволюционная биология и высокопроизводительные вычисления в биоинформатике».
Продолжительность работ
2008, 5 мес.
Бюджетные средства
0,5 млн
Количество заявок
1
Тема
Разработка методологических основ создания информационного и программного обеспечения для анализа функционального эффекта полиморфизма белков человека, полученного из индивидуальных геномов.
Продолжительность работ
2009 - 2010, 14 мес.
Бюджетные средства
8 млн
Количество заявок
1
Тема
Разработка новых способов регуляции экспрессии генов у эукариот.
Продолжительность работ
2008 - 2009, 17 мес.
Бюджетные средства
7,8 млн
Количество заявок
1
Тема
Разработка систем молекулярной идентификации и оценка вариабельности геномов отечественных сортов важнейших овощных культур.
Продолжительность работ
2008 - 2009, 17 мес.
Бюджетные средства
7,8 млн
Количество заявок
2