Регистрация / Вход
Прислать материал

Обеспечение эффективности суперкомпьютерных центров будущего на основе технологий обработки больших объемов данных и экстремальных вычислений

Докладчик: Стефанов Константин Сергеевич

Должность: старший научный сотрудник Научно-исследовательского вычислительного центра Московского государственного университета им. М.В. Ломоносова, к.ф.-м.н.

Цель проекта:
Архитектура суперкомпьютерных центров совершенствуется с каждым годом. Это приводит к тому, что эффективность выполнения приложений деградирует, поскольку все сложнее становится учитывать возрастающее многообразие аппаратных особенностей суперкомпьютеров, каждая из которых может кардинальным образом влиять на скорость расчетов. На данный момент эффективность на уровне 3-5 процентов уже является нормой; однако подобное неоптимальное использование вы-числительных ресурсов приводит к серьезным временны́м и, в конечном итоге, финансовым потерям. Требуется разработка комплекса программных средств, который позволит проводить разносторонний анализ эффективности как отдельных пользовательских приложений, так и суперкомпьютерного центра в целом. Целью проекта является выполнение прикладных научных исследований для создания новых технологий оперативной диагностики состояния и экспертизы внутренних ресурсов суперкомпьютеров для обеспечения эффективности суперкомпьютерных центров на основе технологий обработки больших объемов данных и экстремальных вычислений.

Основные планируемые результаты проекта:
В результате выполнения проекта будет разработан комплекс технологий и программных средств для обеспечения эффективности работы суперкомпьютерных центров малого, среднего и высокого уровней производительности, а также перспективных центров сверхвысокого уровня производительности. Разрабатываемый комплекс технологий и программных средств будет охватывать наиболее значимые аспекты функционирования большого суперкомпьютерного комплекса с точки зрения его использования, администрирования и поддержки его функционирования.
Данный комплекс будет совмещать различные направления к обеспечению эффективности. В частности, будут разработаны и реализованы подходы к детальному анализу динамических характеристик как отдельных приложений, так и всего суперкомпьютера в целом, на основе мониторинга состояния вычислительной системы. Также будет созданы методы и программные средства анализа работоспособности компонентов суперкомпьютера и определения нештатных ситуаций, которые могут приводить к критическим сбоям в работе системы.
В результаты выполнения проекта будут получены новые результаты, не имеющие аналогов в мире.

Назначение и область применения, эффекты от внедрения результатов проекта:
В рамках данного проекта создается набор методов и программных средств, направленных на обеспечение эффективности функционирования существующих вычислительных систем и суперкомпьютерных центров будущего. Это позволит ускорить проведение исследований в таких областях, как нефтегазовый сектор, машиностроение, производство новых материалов, экология, энергетика и других. Применение полученных в данном проекте результатов окажет позитивное влияние на развитие не только суперкомпьютерной отрасли, но и науки, техники и промышленности в целом.
Внедрение результатов проекта в российские суперкомпьютерные центры будет способствовать дальнейшему развитию сферы исследований и разработок в области прикладных исследований в России.

Текущие результаты проекта:
Выполнен аналитический обзор современной литературы, затрагивающей научно-техническую проблему, исследуемую в рамках ПНИ. Данный обзор показывает, что, несмотря на актуальность рассматриваемой проблемы и богатый накопленный опыт существующих работ, общая задача обеспечения эффективности суперкомпьютерных центров далека от решения.
По разработанным на данном этапе методикам были выполнены оценки, отражающие общий объем и структуру данных, которые необходимо собирать и анализировать для получения детальной информации о состоянии современных суперкомпьютеров.
Выполнены теоретические оценки необходимого объема хранимых данных для анализа эффективности работы реальных приложений пользователей.
Разработана архитектура прототипа программной системы обеспечения эффективности функционирования суперкомпьютерных центров и определен набор его компонентов.