![]() |
ИСТИНА |
Войти в систему Регистрация |
ИСТИНА ПсковГУ |
||
- исследование существующих моделей и подходов к сравнительному анализу суперкомпьютерных систем. Разработка базовой версии модели суперкомпьютерных систем, отражающей результаты анализа; - исследование существующих методов и подходов к развертыванию системы мониторинга и анализа производительности на суперкомпьютерах с различной архитектурой, а также исследование и разработка методов переноса подсистем визуализации и хранения данных системы мониторинга производительности и системы для автоматического обнаружения потенциальных проблем с производительностью в суперкомпьютерных приложениях; - исследование и разработка методов прогнозирования времени выполнения задания и времени передачи данных для выполнения задания на основе методов машинного обучения и разработка мультиагентных методов с обучением для управления распределением потока заданий в гетерогенной сети высокопроизводительных вычислителей.
The aim of the work is: - study of existing models and approaches to comparative analysis of supercomputer systems. Development of the basic version of the model of supercomputer systems, reflecting the results of the analysis; - study of existing methods and approaches to deploying a performance monitoring and analysis system on supercomputers with different architectures, as well as research and development of methods for transferring visualization and data storage subsystems of a performance monitoring system and a system for automatically detecting potential performance problems in supercomputing applications; - research and development of methods for predicting the task execution time and data transfer time to complete the task based on machine learning methods and the development of multi-agent methods with learning to control the distribution of the task flow in a heterogeneous network of high-performance computers.
1 В процессе исследования моделей и подходов к сравнительному анализу суперкомпьютерных систем и разработки базовой версии модели суперкомпьютерных систем должны быть решены следующие задачи: 1.1 Должно быть проведено исследование существующих моделей и подходов к сравнительному анализу суперкомпьютерных систем, включающее рассмотрение основных мировых, региональных, специализированных рейтингов, использующихся при построении рейтингов бенчмарков, а также перспективных бенчмарков. 1.2 Должны быть выделены перспективные критерии оценки и сравнения суперкомпьютерных систем, которые лягут в основу разрабатываемых методов анализа. 1.3 Должна быть разработана базовая версия модели суперкомпьютерных систем, отражающая результаты анализа. 1.4 Должна быть проведена апробация базовой версии модели на ведущих и новейших/перспективных системах России и мира, в ходе которой рассмотрены и описаны 10 наиболее производительных вычислительных систем России из рейтинга Тоp50 актуальной редакции, а также рассмотрены и описаны 10 наиболее производительных вычислительных систем мира из рейтинга Top500 актуальной редакции. 1.5 По результатам апробации должна быть создана первая версия базы моделей суперкомпьютерных систем, которая будет пополняться в ходе дальнейших работ. 2 В процессе исследования методов и подходов к развертыванию системы мониторинга и анализа производительности суперкомпьютеров с различной архитектурой, исследований и разработки методов переноса подсистем визуализации и хранения данных системы мониторинга производительности, а также системы для автоматического обнаружения потенциальных проблем с производительностью в суперкомпьютерных приложениях, должны быть решены следующие задачи: 2.1 Проанализированы методы и подходы к развертыванию систем мониторинга производительности суперкомпьютеров с различной архитектурой. 2.2 Разработаны методы переноса между различными суперкомпьютерами подсистем визуализации и хранения данных системы мониторинга производительности. 2.3 Исследованы и разработаны методы переноса между различными суперкомпьютерами системы автоматического обнаружения потенциальных проблем с производительностью в суперкомпьютерных приложениях. 2.4 С помощью разработанных методов создан прототип программного решения для проведения мониторинга и анализа производительности суперкомпьютерных приложений. 2.5 Изучены и апробированы на практике подходы к созданию экспертного центра, направленного на детальный анализ и оптимизацию производительности реальных суперкомпьютерных приложений. 2.6 Апробирован разработанный прототип программного решения на макетах или существующих суперкомпьютерах. 3 В процессе разработки методов прогнозирования времени выполнения задания и времени передачи данных для выполнения задания на основе методов машинного обучения и разработки мультиагентных методов с обучением должны быть решены следующие задачи: 3.1 Разработка математической модели функционирования систем на базе гетерогенной сети высокопроизводительных вычислителей (ГСВВ). 3.2 Анализ существующих инвариантных к особенностям высокопроизводительных вычислителей (ВВ) методов машинного обучения для прогнозирования времени выполнения заданий в среде ГСВВ на различных вычислительных ресурсах. 3.3 Математическая постановка задачи оптимального распределения заданий в среде ГСВВ на основе мультиагентных методов оптимизации с обучением и прогнозированием времени их выполнения, инвариантного к особенностям ВВ, на различных вычислительных ресурсах. 3.4 Анализ существующих подходов к оценке используемых ресурсов и времени выполнения заданий в ГСВВ. 3.5 Разработка инвариантных к особенностям ВВ методов прогнозирования времени выполнения задания на основе методов машинного обучения. 3.6 Разработка методов оценки времени передачи данных для выполнения задания в среде ГСВВ, инвариантных к особенностям ВВ и с минимальной зависимостью от информации о топологии и особенностях сети передачи данных, на основе методов машинного обучения. 3.7 Обзор существующих алгоритмов и методов МА-оптимизации распределения заданий и управления трафиком в ГСВВ. 3.8 Анализ существующих и разработка новых критериев мультиагентной оптимизации распределения потока заданий в ГСВВ, инвариантных к особенностям ВВ. 3.9 Разработка новых методов функционирования МА-диспетчера потока заданий в среде ГСВВ, инвариантных к особенностям ВВ.
Коллектив исполнителей имеет многолетний опыт работы в области анализа и повышения эффективности работы суперкомпьютерных систем и выполняющихся на них приложений. В частности, по теме 1 существенным заделом является опыт составления рейтинга Топ50 суперкомпьютеров России, по теме 2 - множество выполненных проектов в области мониторинга и анализа эффективности работы вычислительных систем и отдельных их компонент. По теме 3 имеется богатый опыт исследований в области сетевого взаимодействия. Коллектив имеет значительное число авторских свидетельств, патенты, публикации и выступления с результатами работ по смежным с Проектом направлениям, что отражено в ИС ИСТИНА Московского университета.
НИИ МВС ЮФУ | Соисполнитель |
Хоздоговор, Российский Федеральный ядерный центр - Всероссийский научно-исследовательский институт экспериментальной физики (ФГУП РФЯЦ-ВНИИЭФ) |
# | Сроки | Название |
1 | 1 июня 2022 г.-30 ноября 2022 г. | Исследование и разработка моделей и подходов к сравнительному анализу суперкомпьютерных систем. Исследование и разработка методов и подходов мониторинга и анализа производительности суперкомпьютеров с различной архитектурой. Разработка математических моделей ыункционирования гетерогенной сети высокопроизводительных вычислений и математических постановок задач оптимального диспетчирования потока заданий на основе мультиагентной оптимизации. |
Результаты этапа: Было проведено исследование существующих моделей и подходов к сравнительному анализу суперкомпьютерных систем. Была разработана базовая версия модели суперкомпьютерных систем, отражающей результаты анализа, позволяющая с требуемой точностью описать конфигурации современных вычислителей с тем, чтобы обеспечить сравнение их возможностей относительно особенностей конфигураций и предложены перспективные критерии оценки суперкомпьютерных систем. Была проведена апробация предложенных методов описания суперкомпьютерных систем – рассмотрены и описаны 20 ведущих супер-ЭВМ России и мира, на основании чего создана первая версия базы моделей суперкомпьютерных систем, которая будет пополняться в ходе дальнейших работ. Были проанализированы методы и подходы к развертыванию систем мониторинга производительности суперкомпьютеров. Были разработаны переносимые подсистемы визуализации и хранения данных системы мониторинга производительности и методы их переноса. Было проведено исследование и разработка методов переноса системы автоматического обнаружения проблем с производительностью в суперкомпьютерных приложениях. Был создан прототип программного решения для проведения мониторинга и анализа производительности суперкомпьютерных приложений. Был предложен подход к созданию экспертного центра, направленного на детальный анализ и оптимизацию производительности суперкомпьютерных приложений. Была выполнена апробация разработанного прототипа программного решения. |
Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".