ИСТИНА |
Войти в систему Регистрация |
|
ИСТИНА ПсковГУ |
||
Объектами исследования настоящей работы являются математические модели и программное обеспечение сложных телекоммуникационных и информационно-вычислительных технологий и систем на их основе, предназначенные: • для разработки высокопроизводительных вычислительных систем; • для сбора и хранения, информационного поиска и тематического анализа слабоструктурированных данных в коллекциях с большим числом взаимосвязанных объектов • для обеспечения безопасности ресурсов и процессов верификации больших сложно организованных информационно-вычислительных систем. Целью работы является разработка и совершенствование теоретической базы и практических архитектурно-технологических решений, создание на этой основе информационно-вычислительных комплексов, включающих современные инструментальные средства для проведения исследований в указанных областях. Методами исследования являются математическое моделирование и алгоритмизация процессов, протекающих в информационно-вычислительных и телекоммуникационных системах, их реализация в виде программного обеспечения и аппаратных средств.
В ходе выполнения работ планируется получение следующих результатов. Разработка средств интеллектуального тестирования для перспективной отечественной many-core - системы на кристалле. Разработка специальной версии программного модуля эмуляции перспективного SIMD - ускорителя. Исследование методов построения больших высокопроизводительных хранилищ (репозиториев) структурированных описаний различных объектов (документов). Исследование вопросов адекватности степени децентрализации таких репозиториев, потребностям предметной области. Разработка системы выполнения запросов к полнотекстовым документам в потоковом режиме. Разработка математических моделей и алгоритмов для автоматического определения переводов публикаций на основе графа соавторства с учетом семантической близости названий публикаций. Разработка второй версии промежуточного представления разновидности языка Рефал для повышения однородности команд этого представления и с целью исключения из представления фрагментов с заведомо неопределенной семантикой.
госбюджет, раздел 0110 (для тем по госзаданию) |
# | Сроки | Название |
1 | 1 января 2019 г.-31 декабря 2019 г. | Математическое и программное обеспечение сложных информационно-вычислительных систем |
Результаты этапа: На направлении «Математическое и программное обеспечение сложно организованных высокопроизводительных вычислительных систем» Реализованы программные механизмы для развёртывания модели распределённой системы с использованием программного средства для управлениями конфигурациями Ansible. Разработаны сценарии для нагрузочного тестирования распределённых систем с различными конфигурациями. Разработана технология преобразования исходного кода C- и OpenCL-программ с константными по числу итераций циклами в форму, которая транслируется базовым компилятором Clang в векторизуемое промежуточное представление, не содержащее инструкций условных переходов. Разработана технология оптимизирующей трансляции получаемого таким образом промежуточного представления в машинный код целевого векторного процессора, имеющего VLIW архитектуру. Разработан синтаксический анализатор для специализированного ассемблера векторного процессора, порождающий соответствующее абстрактное синтаксическое дерево с последующим его преобразованием в промежуточное представление. На направлении «Методы и средства сбора и хранения, информационного поиска и тематического анализа слабоструктурированных данных в коллекциях с большим числом взаимосвязанных объектов» Выделены критерии оценки уровня периодических научных мероприятий. Предложены методы получения количественных оценок, на основе открытых данных. Реализованы прототипы программных средств. Разработана модель хранения данных о ключевых словах публикаций в реляционных базах данных. Разработан алгоритм и программный модуль для загрузки ключевых слов из внешних систем. Разработан алгоритм и реализован программный модуль для поиска переводов ключевых слов в словарях при помощи программного интерфейса сервиса Abbyy Lingvo. Реализована начальная версия модуля поиска экспертов в предметной области, заданной ключевыми словами. Исследованы методы пост-обработки векторных представлений слов и документов, базирующиеся на понижении размерности векторных представлений и на переходе от числовых признаков к категориальным. Исследованы существующие и разработаны новые методы формирования векторных представлений документов по векторным представлениям слов. Разработаны методы, базирующиеся на решении задачи восстановления регрессии Разработаны математические модели алгоритмов построения схожести объектов на основе графа цитируемости. Разработана программная реализация, позволяющая подбирать похожие по тематики журналы и конференции. На направлении «Математическое и программное обеспечение безопасности ресурсов и процессов верификации больших информационно-вычислительных систем» Доработана модель проверки типов и на её основе внесены модификации в программную реализацию средства проверки типов для разновидности языка Рефал. Разработан макет средства проверки типов лямбда-исчисления с простыми типами. Добавлена возможность экспорта структуры данных реляционной модели ЛРД в JSON формат. Разработано средство визуализации структуры отношений между классами системы. | ||
2 | 1 января 2020 г.-31 декабря 2020 г. | Математическое и программное обеспечение сложных информационно-вычислительных систем |
Результаты этапа: По направлению "Математическое и программное обеспечение сложно организованных высокопроизводительных вычислительных систем" Разработаны сценарии для нагрузочного тестирования информационно-аналитической системы. Разработан подход тестирования many-core системы на кристалле. Разработан специальный UV-код. Разработана специальная версия эмулятора перспективного SIMD -ускорителя для отечественного many-core процессора, которая реализована совместно с модулем ассемблера и пошагового программного отладчика векторных программ. Сформирован набор начальных (базовых) требований к хранилищу структурированных описаний документов. Проведен анализ существующих решений по созданию и поддержке хранилищ структурированных описаний документов. Проведено исследование возможностей пакета Apache Chemistry. По направлению "Методы и средства сбора и хранения, информационного поиска и тематического анализа слабоструктурированных данных в коллекциях с большим числом взаимосвязанных объектов" Разработана система выполнения полнотекстовых запросов с булевыми связками. Реализована поддержка учета различных форм слов из поискового запроса. Реализован автоматический поиск переводов ключевых слов при помощи сервиса Википедия. Добавлена поддержка поиска экспертов по предметной области,связанной с научно-исследовательской работой (НИОКР). Разработаны математические модели и алгоритмы для автоматического определения переводов публикаций на основе графа соавторства с учетом семантической близости названий публикаций. Проведено исследование методов построения векторных представлений для набора документов, имеющих фиксированную длину. Проведено исследование методов представления документов в виде объединения документов, имеющих фиксированную длину. По направлению "Математическое и программное обеспечение безопасности ресурсов и вопросов верификации больших, сложно организованных информационно-вычислительных систем" Разработана вторая версия промежуточного представления разновидности языка Рефал и реализован её интерпретатор. Доработана подсистема визуализации реляционной модели в плане удобства пользовательского интерфейса. Проведена оценка быстродействия механизмов реляционной модели ЛРД по сравнению с ранее используемыми в системе механизмами разграничения доступа. | ||
3 | 1 января 2021 г.-31 декабря 2021 г. | Математическое и программное обеспечение сложных информационно-вычислительных систем |
Результаты этапа: По направлению "Математическое и программное обеспечение сложно организованных высокопроизводительных вычислительных систем" Разработан сценарий для нагрузочного тестирования механизмов ввода и верификации наукометрических данных в информационно-аналитических системах с апробацией на реальных данных. Проведена серия экспериментов с популярными компонентами Web-систем (сервер Nginx, Python-драйвере СУБД PostgreSQL. Разработана формальная модель и реализован программный прототип А-машины: асинхронного обобщения графовой G-машины, известной из теории программирования. Разработан алгоритм декомпозиции векторизуемого кода. Разработан алгоритм статистического анализа бездивергентных фрагментов векторного кода. Исследованы возможные механизмы построения гетерогенных хранилищ наукометрических данных с единым центром. По направлению "Методы и средства сбора и хранения, информационного поиска и тематического анализа слабоструктурированных данных в коллекциях с большим числом взаимосвязанных объектов" Разработан метод выявления искомых отношений в текстах аннотаций. Переработана архитектура модуля поиска экспертов по предметной области. Добавлена возможность задавать правила для учета весовых коэффициентов результатов деятельности. Добавлена фильтрация по году результата деятельности. Разработана математическая модель и алгоритмы для тематического поиска конференций. Проведено исследование методов построения векторных представлений для набора документов. По направлению "Математическое и программное обеспечение безопасности ресурсов и вопросов верификации больших, сложно организованных информационно-вычислительных систем" Разработан компилятор реляционной модели разграничения доступа. Спроектирована и реализована функция для обработки порожденных отношений. Разработаны два вида генераторов выражений промежуточного представления. | ||
4 | 1 января 2022 г.-31 декабря 2022 г. | Математическое и программное обеспечение сложных информационно-вычислительных систем |
Результаты этапа: По направлению "Математическое и программное обеспечение сложно организованных высокопроизводительных вычислительных систем" Разработан набор сценариев для нагрузочного тестирования механизмов ввода и верификации наукометрических данных в информационно-аналитических системах. Произведена адаптация разработанных алгоритмов долговременного кэширования к Python-фреймворку Django. Разработан алгоритм распределения тел циклов с большим количеством инструкций на несколько сегментов векторного ускорителя. Реализована процедура формирования пакета данных о НИОКТР для передачи сведений в ЕГИСУ НИОКТР. Подготовлены изменения в структуре базе данных для сбора дополнительных сведений о НИОКТР. Реализован пользовательский интерфейс. По направлению "Методы и средства сбора и хранения, информационного поиска и тематического анализа слабоструктурированных данных в коллекциях с большим числом взаимосвязанных объектов" Проведено выделение новой научной технологии из аннотаций научных публикаций с использованием методов машинного обучения. Расширены функции модуля формирования запросов к СУБД для построения списков агрегированных данных из различных таблиц. Разработаны математическая модель и алгоритмы для тематического поиска экспертов по данным наукометрических систем соавторства. Разработан интерфейс на основе модуля SQLREPORT. Подготовлен предварительный вариант учебного пособия по математическим основам машинного обучения. По направлению "Математическое и программное обеспечение безопасности ресурсов и вопросов верификации больших, сложно организованных информационно-вычислительных систем" Разработан макет средства статического анализа исходного кода информационно-аналитической системы с Web-интерфейсом на основе платформы Django. | ||
5 | 1 января 2023 г.-31 декабря 2023 г. | Математическое и программное обеспечение сложных информационно-вычислительных систем |
Результаты этапа: По направлению "Математическое и программное обеспечение сложно организованных высокопроизводительных вычислительных систем" Реализован программный макет наукометрической информационно-аналитической системы с использованием Django REST Framework, в котором реализовано кэширование данных посредством мемоизации вычислений. Мемоизация осуществляется путём кэширования результатов представления данных, вычисляемых вложенными сериализаторами данных. С целью миграции приложений, разработанных на базе фреймворка Django, была разработана совокупность скриптов, дополняющих функционал популярного средства Ora2Pg для конвертации собственно базы данных под систему управления PostgreSQL. Реализована цепочка трансляции, которая позволяет из дампа БД для Oracle получить эквивалентную ей базу данных для СУБД PostgreSQL. Реализован макет сервиса получения сведений о юридических лицах из внешних источников данных. По направлению "Методы и средства сбора и хранения, информационного поиска и тематического анализа слабоструктурированных данных в коллекциях с большим числом взаимосвязанных объектов" Разработана онтология верхнего уровня для описания результатов научных исследований, включающей понятия задача, метод решения, алгоритм, свойство, условие. Метод автоматического пополнения онтологии специальной научной лексикой основан на использовании лексических шаблонов. Проведена модернизация программного кода для поиска и ранжирования результатов деятельности для использования актуальных версий Python 3.11 и Django 2.2, а также системы управления базами данных PostgreSQL. Разработана модель для автоматического выявления и устранения дубликатов конференций в наукометрических системах. Были продолжены работы по подготовке второй части учебного пособия по математическим основам машинного обучения, посвященной нейросетевым методам обучения. По направлению "Математическое и программное обеспечение безопасности ресурсов и вопросов верификации больших, сложно организованных информационно-вычислительных систем" В рамках настоящей задачи проводится эксперимент, целью которого является оценить возможность снижения количества промежуточных слоёв между исходным кодом и тем, что исполняется фактически (т.е. машинным кодом) с использованием современных средств разработки. Разработаны два варианта макета компилятора низкоуровневого языка программирования, представляющего собой язык ассемблера с возможностью автоматического выделения регистров и передачи управления на заданный блок. | ||
6 | 1 января 2024 г.-31 декабря 2024 г. | Математическое и программное обеспечение сложных информационно-вычислительных систем |
Результаты этапа: | ||
7 | 1 января 2025 г.-31 декабря 2025 г. | Математическое и программное обеспечение сложных информационно-вычислительных систем |
Результаты этапа: |
Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".