Место издания:ИКИ РАН Институт космических исследований РАН
Первая страница:306
Аннотация:Целью настоящей работы является адаптация и применение 4-ступенчатого нейросетевого метода анализа многомерных временных рядов с целью прогнозирования наступления тех или иных событий и поиска их предвестников – явлений, представляющих собой некую неизвестную комбинацию значений параметров, описывающих объект [1]. Алгоритм был применен для прогнозирования геомагнитного индекса Kp. Разработанный подход позволяет адаптивно отбирать как физические входные признаки, так и конкретные используемые значения задержки при учёте предыстории каждого физического признака. Это может дать лучшее понимание процессов, происходящих в исследуемом объекте (в данном случае – в магнитосфере Земли). Для прогнозирования Kp-индекса в качестве входных признаков были использованы среднечасовые значения следующих величин: 1. Параметры солнечного ветра (СВ) в точке Лагранжа L1 между Землей и Солнцем: скорость СВ ν (км/с), температура (K), плотность протонов в СВ np(см-3) 2. Параметры вектора межпланетного магнитного поля (ММП) в той же точке L1 в системе GSM: Bx, By, Bz (компоненты ММП), модуль ММП Bmagn (нТл). 3. Геомагнитные индексы: экваториальный геомагнитный индекс Dst (нТл), планетарный геомагнитный индекс Kp (безразмерный). 4. Случайные шумовые признаки, добавленные для проверки того, что система распознает их как несущественные для прогнозирования целевой переменной. Общая схема работы 4 ступенчатого алгоритма включает в себя следующие шаги: 1. Отбор наиболее существенных физических признаков (переменных) из числа тех, от которых, по мнению исследователя, может зависеть прогнозируемая искомая величина. В текущей реализации для этого используется итеративный подход. В рамках этого подхода система оценивает корреляцию (Пирсон/Спирмен) между входным признаком и его задержками и прогнозируемой переменной. Затем по заданному порогу отбирается часть переменных, которые будут использованы далее. 2. Отбор диапазона используемых задержек. Для этого создаются наборы входных признаков следующим образом: 0 набор – выбранные на первом этапе входные переменные в текущий момент времени, 1 набор – к 0 набору добавляются все входные переменные с задержкой в 1 отсчет, 2 набор – к 1 набору добавляются все входные переменные с задержкой в 2 отсчета и т.д. до заданной исследователем границы. На каждом наборе, созданном в рамках описанного цикла, обучается модель машинного обучения, качество которой оценивается на заранее отложенном наборе данных. Цикл прекращается, когда по заданному критерию добавление входных переменных перестает существенно улучшать точность прогнозирования. 3. Отбор наиболее важных входных признаков из полученного многомерного пространства, ограниченного на первых двух этапах. Для этого этапа подходит один из стандартных подходов к оценке важности входных признаков. 4. Подбор гиперпараметров модели. Исследование выполнено за счёт гранта Российского научного фонда № 23-21-00237, https://rscf.ru/project/23-21-00237/. 1. S.Dolenko et al. LNCS 5769, 295-304. https://doi.org/10.1007/978-3-642-04277-5_30