Алгоритм восстановления пропущенных данных в выборке фитоиндикационного мониторинга с использованием метода главных компонентстатьяИсследовательская статья
Аннотация:Предложен подход к построению оценок для пропущенных значений в многомерных выборках. Достаточным условием его применимости является предположение о наличии между координатами наблюдаемой величины связей, которые хорошо аппроксимируются линейными уравнениями. Для выявления таких связей предполагается использование метода главных компонент с предварительной нормализацией. Восстановление пропущенной информации осуществляется путем проектирования неполных данных на подпространство, содержащее нескольких первых главных компонент. Для минимизации погрешности оценки метод главных компонент повторно применяется к части исходной выборки и исключаются неустойчивые компоненты, которые чувствительны к сокращению выборки и, как следствие, подвержены влиянию шума. Для демонстрации полученных результатов разработанный алгоритм был применен к экспериментальным даннымфитоиндикационного мониторинга в 24-компонентной наблюдательной сети.