![]() |
ИСТИНА |
Войти в систему Регистрация |
ИСТИНА ПсковГУ |
||
Большие масштабы внедрения наноматериалов на основе наночастиц магнетита Fe3O4 в биомедицине и ремедиационных мероприятиях благодаря технологичности и возможности варьирования свойств на стадии синтеза поднимает острый вопрос о безопасности использования данных наноматериалов и снижения трудозатрат при проведении множества рутинных экспериментов при оценке их токсичности. В настоящем исследовании для установления взаимосвязи с помощью методов машинного обучения между параметрами условий синтеза, кристаллической структурой и биологическими свойствами собрана база данных рентгенофазового анализа из более 100 собственных образцов наночастиц, модифицированных различными соединениями и в различных условиях синтеза, из которых только 21 образец использован для моделирования токсичности по отношению к инфузориям (Paramecium caudatum) и горчице белой (Sinapis alba). В качестве предикторов были использованы параметры кристаллической решетки a=8,2-8,9 Ao c индексом Миллера [440] и различные соотношения спектра, полученные с помощью библиотеки для обработки временных рядов «tsfel». Отдельно решались задачи регрессии и классификации. В задаче регрессии прогнозировалось значение EC50, а в задаче классификации прогнозировалось отношение к классу токсичных или нетоксичных соединений. В работе были использованы следующие модели: RandomForest, GradientBoosting, kNN и DecisionTree. Несбалансированность классов в выборке, вызванная отсутствием значительной токсичности у большинства образцов, не позволила построить адекватную регрессионную модель. В задаче классификации наилучшие метрики удалось достичь с помощью GradientBoosting, однако значения F-1 меры давали широкий разброс значений в зависимости от деления на обучающую и тестовую выборку. Для решения данной проблемы необходимо расширение выборки или использование методов искусственного расширения выборки с использованием как классических подходов, так и специализированных для молекулярного моделирования. Работа выполнена при финансовой поддержке Российского научного фонда (грант №23- 23-00621).