Аннотация:Спектроскопия ближнего и дальнего инфракрасного (ИК) диапазона позволяет идентифицировать различные органические соединения, в том числе молекулы полициклических ароматических углеводородов (ПАУ). Важной задачей является идентификация ПАУ в спектрах межзвездной среды и других астрономических объектов, поскольку эти молекулы являются неотъемлемым компонентом химической эволюции во Вселенной. Кроме того, из-за высокой токсичности и мутагенности контроль содержания ПАУ является одной из важнейших задач экологического мониторинга. Заряд даже структурно идентичных молекул ПАУ в значительной мере влияет на профиль их ИК-спектров. С помощью теоретических методов, основанных на квантовохимических расчетах, таких как теория функционала плотности (DFT), уже получено достаточно большое количество спектров для молекул с различными зарядами. Однако общее количество известных молекул ПАУ существенно больше и расчет всех спектров затруднен из-за высокой ресурсоемкости и длительности квантовохимических расчетов. Поэтому мы предлагаем альтернативный высокоскоростной подход, основанный на предсказании ИК-спектров как нейтральных, так и заряженных молекул ПАУ методами машинного обучения. Для решения поставленной задачи мы обучили модели на основе градиентного бустинга (XGBoost), а также графовой нейронной сети. Заряд молекулы учитывается посредством кодирования в бинарные (one-hot) или обучаемые представления. Оба подхода демонстрируют высокую предсказательную способность, впервые позволяя быстро и точно моделировать ИК-спектры ионизованных ПАУ. Модель XGBoost показывает наивысшую среднюю точность предсказания, тогда как графовая нейронная сеть обеспечивает большую точность в предсказании ключевых особенностей спектров отдельных молекул. Нейросетевой подход обладает значительным потенциалом для дальнейшего развития благодаря своим возможностям в работе с молекулярными графами, включая возможные пути решения ограниченной точности предсказания для слабо представленных классов, таких как гетероатомные ПАУ, например, с использованием переноса обучения (transfer learning).