Аннотация:Прогнозирование инфляции является важной прикладной задачей. Одним из способов улучшения прогноза инфляции является извлечение признаков из новостей, так как, во-первых, в новостях может содержаться информация о важных событиях, которые напрямую или косвенно влияют на инфляцию, a во-вторых, новости могут влиять на инфляционные ожидания. Одним из самых популярных методов выделения признаков из текста в экономической литературе является тематическое моделирование. Данная работа посвящена сравнительному анализу двух методов извлечения тем — впервые используемому в данной работе BERTopic, основанного на нейросетях, и более популярного LDA, основанного на анализе распределения частоты встречаемости слов в текстах, — для прогнозирования инфляции в России с использованием данных из популярных телеграм-каналов. На примере прогнозирования компонент ИПЦ было показано, что использование тем, извлеченных с помощью BERTopic дает лучшие метрики прогноза по сравнению с темами, извлеченными с помощью LDA. К тому же сам по себе BERTopic удобнее для работы, так как является более современным методом обработки естественного языка. Главным вкладом данной работы является демонстрация того, что простая замена метода тематического моделирования может улучшить качество анализа инфляции.