Аннотация:Грибы играют важную роль в функционировании экосистем, выступая в качестве основныхкомпонентов в круговороте питательных веществ и формировании симбиотических отношений.Технологии следующего и третьего поколения (NGS/TGS) позволяют обрабатывать множество образцови генерировать миллионы прочтений, что увеличивает объем данных для анализа биоразнообразия. TGSобеспечивает считывание длинных последовательностей по сравнению с NGS, позволяя получить болееполное представление о генетической вариабельности. Однако TGS имеет меньшую точность прочтенийпо сравнению с NGS. Использование алгоритма жадной кластеризации не позволяет корректногруппировать длинные шумные прочтения TGS. Для обработки данных TGS искусственных сообществгрибных патогенов человека показал свою эффективность UMAP-HDBSCAN.Целью нашей работы было апробирование этого метода для обработки данных TGS метабаркодингагрибных сообществ. Для этого был разработан пайплайн на Bash и Python 3, который на этапекластеризации использует UMAP-HDBSCAN имплементированный в NanoCLUST. Пайплайнапробирован на данных секвенирования ампликонов локуса ITS1–5.8S–ITS2 на Nanopore MinION.Проанализированы 46 проб, в среднем по 111822 сырых ридов. Каждая проба кластеризовалась в среднемна 218 кластеров, более 80% консенсусов успешно классифицированы до рода и 50% до вида со сходствомболее 99%. Качество полученных консенсусов достаточно для ручного курирования выравниванием нареференс и, следовательно, последовательности пригодны для использования в филогенетическихпостроениях.В целом, результаты обработки были сопоставимы с результатами обработки данных NGS и давалипоследовательности около 700 пар нуклеотидов, более эффективные для построения филогений. Такимобразом, подготовленный пайплайн с использованием UMAP-HDBSCAN позволяет корректноанализировать TGS данные и может быть использован для метабаркодинга грибов природных сообществ.