Аннотация:Последние достижения в области нанопорового секвенирования значительно расширили возможности обнаружения модифицированных нуклеотидов, таких как 5-метилцитозин (5mC), являющийся ключевым участником эпигенетической регуляции экспрессии генов. Тем не менее, существующие basecalling-модели для нанопорового секвенирования остаются недостаточно точными для определения метилирования ДНК в G/C-богатых регионах, в особенности тех, которые способны образовывать G-квадруплексные (G4) структуры. Мы продемонстрировали, что новейшие basecalling-модели, разработанные Oxford Nanopore, показывают высокий уровень ложно положительных сигналов 5mC в G4-образующих последовательностях промотора онкогена MGMT, даже в неметилированных контролях. Ошибочные сигналы метилирования значительно реже встречаются при использовании более старой химии R9 или при использовании сторонних моделей, таких как DeepMod2.Полученные результаты свидетельствуют о том, что G4-структуры и/или их нуклеотидный контекст могут препятствовать точному обнаружению модифицированных оснований. Следовательно, необходимо выяснить, являются ли подобные ошибки следствием образования G4-структур во время секвенирования или артефактом расшифровки данных секвенирования G4-образующих последовательностей. Данная проблема подчеркивает необходимость разработки специализированных высокоточных моделей обнаружения модификаций в G/С-богатых областях. Повышение точности определения профиля метилирования ДНК расширит возможности клинической интерпретации геномных данных и выбора стратегии терапии онкологических заболеваний.Работа выполнена при поддержке РНФ (грант № 25-14-00126).