Аннотация:Белки E6 и E7 вируса папилломы человека (ВПЧ) играют ключевую роль в онкогенезе папилломавирусной инфекции. Данные по изменчивости этих онкобелков ограничены, а факторы, влияющие на их изменчивость, малоизучены. Нами проанализирована вариабельность известных к настоящему времени последовательностей белков E6 и E7 ВПЧ типа 16 (ВПЧ16) с учетом их географического происхождения и года cбора образцов, а также направления их эволюции в основных географических регионах мира. Из базы данных GenBank NCBI 6 октября 2022 года были выгружены все последовательности, относящиеся к фрагментам генома ВПЧ16, кодирующим онкобелки E6 и E7. Образцы отфильтровали по следующим параметрам: последовательность включает хотя бы одну из двух интересующих рамок считывания целиком, известны дата сбора и страна происхождения. Всего отобрали 3 651 полногеномную нуклеотидную последовательность, кодирующую белок E6, и 4 578 полногеномных нуклеотидных последовательностей, кодирующих белок E7. Полученные после выборки и выравнивания нуклеотидные последовательности переводили в аминокислотные и анализировали с применением программ MEGA11, R, RStudio, Jmodeltest 2.1.20, BEAST v1.10.4, Fastcov и Biostrings. Наибольшая изменчивость первичной структуры белка E6 зарегистрирована в позициях 17, 21, 32, 85 и 90 а. о., а для E7 ‒ в позициях 28, 29, 51 и 77 а. о. Выборка разделилась по географическому признаку на 5 гетерогенных групп: африканскую, европейскую, американскую, регион Юго-Западной и Южной Азии и регион Юго-Восточной Азии. Для ряда стран были выявлены уникальные аминокислотные замены (АК-замены) в белках E6/E7 ВПЧ16, предположительно, характерные для отдельных этнических групп. В основном они локализуются в сайтах известных В- и Т-клеточных эпитопов и относительно редко в структурно-функциональных доменах. Выявленные различия в АК-заменах у различных этнических групп и их колокализация с кластерами B- и T-клеточных эпитопов позволяют предположить их возможную взаимосвязь с географическим распределением аллелей и гаплотипов главного комплекса гистосовместимости (HLA). Это может приводить к распознаванию различного набора В- и Т-клеточных эпитопов вируса, что обусловливает региональные различия в направлении эпитопного дрейфа. В результате филогенетического анализа нуклеотидных последовательностей, кодирующих белок E6 ВПЧ16, выявлен общий предок, подтверждена региональная кластеризация последовательностей гена белка E6 по набору наиболее распространенных АК-замен, а также обнаружены случаи реверсии отдельных АК-замен при изменении региона распространения вируса. Для белка E7 аналогичный анализ был невозможен из-за высокой гомологии последовательностей. Ковариационный анализ совокупной выборки выявил отсутствие взаимосвязи между аминокислотными остатками в белке E6, в белке E7, а также между E6 и E7. Полученные в работе данные важны для разработки терапевтических вакцин против ВПЧ высокого канцерогенного риска