Аннотация:Курсовая работа посвящена использованию частоты основного тона в задаче распознавания эмоций диктора по голосу, особенностям алгоритмов для определения частоты основного тона.
В работе были рассмотрены разные методы определения частоты основного тона: методы временной области (основанные на временной динамике сигнала), методы частотной области (основанные на частотной структуре сигнала) и комбинированные методы (использующие как частотную, так и временную информацию о сигнале). Была представлена реализация некоторых методов на языке Python, сопровождаемая теоретическим подкреплением. Также был проведен ряд экспериментов, в ходе которых модель распознавания эмоций была обучена отдельно на мел-частотных кепстральных коэффициентах, частотах основного тона, а также на комбинации этих признаков. Далее полученные точности сравнивались для выявления оптимальной характеристики звукового сигнала для рассматриваемой задачи.