Аннотация:В нейросетевом синтаксическом анализаторе Natasha для построения базовых векторых представлений токенов используется словарь векторных представлений. Отсутствующие в нем токены получают одинаковое векторное представление («зашумленные» токены). В статье исследуется взаимосвязь качества синтаксического анализа и доли «зашумленных» токенов в предложении. Установлено, что в большинстве предложений от 20% до 40% токенов являются «зашумленными». На значительной доле этих предложений синтаксический анализатор достигает высоких значений по метрикам UAS и LAS. Однако выявлены и предложения, на которых синтаксический анализатор демонстрирует высокое качество работы, несмотря на высокую долю «зашумленных» токенов. В рамках данного исследования реализована программа, позволяющая извлекать базовые векторные представления токенов, используемые в синтаксическом анализе: https://github.com/Derinhelm/parser_stat/tree/natasha_emb.