Аннотация:Представлен метод автоматизированного выделения свойств матери-
алов из полнотекстовых научных статей, основанный на разработанных алгорит-
мах распознавания, стандартизации и связывания элементных составов материалов
с их физическими характеристиками. Рассмотрено программное средство извлече-
ния выбранных свойств сплавов-припоев и спаянных соединений из текста и таблиц,
реализующее данный метод. Предложены последовательность обработки и способ
токенизации текста, позволившие достичь полноты и точности извлечения целевой
информации > 90 % на тестовой выборке. Показано, что представленный метод
обработки может быть применен к публикациям, относящимся к иным областям
материаловедения. Сделан вывод о возможности формирования тематических баз
данных свойств материалов с использованием метода.