|
ИСТИНА |
Войти в систему Регистрация |
ИСТИНА ПсковГУ |
||
Представлен метод автоматизированного выделения свойств материалов из полнотекстовых научных статей, основанный на разработанных алгоритмах распознавания, стандартизации и связывания элементных составов материалов с их физическими характеристиками. Рассмотрено программное средство извлечения выбранных свойств сплавов-припоев и спаянных соединений из текста и таблиц, реализующее данный метод. Предложены последовательность обработки и способ токенизации текста, позволившие достичь полноты и точности извлечения целевой информации > 90 % на тестовой выборке. Показано, что представленный метод обработки может быть применен к публикациям, относящимся к иным областям материаловедения. Сделан вывод о возможности формирования тематических баз данных свойств материалов с использованием метода.