статья в сборнике трудов конференции

Классификация научных текстов посредством сжатия аннотаций на примере публикаций, индексируемых в библиографической базе данных Scopus

Селиванова И.В.
Государственная публичная научно-техническая библиотека СО РАН
Новосибирский национальный исследовательский государственный университет
Распределенные информационно-вычислительные ресурсы. Цифровые двойники и большие данные. (DICR-2019)(Труды XVII Международной конференции)
№ / 2019
страницы: 178-184
В работе исследуется возможность применения метода автоматической классификации научных текстов на основе сжатия данных, успешно применявшегося к полным текстам научных статей к классификации текстов на основе аннотаций. Для классификации были использованы библиографические описания публикаций из базы данных Scopus. Сравнение результатов проводилось с использованием тематических рубрик Scopus. Выявлено, что построение обучающей выборки на основе высокоцитируемых публикаций улучшает качество классификации.