научная статья

О ПОДХОДЕ К ТЕМАТИЧЕСКОЙ КЛАССИФИКАЦИИ ДОКУМЕНТОВ

Федотов А.М.
Институт вычислительных технологий СО РАН
Новосибирский государственный университет
Прозоров О.В.
Новосибирский государственный университет
Федотова О.А.
Новосибирский государственный университет
Государственная научно-техническая библиотека СО РАН
Бапанов А.А.
Евразийский национальный университет им. Л. Н. Гумилева
Вестник Новосибирского государственного университета. Серия: Информационные технологии
№ 1 / 2017
страницы: 79-88
Работа посвящена анализу подходов и алгоритмов классификации текстовых документов. Рассматривается подход к тематической классификации документов. Для этого используется специально построенная мера близости документов, учитывающая специфику предметной области. Значения весовых коэффициентов в формуле для вычисления меры близости определяются предполагаемой априорной достоверностью данных соответствующей шкалы.