научная статья

ИНФРАСТРУКТУРА ДЛЯ ШИРОКОМАСШТАБНОГО СБОРА ВЕБОМЕТРИЧЕСКИХ ПОКАЗАТЕЛЕЙ

Косяков Д.В.
Государственная публичная научно-техническая библиотека СО РАН
Институт нефтегазовой геологии и геофизики им. А. А. Трофимука Сибирского отделения Российской академии наук (ИНГГ СО РАН)
Труды ГПНТБ СО РАН
№ 1,5 / 2020
страницы: 86-97
Основной целью научных рейтингов является не только сравнение, но и стимулирование развития университетов и научных институтов, улучшение результативности их образовательных и исследовательских процессов. Однако существующие вебометрические рейтинги плохо для этого подходят из-за отсутствия возможности их анализа и достоверизации. Решением проблемы является изменение подхода к вебометрическим измерениям, в основе которого лежат принципы регулярного сбора и открытости исходных данных. Рассматриваются индикаторы, использующиеся в задачах академической вебометрики, их достоверность и устойчивость, обосновывается необходимость регулярного сбора значений этих индикаторов для повышения качества данных и анализа их динамики. На основе опыта реализации проекта по исследованию российского академического веб-пространства (http://www.webometrix.ru) анализируются проблемы, возникающие при сборе значений вебометрических индикаторов сайтов научноисследовательских организаций и учреждений высшего образования в мировом масштабе с частотой не менее 1 раза в месяц. Описывается реализованная автором распределенная система сбора значений вебометрических индикаторов и производится оценка необходимой степени распараллеливания процесса. Разработанный подход является универсальным для задач сбора больших объемов информации методом извлечения данных со страниц веб-сайтов, а сбор вебометрических данных является также актуальным для задач анализа других тематических сегментов веб-пространства, например сайтов библиотек.