Иерархический алгоритм кластеризации графа для анализа семантических WEB-данных

Аннотация: 
В работе рассмотрен алгоритм кластеризации, с помощью которого осуществляется иерархическое разбиение взвешенного графа. На различных уровнях разбиение содержит разное число кластеров (множеств вершин), причем кластеры в разбиении более низкого уровня являются подмножествами кластеров более высоких уровней. Работа алгоритма проанализирована на примере построения формальной классификации областей знаний на основе данных об отнесении индексируемых в наукометрической базе изданий к конкретным областям знаний (предметным областям или их разделам~--- предметным категориям). В базе каждое издание (журнал, материалы конференции, сборник) отнесены к одной или нескольким категориям. По этим данным вычисляется показатель корреляции между областями знаний, причем ребру графа, вершинам которого соответствуют области знаний, присваивается вес, равный значению этого показателя корреляции. Предлагаемый подход может использоваться для оценки интенсивности взаимодействия между исследователями, работающими в различных областях знаний и динамики такой интенсивности по годам.