Система непересекающихся множеств

Система непересекающихся множеств (англ. disjoint-set, или union–find data structure) — структура данных, которая позволяет администрировать множество элементов, разбитое на непересекающиеся подмножества. При этом каждому подмножеству назначается его представитель — элемент этого подмножества. Абстрактная структура данных определяется множеством трёх операций: $\{\mathrm {Union} ,\mathrm {Find} ,\mathrm {MakeSet} \}$ .

Применяется для хранения компонент связности в графах, в частности, алгоритму Краскала необходима подобная структура данных для эффективной реализации.

Определение

Пусть $S$ конечное множество, разбитое на непересекающиеся подмножества (классы) $X_{i}$ :

S=X_{0}\cup X_{1}\cup X_{2}\cup \ldots \cup X_{k}:X_{i}\cap X_{j}=\varnothing \quad \forall i,j\in \lbrace 0,1,\ldots ,k\rbrace ,i\neq j

.

Каждому подмножеству $X_{i}$ назначается представитель $r_{i}\in X_{i}$ . Соответствующая система непересекающихся множеств поддерживает следующие операции:

$\mathrm {MakeSet} (x)$ : создаёт для элемента $x$ новое подмножество. Назначает этот же элемент представителем созданного подмножества.
$\mathrm {Union} (r,s)$ : объединяет оба подмножества, принадлежащие представителям $r$ и $s$ , и назначает $r$ представителем нового подмножества.
$\mathrm {Find} (x)$ : определяет для $x\in S$ подмножество, к которому принадлежит элемент, и возвращает его представителя.

Алгоритмическая реализация

Тривиальная реализация сохраняет принадлежность элементов из $S$ и представителей $r_{i}$ в индексном массиве. На практике же чаще используются множества деревьев. Это позволяет существенно сократить время, необходимое для операции Find. При этом представитель записывается в корень дерева, а остальные элементы класса в узлы под ним.

$\mathrm {Union} (r,s)$ : вешает корень более низкого дерева под корень более высокого дерева. Если при этом $r$ становится потомком $s$ , оба узла меняются местами.
$\mathrm {Find} (x)$ : проходит путь от $x$ до корня дерева и возвращает его (корень в данном случае является представителем).

Эвристики

Для ускорения операций Union и Find могут быть использованы эвристики Union-By-Size, Union-By-Height, Random-Union и сжатие путей.

В эвристике Union-By-Size во время операции $\mathrm {Union} (r,s)$ корень меньшего дерева вешается под корень большего дерева. Благодаря этому подходу сохраняется балансировка дерева. Глубина каждого поддерева $T$ не может превысить величину $\log \left|T\right|$ . При использовании этой эвристики время операции Find в худшем случае увеличивается с $O(\log n)$ до $O(n)$ . Для эффективной реализации предлагается сохранять в корне количество узлов в дереве.

Эвристика Union-By-Height аналогична Union-By-Size, но использует высоту дерева вместо размера.

В эвристике Random-Union используется тот факт, что можно не тратить дополнительные $O(n)$ памяти на сохранение количества узлов в дереве: достаточно выбирать корень случайным образом — такое решение даёт на случайных запросах скорость, вполне сравнимую с другими реализациями. Тем не менее, если имеется много запросов вида «объединить большое множество с маленьким», данная эвристика улучшает матожидание (то есть среднее время работы) всего в два раза, поэтому использовать её без эвристики сжатия путей не рекомендуется.

Эвристика сжатия путей используется, чтобы ускорить операцию $\mathrm {Find} (x)$ . При каждом новом поиске все элементы, находящиеся на пути от корня до искомого элемента, вешаются под корень дерева. В этом случае операция Find будет работать в среднем $\alpha (n)$ , где $\alpha$ — функция, обратная функции Аккермана. Это позволяет значительно ускорить работу, так как $\alpha$ для всех применяемых на практике значений принимает значение, меньшее 5.

Пример реализации

Реализация на C++:

const int MAXN = 1000;

int p[MAXN], rank[MAXN];

void MakeSet(int x) 
{
    p[x] = x;
    rank[x] = 0;
}

int Find(int x) 
{
    return ( x == p[x] ? x : p[x] = Find(p[x]) );
}

void Union(int x, int y) 
{
    if ( (x = Find(x)) == (y = Find(y)) )
        return;
	
    if ( rank[x] <  rank[y] )
        p[x] = y;
    else {
        p[y] = x;
        if ( rank[x] == rank[y] )
            ++rank[x];
    }
}

Реализация на Free Pascal:

const MAX_N = 1000;

var Parent , Rank : array [ 1 .. MAX_N ] of LongInt;

procedure swap ( var x , y : LongInt );
  var tmp : LongInt;
begin
  tmp := x; 
  x := y; 
  y := tmp;
end;

procedure MakeSet ( x : LongInt ) ;
begin
  Parent[x] := x;
  Rank[x] := 0;
end;

function Find ( x : LongInt ) : LongInt;
begin
  if ( Parent[x] <> x ) then
    Parent[x] := Find ( Parent[x] );
  Exit ( Parent[x] );
end;

procedure Union ( x , y : LongInt );
begin
  x := Find ( x );
  y := Find ( y );
  if ( x = y ) then exit();
  if ( Rank[x] < Rank[y] ) then swap ( x , y );
  
  Parent[y] := x;
  if ( Rank[x] = Rank[y] ) then
    inc ( Rank[x] );
end;

См. также

Лес непересекающихся множеств

Литература

Galler, Bernard A., and Michael J. Fisher. «An improved equivalence algorithm.» // Communications of the ACM, 7.5 (1964): 301—303. (англ.)
Tarjan, Robert E., and Jan Van Leeuwen. «Worst-case analysis of set union algorithms.» // Journal of the ACM 31.2 (1984): 245—281. (англ.)
Томас Кормен и др. Алгоритмы: построение и анализ = Introduction to Algorithms. — 2-е изд. — М.: «Вильямс», 2006. — С. 1296. — ISBN 0-07-013151-1.

Ссылки

Union-Find / Kevin Wayne, Pearson-Addison Wesley (англ.)
Chapter 22: Data Structures For Disjoint Sets / Introduction to Algorithms, Thomas H. Cormen, Charles E. Leiserson, and Ronald L. Rivest (англ.)
Визуализатор работы некоторых структур данных для непересекающихся множеств / ИТМО
Реализация непересекающихся множеств в коллекции библиотек C++ Boost, 2006

Структуры данных
Типы	Коллекция Контейнер
Абстрактные	Ассоциативный массив Многомерный ассоциативный массив Список Стек Очередь Двухсторонняя очередь Очередь с приоритетом Двухстороняя очередь с приоритетом Множество Мультимножество Система непересекающихся множеств
Массив	Битовая карта Кольцевой буфер Динамический массив Хеш-таблица Дерево хеш-таблицы^[англ.] Разреженная матрица
Связные^[англ.]	Ассоциативный список Связный список Список с пропусками Развёрнутый связный список Односвязный список Двусвязный список XOR-связный список
Деревья	B-дерево Двоичное дерево поиска AA-дерево^[англ.] AVL-дерево Красно-чёрное дерево Самобалансирующееся двоичное дерево поиска^[англ.] Splay-дерево Куча Двоичная куча Биномиальная куча Фибоначчиева куча R-дерево R*-дерево R+-дерево^[англ.] R-дерево Гильберта Префиксное дерево Hash tree^[англ.]
Графы	Бинарная диаграмма решений Ориентированный граф Ориентированный ациклический граф Гиперграф

Система непересекающихся множеств

Содержание

Определение

Алгоритмическая реализация

Эвристики

Пример реализации

См. также

Литература

Ссылки

Навигация

Система непересекающихся множеств

Определение

Алгоритмическая реализация

Эвристики

Пример реализации

См. также

Литература

Ссылки

Навигация

Поиск