概论

定义

并查集是一种树型的数据结构,用于处理一些不相交集合的合并及查询问题(即所谓的并、查)。比如说,我们可以用并查集来判断一个森林中有几棵树、某个节点是否属于某棵树等。

主要构成

并查集主要由一个整型数组pre[ ]和两个函数find( )、join( )构成。 数组 pre[ ] 记录了每个点的前驱节点是谁,函数 find(x) 用于查找指定节点 x 属于哪个集合,函数 join(x,y) 用于合并两个节点 x 和 y 。

作用

并查集的主要作用是求连通分支数(如果一个图中所有点都存在可达关系(直接或间接相连),则此图的连通分支数为1;如果此图有两大子图各自全部可达,则此图的连通分支数为2……)

并查集的应用

案例及其讲解

江湖门派

分析

其中每个帮派的教主可以随机选择,只要两个人的教主相同,他们就属于同一个帮派。其中的教主指的就是代表元

代表元:用集合中的某个元素来代表这个集合,这个元素就被称为该集合的代表元。

用于找代表元的函数find(x)

pre[ ]数组用于记录每个人的上级是谁,层层查找直至找到主教,主教(即代表元)的特征为他的上级为他自己。

int find(int x){
    while(pre[x]!=x)
        x=pre[x];
    return x;
}

用于合并两个人所在帮派的函数join(x,y)

假设A帮派中的一个成员张三与B帮派中的一个成员李四想合并两个帮派,他们要做的事情有两点:

  1. 张三和李四分别找到他们各自的教主
  2. 你来随机指派一个人当合并后帮派的教主

写成函数即为

void join(int x,int y){
    int a=find(x);
    int b=find(y);
    if(a!=b)
        pre[a]=b;
}

例题:畅通工程

题目

Problem Description 某省调查城镇交通状况,得到现有城镇道路统计表,表中列出了每条道路直接连通的城镇。省政府“畅通工程”的目标是使全省任何两个城镇间都可以实现交通(但不一定有直接的道路相连,只要互相间接通过道路可达即可)。问最少还需要建设多少条道路?

Input 测试输入包含若干测试用例。每个测试用例的第1行给出两个正整数,分别是城镇数目N ( < 1000 )和道路数目M;随后的M行对应M条道路,每行给出一对正整数,分别是该条道路直接连通的两个城镇的编号。为简单起见,城镇从1到N编号。 注意:两个城市之间可以有多条道路相通,也就是说 3 3 1 2 1 2 2 1 这种输入也是合法的 当N为0时,输入结束,该用例不被处理。 Huge input, scanf is recommended.

Output 对每个测试用例,在1行里输出最少还需要建设的道路数目。

输入样例

4 2
1 3
4 3
3 3
1 2
1 3
2 3
5 2
1 2
3 5
999 0
0

输出样例

1
0
2
998

Code

#define _CRT_SECURE_NO_WARNINGS
#include<iostream>
#include<algorithm>
using namespace std;
int set[1010];
int findx(int x) {
	int r = x;
	while (r != set[r]) r = set[r];
	return r;
}
void join(int x, int y) {
	int a = findx(x);
	int b = findx(y);
	if(a!=b)
	set[a] = b;
}
int main() {
	int n, m;
	while (cin >> n >> m && n) {
		for (int i = 1; i <= n; i++) {
			set[i] = i;
		}
		for (int i = 0; i < m; i++) {
			int x, y;
			cin >> x >> y;
			join(x, y);
		}
		int count = 0;
		for (int i = 1; i <= n; i++) {
			if (set[i] == i) count++;
		}
		cout << count - 1 << endl;//N堆通路之间只需要N-1条道路即可全部连通
	}
	return 0;
}

优化

I. 路径压缩(优化find(x))

如果一个帮派中所有成员的上级都为教主,那么只需一步就可找到教主。

代码(递归写法)

int find(int x){
    if(pre[x]==x) return x;
    pre[x]=find(pre[x]);
    return pre[x];
}

缺陷:只有当查找了某个节点的代表元(教主)后,才能对该查找路径上的各节点进行路径压缩。换言之,第一次执行查找操作的时候是实现没有压缩效果的,只有在之后才有效。