概论
定义
并查集是一种树型的数据结构,用于处理一些不相交集合的合并及查询问题(即所谓的并、查)。比如说,我们可以用并查集来判断一个森林中有几棵树、某个节点是否属于某棵树等。
主要构成
并查集主要由一个整型数组pre[ ]和两个函数find( )、join( )构成。 数组 pre[ ] 记录了每个点的前驱节点是谁,函数 find(x) 用于查找指定节点 x 属于哪个集合,函数 join(x,y) 用于合并两个节点 x 和 y 。
作用
并查集的主要作用是求连通分支数(如果一个图中所有点都存在可达关系(直接或间接相连),则此图的连通分支数为1;如果此图有两大子图各自全部可达,则此图的连通分支数为2……)
并查集的应用
案例及其讲解
分析
其中每个帮派的教主可以随机选择,只要两个人的教主相同,他们就属于同一个帮派。其中的教主
指的就是代表元
。
代表元:用集合中的某个元素来代表这个集合,这个元素就被称为该集合的代表元。
用于找代表元的函数find(x)
pre[ ]数组用于记录每个人的上级是谁,层层查找直至找到主教,主教(即代表元)的特征为他的上级为他自己。
int find(int x){
while(pre[x]!=x)
x=pre[x];
return x;
}
用于合并两个人所在帮派的函数join(x,y)
假设A帮派中的一个成员张三与B帮派中的一个成员李四想合并两个帮派,他们要做的事情有两点:
- 张三和李四分别找到他们各自的教主
- 你来随机指派一个人当合并后帮派的教主
写成函数即为
void join(int x,int y){
int a=find(x);
int b=find(y);
if(a!=b)
pre[a]=b;
}
例题:畅通工程
题目
Problem Description 某省调查城镇交通状况,得到现有城镇道路统计表,表中列出了每条道路直接连通的城镇。省政府“畅通工程”的目标是使全省任何两个城镇间都可以实现交通(但不一定有直接的道路相连,只要互相间接通过道路可达即可)。问最少还需要建设多少条道路?
Input 测试输入包含若干测试用例。每个测试用例的第1行给出两个正整数,分别是城镇数目N ( < 1000 )和道路数目M;随后的M行对应M条道路,每行给出一对正整数,分别是该条道路直接连通的两个城镇的编号。为简单起见,城镇从1到N编号。 注意:两个城市之间可以有多条道路相通,也就是说 3 3 1 2 1 2 2 1 这种输入也是合法的 当N为0时,输入结束,该用例不被处理。 Huge input, scanf is recommended.
Output 对每个测试用例,在1行里输出最少还需要建设的道路数目。
输入样例
4 2
1 3
4 3
3 3
1 2
1 3
2 3
5 2
1 2
3 5
999 0
0
输出样例
1
0
2
998
Code
#define _CRT_SECURE_NO_WARNINGS
#include<iostream>
#include<algorithm>
using namespace std;
int set[1010];
int findx(int x) {
int r = x;
while (r != set[r]) r = set[r];
return r;
}
void join(int x, int y) {
int a = findx(x);
int b = findx(y);
if(a!=b)
set[a] = b;
}
int main() {
int n, m;
while (cin >> n >> m && n) {
for (int i = 1; i <= n; i++) {
set[i] = i;
}
for (int i = 0; i < m; i++) {
int x, y;
cin >> x >> y;
join(x, y);
}
int count = 0;
for (int i = 1; i <= n; i++) {
if (set[i] == i) count++;
}
cout << count - 1 << endl;//N堆通路之间只需要N-1条道路即可全部连通
}
return 0;
}
优化
I. 路径压缩(优化find(x))
如果一个帮派中所有成员的上级都为教主,那么只需一步就可找到教主。
代码(递归写法)
int find(int x){
if(pre[x]==x) return x;
pre[x]=find(pre[x]);
return pre[x];
}
缺陷
:只有当查找了某个节点的代表元(教主)后,才能对该查找路径上的各节点进行路径压缩。换言之,第一次执行查找操作的时候是实现没有压缩效果的,只有在之后才有效。