并查集及其应用
概论
定义
并查集是一种树型的数据结构,用于处理一些不相交集合的合并及查询问题(即所谓的并、查)。比如说,我们可以用并查集来判断一个森林中有几棵树、某个节点是否属于某棵树等。
主要构成
并查集主要由一个整型数组pre[ ]和两个函数find( )、join( )构成。
数组 pre[ ] 记录了每个点的前驱节点是谁,函数 find(x) 用于查找指定节点 x 属于哪个集合,函数 join(x,y) 用于合并两个节点 x 和 y 。
作用
并查集的主要作用是求连通分支数(如果一个图中所有点都存在可达关系(直接或间接相连),则此图的连通分支数为1;如果此图有两大子图各自全部可达,则此图的连通分支数为2……)
并查集的应用
案例及其讲解
分析
其中每个帮派的教主可以随机选择,只要两个人的教主相同,他们就属于同一个帮派。其中的教主
指的就是代表元
。
代表元:用集合中的某个元素来代表这个集合,这个元素就被称为该集合的代表元。
用于找代表元的函数find(x)
pre[ ]数组用于记录每个人的上级是谁,层层查找直至找到主教,主教(即代表元)的特征为他的上级为他自己。
1 | int find(int x){ |
用于合并两个人所在帮派的函数join(x,y)
假设A帮派中的一个成员张三与B帮派中的一个成员李四想合并两个帮派,他们要做的事情有两点:
- 张三和李四分别找到他们各自的教主
- 你来随机指派一个人当合并后帮派的教主
写成函数即为
1 | void join(int x,int y){ |
例题:畅通工程
题目
Problem Description
某省调查城镇交通状况,得到现有城镇道路统计表,表中列出了每条道路直接连通的城镇。省政府“畅通工程”的目标是使全省任何两个城镇间都可以实现交通(但不一定有直接的道路相连,只要互相间接通过道路可达即可)。问最少还需要建设多少条道路?
Input
测试输入包含若干测试用例。每个测试用例的第1行给出两个正整数,分别是城镇数目N ( < 1000 )和道路数目M;随后的M行对应M条道路,每行给出一对正整数,分别是该条道路直接连通的两个城镇的编号。为简单起见,城镇从1到N编号。
注意:两个城市之间可以有多条道路相通,也就是说
3 3
1 2
1 2
2 1
这种输入也是合法的
当N为0时,输入结束,该用例不被处理。
Huge input, scanf is recommended.
Output
对每个测试用例,在1行里输出最少还需要建设的道路数目。
输入样例
1 | 4 2 |
输出样例
1 | 1 |
Code
1 |
|
优化
I. 路径压缩(优化find(x))
如果一个帮派中所有成员的上级都为教主,那么只需一步就可找到教主。
代码(递归写法)
1 | int find(int x){ |
缺陷
:只有当查找了某个节点的代表元(教主)后,才能对该查找路径上的各节点进行路径压缩。换言之,第一次执行查找操作的时候是实现没有压缩效果的,只有在之后才有效。