数据清洗:Python的列表的交集、并集、差集


运行环境 Runtime environment

1
2
3
操作系统: Windos10  
IDE: pycharm 2021.3.1 x64
语言: python v3.9.1

背景

数据清洗和结构化的时候,免不了要对两方数据进行对比或者合并。

Python列表的常见的三种集合操作,还是要记录一下。

代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
l1 = ['1','2','3','4']
l2 = ['3','4','5','6']

# 交集
result1 = [i for i in l1 if i in l2]
result2 = list(set(l1).intersection(set(l2)))
print(result1)
print(result2)

# 并集
result3 = list(set(l1).union(set(l2)))
print(result3)

# 差集
# 元素在 l1 不在 l2
result4 = list(set(l1).difference(set(l2)))
print(result4)

运行结果

总结

没啥总结的,就是日常应用。数据结构的处理基本功,贵在积累。