平时做数据处理是不是就会用到,干脆就记录一下。

运行环境 Runtime environment

1
2
3
操作系统: Windos10  
IDE: JetBrains Pycharm 2019.2.4 x64
语言: Python 3.7.4

背景

python 去重一顿操作猛如虎,set list 扒拉下去,就去重了,但是顺序就打乱了。如果对顺序没有需要的话,这样确实没有什么所谓。
但是如果需要保留顺序的话,就需要一点小小的改变。

code && demo

  1. list去重,顺序乱掉

    1
    2
    3
    4
    5
    6
    7
    8
    # normal 写法
    l1 = ['b','c','d','b','c','a','a']
    l2 = list(set(l1))
    print(l2)

    # plus 写法
    l1 = ['b','c','d','b','c','a','a']
    l2 = {}.fromkeys(l1).keys()
  2. 去重后还是原list顺序

    1
    2
    3
    4
    5
    6
    7
    8
    # normal 写法
    l1 = ['b','c','d','b','c','a','a']
    l2 = list(set(l1))
    l2.sort(key=l1.index)

    # plus 写法
    l1 = ['b','c','d','b','c','a','a']
    l2 = sorted(set(l1),key=l1.index)
  3. 写循环代码实现

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    # normal 写法
    l1 = ['b','c','d','b','c','a','a']
    l2 = []
    for i in l1:
    if not i in l2:
    l2.append(i)

    # plus 写法

    l1 = ['b','c','d','b','c','a','a']
    l2 = []
    [l2.append(i) for i in l1 if not i in l2]
  4. 写while循环代码实现

    1
    2
    3
    4
    5
    6
    L = [3, 1, 2, 1, 3, 4]
    T = L[:]
    for i in L:
    while T.count(i) > 1:
    del T[T.index(i)]
    T.sort(key=L.index)
  5. lambda写法

    1
    2
    3
    L = [3, 1, 2, 1, 3, 4]
    func = lambda L,i: L if i in L else L + [i]
    T = reduce(func, [[], ] + L)

    备注:

  • ambda L,i: L if i in L else L + [i]    # 如果元素在列表中,那么返回列表本身,不在的话L + [i]
  • [[], ] + L # 等价于 [[], L],方便后面计算

总结

如果纠结空间复杂度的,用python干啥?
先谈能不能完成,再谈优化吧。