使用python统计一段字符串当中,某一个字符重复出现的次数。


运行环境 Runtime environment

1
2
3
操作系统: Windos10  
IDE: pycharm 2020.3.2 x64
语言: python v3.9.1

背景

近日,其他部门提出的采集需求。

需要使用到公司内部数据库某一字段的值,去目标网站进行检索。

目标网站搜索词的联想词排序情况复杂,所以需要对搜索词进行切割穷举组合,再分别拿去搜索的。

切割成多少段,是根据特定连接符号决定的,但是由于切割段数过多,穷举数量就会爆炸增长。

在此,需要统计字符串中存在多少个连接符号,来决定是穷举搜索,还是舍弃该词的搜索操作。

方法说明

(str).count()

count(str[,start][,end])

1
2
3
4
5
判断字符串中,

从start开始的下标到字符串的结尾end中出现了多少个str (给定字符)

如果 start到end 没写 默认 从头到尾字符串中出现str出现的次数

代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14

# 依据 & 符号切割

temp_str = "Neomycin Sulfate & Polymyxin B Sulfate & Estradiol Valerate & Testosterone Enanthate"

print(temp_str.count("&"))
#(输出) 3 表示从字符串左到右 有 3 个 & 符号

print(temp_str.count("&",21,len(temp_str))) #就是从下标8以后开始
#(输出) 2 表示从字符串左到右的第20个字符开始 有 2 个 & 符号

print(temp_str.count("&",41,len(temp_str))) #就是从下标9以后开始
#(输出) 1 表示从字符串左到右的第 41 个字符开始 有 1 个 & 符号

总结

字符串处理,统计某些特殊字符的数量,可以作为逻辑的判断依据。

又可做某些简单的词频统计。