这两天“格路”一词频上热搜,您知道啥叫“格路”吗?
格路音自东北方言(实际是山东方言),为日常生活用语,格外不同,路数不大众之意。说白了,就是有点儿特立独行,独特。
呵呵,您别说,文件中也有“格路”的,那就是独特行,是与任何其他行都不同的行。它们默默地混迹于重复行中,没有两把刷子,您是很难快速确定一个文件中有多少独特行的。
Python可以。
思路:
代码:
f = open('file') # ①打开目标文件
ls = f.readlines() # ②读取行为列表
s1 = set(ls) # ③转列表为集合,元素为重复行代表+独特行
for i in s1: # ④将去重后的行自列表逐一移除
ls.remove(i)
s2 = set(ls) # ⑤转移除后的列表为集合,元素为重复行代表
print('本文有{}独特行'.format(len(s1)-len(s2)))
还可以根据字典的特点,采用遍历的方法,以行为键,统计对应值为1的行:
f = open('file')
d = {}
for i in f:
d[i] = d.get(i, 0) + 1
count = 0
for k in d.keys():
if d[k] == 1:
count += 1
print('本文有{}独特行'.format(count))
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/106952.html