文本内容:
我是中国人
word_list
我是中国人
word_list
我是中国人
word!list
我是中国人
word!list
wordlist
kobe
china
china
china
butler
hello
哈喽
world
world
代码展示:
import re
def fun_count():
word_list = []
with open("test.txt", "r", encoding='utf-8') as f:
f_file = f.readlines()
for line in f_file:
if line.strip() != '':
line_word = re.findall(r"[a-zA-Z]+", line) # todo 利用切片把Word取出来,返回是一个list
word_list += line_word # todo 把Word汇总成一个list
return word_list
def main():
word_dict = {}
word_dict1={}
result = fun_count()
for item in result:
if item not in word_dict:
word_dict[item] = 1
else:
word_dict[item] += 1
word_result=sorted(word_dict.items(),key=lambda x:x[1],reverse=True)
for item1 in word_result:
word_dict1[item1[0]]=item1[1]
return word_dict1
if __name__ == '__main__':
res = main()
print(res)
执行结果:
{'word': 4, 'list': 4, 'china': 3, 'world': 2, 'wordlist': 1, 'kobe': 1, 'butler': 1, 'hello': 1}
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/123209.html