有时,我们需要统计一篇英语小短文中每一个英文字母呈现的次数,这个用手工统计显然不成能完当作。即使共同电脑进行,也可能需要良多久。这时我们可以利用python编写一个小程序,很轻松的完当作这个工作。下面看我一步步操作。
东西/原料
- python3.7
方式/步调
- 1
第一步,先读入指心猿意马文件的内容。因为这个文件比力小,可以直接读入。若是文件较大,可以逐行或分部门读入内存。
- 2
第二步,对读入的文本将标点等特别符号、换行符、空格等替代为空。这一步比力主要,称为数据清洗,一般利用遍历+string.replace(old,new)来完当作。
- 3
第三步,将全文同一转换当作小写字母。这是为了便于统计,若是工作要求巨细写字母分隔统计,这一步可以不操作。
- 4
第四步,成立统计字典,对文本逐个遍历进行统计。利用字典get方式,已有的字母次数加上,没有字母写入字典。
- 5
第五步,按统计值进行排序。将字典键值对转化为列表,然后再对列表按值进行降序摆列。
- 6
第六步,按排序成果插手文本后面。利用追加的体例读入文件,然后遍历列表,将字母及对应成果写入文件。
注重事项
- 这个小程序除了可以用来统计字母,也可以稍微革新一下用来统计单词呈现的频度,这样对于阐发作者写作特点,文章的中间思惟很有帮忙。
- 接待大师和我交流。
来源:百闻(微信/QQ号:9397569),转载请保留出处和链接!
本文链接:https://www.ibaiwen.com/web/280343.html
- 上一篇: 招商银行专业版怎么下载
- 下一篇: 修理工具图片设计
- 热门文章
-
WB蒙特利尔(WB Montreal)——欧美十大最差视频游戏开发商
迅猛龙(Velociraptor)——欧美史前十大死亡动物
什么是果酱猫(What Marmalade Cats)?
神奇蜘蛛侠2(The Amazing Spider-Man 2)——欧美最佳蜘蛛侠电影
faceu激萌怎么把瘦脸开到最大
希瑟(Heather)——欧美十大最佳柯南灰歌
奥兹奥斯本(Ozzy Osbourne)——欧美十大高估歌手
二人梭哈
什么是小脑前下动脉(Anterior Inferior Cerebellar Artery)?
我应该知道康涅狄格州的什么(What Should I Know About Connecticut)?
- 热评文章
- 最新评论
-
- 最近访客
-
- 站点信息
-
- 文章总数:261580
- 页面总数:9
- 分类总数:1
- 标签总数:0
- 评论总数:0
- 浏览总数:74382