美文网首页
获取一篇文章中出现最多的单词

获取一篇文章中出现最多的单词

作者: 冬月廿拾 | 来源:发表于2019-10-10 20:05 被阅读0次

代码片段来源:https://github.com/Show-Me-the-Code/python/tree/master/A1014280203/4

精彩代码片段

    for word in complete_text.lower().split():
        records[word] = records.get(word, 0) + 1

题目

任一个英文的纯文本文件,统计其中的单词出现的个数。

原思路:
  • 将文件中的转义符\n,\t替换成空格
  • 将文件内容以空格切成数组然后转为元组(去重) tuple_a
  • 再定义一个数组list_a 内容=文件内容以空格切隔
  • 建一个二维数组list_b,保存单词与对应的数量
  • 在一个white中(终止条件lista长度=0)用for遍历tuple_a,用for判断在list_a中是否存在,如果存在:在list_b中新增/修改 数组(单词,出现的次数),并使用下标将list_a对应的单词删除,跳出循环
问题点:

最后一步使用两个for稍微麻烦,二维数组list_b不好排序

新代码的精彩点:代码精简,且易于理解
#complete_text为文章内容('t 、're之类的缩写已转换)
#records为字典
    for word in complete_text.lower().split():
        records[word] = records.get(word, 0) + 1
  • 采取直接便利文章的方法,然后使用字典来记录单词及对应的次数
  • dict[key] = value ,字典的key不能重复,每次执行可以认为是修改
  • get()方法在字典中没有key时返回value=0,有则返回真实的value,用于计算单词出现的次数

相关文章

  • 获取一篇文章中出现最多的单词

    代码片段来源:https://github.com/Show-Me-the-Code/python/tree/ma...

  • 取出一篇英文文章出现最多的单词

    前段时间面试遇见一个面试题,虽然思路大体对了,但是细节上做的很不好。所以把这个代码敲一遍运行成功并在细节地方解析一...

  • MapReduce 之倒排索引

    倒排索引 介绍: 即是 统计每篇文章 每个单词出现的次数,以此达到在搜索引擎中 搜索关键字,检索出出现关键字 最多...

  • python面试题-2018-01-29

    用python实现统计一篇英文文章内每个单词的出现频率,并返回出现频率最高的前10个单词及其出现次数,并解答以下问...

  • 打卡29天(6.24)

    今天用了艾宾浩斯遗忘曲线,复习了两篇,开始有那种感觉-别的文章中的生单词,会在另一篇中出现,变为认识的单词。 “我...

  • Python统计单词出现的次数

    -摘抄自网络作者:FOOFISH-PYTHON之禅 题目:统计一个文件中每个单词出现的次数,列出出现频率最多的5个...

  • NLP 的中文分词技术之规则分词

    在英语中,单词本身就是词的表达,一篇英文文章由单词和分隔符组成,而在汉语中,词是以字为基本单位的,但是一篇文章的语...

  • 如何阅读一篇英语文章

    如何阅读一篇英语文章2018.09.26 写 预习:查字词-标记不认识的单词和词组-单词分类重要的动词重复出现的本...

  • 获取字符串中出现次数最多的字符

    获取字符串中出现次数最多的字符。

  • 819. 最常见的单词

    给定一个段落 (paragraph) 和一个禁用单词列表 (banned)。返回出现次数最多,同时不在禁用列表中的...

网友评论

      本文标题:获取一篇文章中出现最多的单词

      本文链接:https://www.haomeiwen.com/subject/ehmapctx.html