PyPDF2:用来处理pdf文件的工具集
-提供了一批处理PDF文件的计算功能
-支持获取信息,分隔/整合文件,加密解密等
-Python实现,不需要额外依赖
NLTK:自然语言文本处理第三方库
-提供可一批简单易用的自然语言文本处理功能
-支持语言文本分类,标记,语法句法,语义分析等
-最优秀的Python自然语言处理库
Python-docx:创建或更新MS Word文件的第三方库
-提供创建或更新.doc .docx等文件的计算功能
-增加并配置段落,图片,表格,文字等,功能全面
网友评论