让您的代码更弱小-六个顶级Python库 (让您的代码更精准)
本文将引见用于人造言语处置义务的6个最佳/target=_blankclass=infotextkey>Python库。无论是初学者还是阅历丰盛的开发人员,都能从中取得启示和协助,优化在NLP畛域的通常才干。
Pynlpir是一个十分低劣的Python中文人造言语处置库。它提供了一系列性能,包含分词、词性标注、命名实体识别等。Pynlpir的装置和经常使用相对繁难,可以经过pip包治理器启动装置。经过导入Pynlpir库,你可以轻松地在Python代码中调用关系函数启动中文文本处置。
如下是经常使用Pynlpir启动中文文本分词的示例代码:
importpynlpir#输入文本启动分词text="这是一段中文文本,咱们经常使用pynlpir启动分词"result=pynlpir.segment(text)print(result)
口头结果如下:
[('这是','r'),('一','m'),('段','q'),('中文','nz'),('文本','n'),(',','w'),('咱们','r'),('经常使用','v'),('pynlpir','nz'),('启动','v'),('分词','n')]
2.Polyglot
Polyglot是一个开源的Python库,用于启动各种人造言语处置(NLP)操作。它基于Numpy,并且具备出色的性能和少量的公用命令。
Polyglot之所以在NLP中如此有用,是由于它支持宽泛的多言语运行。依据其文档,Polyglot支持165种言语的分词,196种言语的言语检测,以及16种言语的词性标注等性能。
如下经常使用Polyglot启动中文分词的示例代码。首先导入Polyglot的Text类,而后创立一个Text对象并传入中文文本。经过访问Text对象的s属性,咱们可以失掉文本的分词结果。最后,咱们遍历分词结果并打印每个分词。
frompolyglot.textimportTexttext=Text("我青睐经常使用Polyglot启动中文文本处置。")tokens=text.wordsfortokenintokens:print(token)
输入结果如下:
我青睐经常使用Polyglot启动中文文本处置。
Pattern是一特性能弱小的Python库,用于人造言语处置(NLP)、数据开掘、网络剖析、机器学习和可视化等义务。它提供了一系列模块和工具,繁难开发人员处置文本数据和启动关系剖析。
以下是一个经常使用Pattern库启动繁难文本处置的示例代码:
frompattern.enimportsentiment,pluralize#文本情感剖析text="IlovePatternlibrary!"sentiment_score=sentiment(text)print(f"SentimentScore:{sentiment_score}")#双数方式转换word="le"plural_word=pluralize(word)print(f"Singular:{word}")print(f"Plural:{plural_word}")
输入结果如下:
SentimentScore:(0.5,0.6)Singular:applePlural:apples
4.scikit-learn
scikit-learn是一个最后作为SciPy库的第三方裁减而产生的Python库,如今已成为一个独立的Python库并托管在上。它被大公司如Spotify宽泛经常使用,经常使用它有许多好处。首先,它关于经典的机器学习算法十分有用,例如渣滓邮件检测、图像识别、预测和客户细分等义务。
除此之外,scikit-learn也可以用于人造言语处置(NLP)义务,如文本分类。文本分类是监视学习中最关键的义务之一,scikit-learn提供了丰盛的性能来支持文本分类。另一个关键的运行场景是情感剖析,经过数据剖析来剖析观念或情感,scikit-learn能够协助启动情感剖析。
这里以scikit-learn启动中文文本特色值抽取为例,代码如下:
fromsklearn.feature_extraction.textimportCountVectorizerdefcount_chinese_demo():data=["我爱吃火锅","我爱喝奶茶"]#1.实例化一个转换器类transfer=CountVectorizer()#2.调用fit_transform()data_new=transfer.fit_transform(data)#CountVectorizer()无法以设置sparse矩阵#toarray()方法可以将sparse矩阵转成二维数组print("data_new:n",data_new.toarray())print("特色值称号:n",transfer.get_feature_names_out())if__name__=="__mn__":count_chinese_demo()
输入结果:
data_new:[[10][01]]特色值称号:['我爱吃火锅''我爱喝奶茶']
5.TextBlob
TextBlob是一个用于处置文本数据的Python库。它提供一个繁难的API,可用于深化钻研经常出现的NLP义务,如词性标注、名词短语提取、情感剖析、文本翻译、分类等。
以下是一个经常使用TextBlob启动情感剖析的示例代码,并输入结果:
fromtextblobimportTextBlobtext="Ilovethisproduct!It'samazing."blob=TextBlob(text)sentiment=blob.sentiment.polarityifsentiment>0:print("Positivesentiment")elifsentiment<0:print("Negativesentiment")else:print("Neutralsentiment")
PyTorch是由Facebook的人工自动钻研团队于2016年创立的开源库。该库的称号源自Torch,这是一个经常使用Lua编程言语编写的深度学习框架。Pytorch能够口头许多义务,尤其适用于NLP和计算机视觉等深度学习运行,具备弱小的API,可以用于裁减库,并领有人造言语处置工具包。
收藏!3个最佳学习Python编程的开源库
1、learn-python3
这个存储库一共有19本Jupyter笔记本。它涵盖了字符串和条件之类的基础知识,然后讨论了面向对象编程,以及如何处理异常和一些Python标准库的特性等。每一个主题都有一个“notebook”链接,它会向你介绍该主题和一些示例代码,当你完成这些内容之后,还有一个练习链接,点击后你就可以做一些测试题。
项目地址:、learn-python
这个存储库还可以作为Python的介绍,帮助你从初级水平上升至中级,这里的中级指的是熟练地使用这种编程语言,而不仅仅是简单的循环和算法。该存储库是一个Python脚本集合,每个脚本都是一个核心类别的子主题,比如“操作符”、“数据类型”和“控制流”。
你不必完整地学习该课程,正如作者指出的那样,你还可以将存储库用作备忘单,在需要的时候,快速查找,查看文档,查看代码,然后运行测试,看代码是否能正常运行,是否按照代码准则编写。
项目地址:、full-speed-python
该存储库快速介绍了字符串和列表等基础知识,然后快速深入到更高级的主题,“类”和“异步编程”等,作者在写这本书时采用了一种实用的方法,用代码示例简要介绍了每个主题,然后直接跳到练习问题,让读者可以自己尝试。你可以在项目详情页下载pdf/epub文件。
项目地址:关于3个最佳学习Python编程的开源库,青藤小编就和您分享到这里了。如果您对python编程有浓厚的兴趣,希望这篇文章可以为您提供帮助。如果您还想了解更多关于python编程的技巧及素材等内容,可以点击本站的其他文章进行学习。
Python 常用的标准库以及第三方库有哪些
Python常用库大全,看看有没有你需要的。 环境管理管理 Python 版本和环境的工具p – 非常简单的交互式 python 版本管理工具。 pyenv – 简单的 Python 版本管理工具。 Vex – 可以在虚拟环境中执行命令。 virtualenv – 创建独立 Python 环境的工具。 virtualenvwrapper- virtualenv 的一组扩展。 包管理管理包和依赖的工具。 pip – Python 包和依赖关系管理工具。 pip-tools – 保证 Python 包依赖关系更新的一组工具。 conda – 跨平台,Python 二进制包管理工具。 Curdling – 管理 Python 包的命令行工具。 wheel – Python 分发的新标准,意在取代 eggs。 包仓库本地 PyPI 仓库服务和代理。 warehouse – 下一代 PyPI。 Warehousebandersnatch – PyPA 提供的 PyPI 镜像工具。 devpi – PyPI 服务和打包/测试/分发工具。 localshop – 本地 PyPI 服务(自定义包并且自动对 PyPI 镜像)。 分发打包为可执行文件以便分发。 PyInstaller – 将 Python 程序转换成独立的执行文件(跨平台)。 dh-virtualenv – 构建并将 virtualenv 虚拟环境作为一个 Debian 包来发布。 Nuitka – 将脚本、模块、包编译成可执行文件或扩展模块。 py2app – 将 Python 脚本变为独立软件包(Mac OS X)。 py2exe – 将 Python 脚本变为独立软件包(Windows)。 pynsist – 一个用来创建 Windows 安装程序的工具,可以在安装程序中打包 Python本身。 构建工具将源码编译成软件。 buildout – 一个构建系统,从多个组件来创建,组装和部署应用。 BitBake – 针对嵌入式 Linux 的类似 make 的构建工具。 fabricate – 对任何语言自动找到依赖关系的构建工具。 PlatformIO – 多平台命令行构建工具。 PyBuilder – 纯 Python 实现的持续化构建工具。 SCons – 软件构建工具。 交互式解析器交互式 Python 解析器。 IPython – 功能丰富的工具,非常有效的使用交互式 Python。 bpython- 界面丰富的 Python 解析器。 ptpython – 高级交互式Python解析器, 构建于python-prompt-toolkit 之上。 文件文件管理和 MIME(多用途的网际邮件扩充协议)类型检测。 imghdr – (Python 标准库)检测图片类型。 mimetypes – (Python 标准库)将文件名映射为 MIME 类型。 – 对 进行封装的模块。 pathlib – (Python3.4+ 标准库)跨平台的、面向对象的路径操作库。 python-magic- 文件类型检测的第三方库 libmagic 的 Python 接口。 Unipath- 用面向对象的方式操作文件和目录watchdog – 管理文件系统事件的 API 和 shell 工具日期和时间操作日期和时间的类库。 arrow- 更好的 Python 日期时间操作类库。 Chronyk – Python 3 的类库,用于解析手写格式的时间和日期。 dateutil – Python datetime 模块的扩展。 delorean- 解决 Python 中有关日期处理的棘手问题的库。 moment – 一个用来处理时间和日期的Python库。 灵感来自于。 PyTime – 一个简单易用的Python模块,用于通过字符串来操作日期/时间。 pytz – 现代以及历史版本的世界时区定义。 将时区数据库引入Python。 – 提供用户友好的函数来帮助用户进行常用的日期和时间操作。 文本处理用于解析和操作文本的库。 通用chardet – 字符编码检测器,兼容 Python2 和 Python3。 difflib – (Python 标准库)帮助我们进行差异化比较。 ftfy – 让Unicode文本更完整更连贯。 fuzzywuzzy – 模糊字符串匹配。 Levenshtein – 快速计算编辑距离以及字符串的相似度。 – 在中日韩语字符和数字字母之间添加空格。 pyfiglet -figlet 的 Python实现。 shortuuid – 一个生成器库,用以生成简洁的,明白的,URL 安全的 UUID。 unidecode – Unicode 文本的 ASCII 转换形式 。 uniout – 打印可读的字符,而不是转义的字符串。 xpinyin – 一个用于把汉字转换为拼音的库。
免责声明:本文转载或采集自网络,版权归原作者所有。本网站刊发此文旨在传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及版权、内容等问题,请联系本网,我们将在第一时间删除。同时,本网站不对所刊发内容的准确性、真实性、完整性、及时性、原创性等进行保证,请读者仅作参考,并请自行核实相关内容。对于因使用或依赖本文内容所产生的任何直接或间接损失,本网站不承担任何责任。