当前位置：首页 > 数码 > 正文内容

让您的代码更弱小-六个顶级Python库 (让您的代码更精准)

admin2年前 (2024-05-13)数码450

本文将引见用于人造言语处置义务的6个最佳/target=_blankclass=infotextkey>Python库。无论是初学者还是阅历丰盛的开发人员，都能从中取得启示和协助，优化在NLP畛域的通常才干。

Pynlpir是一个十分低劣的Python中文人造言语处置库。它提供了一系列性能，包含分词、词性标注、命名实体识别等。Pynlpir的装置和经常使用相对繁难，可以经过pip包治理器启动装置。经过导入Pynlpir库，你可以轻松地在Python代码中调用关系函数启动中文文本处置。

如下是经常使用Pynlpir启动中文文本分词的示例代码：

importpynlpir#输入文本启动分词text="这是一段中文文本，咱们经常使用pynlpir启动分词"result=pynlpir.segment(text)print(result)

口头结果如下：

[('这是','r'),('一','m'),('段','q'),('中文','nz'),('文本','n'),('，','w'),('咱们','r'),('经常使用','v'),('pynlpir','nz'),('启动','v'),('分词','n')]

2.Polyglot

Polyglot是一个开源的Python库，用于启动各种人造言语处置（NLP）操作。它基于Numpy，并且具备出色的性能和少量的公用命令。

Polyglot之所以在NLP中如此有用，是由于它支持宽泛的多言语运行。依据其文档，Polyglot支持165种言语的分词，196种言语的言语检测，以及16种言语的词性标注等性能。

如下经常使用Polyglot启动中文分词的示例代码。首先导入Polyglot的Text类，而后创立一个Text对象并传入中文文本。经过访问Text对象的s属性，咱们可以失掉文本的分词结果。最后，咱们遍历分词结果并打印每个分词。

frompolyglot.textimportTexttext=Text("我青睐经常使用Polyglot启动中文文本处置。")tokens=text.wordsfortokenintokens:print(token)

输入结果如下：

我青睐经常使用Polyglot启动中文文本处置。

Pattern是一特性能弱小的Python库，用于人造言语处置（NLP）、数据开掘、网络剖析、机器学习和可视化等义务。它提供了一系列模块和工具，繁难开发人员处置文本数据和启动关系剖析。

以下是一个经常使用Pattern库启动繁难文本处置的示例代码：

frompattern.enimportsentiment,pluralize#文本情感剖析text="IlovePatternlibrary!"sentiment_score=sentiment(text)print(f"SentimentScore:{sentiment_score}")#双数方式转换word="le"plural_word=pluralize(word)print(f"Singular:{word}")print(f"Plural:{plural_word}")

输入结果如下：

SentimentScore:(0.5,0.6)Singular:applePlural:apples

4.scikit-learn

scikit-learn是一个最后作为SciPy库的第三方裁减而产生的Python库，如今已成为一个独立的Python库并托管在上。它被大公司如Spotify宽泛经常使用，经常使用它有许多好处。首先，它关于经典的机器学习算法十分有用，例如渣滓邮件检测、图像识别、预测和客户细分等义务。

除此之外，scikit-learn也可以用于人造言语处置（NLP）义务，如文本分类。文本分类是监视学习中最关键的义务之一，scikit-learn提供了丰盛的性能来支持文本分类。另一个关键的运行场景是情感剖析，经过数据剖析来剖析观念或情感，scikit-learn能够协助启动情感剖析。

这里以scikit-learn启动中文文本特色值抽取为例，代码如下：

fromsklearn.feature_extraction.textimportCountVectorizerdefcount_chinese_demo():data=["我爱吃火锅","我爱喝奶茶"]#1.实例化一个转换器类transfer=CountVectorizer()#2.调用fit_transform()data_new=transfer.fit_transform(data)#CountVectorizer()无法以设置sparse矩阵#toarray()方法可以将sparse矩阵转成二维数组print("data_new:n",data_new.toarray())print("特色值称号：n",transfer.get_feature_names_out())if__name__=="__mn__":count_chinese_demo()

输入结果：

data_new:[[10][01]]特色值称号：['我爱吃火锅''我爱喝奶茶']

5.TextBlob

TextBlob是一个用于处置文本数据的Python库。它提供一个繁难的API，可用于深化钻研经常出现的NLP义务，如词性标注、名词短语提取、情感剖析、文本翻译、分类等。

以下是一个经常使用TextBlob启动情感剖析的示例代码，并输入结果：

fromtextblobimportTextBlobtext="Ilovethisproduct!It'samazing."blob=TextBlob(text)sentiment=blob.sentiment.polarityifsentiment>0:print("Positivesentiment")elifsentiment<0:print("Negativesentiment")else:print("Neutralsentiment")

PyTorch是由Facebook的人工自动钻研团队于2016年创立的开源库。该库的称号源自Torch，这是一个经常使用Lua编程言语编写的深度学习框架。Pytorch能够口头许多义务，尤其适用于NLP和计算机视觉等深度学习运行，具备弱小的API，可以用于裁减库，并领有人造言语处置工具包。

收藏!3个最佳学习Python编程的开源库

1、learn-python3

这个存储库一共有19本Jupyter笔记本。它涵盖了字符串和条件之类的基础知识，然后讨论了面向对象编程，以及如何处理异常和一些Python标准库的特性等。每一个主题都有一个“notebook”链接，它会向你介绍该主题和一些示例代码，当你完成这些内容之后，还有一个练习链接，点击后你就可以做一些测试题。

项目地址：、learn-python

这个存储库还可以作为Python的介绍，帮助你从初级水平上升至中级，这里的中级指的是熟练地使用这种编程语言，而不仅仅是简单的循环和算法。该存储库是一个Python脚本集合，每个脚本都是一个核心类别的子主题，比如“操作符”、“数据类型”和“控制流”。

你不必完整地学习该课程，正如作者指出的那样，你还可以将存储库用作备忘单，在需要的时候，快速查找，查看文档，查看代码，然后运行测试，看代码是否能正常运行，是否按照代码准则编写。

项目地址：、full-speed-python

该存储库快速介绍了字符串和列表等基础知识，然后快速深入到更高级的主题，“类”和“异步编程”等，作者在写这本书时采用了一种实用的方法，用代码示例简要介绍了每个主题，然后直接跳到练习问题，让读者可以自己尝试。你可以在项目详情页下载pdf/epub文件。

项目地址：关于3个最佳学习Python编程的开源库，青藤小编就和您分享到这里了。如果您对python编程有浓厚的兴趣，希望这篇文章可以为您提供帮助。如果您还想了解更多关于python编程的技巧及素材等内容，可以点击本站的其他文章进行学习。

Python 常用的标准库以及第三方库有哪些

Python常用库大全，看看有没有你需要的。环境管理管理 Python 版本和环境的工具p – 非常简单的交互式 python 版本管理工具。 pyenv – 简单的 Python 版本管理工具。 Vex – 可以在虚拟环境中执行命令。 virtualenv – 创建独立 Python 环境的工具。 virtualenvwrapper- virtualenv 的一组扩展。包管理管理包和依赖的工具。 pip – Python 包和依赖关系管理工具。 pip-tools – 保证 Python 包依赖关系更新的一组工具。 conda – 跨平台，Python 二进制包管理工具。 Curdling – 管理 Python 包的命令行工具。 wheel – Python 分发的新标准，意在取代 eggs。包仓库本地 PyPI 仓库服务和代理。 warehouse – 下一代 PyPI。 Warehousebandersnatch – PyPA 提供的 PyPI 镜像工具。 devpi – PyPI 服务和打包/测试/分发工具。 localshop – 本地 PyPI 服务（自定义包并且自动对 PyPI 镜像）。分发打包为可执行文件以便分发。 PyInstaller – 将 Python 程序转换成独立的执行文件（跨平台）。 dh-virtualenv – 构建并将 virtualenv 虚拟环境作为一个 Debian 包来发布。 Nuitka – 将脚本、模块、包编译成可执行文件或扩展模块。 py2app – 将 Python 脚本变为独立软件包（Mac OS X）。 py2exe – 将 Python 脚本变为独立软件包（Windows）。 pynsist – 一个用来创建 Windows 安装程序的工具，可以在安装程序中打包 Python本身。构建工具将源码编译成软件。 buildout – 一个构建系统，从多个组件来创建，组装和部署应用。 BitBake – 针对嵌入式 Linux 的类似 make 的构建工具。 fabricate – 对任何语言自动找到依赖关系的构建工具。 PlatformIO – 多平台命令行构建工具。 PyBuilder – 纯 Python 实现的持续化构建工具。 SCons – 软件构建工具。交互式解析器交互式 Python 解析器。 IPython – 功能丰富的工具，非常有效的使用交互式 Python。 bpython- 界面丰富的 Python 解析器。 ptpython – 高级交互式Python解析器，构建于python-prompt-toolkit 之上。文件文件管理和 MIME（多用途的网际邮件扩充协议）类型检测。 imghdr – （Python 标准库）检测图片类型。 mimetypes – （Python 标准库）将文件名映射为 MIME 类型。 – 对进行封装的模块。 pathlib – （Python3.4+ 标准库）跨平台的、面向对象的路径操作库。 python-magic- 文件类型检测的第三方库 libmagic 的 Python 接口。 Unipath- 用面向对象的方式操作文件和目录watchdog – 管理文件系统事件的 API 和 shell 工具日期和时间操作日期和时间的类库。 arrow- 更好的 Python 日期时间操作类库。 Chronyk – Python 3 的类库，用于解析手写格式的时间和日期。 dateutil – Python datetime 模块的扩展。 delorean- 解决 Python 中有关日期处理的棘手问题的库。 moment – 一个用来处理时间和日期的Python库。灵感来自于。 PyTime – 一个简单易用的Python模块，用于通过字符串来操作日期/时间。 pytz – 现代以及历史版本的世界时区定义。将时区数据库引入Python。 – 提供用户友好的函数来帮助用户进行常用的日期和时间操作。文本处理用于解析和操作文本的库。通用chardet – 字符编码检测器，兼容 Python2 和 Python3。 difflib – (Python 标准库)帮助我们进行差异化比较。 ftfy – 让Unicode文本更完整更连贯。 fuzzywuzzy – 模糊字符串匹配。 Levenshtein – 快速计算编辑距离以及字符串的相似度。 – 在中日韩语字符和数字字母之间添加空格。 pyfiglet -figlet 的 Python实现。 shortuuid – 一个生成器库，用以生成简洁的，明白的，URL 安全的 UUID。 unidecode – Unicode 文本的 ASCII 转换形式。 uniout – 打印可读的字符，而不是转义的字符串。 xpinyin – 一个用于把汉字转换为拼音的库。

免责声明：本文转载或采集自网络，版权归原作者所有。本网站刊发此文旨在传递更多信息，并不代表本网赞同其观点和对其真实性负责。如涉及版权、内容等问题，请联系本网，我们将在第一时间删除。同时，本网站不对所刊发内容的准确性、真实性、完整性、及时性、原创性等进行保证，请读者仅作参考，并请自行核实相关内容。对于因使用或依赖本文内容所产生的任何直接或间接损失，本网站不承担任何责任。

标签: Python库