从命令行进行简单的文本分析
项目描述
从命令行进行简单的文本分析。
主页: http: //learntextvis.github.io/textkit/
关于
textkit是一系列小型的、unix 风格的工具,提供了一套将文本作为数据处理的功能。
将 textkit 视为基本的自然语言处理功能 - 从命令行。
文本套件功能
这里有一些你可以用 textkit 做的很酷的事情。
将文档转换为一组单词标记并从标记中删除所有标点符号:
textkit text2words input.txt | textkit filterpunc
计算文本中最常用的单词:
textkit text2words alice.txt | textkit count --limit 20
做同样的事情,但删除标点符号:
textkit text2words alice.txt | textkit filterpunc | textkit count --limit 20
安装
$ pip install -U textkit $ textkit --help
开发安装
要在本地测试,请克隆 repo:
git clone git@github.com:learntextvis/textkit.git
创建本地虚拟环境或conda环境。
以下是我为安装和测试 textkit创建本地conda环境的方法:
conda create --name textkit nltk source activate textkit
然后我进入textkit目录安装它的要求
cd textkit pip install -r requirements.txt
最后,我使用--editable标志安装了本地版本的 textkit :
pip install --editable .
例子
在快速入门指南中查看更多示例。
要求
Python >= 2.6 或 >= 3.3
项目链接
项目详情
下载文件
下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。
源分布
textkit-0.2.3.tar.gz
(11.6 kB
查看哈希)
内置分布
textkit-0.2.3-py2.py3-none-any.whl
(20.6 kB
查看哈希)