Skip to main content

从命令行进行简单的文本分析

项目描述

从命令行进行简单的文本分析。

主页: http: //learntextvis.github.io/textkit/

关于

textkit是一系列小型的、unix 风格的工具,提供了一套将文本作为数据处理的功能。

将 textkit 视为基本的自然语言处理功能 - 从命令行。

文本套件功能

这里有一些你可以用 textkit 做的很酷的事情。

将文档转换为一组单词标记并从标记中删除所有标点符号:

textkit text2words input.txt | textkit filterpunc

计算文本中最常用的单词:

textkit text2words alice.txt | textkit count --limit 20

做同样的事情,但删除标点符号:

textkit text2words alice.txt | textkit filterpunc | textkit count --limit 20

安装

$ pip install -U textkit
$ textkit --help

开发安装

要在本地测试,请克隆 repo:

git clone git@github.com:learntextvis/textkit.git

创建本地虚拟环境或conda环境。

以下是我为安装和测试 textkit创建本地conda环境的方法:

conda create --name textkit nltk

source activate textkit

然后我进入textkit目录安装它的要求

cd textkit

pip install -r requirements.txt

最后,我使用--editable标志安装了本地版本的 textkit :

pip install --editable .

例子

在快速入门指南中查看更多示例。

要求

  • Python >= 2.6 或 >= 3.3

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

textkit-0.2.3.tar.gz (11.6 kB 查看哈希

已上传 source

内置分布

textkit-0.2.3-py2.py3-none-any.whl (20.6 kB 查看哈希

已上传 py2 py3