Skip to main content

用于从文本生成 ngram 和词袋表示的简单包。

项目描述

一个简单的包,旨在用于演示 Python 中的基本自然语言处理 (NLP) 特征工程。

## 更多信息:

### 练习数据集

[堆栈交换数据转储]( https://archive.org/details/stackexchange )

### 文本编码

[每个软件开发人员绝对、肯定必须了解 Unicode 和字符集(没有借口!) ,作者 Joel Spolsky](http://www.joelonsoftware.com/articles/Unicode.html

#### 包

### 自然语言处理

[主题模型的护理和喂养:问题、诊断和改进](http://www.people.fas.harvard.edu/~airoldi/pub/books/b02.AiroldiBleiEroshevaFienberg2014HandbookMMM/Ch12_MMM2014.pdf

### Python 中的函数式编程

[ Python 中的函数式编程 检查 Python 的函数方面:哪些选项效果很好,哪些选项应该避免使用 David Mertz]( https://www.oreilly.com/ideas/functional-programming-in-python )

#### 包

下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

text2math-0.0.8.dev1.tar.gz (37.1 kB 查看哈希

已上传 source

内置分布

text2math-0.0.8.dev1-py2.py3-none-any.whl (9.9 kB 查看哈希

已上传 py2 py3