Skip to main content

sense_text_extractor

项目描述

意义文本提取器

sense-text-extractor 是容器客户端库

安装方式(当前版本0.0.1)

pip install sense-text-extractor

使用指南

基于sense-core的settings.ini的label配置调用:

from sense_text_extractor import SenseTextExtractor
extractor = SenseTextExtractor(label='text_extractor')
text = extractor.extract_text("http://sports.sina.com.cn/g/pl/2019-01-11/doc-ihqhqcis5048507.shtml", "穆里尼奥在等待复出")
print(text)

使用host和port的调用:

extractor = SenseTextExtractor('52.83.143.61', '6681')
text = extractor.extract_text("http://sports.sina.com.cn/g/pl/2019-01-11/doc-ihqhqcis5048507.shtml", "穆里尼奥在等待复出")
print(text)

使用说明

extract_如果需要下载字符串,表示自己可能会抛出异常,需要捕获的html源代码。 ,不然的话,也很容易被蠕虫爬行。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

sense-text-extractor-0.0.5.tar.gz (4.8 kB 查看哈希)

已上传 source

内置分布

sense_text_extractor-0.0.5-py3-none-any.whl (5.6 kB 查看哈希

已上传 py3