sense_text_extractor
项目描述
意义文本提取器
sense-text-extractor 是容器客户端库
安装方式(当前版本0.0.1)
pip install sense-text-extractor
使用指南
基于sense-core的settings.ini的label配置调用:
from sense_text_extractor import SenseTextExtractor
extractor = SenseTextExtractor(label='text_extractor')
text = extractor.extract_text("http://sports.sina.com.cn/g/pl/2019-01-11/doc-ihqhqcis5048507.shtml", "穆里尼奥在等待复出")
print(text)
使用host和port的调用:
extractor = SenseTextExtractor('52.83.143.61', '6681')
text = extractor.extract_text("http://sports.sina.com.cn/g/pl/2019-01-11/doc-ihqhqcis5048507.shtml", "穆里尼奥在等待复出")
print(text)
使用说明
extract_如果需要下载字符串,表示自己可能会抛出异常,需要捕获的html源代码。 ,不然的话,也很容易被蠕虫爬行。
项目详情
下载文件
下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。
源分布
sense-text-extractor-0.0.5.tar.gz
(4.8 kB
查看哈希)
内置分布
关
sense_text_extractor -0.0.5-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 3f41eeb1319668c2451d3a96e7f3f687990d0612e6cc49d30f42ee4bdc0b0cbb |
|
MD5 | 3010e1d564e6e327102c65e1e43bdcba |
|
布莱克2-256 | b6454eab1b89e332c85bffe4ce378f82e0eb5e4b21d398304a28e79c5ba0667a |