Python的网址黑名单/白名单库
项目描述
用于查询自定义和第三方网址黑名单和白名单的库。
特征
Google 安全浏览查找 API和hpHosts 服务的客户端类
支持自定义 DNSBL 服务客户端
SURBL、Spamhaus ZEN和Spamhaus DBL的预配置客户端
支持查询和填充自定义主机白名单和黑名单
将多个 URL 测试器组合成一个复合测试器
使用复合 URL 测试器时可选查询重定向 URL 地址
支持 Python 2 和 3
用法
主机黑名单中主机值成员资格的简单测试:
>>> from spam_lists import SPAMHAUS_DBL
>>> 'dbltest.com' in SPAMHAUS_DBL
True
lookup(host_value)
方法返回一个命名元组,其中包含:
列出的主机是搜索域的父级,或列出的 IP 地址等于在黑名单中搜索的地址
返回信息的来源作为用于搜索值的客户端的实例
一组与值相关的分类术语
>>> SPAMHAUS_DBL.lookup('dbltest.com')
AddressListItem(value=u'dbltest.com', ...)
测试序列中是否有垃圾邮件 URL:
>>> urls_to_test = (
'http://google.com',
'http://wikipedia.org',
'http://dbltest.com'
)
>>> SPAMHAUS_DBL.any_match(urls_to_test)
True
从一系列值中过滤出已识别的垃圾邮件 URL 会返回一个生成器对象,该对象会生成垃圾邮件 URL:
>>> result = SPAMHAUS_DBL.filter_matching(urls_to_test)
>>> result
<generator object <genexpr> at 0xb4f60a7c>
>>> list(result)
['http://dbltest.com']
调用lookup_matching(urls)
会返回一个生成器对象,该对象会产生用于匹配 URL 的名为 tuple 的 AddressListItem 实例:
>>> result = SPAMHAUS_DBL.lookup_matching(urls_to_test)
>>> result
<generator object lookup_matching at 0xb4f60e3c>
>>> list(result)
[AddressListItem(value=u'dbltest.com', ...)]
如需更多信息,请阅读spam_lists 包文档字符串。
安装
使用 pip 安装:
$ pip install spam-lists
为了能够运行测试,请安装测试附加功能:
$ pip install spam-lists[test]
执照
麻省理工学院
见许可证