Tranco:一个以研究为导向的顶级网站排名强化反对操纵
项目描述
特兰科
该软件包允许轻松访问在https://tranco-list.eu上发布的 Tranco 列表。
用法
创建一个Tranco
对象,指示是否要缓存下载的列表:
from tranco import Tranco
t = Tranco(cache=True, cache_dir='.tranco')
然后,您可以使用以下方法从此对象中检索列表list
:
latest_list = t.list()
date_list = t.list(date='2019-02-25')
此方法返回 a TrancoList
,它允许您检索列表的某个前缀 ( top
)、列表 ID ( list_id
)、列表页面 ( list_page
) 或域的排名 ( rank
):
latest_list.top(10000)
latest_list.list_id
latest_list.list_page
latest_list.rank("google.com")
latest_list.rank("not.in.ranking") # returns -1
您还可以生成自定义列表。首先,创建一个Tranco
具有有效凭据的对象(可从您的帐户页面获得):
from tranco import Tranco
t = Tranco(account_email="abc@xyz.eu", api_key="123ABC")
然后,将自定义列表的配置(根据此架构configure
)传递给:
c = t.configure(
{
'providers': ['alexa', 'umbrella', 'majestic'],
'startDate': '2021-01-01',
'endDate': '2021-01-30',
'combinationMethod': 'dowdall',
'listPrefix': 'full',
'filterPLD': 'on',
}
)
该方法返回一个元组:列表是否已经可用或仍在生成中,以及已经/将要分配给列表的 ID。
您可以通过以下方式检索列表的元数据list_metadata
:
m = t.list_metadata(list_id="6P7X")
如果还在生成列表,可以使用此方法跟踪进度;生成列表后,此元数据将指示列表的配置方式。
项目详情
下载文件
下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。
源分布
tranco-0.6.tar.gz
(4.5 kB
查看哈希)
内置分布
tranco-0.6-py3-none-any.whl
(5.4 kB
查看哈希)