Skip to main content

Tranco:一个以研究为导向的顶级网站排名强化反对操纵

项目描述

特兰科

该软件包允许轻松访问在https://tranco-list.eu上发布的 Tranco 列表。

用法

创建一个Tranco对象,指示是否要缓存下载的列表:

from tranco import Tranco
t = Tranco(cache=True, cache_dir='.tranco')

然后,您可以使用以下方法从此对象中检索列表list

latest_list = t.list()
date_list = t.list(date='2019-02-25')

此方法返回 a TrancoList,它允许您检索列表的某个前缀 ( top)、列表 ID ( list_id)、列表页面 ( list_page) 或域的排名 ( rank):

latest_list.top(10000)
latest_list.list_id
latest_list.list_page
latest_list.rank("google.com")
latest_list.rank("not.in.ranking") # returns -1

您还可以生成自定义列表。首先,创建一个Tranco具有有效凭据的对象(可从您的帐户页面获得):

from tranco import Tranco
t = Tranco(account_email="abc@xyz.eu", api_key="123ABC")

然后,将自定义列表的配置(根据此架构configure)传递给:

c = t.configure(
    {
        'providers': ['alexa', 'umbrella', 'majestic'],
        'startDate': '2021-01-01',
        'endDate': '2021-01-30',
        'combinationMethod': 'dowdall',
        'listPrefix': 'full',
        'filterPLD': 'on',
    }
)

该方法返回一个元组:列表是否已经可用或仍在生成中,以及已经/将要分配给列表的 ID。

您可以通过以下方式检索列表的元数据list_metadata

m = t.list_metadata(list_id="6P7X")

如果还在生成列表,可以使用此方法跟踪进度;生成列表后,此元数据将指示列表的配置方式。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

tranco-0.6.tar.gz (4.5 kB 查看哈希

已上传 source

内置分布

tranco-0.6-py3-none-any.whl (5.4 kB 查看哈希

已上传 py3