Skip to main content

终极站点地图解析器

项目描述

构建状态 文件状态 覆盖状态 PyPI 包

适用于 Python 3.5+ 的网站站点地图解析器。

特征

安装

pip install ultimate_sitemap_parser

用法

from usp.tree import sitemap_tree_for_homepage

tree = sitemap_tree_for_homepage('https://www.nytimes.com/')
print(tree)

sitemap_tree_for_homepage()将返回一个AbstractSitemap子类对象树,这些对象代表网站上的站点地图层次结构;请参阅AbstractSitemap 子类的参考

如果您只想列出网站内所有站点地图中的所有页面,请考虑使用all_pages()方法:

# all_pages() returns an Iterator
for page in tree.all_pages():
    print(page)

all_pages()方法将返回一个产生SitemapPage对象的迭代器;请参阅SitemapPage 的参考

下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

Ultimate_sitemap_parser-0.5.tar.gz (20.2 kB 图哈希)

已上传 source

内置分布

Ultimate_sitemap_parser-0.5-py2.py3-none-any.whl (23.2 kB 查看哈希

已上传 py2 py3