Skip to main content

一个包,允许用户使用 Selenium 和 Chrome webdriver 捕获网站的整页屏幕截图。

项目描述

Pywebcapture

一个包,允许用户使用 Selenium 和 Chrome webdriver 捕获网站的整页屏幕截图。

使用 Python 3.8.3 版测试

安装

  1. 下载最新版本的Chrome 网络驱动程序
  2. 将 chrome webdriver 路径添加到系统 PATH(也可以将驱动程序的绝对路径传递给 Driver 实例)
  3. pip install pywebcapture

基本用法

导入模块:

from pywebcapture import loader, driver

使用 CSVLoader 加载包含 url 和可选文件名的 csv 文件:

选项:

  • input_filepath - csv 文件的绝对路径 (str)
  • has_header - 您的 csv 是否有标题行或现在(布尔)
  • uri_column - 包含 uri 的列,可以使用列名 (str) 或索引位置 (int)
  • filename_column - 包含所需文件名 (str) 的列,可以设置为 None,驱动程序将使用 uri netloc 作为文件名
csv_file = loader.CSVLoader("example.csv", True, 3, None)

从 CSVLoader 实例调用 get_uri_dict() 方法,这会将 CSV 解析为 Python 字典:

uri_dict = csv_file.get_uri_dict()

创建 Web 驱动程序的实例:

选项:

  • driver_path - 这是 chrome webdriver 的绝对路径,如果为 None 或“chromedriver”,它将尝试搜索 %PATH
  • output_path - 这是您要在 (str) 处保存屏幕截图的输出路径
  • 延迟 - 这是每个页面请求之间的延迟(以秒为单位),最小为 2 秒,请尊重抓取页面 :)
  • uri_dict - 包含您的文件名和 uri 的 Python 字典
d = driver.Driver("path/to/chrome/webdriver", None, 3, uri_dict)

运行驱动程序,这将遍历所有uri,获取最大滚动高度,然后截图

d.run()

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

pywebcapture-0.0.3.tar.gz (5.1 kB 查看哈希

已上传 source

内置分布

pywebcapture-0.0.3-py3-none-any.whl (10.1 kB 查看哈希

已上传 py3