一个包,允许用户使用 Selenium 和 Chrome webdriver 捕获网站的整页屏幕截图。
项目描述
Pywebcapture
一个包,允许用户使用 Selenium 和 Chrome webdriver 捕获网站的整页屏幕截图。
使用 Python 3.8.3 版测试
安装
- 下载最新版本的Chrome 网络驱动程序
- 将 chrome webdriver 路径添加到系统 PATH(也可以将驱动程序的绝对路径传递给 Driver 实例)
- 跑
pip install pywebcapture
基本用法
导入模块:
from pywebcapture import loader, driver
使用 CSVLoader 加载包含 url 和可选文件名的 csv 文件:
选项:
- input_filepath - csv 文件的绝对路径 (str)
- has_header - 您的 csv 是否有标题行或现在(布尔)
- uri_column - 包含 uri 的列,可以使用列名 (str) 或索引位置 (int)
- filename_column - 包含所需文件名 (str) 的列,可以设置为 None,驱动程序将使用 uri netloc 作为文件名
csv_file = loader.CSVLoader("example.csv", True, 3, None)
从 CSVLoader 实例调用 get_uri_dict() 方法,这会将 CSV 解析为 Python 字典:
uri_dict = csv_file.get_uri_dict()
创建 Web 驱动程序的实例:
选项:
- driver_path - 这是 chrome webdriver 的绝对路径,如果为 None 或“chromedriver”,它将尝试搜索 %PATH
- output_path - 这是您要在 (str) 处保存屏幕截图的输出路径
- 延迟 - 这是每个页面请求之间的延迟(以秒为单位),最小为 2 秒,请尊重抓取页面 :)
- uri_dict - 包含您的文件名和 uri 的 Python 字典
d = driver.Driver("path/to/chrome/webdriver", None, 3, uri_dict)
运行驱动程序,这将遍历所有uri,获取最大滚动高度,然后截图
d.run()
项目详情
下载文件
下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。
源分布
pywebcapture-0.0.3.tar.gz
(5.1 kB
查看哈希)
内置分布
pywebcapture-0.0.3-py3-none-any.whl
(10.1 kB
查看哈希)
关
pywebcapture -0.0.3.tar.gz 的哈希值
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | 470cc51e1c6069cb4fb0ea5d8819f2528a6a26c5f17348ab89c7e305f8475c49 |
|
| MD5 | a139ec9e985fa8a15be8942594670087 |
|
| 布莱克2-256 | b20b88dfdaf7c686c0bee7a1fc7bbb1a21a24637e48ba990b25d934890cdf492 |
关
pywebcapture -0.0.3-py3-none-any.whl 的哈希值
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | 240571b52dc496f33420240f824f6a15c6950ecc81172d0a2202cffe502f5833 |
|
| MD5 | 6eaa28135e606860ee92763117861836 |
|
| 布莱克2-256 | 89a42935b5dabaa4c6c411b40591587552e286d7d307948ec40747e56fdc9749 |