Skip to main content

读取 HTML 数据并将其转换为 python 类。

项目描述

HTML阅读器

读取 HTML 数据并将其转换为 python 类。

安装

来自 PyPi:

pip install HTML-Reader

来自 Github 回购:

pip install git+https://github.com/Monkvy/HTML-Reader

用法

通过class、id、src等获取元素

  • 打开 HTML 文件或使用 HTML 代码创建字符串。
  • 通过调用 Element.Get() 获取 HTML-Element 并插入关键字。

示例 HTML 文件“example.html”:

<div class="content">
	<h1 class="title">Example title</h1>
	<p>
		Lorem ipsum dolor sit amet, 
		consetetur sadipscing elitr, sed diam
	</p>
</div>

蟒蛇代码:

import HTMLReader

with open("example.html", "r") as file:
	raw_html = file.read()
	title = HTMLReader.Element.Get(raw_html, "class=\"title\"")[0]
	
	print(title.content)

输出:

Example title

按标签获取元素

  • 打开上面示例中创建的 HTML 文件。
  • 通过调用 Element.GetWithTag() 获取 HTML-Element 并插入标签。
import HTMLReader

with open("example.html", "r") as file:
	raw_html = file.read()
	title = HTMLReader.Element.GetWithTag(raw_html, "p")[0]
	
	print(title.content)

输出:

Lorem ipsum dolor sit amet, 
consetetur sadipscing elitr, sed diam

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

HTML-Reader-1.1.1.tar.gz (4.5 kB 查看哈希

已上传 source

内置分布

HTML_Reader-1.1.1-py3-none-any.whl (5.2 kB 图哈希)

已上传 py3