html_jumping - 允许获取来自多个先前 URL 的 HTML。有时这需要获取需要 cookie 或 HTTP 引荐来源网址才能获取特定页面的网页。

允许获取来自多个先前 URL 的 HTML。有时这需要获取需要 cookie 或 HTTP 引荐来源网址才能获取特定页面的网页。

Development Status
- 3 - Alpha
Intended Audience
- Developers
License
- OSI Approved :: GNU General Public License (GPL)
Topic
- Utilities

项目描述

欢迎来到 HTML 跳转

作者：

丹尼尔·佩雷斯·拉达 <@dperezrada>

什么？

允许获取来自多个先前 URL 的 HTML。有时这需要获取需要 cookie 或 HTTP 引荐来源网址才能获取特定页面的网页。

先决条件

你会需要：

httplib2
http://socksipy.sourceforge.net/（如果你想使用代理）

要运行测试，您还需要：

lxml

例子

没有代理

from html_jumping import HtmlJumping
handler = HtmlJumping()
urls = [
    {
        'url': 'http://pypi.python.org/pypi',
        'method': 'GET'
    },
    {
        'url': 'http://pypi.python.org/pypi',
        'method': 'GET',
        'body': {
            'term': 'html_jumping',
            ':action': 'search',
            'submit': 'search'
        }
    }
]
received_header, received_content = handler.get(urls)

带代理

允许您使用 HTTP 代理，您需要安装 socksipy 库。

from html_jumping import HtmlJumping
handler = HtmlJumping()
urls = [
    {
        'url': 'http://pypi.python.org/pypi',
        'method': 'GET'
    },
    {
        'url': 'http://pypi.python.org/pypi',
        'method': 'GET',
        'body': {
            'term': 'html_jumping',
            ':action': 'search',
            'submit': 'search'
        }
    }
]
received_header, received_content = handler.get(
    urls,
    proxy_info = {'host': '127.0.0.1', 'port': '8081'}
)

带有永久标题

这将在每次调用中发送标题“Accept-Language”。

from html_jumping import HtmlJumping
handler = HtmlJumping()
urls = [
    {
        'url': 'http://pypi.python.org/pypi',
        'method': 'GET'
    },
    {
        'url': 'http://pypi.python.org/pypi',
        'method': 'GET',
        'body': {
            'term': 'html_jumping',
            ':action': 'search',
            'submit': 'search'
        }
    }
]
received_header, received_content = handler.get(
    urls,
    permanent_headers = {'Accept-Language': 'es, en-cl;q=0.5'}
)

测试

跑

>> 鼻子测试

项目详情

发布历史发布通知| RSS订阅

这个版本

0.2.4

2012 年 8 月 25 日

0.2.3

2012 年 8 月 20 日

0.2.2

2012 年 2 月 13 日

0.2.1

2011 年 11 月 25 日

0.2

2011 年 11 月 10 日

0.1

2010 年 8 月 30 日

下载文件

下载适用于您平台的文件。如果您不确定要选择哪个，请了解有关安装包的更多信息。

源分布

html_jumping-0.2.4.tar.gz (3.7 kB 查看哈希)

已上传 2012 年 8 月 25 日 source

html_jumping -0.2.4.tar.gz 的哈希值

html_jumping-0.2.4.tar.gz 的哈希值
算法	哈希摘要
SHA256	`8491722577a206530b09b80ea741e64fe3d96df8ac2e9c3683eb00f43a2ba5cf`
MD5	`e1b850e7a3e0c175c01ea53305bddf1d`
布莱克2-256	`143696a45ddfca6766c29d18860072d0eb1f6b96c12eea6467e07008bda90857`

html_jumping 0.2.4

导航

项目链接

统计数据

Meta

Maintainers

分类

项目描述

欢迎来到 HTML 跳转

什么？

先决条件

例子

没有代理

带代理

带有永久标题

测试

项目详情

项目链接

统计数据

元

维护者

分类器

发布历史发布通知| RSS订阅

下载文件

源分布

html_jumping 0.2.4

导航

项目链接

统计数据

Meta

Maintainers

分类

项目描述

欢迎来到 HTML 跳转

什么？

先决条件

例子

没有代理

带代理

带有永久标题

测试

项目详情

项目链接

统计数据

元

维护者

分类器

发布历史 发布通知| RSS订阅

下载文件

源分布

发布历史发布通知| RSS订阅