Skip to main content

通过美国人口普查区块组将地址映射到地区剥夺指数

项目描述

地理编码-adi

它是什么?

geocode-adi是一个 Python 包,它允许将地址信息映射到 美国人口普查区块组级别 的 Gopal K. Singh 的地区剥夺指数 (ADI) ,该指数由威斯康星大学麦迪逊分校的应用人口实验室计算,并提供于 威斯康星大学麦迪逊分校的邻里地图集

在哪里得到它?

源代码目前托管在 GitHub 上: https ://github.com/AyushDoshi/geocode-adi 。

Python 包索引 (PyPI)中提供了已发布版本的二进制安装程序 。

pip install geocode-adi

依赖项

  • Pandas - 读取地址数据、对其进行操作并将其导出回来所必需的。
  • Numpy - 需要分块地址数据和添加“非数字”值。
  • 请求- 向 Google 发出 GET 请求时需要。
  • Geopy - 对 Nominatim/OpenStreetMaps 进行地理编码 API 调用所必需的。
  • 人口普查地理编码- 对美国人口普查地理编码器进行地理编码 API 调用时需要 。
  • tqdm - 制作进度条所必需的。

如果使用二进制安装程序(例如通过PyPI )安装geocode-adi,则应自动安装所需的依赖项。

如何使用它?

这个包旨在作为命令行/终端中的脚本运行,尽管在 geocodeadi.py文件中找到的各个函数可以作为模块导入。

该脚本采用逗号分隔的文件,例如 .CSV,其中包含地址信息。具体来说,该文件必须至少包含 4 列:'Address''City''State''ZIP Code'。这些列也必须这样标记。“地址”列必须至少包含街道编号和名称。其他信息,例如公寓或套房号码,是可选的。地址格式正确的一个示例是存储库中的 AddressSample.csv文件。

安装后,可以通过以下方式在命令行/终端中简单地调用geocode-adi :

python -m geocode-adi [PATH_TO_ADDRESS_FILE]

例如,使用文件AddressSample.csv

python -m geocode-adi AddressSample.csv

它是如何工作的?

geocode-adi通过 4 个总体步骤将地址映射到 ADI:

  1. 它将地址导入到 Pandas DataFrame 中。
  2. 它将地址转换为美国人口普查块组,这本身分为 6 个步骤:
    1. 它从地址列表中过滤掉大部分 PO 和 Route 框并将它们放在一边。
    2. 然后,它使用美国人口普查地理编码器将过滤后的地址直接转换为美国人口普查块
    3. 然后尝试使用 Google 将未能直接转换为美国人口普查块组的地址转换为坐标。
    4. 然后尝试使用Nominatim/OpenStreetMaps将未能通过 Google 转换为坐标的地址转换为坐标。
    5. 通过 Google 或 Nominatim/OpenStreetMaps 成功转换为坐标的地址,然后再次尝试使用美国人口普查地理编码器再次转换为美国人口普查区块组,但这次使用坐标而不是直接使用地址。
    6. 然后合并在第一轮或第二轮中成功转换为美国人口普查块的地址。由于是 PO/Route Box、未能转换为坐标或未能将其坐标转换为美国人口普查块组而未能转换的地址也会被合并。
  3. 成功转换为美国人口普查区块组的地址会根据其美国人口普查区块组映射到 ADI 值。
  4. 通过其 US Census Block Group 映射到 ADI 值的地址将导出到一个标记为 success.csv 的 .CSV文件。未能转换为人口普查块组的地址将导出到标记为failed.csv的 .CSV 文件。

执照

麻省理工学院

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

geocode-adi-2.0.0.tar.gz (1.9 MB 查看哈希

已上传 source

内置分布

geocode_adi-2.0.0-py3-none-any.whl (1.9 MB 查看哈希

已上传 py3