Skip to main content

实用功能

项目描述

Pyplatform 是在混合云环境中围绕 Google BigQuery 构建的数据分析平台架构。

平台:

  • 提供快速、可扩展且可靠的 SQL 数据库解决方案
  • 通过在 python 运行时环境中使用无服务器计算解决方案构建数据管道来抽象基础设施
  • 通过使用 jupyter lab 作为主要工具来简化开发环境

安装

pip install pyplatform

搭建开发环境

git clone https://github.com/mhadi813/pyplatform
cd pyplatform
conda env create -f pyplatform_dev.yml

环境变量

import os

os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = 'path/to/default_service_account.json'
os.environ['DATASET'] = 'default_bigquery_dataset_name'
os.environ['STORAGE_BUCKET'] = 'default_storage_bucket_id'

用法

常见的数据管道架构:

- Http 来源

-本地服务器

- Bigquery 与 Azure 逻辑应用程序的集成

-事件驱动的 ETL 过程

-流式传输管道

探索模块

import pyplatform as pyp
pyp.show_me()

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

pyplatform-udf-0.0.4.tar.gz (5.5 kB 查看哈希

已上传 source

内置分布

pyplatform_udf-0.0.4-py3-none-any.whl (5.7 kB 查看哈希

已上传 py3