在 s3 中连接文件

项目描述

Python S3 连接

S3 Concat 用于将 s3 存储桶中的许多小文件连接成更少的大文件。

安装

pip install s3-concat

用法

命令行

$ s3-concat -h

进口

from s3_concat import S3Concat

bucket = 'YOUR_BUCKET_NAME'
path_to_concat = 'PATH_TO_FILES_TO_CONCAT'
concatenated_file = 'FILE_TO_SAVE_TO.json'
# Setting this to a size will always add a part number at the end of the file name
min_file_size = '50MB'  # ex: FILE_TO_SAVE_TO-1.json, FILE_TO_SAVE_TO-2.json, ...
# Setting this to None will concat all files into a single file
# min_file_size = None  ex: FILE_TO_SAVE_TO.json

# Init the job
job = S3Concat(bucket, concatenated_file, min_file_size,
               content_type='application/json',
              #  session=boto3.session.Session(),  # For custom aws session
              # s3_client_kwargs={}  # Use to pass arguments allowed by the s3 client: https://boto3.amazonaws.com/v1/documentation/api/latest/reference/core/session.html
               )
# Add files, can call multiple times to add files from other directories
job.add_files(path_to_concat)
# Add a single file at a time
job.add_file('some/file_key.json')
# Only use small_parts_threads if you need to. See Advanced Usage section below.
job.concat(small_parts_threads=4)

高级用法

根据您的用例，您可能希望使用small_parts_threads.

small_parts_threads仅在您尝试连接的文件小于 5MB 时使用。由于 s3 multipart_upload api 的限制（请参阅下面的限制），任何小于 5MB 的文件都需要在本地下载，连接在一起，然后重新上传。通过设置此线程数，它将并行下载部分以更快地创建连接过程。

为这些参数设置的值取决于您的用例和运行它的系统。

限制

这使用 s3 的分段上传，其限制为https://docs.aws.amazon.com/AmazonS3/latest/dev/qfacts.html

项目详情

发布历史发布通知| RSS订阅

这个版本

0.2.3

2021 年 5 月 21 日

0.2.2

2021 年 2 月 3 日

0.2.1

2020 年 10 月 3 日

0.2.0

2020 年 8 月 27 日

0.1.9

2020 年 5 月 14 日

0.1.8

2020 年 5 月 10 日

0.1.7

2020 年 1 月 20 日

0.1.6

2020 年 1 月 16 日

0.1.5

2020 年 1 月 16 日

0.1.4

2019 年 10 月 24 日

0.1.3

2019 年 7 月 3 日

0.1.2

2019 年 5 月 23 日

0.1.1

2019 年 5 月 16 日

0.1.0

2019 年 5 月 9 日

0.0.7

2020 年 1 月 20 日

0.0.6rc5 预发布

2019 年 5 月 8 日

0.0.6rc4 预发布

2019 年 5 月 8 日

0.0.6rc3 预发布

2019 年 5 月 8 日

0.0.6rc2 预发布

2019 年 5 月 7 日

0.0.6rc1 预发布

2019 年 5 月 1 日

0.0.5

2019 年 5 月 1 日

0.0.4

2019 年 3 月 2 日

0.0.3

2019 年 3 月 1 日

0.0.2

2019 年 3 月 1 日

下载文件

下载适用于您平台的文件。如果您不确定要选择哪个，请了解有关安装包的更多信息。

源分布

s3-concat-0.2.3.tar.gz （7.5 kB 查看哈希）

已上传 2021 年 5 月 21 日 source

s3-concat-0.2.3.tar.gz 的哈希值

s3-concat-0.2.3.tar.gz 的哈希值
算法	哈希摘要
SHA256	`3464265a40f4739c1495f900d7075901f371b8ad3f949e21a32e2c0a22eca86b`
MD5	`c2f9978103d0ea344f6c5246e498f5f3`
布莱克2-256	`e283ee700da614ed6746d985b76245d604950cad63558f76cc220fbe8b29d02f`

s3-concat 0.2.3

导航

项目链接

统计数据

Meta

Maintainers

分类

项目描述

Python S3 连接

安装

用法

命令行

进口

高级用法

限制

项目详情

项目链接

统计数据

元

维护者

分类器

发布历史发布通知| RSS订阅

下载文件

源分布

s3-concat 0.2.3

导航

项目链接

统计数据

Meta

Maintainers

分类

项目描述

Python S3 连接

安装

用法

命令行

进口

高级用法

限制

项目详情

项目链接

统计数据

元

维护者

分类器

发布历史 发布通知| RSS订阅

下载文件

源分布

发布历史发布通知| RSS订阅