用于加载和处理 DVK 文件格式的媒体文件的实用程序。
项目描述
DVK 存档 (Python)
用于加载和处理 DVK 文件格式的媒体文件的实用程序。
安装
DVK Archive 可以使用 pip从其PyPI 包中安装:
pip install dvk-archive
如果从源代码安装,则需要以下 python 包:
脚本
所有脚本都包含一个 [directory] 字段,它告诉脚本要搜索哪个目录。如果留空,[directory] 默认为当前工作目录。脚本搜索 [directory] 及其子目录。
发现错误
用于在 DVK 文件及其引用媒体中查找错误的脚本。
dvk 相同的 ID
dvk-same-ids [directory]
检查 [目录] 中共享相同 ID 的 DVK 文件。如果找到任何文件路径,则打印文件路径。
dvk 未链接
dvk-unlinked [directory]
检查 [目录] 中未链接到 DVK 文件的任何文件。忽略不包含 DVK 的文件夹。如果找到任何文件路径,则打印文件路径。
dvk 缺少媒体
dvk-missing-media [directory]
检查 [目录] 中引用媒体文件或不存在的辅助媒体文件的任何 DVK 文件。如果找到任何文件路径,则打印文件路径。
重新格式化
用于编辑 DVK 文件及其引用媒体的脚本。
dvk-重命名
dvk_rename [directory]
重命名 [目录] 中的所有 DVK 及其引用的媒体以符合标准命名约定:TITLE_ID
DVK 文件格式
DVK 文件只是重新打包的 JSON 文件,其中包含从 Internet 下载的媒体文件的有用元数据字段。DVK 文件仅包含元数据,并指向单独的媒体文件(图像、视频、音频等)。
下面是标准的 DVK 元数据字段,显示了它们对应的 JSON 键。
ID
(str) 供其他 DVK 文件参考的唯一 ID。
标题
(字符串)引用媒体的标题。
艺术家
(list[str]) 创建引用媒体的艺术家/作者列表。
时间
(str) 显示引用媒体发布/上传的时间和日期的字符串。
格式为 YYYY/MM/DD|hh:mm
示例:2017 年 10 月 6 日下午 5:00 -> 2017/10/06|17:00
web_tags
(list[str]) 从引用媒体的原始 Web 源收集的标签列表。
描述
(str) 从引用媒体的原始 Web 源收集的媒体描述。
page_url
(str) 引用媒体的来源网页的 URL。
直接网址
(str) 下载引用媒体的直接媒体 URL。不要与 page_url 混淆,它是包含引用媒体和附件信息的页面的 URL。
二级网址
(str) 从中下载次要媒体文件的直接媒体 URL。此字段仅在 DVK 引用辅助媒体文件时使用。(见二级文件)
媒体文件
(str) 引用的媒体文件的文件路径。路径相对于 DVK 文件的目录。
次要文件
(str) 补充主媒体文件的辅助媒体文件的文件路径。例如,引用文本文件的 DVK 可能具有用于封面插图的辅助文件。路径相对于 DVK 文件的目录。如果没有辅助媒体文件,则不使用。
最爱
(list[str]) 在其来源网站上收藏媒体的艺术家列表。用于表示媒体是从收藏夹画廊下载的,而不是从艺术家本身下载的。
is_single
(bool) 文件是否单独下载,而不是作为更大画廊的一部分。