django-filemetadata - 从数据库中的本地文件同步元数据

从数据库中的本地文件同步元数据

项目描述

使用此应用程序搜索本地文件并索引一些元数据信息以及数据库中文件（文本）的内容（FileMetadata 模型）。可以将多个目录配置为索引（settings.FILEMETADATA_LOOKUP_DIRS）。使用数据库中注册的信息，可以使用 django 的功能（过滤器、导出等）或其他应用程序来操作数据。例如，此应用程序可用作实现受保护的下载页面或在搜索工具中搜索文件内容的基础。

存储库：https ://gitlab.com/rristow/django-filemetadata
许可证：BSD 2-Clause

Python 3.6+ 支持此版本；和 Django 2.2+。

安装

使用 pip 安装软件包：

$ pip install django-filemetadata

在INSTALLED_APPS中添加 App

INSTALLED_APPS=(
    "django-filemetadata",
),

执行 makemigrations/migrate。

配置

配置目录以在设置中查找文件：

FILEMETADATA_LOOKUP_DIRS=['/folder1/folder2', '/folder3/folder4']

利用率

使用管理命令索引数据

usage:  filemetadata_index [-f FOLDERS] [-c] [-d] [-s] [-x] [-n] [-a]

Update the the file-metadata found in the directories into the DB.

optional arguments:
  -f FOLDERS            Folder(s) to index (coma separated)
  -c                    Clear the data before reindex
  -d                    Delete only the data from these folders and exit
  -s                    Index the symlinks (Do not follow it)
  -x                    Extract the content of the file (text)
  -n                    Non-reentrant mode (Not recursive)
  -a                    Abort on errors

例如

重新索引设置中配置的文件

python 文件元数据索引

或通知目录

python filemetadata_index -f /folder1/folder2,/folder3

或者只是从这些文件夹中删除数据（在这种情况下不是递归的）：

python filemetadata_index -d -n -f /folder1/folder2,/folder3

转到 Admin 并检查 FileMetadata 模型中的数据。

定制

支持 .pdf 文件此应用程序与“PyPDF4”库兼容。如果安装了它，它可用于在必要时从 pdf 文件中提取内容。

自定义提取器如果需要，可以通过更具体的功能覆盖提取文件内容的功能。为此，请在 indexer.py 模块中重载函数 'func_extract_text'

from filemetadata import indexer

def my_extractor(posixpath_obj):
    ...
    return file_content

indexer.func_extract_text = my_extractor

或 FileIndexer 类的 extract_text 方法

from filemetadata.indexer import FileIndexer

class MyFileIndexer(FileIndexer):
  def extract_text(self, file_obj):
    ...
    return file_content

测试

运行测试

python load_tests.py

项目详情

发布历史发布通知| RSS订阅

这个版本

1.0.4

2020 年 12 月 31 日

1.0.3

2020 年 12 月 31 日

1.0.2

2020 年 12 月 30 日

1.0.1

2020 年 12 月 30 日

1.0.0

2020 年 12 月 30 日

0.1.2

2020 年 12 月 30 日

0.1.1

2020 年 12 月 30 日

0.1.0

2020 年 12 月 30 日

0.0.2

2020 年 12 月 30 日

下载文件

下载适用于您平台的文件。如果您不确定要选择哪个，请了解有关安装包的更多信息。

源分布

django-filemetadata-1.0.4.tar.gz (17.6 kB 查看哈希)

已上传 2020 年 12 月 31 日 source

django-filemetadata-1.0.4.tar.gz 的哈希值

django-filemetadata-1.0.4.tar.gz 的哈希值
算法	哈希摘要
SHA256	`15590f964f94b308aa89ab75acf7a0dc722ffce05c00c19e9c9c1d717c0af593`
MD5	`5db9707f21e4e05cfd3cb4d4b45f71bd`
布莱克2-256	`207ac714e772b9e1eebf1a77fa3edef29c3091170aae9eb9f14b61192ab8ad7e`

django-filemetadata 1.0.4

导航

项目链接

统计数据

Meta

Maintainers

分类

项目描述

安装

配置

利用率

定制

测试

项目详情

项目链接

统计数据

元

维护者

分类器

发布历史发布通知| RSS订阅

下载文件

源分布

django-filemetadata 1.0.4

导航

项目链接

统计数据

Meta

Maintainers

分类

项目描述

安装

配置

利用率

定制

测试

项目详情

项目链接

统计数据

元

维护者

分类器

发布历史 发布通知| RSS订阅

下载文件

源分布

发布历史发布通知| RSS订阅