Skip to main content

用于生成各种 TACL 结果和报告的脚本集合

项目描述

tacl-extra 提供了使用TACL 软件的脚本和库。

提供的脚本有:

  • int-all:为提供的语料库中的每对文本生成扩展和缩减的相交结果文件。

  • jitc:生成一个 HTML 报告,显示一组作品之间的重叠量,忽略与第二组作品中的作品重叠的部分。

  • 生命周期:生成结果数据和报告,显示在一组语料库中使用或停用的 n-gram 的生命周期。

  • paternity:生成一系列结果文件,给出一个语料库和第二个语料库中的每个工作之间共有的 n-gram,这些文件在第三个语料库中不存在。

脚本的实际工作是在可以被其他代码导入和使用的库代码中完成的。

代码在https://github.com/ajenhl/tacl-extra/开发,文档在 http://tacl-extra.readthedocs.io/en/latest/可用。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

tacl-extra-1.0.1.tar.gz (19.6 kB 查看哈希

已上传 source

内置分布

tacl_extra-1.0.1-py3-none-any.whl (27.7 kB 查看哈希

已上传 py3