日本漫画的OCR

项目描述

漫画 OCR

日文文本的光学字符识别，主要关注日文漫画。它使用使用 Transformers 的Vision Encoder Decoder框架构建的自定义端到端模型。

漫画 OCR 可用作通用印刷日文 OCR，但其主要目标是提供高质量的文本识别，对漫画特定的各种场景具有鲁棒性：

垂直和水平文本
带有假名的文本
覆盖在图像上的文字
各种各样的字体和字体样式
低质量图像

与许多 OCR 模型不同，Manga OCR 支持在单次向前传递中识别多行文本，因此可以立即处理漫画中的文本气泡，而无需将它们拆分成行。

也可以看看：

开发代码，包括用于训练和合成数据生成的代码：链接
合成数据生成管道的描述+生成图像的示例：链接

项目详情

发布历史发布通知| RSS订阅

这个版本

0.1.7

2022 年 3 月 9 日

0.1.6 猛拉

2022 年 3 月 9 日

0.1.5

2022 年 1 月 23 日

0.1.4

2022 年 1 月 21 日

0.1.3

2022 年 1 月 20 日

0.1.2

2022 年 1 月 20 日

0.1.1

2022 年 1 月 17 日

0.1.0

2022 年 1 月 17 日

下载文件

下载适用于您平台的文件。如果您不确定要选择哪个，请了解有关安装包的更多信息。

源分布

manga-ocr-0.1.7.tar.gz （65.4 kB 查看哈希）

已上传 2022 年 3 月 9 日 source

内置分布

manga_ocr-0.1.7-py3-none-any.whl （62.3 kB 查看哈希）

已上传 2022 年 3 月 9 日 py3

manga-ocr-0.1.7.tar.gz 的哈希值

manga-ocr-0.1.7.tar.gz 的哈希值
算法	哈希摘要
SHA256	`5252a89007404897c0b99355a9186f9ef2a7e0e8cfc096cb81134e0800cd00b9`
MD5	`1952e27ffe5a3466ac9728a84719c718`
布莱克2-256	`d0fbb8d5fa2088096a19cee7a4d678f9289c8e39f800c9622689212514d9caf2`

manga_ocr -0.1.7-py3-none-any.whl 的哈希值

manga_ocr-0.1.7-py3-none-any.whl 的哈希值
算法	哈希摘要
SHA256	`016465f44f0889f25500c820b37b2002949a93e3be266a70ed8fb3f7d7a3ae0d`
MD5	`e4db21e5e81b0f0e0aee094c24eb71d6`
布莱克2-256	`88f92fdafa072a4e8d8b6a0aa7fc5c0205c4f626742e4789ec8bf14f65f7ffeb`

manga-ocr 0.1.7

导航

项目链接

统计数据

Meta

Maintainers

分类

项目描述

漫画 OCR

项目详情

项目链接

统计数据

元

维护者

分类器

发布历史发布通知| RSS订阅

下载文件

源分布

内置分布

manga-ocr 0.1.7

导航

项目链接

统计数据

Meta

Maintainers

分类

项目描述

漫画 OCR

项目详情

项目链接

统计数据

元

维护者

分类器

发布历史 发布通知| RSS订阅

下载文件

源分布

内置分布

发布历史发布通知| RSS订阅