Skip to main content

Python 3 的通用编码检测器

项目描述

Chardet:通用字符编码检测器

构建状态 https://img.shields.io/coveralls/chardet/chardet/stable.svg PyPI 上的最新版本 执照
检测到
  • ASCII、UTF-8、UTF-16(2 个变体)、UTF-32(4 个变体)

  • Big5、GB2312、EUC-TW、HZ-GB-2312、ISO-2022-CN(繁简体中文)

  • EUC-JP、SHIFT_JIS、CP932、ISO-2022-JP(日语)

  • EUC-KR、ISO-2022-KR、Johab(韩文)

  • KOI8-R、MacCyrillic、IBM855、IBM866、ISO-8859-5、windows-1251(西里尔文)

  • ISO-8859-5、windows-1251(保加利亚)

  • ISO-8859-1、windows-1252(西欧语言)

  • ISO-8859-7、windows-1253(希腊语)

  • ISO-8859-8、windows-1255(视觉和逻辑希伯来语)

  • TIS-620(泰语)

需要 Python 3.6+。

安装

PyPI安装:

pip install chardet

文档

对于用户,文档现在可在https://chardet.readthedocs.io/获得。

命令行工具

chardet 带有一个命令行脚本,它报告一个或多个文件的编码:

% chardetect somefile someotherfile
somefile: windows-1252 with confidence 0.5
someotherfile: ascii with confidence 1.0

关于

这是 Mark Pilgrim 出色的 C 原始 chardet 移植和Ian Cordascocharade Python 3 兼容分支的延续。

维护者

丹布兰查德

下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

chardet-5.0.0.tar.gz (2.0 MB 查看哈希

已上传 source

内置分布

chardet-5.0.0-py3-none-any.whl (193.6 kB 查看哈希

已上传 py3