Python 3 的通用编码检测器
项目描述
Chardet:通用字符编码检测器
- 检测到
ASCII、UTF-8、UTF-16(2 个变体)、UTF-32(4 个变体)
Big5、GB2312、EUC-TW、HZ-GB-2312、ISO-2022-CN(繁简体中文)
EUC-JP、SHIFT_JIS、CP932、ISO-2022-JP(日语)
EUC-KR、ISO-2022-KR、Johab(韩文)
KOI8-R、MacCyrillic、IBM855、IBM866、ISO-8859-5、windows-1251(西里尔文)
ISO-8859-5、windows-1251(保加利亚)
ISO-8859-1、windows-1252(西欧语言)
ISO-8859-7、windows-1253(希腊语)
ISO-8859-8、windows-1255(视觉和逻辑希伯来语)
TIS-620(泰语)
需要 Python 3.6+。
安装
从PyPI安装:
pip install chardet
文档
对于用户,文档现在可在https://chardet.readthedocs.io/获得。
命令行工具
chardet 带有一个命令行脚本,它报告一个或多个文件的编码:
% chardetect somefile someotherfile somefile: windows-1252 with confidence 0.5 someotherfile: ascii with confidence 1.0
关于
这是 Mark Pilgrim 出色的 C 原始 chardet 移植和Ian Cordasco的 charade Python 3 兼容分支的延续。
- 维护者:
丹布兰查德
项目详情
下载文件
下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。
源分布
chardet-5.0.0.tar.gz
(2.0 MB
查看哈希)
内置分布
chardet-5.0.0-py3-none-any.whl
(193.6 kB
查看哈希)