Skip to main content

用于平假名、片假名、Hankaku、Zenkaku 等的纯 Python 日文字符转换器

项目描述

贾康夫

travis-ci.org 工作服.io 版本 最新版本 执照

jaconv(日语转换器)是平假名、片假名、半角(半角字符)和 Zenkaku(全角字符)的转换器

日语 README可用。

安装

$ pip install jaconv

用法

另见文档

import jaconv

# Hiragana to Katakana
jaconv.hira2kata('ともえまみ')
# => 'トモエマミ'

# Hiragana to half-width Katakana
jaconv.hira2hkata('ともえまみ')
# => 'トモエマミ'

# Katakana to Hiragana
jaconv.kata2hira('巴マミ')
# => '巴まみ'

# half-width character to full-width character
# default parameters are followings: kana=True, ascii=False, digit=False
jaconv.h2z('ティロ・フィナーレ')
# => 'ティロ・フィナーレ'

# half-width character to full-width character
# but only ascii characters
jaconv.h2z('abc', kana=False, ascii=True, digit=False)
# => 'abc'

# half-width character to full-width character
# but only digit characters
jaconv.h2z('123', kana=False, ascii=False, digit=True)
# => '123'

# half-width character to full-width character
# except half-width Katakana
jaconv.h2z('アabc123', kana=False, digit=True, ascii=True)
# => 'アabc123'

# an alias of h2z
jaconv.hankaku2zenkaku('ティロ・フィナーレabc123')
# => 'ティロ・フィナーレabc123'

# full-width character to half-width character
# default parameters are followings: kana=True, ascii=False, digit=False
jaconv.z2h('ティロ・フィナーレ')
# => 'ティロ・フィナーレ'

# full-width character to half-width character
# but only ascii characters
jaconv.z2h('abc', kana=False, ascii=True, digit=False)
# => 'abc'

# full-width character to half-width character
# but only digit characters
jaconv.z2h('123', kana=False, ascii=False, digit=True)
# => '123'

# full-width character to half-width character
# except full-width Katakana
jaconv.z2h('アabc123', kana=False, digit=True, ascii=True)
# => 'アabc123'

# an alias of z2h
jaconv.zenkaku2hankaku('ティロ・フィナーレabc123')
# => 'ティロ・フィナーレabc123'

# normalize
jaconv.normalize('ティロ・フィナ〜レ', 'NFKC')
# => 'ティロ・フィナーレ'

# Hiragana to alphabet
jaconv.kana2alphabet('じゃぱん')
# => 'japan'

# Alphabet to Hiragana
jaconv.alphabet2kana('japan')
# => 'じゃぱん'

# Katakana to Alphabet
jaconv.kata2alphabet('ケツイ')
# => 'ketsui'

# Alphabet to Katakana
jaconv.alphabet2kata('namba')
# => 'ナンバ'

# Hiragana to Julius's phoneme format
jaconv.hiragana2julius('てんきすごくいいいいいい')
# => 't e N k i s u g o k u i:'

笔记

jaconv.normalize 方法扩展 unicodedata.normalize 用于日语处理。

'〜' => 'ー'
'~' => 'ー'
"’" => "'"
'”'=> '"'
'“' => '``'
'―' => '-'
'‐' => '-'
'˗' => '-'
'֊' => '-'
'‐' => '-'
'‑' => '-'
'‒' => '-'
'–' => '-'
'⁃' => '-'
'⁻' => '-'
'₋' => '-'
'−' => '-'
'﹣' => 'ー'
'-' => 'ー'
'—' => 'ー'
'―' => 'ー'
'━' => 'ー'
'─' => 'ー'

变化

0.3 (2021-03-29)

  • 修复错误(alphabet2kana)感谢@Cuddlemuffin007

  • 支持 Python 3.8 和 3.9

  • 添加方便的函数:alphabet2kata 和 kata2alphabet。谢谢@kokimame

  • 为 julius 添加函数:hiragana2julius

0.2.4 (2018-02-04)

  • 修复错误(假名2字母)

  • 支持 Python 3.7

  • 不再支持 Python 2.6

  • 添加 z2h -> zenkaku2hankaku 和 h2z -> hankaku2zenkaku 的别名

0.2.3 (2018-02-03)

  • 修复错误(alphabet2kana,kana2alphabet)感谢@letuananh

0.2.2 (2018-01-22)

  • 修复错误(kana2alphabet)感谢@kokimame

  • 支持 Python 3.6

0.2.1 (2017-09-14)

  • 修复错误(alphabet2kana、kana2alphabet)

0.2 (2015-04-02)

  • 更改模块名称 jctconv -> jaconv

  • 添加字母和平假名相互转换(alphabet2kana,kana2alphabet)

0.1.1 (2015-03-12)

  • 支持视窗

  • 支持 Python 3.5

0.1 (2014-11-24)

  • 添加一些日文字符转换表格(ゝゞ・「」。、)

  • 减少内存使用

  • 不推荐使用某些函数名称(hankaku2zenkaku、zenkaku2hankaku、H2K、H2hK、K2H)

0.0.7 (2014-03-22)

z2h 和 h2z 允许确定类似于 mojimoji 的目标字符类型。关于半假名转换的错误修复。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

jaconv-0.3.tar.gz (15.7 kB 查看哈希

已上传 source