阿拉伯语拼写更正
项目描述
描述
用于检查阿拉伯语句子拼写的简单库。该库使用由 +500K 单词组成的词汇表,并使用 1-edit_distance 和 2-edit_distance 来纠正拼写错误的单词。它还使用 1-ngram 语言模型来根据先前的上下文来纠正单词。
安装
pip install ar-corrector
用法
正确的单词拼写
from ar_corrector.corrector import Corrector
corr = Corrector()
corr.spell_correct('بختب') # return 5 corrections with top frequencies
# [('بكتب', 61), ('برتب', 22), ('بختم', 21), ('بختي', 9), ('بخت', 7)]
corr.spell_correct('بختب', 2) # return 2 corrections with top frequencies
# [('بكتب', 61), ('برتب', 22),]
corr.spell_correct('بختب', 1) # return 1 correction with top frequency
# [('بكتب', 61)]
corr.spell_correct('لتمشتلميتلكب', 4) # return the same word
# لتمشتلميتلكب
corr.spell_correct('من') # return true
# True
使用上下文更正单词拼写
from ar_corrector.corrector import Corrector
corr = Corrector()
sent = 'أكدت قواءص التمذد في تشاد أنها تواضضل طريقها للعاحمة'
print(corr.contextual_correct(sent))
#أكدت قوات التمرد في تشاد أنها تواصل طريقها للعاصمة
sent = 'اتتنتهى حدث آبل المنتظو بالإعلاخ عن مموعة من المنتجات'
print(corr.contextual_correct(sent))
#انتهى حدث آبل المنتظر الإعلان عن مجموعة من المنتجات
项目详情
下载文件
下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。
源分布
ar_corrector-1.1.6.tar.gz
(51.5 MB
查看哈希)
内置分布
ar_corrector-1.1.6-py3-none-any.whl
(53.4 MB
查看哈希)
关
ar_corrector -1.1.6.tar.gz 的哈希值
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | 2eb287322c1fc10ac8e172374686da42af3137e370a320d81fa08bac7cef5d91 |
|
| MD5 | fc9e7102511c97bc46f3e59cbc7b3f9a |
|
| 布莱克2-256 | 371ba1fab0a76ae79dc03668f8c82c290c2299b6cc7e487c50b10200d1352931 |
关
ar_corrector -1.1.6-py3-none-any.whl 的哈希值
| 算法 | 哈希摘要 | |
|---|---|---|
| SHA256 | f3d4a4fe8ff8696c922a5807757506e56c0d720258c7716bfca607b90a8e77f7 |
|
| MD5 | e882c98f6f0242c87fbe9b432e8ebb0f |
|
| 布莱克2-256 | 2d32ce0b2170db48ab9227d08802f93ce1cb105fdcc97c532333fadc38281bf8 |