Skip to main content

阿拉伯语拼写更正

项目描述

描述

用于检查阿拉伯语句子拼写的简单库。该库使用由 +500K 单词组成的词汇表,并使用 1-edit_distance 和 2-edit_distance 来纠正拼写错误的单词。它还使用 1-ngram 语言模型来根据先前的上下文来纠正单词。

安装

pip install ar-corrector

用法

正确的单词拼写

from ar_corrector.corrector import Corrector
corr = Corrector()

corr.spell_correct('بختب') # return 5 corrections with top frequencies
# [('بكتب', 61), ('برتب', 22), ('بختم', 21), ('بختي', 9), ('بخت', 7)]

corr.spell_correct('بختب', 2) # return 2 corrections with top frequencies
# [('بكتب', 61), ('برتب', 22),]

corr.spell_correct('بختب', 1) # return 1 correction with top frequency
# [('بكتب', 61)]

corr.spell_correct('لتمشتلميتلكب', 4) # return the same word
# لتمشتلميتلكب

corr.spell_correct('من') # return true
# True

使用上下文更正单词拼写

from ar_corrector.corrector import Corrector
corr = Corrector()

sent = 'أكدت قواءص التمذد في تشاد أنها تواضضل طريقها للعاحمة'
print(corr.contextual_correct(sent)) 
#أكدت قوات التمرد في تشاد أنها تواصل طريقها للعاصمة

sent = 'اتتنتهى حدث آبل المنتظو بالإعلاخ عن مموعة من المنتجات'
print(corr.contextual_correct(sent))
#انتهى حدث آبل المنتظر الإعلان عن مجموعة من المنتجات

项目详情


下载文件

下载适用于您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

ar_corrector-1.1.6.tar.gz (51.5 MB 查看哈希

已上传 source

内置分布

ar_corrector-1.1.6-py3-none-any.whl (53.4 MB 查看哈希

已上传 py3