新增形近字错别字检查和敏感词检查

形近字错误智能识别
此功能用于检查形近字错误。此类错误的一般是由OCR识别错误产生。笔画输入、手写输入也会产生此类错误。

敏感词识别
敏感词识别不仅能识别与敏感词列表中完全相同的词,还能识别中间夹杂特殊字符的敏感词。例如 “中共中央” 为敏感词,不仅能识别到 “中共中央”, 还能识别出 “中a共bc中$@央” “中a共啊哈中a央” 等。


注:浏览器插件和Word插件暂不支持这两种错误类型,此功能正在开发当中。

校对服务引擎重要更新

今日上线最新的校对服务引擎,主要更新有
1. 采用新的分词,大幅减少分词歧义。 最新采用的是 结巴分词C++版本 。使用此分词之后大幅减少了由分词错误引起的误判。 但是现有的结巴分词词库太小,有个大词库 dict.367W.utf8,但是它的词非常不规范,需要进一步整理。下一步我们将整理词库,并继续寻找更合适的分词。

2. 采用新的判断规则,大幅减少误判。


怎么使用新引擎 用户不需要做什么,跟以前一样使用网站或插件检查错误即可。插件和网站会自动连接新的校对服务引擎。