第一批异形词整理表+264组异形词整理表
《咬文嚼字》2006-2016年十大语文差错
江苏省首届报纸优秀作品审核委员会,曾经对总计200万字的599件参评作品认真审核。据统计,被审核出的差错总计555处,笔者根据审核中发现的差错内容,将其归纳为以下十类,并作简要分析,以供广大同仁借鉴。
1. 网站新添词典收录查询,统计了七本常用词典的字词收入情况。
-
- 当不能确定一个词中的某个字是否正确,常用的办法是查词典。但是大部分词典没有电子版,查起来比较麻烦,这时可以尝试使用
- 。通过是否被词典收录来确认字词是否正确。
-
- 或者不能确定某两个词搭配是否正确,也可以通过查询词典是否收录,来确认正确用法。 比如“一
-
- ”还是“一
- ”。
- 校对助手、浏览器插件都已经无缝集成了词典收录查询功能.
2. 校对助手
- 修复:提示窗口在XP下有时会自动缩小。
- 修复:绿色版Word引起校对助手崩溃。
- 修复:Word 有表格时错误定位不准。
- 优化:助手与服务器通信全改成POST方式。
- 优化:“校对所有”按钮改为“校对后10页”。
3. 浏览器插件
- 修复:网页插件有时不能忽略所有错误。
- 修复:网页中,校对选中的文字时,有时不能标识错误。
- 修复:有时点击错误不显示菜单。
3. 校对服务器
- 调整 3 个字组成的词的校对算法,大幅减少误判。
- 自动检查 Word 和 WPS 文档中的错别字。同时支持检查同音字错误、形近字错误、敏感词、搭配错误。
- 支持:WPS 2016、Word 2003-2016(32、64)
- 适用:Win 10 / Win 8.1 / Win 7 / Vista / XP
- 校对助手代替了 Word 插件 1.0。
2. 浏览器插件 2.0
- 在检查同音字基础上,新增形近字错误、敏感词、搭配错误检查的功能。
- 支持 Chrome(谷歌浏览器)、360极速浏览器、360安全浏览器、QQ浏览器
3. 校对服务器升级
- 提高校对速度
- 新增检查搭配错误功能
形近字错误智能识别
此功能用于检查形近字错误。此类错误的一般是由OCR识别错误产生。笔画输入、手写输入也会产生此类错误。
敏感词识别
敏感词识别不仅能识别与敏感词列表中完全相同的词,还能识别中间夹杂特殊字符的敏感词。例如 “中共中央” 为敏感词,不仅能识别到 “中共中央”, 还能识别出 “中a共bc中$@央” “中a共啊哈中a央” 等。
注:浏览器插件和Word插件暂不支持这两种错误类型,此功能正在开发当中。
此功能用于检查形近字错误。此类错误的一般是由OCR识别错误产生。笔画输入、手写输入也会产生此类错误。
敏感词识别
敏感词识别不仅能识别与敏感词列表中完全相同的词,还能识别中间夹杂特殊字符的敏感词。例如 “中共中央” 为敏感词,不仅能识别到 “中共中央”, 还能识别出 “中a共bc中$@央” “中a共啊哈中a央” 等。
注:浏览器插件和Word插件暂不支持这两种错误类型,此功能正在开发当中。
今日上线最新的校对引擎,主要更新有:
1. 采用新的分词,大幅减少分词歧义。
最新采用的是 结巴分词的 C++版本 。使用此分词之后大幅减少了由分词错误引起的误判。但是现有的结巴分词词库太小,有个大词库 dict.367W.utf8,但是它的词非常不规范,需要进一步整理。下一步我们将整理词库,并继续寻找更合适的分词。
2. 采用新的判断规则,大幅减少误判。
怎么使用新引擎:
用户不需要做什么,跟以前一样使用网站或插件检查错误即可。插件和网站会自动连接新的校对服务引擎。
分类
自动校对Word插件发布
Word 插件已经完成,能够自动校对本页或校对所有页面。欢迎下载试用! 安装之后,会在Word工具栏内添加一个“无错字”的标签页。
如果安装之后没有工具栏,请先关闭360 或金山杀毒等软件再重新安装。此类安全软件会阻止注册Word插件。
分类
360浏览器应用上线了
360浏览器插件已经通过审核,可以下载使用了!