敏感词自动检测技术是基于海量语料统计和HM-CLM机器学习的信息过滤技术,有效地识别各种有害文字信息,帮助用户摆脱有害信息的侵扰.进一步杜绝各种严重政治性错误、淫秽色情、凶杀暴力、赌博迷信等内容的发生,可对各类有害信息及时有效地发起预警,并严防此类严重错误见诸报端。敏感词涉及“政治问题”、“负面报道”、“贬义词汇”、“民族宗教问题”和“色情描写”,“台湾问题”。
应用于报社敏感词检查、互联网络信息过滤、垃圾邮件过滤、“法轮功”、“64”等信息过滤等内容安全领域