DFA算法

其他 2019-03-13 16:04:45 阅读次数: 0

今天新学习了一个敏感词匹配的算法，记录一下。

　　原文地址：https://blog.csdn.net/qq_36827957/article/details/74357283

　　1、用途：

　　　　主要用于敏感词匹配。

　　2、原理：

　　以王八蛋和王八羔子两个敏感词来进行描述，首先构建敏感词库，该词库名称为SensitiveMap，这两个词的二叉树构造为：

以上面例子构造出来的SensitiveMap为敏感词库进行示意，假设这里输入的关键字为：王八不好，流程图如下：

3.代码编写

3.1构造敏感词实现代码

3.2实现敏感词查询代码

4.优化思路

4.1敏感词中间填充无意义字符问题

对于“王*八&&蛋”这样的词，中间填充了无意义的字符来混淆，在我们做敏感词搜索时，同样应该做一个无意义词的过滤，当循环到这类无意义的字符时进行跳过，避免干扰。

4.2敏感词用拼音或部分用拼音代替

两种解决思路：一种是最简单是遇到这类问题，先丰富敏感词库进行快速解决。第二种是判断时将敏感词转换为拼音进行对比判断。

不过目前这两种方案均不能彻底很好的解决该问题，此类问题还需进一步研究。

4.3效率问题

由于敏感词的在构造词库时耗时长，建议将构造后的敏感词库进行缓存。在敏感词新增和删除时进行词库的更新。

猜你喜欢

转载自www.cnblogs.com/smilond/p/10523672.html

DFA算法

JAVA 实现DFA算法

DFA0算法

敏感词汇过滤DFA算法

DFA算法C#实现

DFA

【敏感词过滤之DFA算法简介】

敏感词查询过滤DFA算法

java 敏感词过滤（DFA算法）（转）

基于DFA算法的过滤内容 javascript

KMP算法之dfa与next数组

matlab DFA算法计算Hurst指数

【待完善】DFA模拟KMP算法

DFA算法实现敏感词过滤

Java实现敏感词过滤 - DFA算法

基于DFA算法实现的敏感词过滤

DFA算法实现敏感词过滤

利用 DFA 算法实现文字过滤

采用DFA算法实现字库屏蔽规则

基于DFA算法的python敏感词检测

iOS实现敏感词过滤 DFA算法

DFA 算法实现敏感词过滤

算法-DFA算法-敏感词过滤算法（OC、Swift、Python）

NFA转化为DFA的子集构造算法和DFA最简化

算法基础类-DFA算法-敏感词过滤

敏感词过滤的算法原理之DFA算法

Java实现DFA算法实现敏感词过滤（转）

Java实现DFA算法进行敏感词过滤

基于DFA算法的敏感词过滤--Java实现

敏感字过滤优化版DFA算法与python代码实现

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)