ML之Apriori:利用关联规则挖掘技术的Apriori算法实对用户推荐现购物网站更多感兴趣产品应用案例
目录
利用关联规则挖掘技术的Apriori算法实对用户推荐现购物网站更多感兴趣产品应用案例
相关文章
ML之Apriori:利用关联规则挖掘技术的Apriori算法实对用户推荐现购物网站更多感兴趣产品应用案例
ML之Apriori:利用关联规则挖掘技术的Apriori算法实对用户推荐现购物网站更多感兴趣产品应用案例实现代码
利用关联规则挖掘技术的Apriori算法实对用户推荐现购物网站更多感兴趣产品应用案例
# 1、定义数据集
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7 entries, 0 to 6
Data columns (total 4 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 7 non-null object
1 B 7 non-null object
2 C 7 non-null object
3 E 3 non-null object
dtypes: object(4)
memory usage: 352.0+ bytes
None
A B C E
0 B C E NaN
1 A B D NaN
2 A D E NaN
3 A C E E
4 B C D NaN
5 B D E E
6 A C D E
# 2、数据预处理
# 2.1、特征编码
# 3、模型训练与推理
# 3.1、使用Apriori算法挖掘频繁项集
frequent_itemsets
support itemsets
0 0.571429 (A_A)
1 0.428571 (A_B)
2 0.142857 (B_B)
3 0.571429 (B_C)
4 0.285714 (B_D)
5 0.428571 (C_D)
6 0.571429 (C_E)
7 0.428571 (E_E)
8 0.142857 (B_B, A_A)
9 0.285714 (B_C, A_A)
10 0.142857 (A_A, B_D)
11 0.285714 (A_A, C_D)
12 0.285714 (A_A, C_E)
13 0.285714 (E_E, A_A)
14 0.285714 (A_B, B_C)
15 0.142857 (A_B, B_D)
16 0.142857 (A_B, C_D)
17 0.285714 (A_B, C_E)
18 0.142857 (A_B, E_E)
19 0.142857 (B_B, C_D)
20 0.285714 (B_C, C_D)
21 0.285714 (B_C, C_E)
22 0.285714 (E_E, B_C)
23 0.285714 (B_D, C_E)
24 0.142857 (E_E, B_D)
25 0.142857 (E_E, C_D)
26 0.285714 (E_E, C_E)
27 0.142857 (B_B, A_A, C_D)
28 0.142857 (B_C, A_A, C_D)
29 0.142857 (B_C, A_A, C_E)
30 0.285714 (E_E, B_C, A_A)
31 0.142857 (A_A, C_E, B_D)
32 0.142857 (E_E, A_A, C_D)
33 0.142857 (E_E, A_A, C_E)
34 0.142857 (A_B, B_C, C_D)
35 0.142857 (A_B, B_C, C_E)
36 0.142857 (A_B, B_D, C_E)
37 0.142857 (A_B, E_E, B_D)
38 0.142857 (A_B, E_E, C_E)
39 0.142857 (E_E, B_C, C_D)
40 0.142857 (E_E, B_C, C_E)
41 0.142857 (E_E, B_D, C_E)
42 0.142857 (E_E, B_C, A_A, C_D)
43 0.142857 (E_E, B_C, A_A, C_E)
44 0.142857 (A_B, E_E, B_D, C_E)
# 3.2、根据频繁项集生成关联规则
rules
antecedents consequents ... leverage conviction
0 (B_B) (A_A) ... 0.061224 inf
1 (A_A) (B_B) ... 0.061224 1.142857
2 (A_A) (C_D) ... 0.040816 1.142857
3 (C_D) (A_A) ... 0.040816 1.285714
4 (E_E) (A_A) ... 0.040816 1.285714
.. ... ... ... ... ...
125 (B_D, C_E) (A_B, E_E) ... 0.102041 1.714286
126 (A_B) (E_E, B_D, C_E) ... 0.081633 1.285714
127 (E_E) (A_B, B_D, C_E) ... 0.081633 1.285714
128 (B_D) (A_B, E_E, C_E) ... 0.102041 1.714286
129 (C_E) (A_B, E_E, B_D) ... 0.061224 1.142857
# 3.3、根据置信度排序并打印前5条规则
antecedents consequents antecedent support ... lift leverage conviction
65 (E_E, A_B) (B_D) 0.142857 ... 3.50 0.102041 inf
59 (B_D, A_B) (C_E) 0.142857 ... 1.75 0.061224 inf
122 (E_E, A_B) (B_D, C_E) 0.142857 ... 3.50 0.102041 inf
32 (E_E, B_C) (A_A) 0.285714 ... 1.75 0.122449 inf
33 (E_E, A_A) (B_C) 0.285714 ... 1.75 0.122449 inf
[5 rows x 9 columns]