关联规则数据的构建是实施算法的前提,在查阅大量的资料之后,也没有找到能讲得清晰的数据构建过程,以下数据的构建是本人对于数据的构建,仅供参考。
以下案例仅仅针对,类似“每一行代表一个用户购买一个商品”。
> x <- data.frame(item=c('a','b','a','b','c'),user=c('1','1','2','2','2'))
> x
item user
1 a 1
2 b 1
3 a 2
4 b 2
5 c 2
# 利用xtabs()做onehot
> y <- xtabs(~ item + user,x)
# 将xtabs转化为matrix
> y <- as.data.frame.matrix(y)
> y <- as.matrix(y)
> class(y)
# 将matrix的结果转化为transactions
> yy <- as(y, "transactions")
# 查看结果
> inspect(yy)
items transactionID
[1] {1,2} a
[2] {1,2} b
[3] {2} c
ok!结果是我想要的。