序列模式挖掘
?
library(arulesSequences) data(zaki) s1 <- cspade(zaki, parameter = list(support = 0.4), control = list(verbose = TRUE)) summary(s1) as(s1, "data.frame") s2 <- cspade(zaki, parameter = list(support = 0.4, maxwin = 5)) as(s2, "data.frame")
第2行导入数据库zaki,它的结构类似于图1所示的那种序列-事件集,第3行设定最小支持度为0.4,并用无约束的SPADE算法搜索频繁序列模式,第6行引入了时间窗的限制,用cSPADE算法进行搜索。整个过程十分简洁明了。
更多使用的例子可在R的终端用?cspade命令查看。
参考文献:
Sequence Mining in Categorical Domains: Incorporating Constraints, Mohammed J. Zaki, 2000 ACM
?
1 楼 zangwenyang 2011-12-20 常见的序列模式挖掘算法