• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    迪恩网络公众号

《R语言数据挖掘》——2.5 R语言实现

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

本节书摘来自华章出版社《R语言数据挖掘》一书中的第2章,第2.5节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.5 R语言实现

算法主要部分的R语言实现为:


2.5.1 SPADE算法

使用等价类的序列模式发现(Sequential Pattern Discovery using Equivalent class,SPADE)算法是应用于序列模式的垂直序列挖掘算法,它采用深度优先策略。算法的特征是:

SPADE算法是Apriori算法的扩展。

算法采用Apriori性质。

需要对初始事务数据集进行多次扫描。

采用垂直数据格式。

算法采用简单的连接运算。

所有序列的发现都需要对数据进行3次扫描。

下面是调用SPADE算法之前的伪代码
F←, ∧k←0, P←{∈∑, support_count(s)≥MIN_SUP}

R语言实现

算法主要部分的R语言代码实现是:

2.5.2 从序列模式中生成规则

序列规则、标签序列规则和类序列规则都可以从序列模式中生成,这些可以从前面的序列模式发现算法中得到。


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap