• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    迪恩网络公众号

R语言简单实现聚类分析计算与分析(基于系统聚类法)

原作者: [db:作者] 来自: [db:来源] 收藏 邀请


聚类分析计算与分析(基于系统聚类法)

下面以一个具体的例子来实现实证分析。2008年我国其中31个省、市和自治区的农村居民家庭平均每人全年消费性支出。

根据原始数据对我国省份进行归类统计。

                                                               原始数据如下

注:数据来源—www.stats.gov.cn(中华人民共和国国家统计局)

 

代码如下:

#读入数据
china <- read.table("F:\\2008年我国其中31个省、市和自治区的农村居民家庭平均每人全年消费性支出.txt",header=TRUE)
distance <- dist(china)  #计算距离
china.hc <- hclust(distance) #聚类分析,最长距离法
plot(china.hc, hang = -1) #绘画系谱图 
re <- rect.hclust(china.hc, k = 5) #分为5类

re
for (i in 1:5) {
print(paste("第",i,"类"))
print(china[re[[i]],]$地区)
}

china.hc <- hclust(distance,method="single") #聚类分析,最短距离法
plot(china.hc, hang = -1) #绘画系谱图 
re <- rect.hclust(china.hc, k = 5) #分为5类

china.hc <- hclust(distance,method="average") #聚类分析,类平均法
plot(china.hc, hang = -1) #绘画系谱图 
re <- rect.hclust(china.hc, k = 5) #分为5类

 

 

china.hc <- hclust(distance,method="centroid") #聚类分析,重心法
plot(china.hc, hang = -1) #绘画系谱图 
re <- rect.hclust(china.hc, k = 5) #分为5类

china.hc <- hclust(distance,method="median") #聚类分析,中间距离法
plot(china.hc, hang = -1) #绘画系谱图 
re <- rect.hclust(china.hc, k = 5) #分为5类

china.hc <- hclust(distance,method="ward") #聚类分析,离差平方和法
plot(china.hc, hang = -1) #绘画系谱图 
re <- rect.hclust(china.hc, k = 5) #分为5类

 

 以上实现了不同聚类分析计算两个类距离算法得出的不同结果。

 根据离差平方和法可将我国省份作出以下分类:

第一类:北京 上海 浙江

第二类:江苏 福建 广东

第三类:江西 湖北 湖南 四川

第四类:天津   河北   辽宁   黑龙江 安徽   山东   河南   云南

第五类:山西   内蒙古 吉林   广西   海南   重庆   贵州   西藏   陕西   新疆   甘肃   青海   宁夏 

 


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
R语言文本挖掘tm包使用发布时间:2022-07-18
下一篇:
集算器和R语言处理外存文本文件的对比发布时间:2022-07-18
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap