• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    迪恩网络公众号

R语言基础-数据转换

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

一、基本转换

读取Excel数据



methods(is) 函数可以查看所有 is 的方法。用于判断数据
methods(as) 函数可以查看所有的转换方法。

二、对大数据集,取数据子集

1.读数据



两种写法


2.随机抽样函数 sample()

对向量抽样

对数据框抽样,取子集

3.删除特定数据

原数据 mtcars

删除1-5列

删除mpg列

4.合并不同的数据集

美国50个州的数据

每个周的分区

合并后的数据集


或者

合并前20行和后20行

注意:

使用 cbind() 和 rbind() 函数合并矩阵时必须要有相同的行和列数

5.去除重复行

使用 duplicated() 函数判断是否为重复值

使用 unique() 函数直接对数据集去重

三、数据框的翻转

使用 t() 函数对mtcars数据进行行和列的翻转

使用 rev() 函数实现向量倒置

通过翻转数据框索引的方式实现 women 数据的翻转

四、数据框数据的替换

使用 transform() 函数修改列的值


或者
  women$height <- women$height*2.54

五、数据框的排序

1.sort() 函数,对向量进行排序


通过列名对数据框排序

2.order() 函数,也可对向量进行排序,不过返回的值是索引

对mtcars数据框中的mpg列进行排序

反排

对多个列进行排序

六、对数据框进行运算

1.apply() 函数,用于数据框或者矩阵

lapply() 函数,运算后返回的值是列表

sapply() 函数,运算后的值返回的是向量

使用state.center 列表数据

tapply() 函数,第二个参数是因子

查看区域有多少个州

七、数据的去中心化和去标准化处理,消除量纲对数据结构的影响

数据中心化:

指数据集中的各项数据减去数据集的均值

数据标准化:

指在中心化之后再除以数据集的标准差,即数据集中的各项数据减去数据集的均值再除以数据集的标准差。

1.案例,对 state.x77 数据绘制热图

  heatmap(state.x77)

非常的不明显,没有意义

2.使用scale() 函数,实现去中心化和去标准化



鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
R语言——中文分词包jiebaR发布时间:2022-07-18
下一篇:
R语言之数据可视化-R的绘图颜色发布时间:2022-07-18
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap