• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    迪恩网络公众号

R语言学习笔记:因子(Factors)

原作者: [db:作者] 来自: [db:来源] 收藏 邀请
  • 因子提供了一个简单并且紧凑的形式来处理分类(名义上的)数据。因子用”水平level”来表示所有可能的取值。如果数据集有取值个数固定的名字变量,因子就特别有用。

    • > g<-c("f","m","f","f","m")
      > g
      [1] "f" "m" "f" "f" "m"
      > g<-factor(g)#因子化
      > g
      [1] f m f f m
      Levels: f m#有几种可选的值

    • 若五个人全部是m,但是你需要两个备选值,可以用如下语法

> other.g<-factor(c("m","m","m","m","m"),levels=c("f","m"))
> other.g


[1] m m m m m
Levels: f m

    • 计算每个元素出现的次数,使用table()函数

> table(g)
g
f m
3 2

    • table()函数还可以用于获得多个因子的交叉表

>  age<-factor(c('adult','adult','adult','adult','juvenile'))
> table(age,g)


          g
age        f m
  adult    3 1
  juvenile 0 1

    • 计算表的边际(margin)和频率。
      • 计算边际

> t<-table(age,g)


> margin.table(t,1)#按照年龄查看边际

age
   adult juvenile
       4        1
> margin.table(t,2)
g
f m
3 2

      • 计算频率

> prop.table(t,1)#

          g
age           f    m
  adult    0.75 0.25

> prop.table(t)

#查看整个表的频率
          g

age          f   m
  adult    0.6 0.2
  juvenile 0.0 0.2


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
R语言爬虫系列6|动态数据抓取范例发布时间:2022-07-18
下一篇:
R语言中的并行处理发布时间:2022-07-18
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap