这篇文章主要介绍“ggplot2常见的四种箱线图是什么”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“ggplot2常见的四种箱线图是什么”文章能帮助大家解决问题。
p <- ggplot(data=employee,aes(x="薪资",y=salary))
p+geom_boxplot(width=0.3)
有少量人的薪资数据偏高,造成箱线图顶部有一些异常值。存在即合理,不要着急去剔除。目标:考察不同职位类别人群的薪资分布、异常值状况。
p <- ggplot(data=employee,aes(x=jobcat,y=salary))
p+geom_boxplot()
p+geom_boxplot(aes(fill=jobcat))
p+geom_boxplot(aes(fill=jobcat))+labs(title="不同职位类别薪资分布",x="职位类别", y = "当前薪资")
目标:在分组箱线图基础上添加散点,提高统计图形的可读性。
p+geom_boxplot()+geom_jitter(width = 0.2, alpha = 0.5, color = 'red')
jitter可以理解为抖动,将散点打散,让我们能观察到点的集中与分散的分布状况。上图中,箱子和黑色点为箱线图的元素,红色的散点则为原始数据的散点图元素,按层堆叠在一起,构成这样一幅有层次感的“带散点的箱线图”。
p+geom_boxplot()+facet_wrap(~gender)
女性和男性各自独立呈现箱线图,相当于用图形可视化的形式对数据进行拆分对比。能够帮我们切割数据粒度,便于对比比较,从而观察到有价值的信息。关于“ggplot2常见的四种箱线图是什么”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注天达云行业资讯频道,小编每天都会为大家更新不同的知识点。