这篇文章主要介绍了R语言怎么删除重复数据的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇R语言怎么删除重复数据文章都会有所收获,下面我们一起来看看吧。
R 删除重复数据的方法,包括duplicated 和unique
针对duplicated, 对向量的元素或数据框的行进行操作的时候,返回逻辑值,以下面的数据框为例:
dat A B C D1 a b a c2 c k b d3 c k c c4...
R 删除重复数据的方法,包括duplicated 和unique
针对duplicated, 对向量的元素或数据框的行进行操作的时候,返回逻辑值,以下面的数据框为例:
dat
A B C D
1 a b a c
2 c k b d
3 c k c c
4 d e q k
5 e f g l
6 h g h q
7 j f q k
8 a b a c
9 e f g l
10 o o l m
duplicated(dat)
[1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE TRUE FALSE
dat是一个十行的数据框,其中第8行和第1行重复,第9行和第5行的数据重复,所以,返回值的第8和第9是TRUE,因此,可以按照如下操作,排除为TRUE,也就是重复的数据,只取数据第一次出现的结果。
dat[!duplicated(dat),]
A B C D
1 a b a c
2 c k b d
3 c k c c
4 d e q k
5 e f g l
6 h g h q
7 j f q k
10 o o l m
duplicated可以针对具体区域进行重复数据的判断,例如:
dat[!duplicated(dat[,c("A","B")]),]
A B C D
1 a b a c
2 c k b d
4 d e q k
5 e f g l
6 h g h q
7 j f q k
10 o o l m
dat[!duplicated(dat[1:8,]),]
A B C D
1 a b a c
2 c k b d
3 c k c c
4 d e q k
5 e f g l
6 h g h q
7 j f q k
9 e f g l
10 o o l m
dat[!duplicated(dat[1:8,c("A","B")]),]
A B C D
1 a b a c
2 c k b d
4 d e q k
5 e f g l
6 h g h q
7 j f q k
9 e f g l
10 o o l m
unique 针对向量和着数据框进行处理,会直接将删除重复后的结果进行返回,返回结果取首次出现结果:
unique(dat)
A B C D
1 a b a c
2 c k b d
3 c k c c
4 d e q k
5 e f g l
6 h g h q
7 j f q k
10 o o l m
两种处理结果,原行名都未发生变化。
关于“R语言怎么删除重复数据”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“R语言怎么删除重复数据”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注天达云行业资讯频道。