R unique() 函数 - 去除重复值
R unique() 函数用于去除向量或数据框中的重复值,返回唯一元素。
unique() 在进行数据清洗、查看分类水平时非常常用。
unique() 函数语法格式如下:
unique(x)
参数说明:
x 输入向量、数据框或矩阵。
实例
# 去除向量中的重复值
x <- c(3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5)
print("原始向量:")
print(x)
print("去重后:")
print(unique(x))
# 查看元素类别
classes <- c("A组", "B组", "A组", "C组", "B组", "A组", "C组")
print("所有类别:")
print(unique(classes))
x <- c(3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5)
print("原始向量:")
print(x)
print("去重后:")
print(unique(x))
# 查看元素类别
classes <- c("A组", "B组", "A组", "C组", "B组", "A组", "C组")
print("所有类别:")
print(unique(classes))
执行以上代码输出结果为:
[1] "原始向量:" [1] 3 1 4 1 5 9 2 6 5 3 5 [1] "去重后:" [1] 3 1 4 5 9 2 6 [1] "所有类别:" [1] "A组" "B组" "C组"
unique() 结合 duplicated() 可以找出哪些是重复值:
实例
x <- c(3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5)
# duplicated() 标记是否重复
print("是否为重复(第二个及之后出现):")
print(duplicated(x))
# 找出所有重复值
dupes <- x[duplicated(x)]
print("重复出现的值:")
print(unique(dupes))
# duplicated() 标记是否重复
print("是否为重复(第二个及之后出现):")
print(duplicated(x))
# 找出所有重复值
dupes <- x[duplicated(x)]
print("重复出现的值:")
print(unique(dupes))
执行以上代码输出结果为:
[1] "是否为重复(第二个及之后出现):" [1] FALSE FALSE FALSE TRUE FALSE FALSE FALSE FALSE [9] TRUE TRUE TRUE [1] "重复出现的值:" [1] 1 5 3

R 语言实例