现在位置: 首页 > R 教程 > 正文

R unique() 函数 - 去除重复值

R 语言实例 R 语言实例

R unique() 函数用于去除向量或数据框中的重复值,返回唯一元素。

unique() 在进行数据清洗、查看分类水平时非常常用。

unique() 函数语法格式如下:

unique(x)

参数说明:

  • x 输入向量、数据框或矩阵。

实例

# 去除向量中的重复值
x <- c(3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5)
print("原始向量:")
print(x)
print("去重后:")
print(unique(x))

# 查看元素类别
classes <- c("A组", "B组", "A组", "C组", "B组", "A组", "C组")
print("所有类别:")
print(unique(classes))

执行以上代码输出结果为:

[1] "原始向量:"
 [1] 3 1 4 1 5 9 2 6 5 3 5
[1] "去重后:"
[1] 3 1 4 5 9 2 6
[1] "所有类别:"
[1] "A组" "B组" "C组"

unique() 结合 duplicated() 可以找出哪些是重复值:

实例

x <- c(3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5)

# duplicated() 标记是否重复
print("是否为重复(第二个及之后出现):")
print(duplicated(x))

# 找出所有重复值
dupes <- x[duplicated(x)]
print("重复出现的值:")
print(unique(dupes))

执行以上代码输出结果为:

[1] "是否为重复(第二个及之后出现):"
 [1] FALSE FALSE FALSE  TRUE FALSE FALSE FALSE FALSE
 [9]  TRUE  TRUE  TRUE
[1] "重复出现的值:"
[1] 1 5 3

R 语言实例 R 语言实例