合并具有多个匹配项的数据帧时,仅选择第一行
发布时间:2020-05-24 20:31:53 所属栏目:MsSql 来源:互联网
导读:我有两个数据框,“数据”和“分数”,并希望将它们合并到“id”列: data = data.frame(id = c(1,2,3,4,5), state = c(KS,MN,AL,FL,CA))scores = data.frame(id = c(1,1,1,2,2,3,3,3), score = c
|
我有两个数据框,“数据”和“分数”,并希望将它们合并到“id”列: data = data.frame(id = c(1,2,3,4,5),state = c("KS","MN","AL","FL","CA"))
scores = data.frame(id = c(1,1,3),score = c(66,75,78,86,85,76,90))
merge(data,scores,by = "id")
semi_join(data,by = "id")
在“得分”数据中,存在具有多个观察的“id”,其中每个匹配在连接之后获得一行.看?合并:
但是,我希望只保留与得分表中第一个匹配对应的行. 半连接本来不错,但我无法从右表中选择得分. 有什么建议么? 解决方法使用data.table以及mult =“first”和nomatch = 0L:require(data.table) setDT(scores); setDT(data) # convert to data.tables by reference scores[data,mult = "first",on = "id",nomatch=0L] # id score state # 1: 1 66 KS # 2: 2 86 MN # 3: 3 76 AL 对于数据的id列中的每一行,找到score’id列中的匹配行,并保留第一行(因为mult =“first”).如果没有匹配,则删除它们(因为nomatch = 0L). (编辑:安卓应用网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
相关内容
- sql-server – 如何计算SQL Server中多个点之间的距离?
- 数据仓库和数据库的实现差异
- sql-server – 监控SQL Server 2008
- SQL Server利用sys.sysprocesses检查SqlServer的阻塞和死锁
- tsql – 在Sql Server数据库架构比较中禁用了更新目标按钮
- sql – 从Oracle表中选择所有列和常量值
- sql-server – SQL Server模拟和连接池
- sql – 在所有查询中都有TRANSACTION
- SQL Server Management Studio中“go”附近的语法不正确
- sql – 如何计算Oracle中的唯一行
