我想合并具有几乎相同值的行,但是我想合并不同的值,这样我就不会丢失以后要分析的信息。
我有以下数据集:
SessionId Client id Product_type Item quantity
1 1 Couch 1
1 1 Table 1
2 2 Couch 1
2 2 Chair 5
我想要一个类似的输出:
SessionId Client id Product_type Item quantity
1 1 Couch, Table 2
2 2 Couch, Chair 6
因此,我需要根据会话ID合并行。但是对于列产品类型,我想将字符名称互相粘贴,对于项目数量,我想对数量求和。我有更多的列,但这些值可以保持不变。
也许我需要分两个步骤进行操作,但是我不确定如何开始。希望有人可以帮助我。
可以这样实现
Created on 2020-05-23 by the reprex package (v0.3.0)
尝试这个。
输出为:
数据