需求:统计每个用户下的评论,合并在一起
原评论 内容有点刺激
合并后是list
再次转为字符串,有的中间是连续两个标点符号,这种先不管,后续清理
最后的代码
最后源码
df_comms_merge=df1.groupby('fromUserUid').apply(lambda x: ','.join(x['content']))
print(df_comms_merge.iloc[-1]) print(df_comms_merge.index[-1])
# 关键点解释:
# groupby('fromUserUid'):需要分组的字段
# join(x['content'])]):需要合并字符串的字段
公式:df.groupby('分组字段').apply(lambda x: ','.join(x['合并字段']))
【 思维拓展 】:join前面可以改成自己喜欢格式,比如| + 等
资料参考:https://blog.csdn.net/qq_32618817/article/details/80430841