python – pandas:根据列值在df中查找事件的第一个事件并标记为新的列值
发布时间:2020-05-25 06:43:05 所属栏目:Python 来源:互联网
导读:我有一个如下所示的数据框:customer_id event_date data 1 2012-10-18 0 1 2012-10-12 0 1 2015-10-12 0 2 2012-09-02 0 2
|
我有一个如下所示的数据框:
我希望添加其他列,例如’flag_1’和&下面的’flag_2′,允许我自己(以及其他我传递修改后的数据时)轻松过滤. Flag_1表示该客户在数据集中的首次出现.我通过排序成功实现了这个: 当列’数据’= 1时,Flag_2将指示每个客户的第一次发生. 实现的附加列的示例如下所示:
我是pandas的新手并不确定如何实现’flag_2’列而不迭代整个数据帧 – 我认为有一种更快的方法来实现使用内置函数但没有找到任何帖子? 谢谢 最佳答案 首先初始化空标志.使用groupby基于customer_id获取组.对于第一个标志,使用loc为每个组中的第一个值设置flag1的值.对flag2使用相同的策略,但首先过滤数据已设置为1的情况. (编辑:安卓应用网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
