pandas数据预处理之dataframe的groupby操作方法-创新互联
在数据预处理过程中可能会遇到这样的问题,如下图:数据中某一个key有多组数据,如何分别对每个key进行相同的运算?
创新互联是一家专业的成都网站建设公司,我们专注成都做网站、网站制作、网络营销、企业网站建设,买链接,一元广告为企业客户提供一站式建站解决方案,能带给客户新的互联网理念。从网站结构的规划UI设计到用户体验提高,创新互联力求做到尽善尽美。dataframe里面给出了一个group by的一个操作,对于”group by”操作,我们通常是指以下一个或多个操作步骤:
l (Splitting)按照一些规则将数据分为不同的组;
l (Applying)对于每组数据分别执行一个函数;
l (Combining)将结果组合到一个数据结构中;
使用dataframe实现groupby的用法:
# -*- coding: UTF-8 -*- import pandas as pd df = pd.DataFrame([{'col1':'a', 'col2':1, 'col3':'aa'}, {'col1':'b', 'col2':2, 'col3':'bb'}, {'col1':'c', 'col2':3, 'col3':'cc'}, {'col1':'a', 'col2':44, 'col3':'aa'}]) print df # 按col1分组并按col2求和 print df.groupby(by='col1').agg({'col2':sum}).reset_index() # 按col1分组并按col2求最值 print df.groupby(by='col1').agg({'col2':['max', 'min']}).reset_index() # 按col1 ,col3分组并按col2求和 print df.groupby(by=['col1', 'col3']).agg({'col2':sum}).reset_index()
分享题目:pandas数据预处理之dataframe的groupby操作方法-创新互联
转载注明:http://scjbc.cn/article/iohci.html