pandas-sql小技巧
问题描述
统计不同产品在不同时间段的销量,即,A产品统计1-5号,B产品统计3-7号的销量….
分析
对于这种简单问题,首先想到的是,用SQL去做,只要提取对应的时间区间就好了。
SQL语法如下:
先取出指定日期区间的数据
-- 先取出指定日期区间的数据
select a.id as 产品ID, a.saledate as 销售日期, a.salecount as 销量
from a(销量表) , b(产品时间表) where a.id=b.id
and a.saledate>=b.startdate(统计开始时间)
and a.saledate<=b.enddate(统计结束时间)
然后再汇总销量
select id, sum(salecount) as 总销量 from tb group by id