IT俱乐部 Python MongoDB按时间分组操作实战

MongoDB按时间分组操作实战

需求

需求是这样的,要统计每一周的各个商品的销售记录,使用 echarts 图表呈现,如下图

说实话,一开始听到这个需求的时候,我是有点慌的,因为 MongoDB 的分组玩的比较少(Mysql 也差不多),又要按照对应的星期来进行分组,这在之前学习 MongoDB 的时候还没接触过,于是就准备写了这篇文章,来记录下我是如何进行分组的

MongoDB 的一些时间操作符

时间操作符(专业术语应该不是这个,后文暂且使用这个来描述),后面会用到的

  •  $dayOfYear: 返回该日期是这一年的第几天。(全年366天)
  •  $dayOfMonth: 返回该日期是这一个月的第几天。(1到31)
  •  $dayOfWeek: 返回的是这个周的星期几。(1:星期日,7:星期六)
  •  $year: 返回该日期的年份部分
  •  $month: 返回该日期的月份部分(between 1 and 12.)
  •  $week: 返回该日期是所在年的第几个星期(between 0 and 53)
  •  $hour: 返回该日期的小时部分
  •  $minute: 返回该日期的分钟部分
  •  $second: 返回该日期的秒部分(以0到59之间的数字形式返回日期的第二部分,但可以是60来计算闰秒。)
  •  $millisecond:返回该日期的毫秒部分(between 0 and 999.)
  •  $dateToString:{ $dateToString: { format: , date: } }

日期分组

mongdb 聚合查询日期 统计每天数据

db.getCollection('Br-Special').aggregate(  
    [     
        {   $project : { day : {$substr: ["$datetime", 0, 10] }}},          
        {   $group   : { _id : "$day",  number : { $sum : 1 }}},  
        {   $sort    : { _id : -1 }}          
    ]  
)

result:

关于日期分组的话,我是借鉴了上面的,也确实带我解惑了下如何按照日期分组。这里贴下我的代码

 let list = await this.goodsModel
   .aggregate([
     { $project: { date: { $dateToString: ['$created_at', 0, 10] } } },
     { $group: { _id: '$date', count: { $sum: 1 } } },
     { $project: { date: '$_id', _id: 0, count: 1 } }, // 再使用$project将_id改名为date
     { $sort: { date: -1 } }, // 根据日期倒序
   ])
   .exec();

或者使用时间操作符(更准确一点)

 let list = await this.goodsModel
   .aggregate([
     {
       $project: { date: { $dateToString: { format: '%Y-%m-%d', date: '$created_at' } } },
     },
     { $group: { _id: '$date', count: { $sum: 1 } } },
     { $project: { date: '$_id', _id: 0, count: 1 } }, // 再使用$project将_id改名为date
     { $sort: { date: -1 } }, // 根据日期倒序
   ])
   .exec();

通过

要注意的是,$group 里的属性必须为_id,不然无法分组

获取到的数据如下(这里只显示一周)

 [
   { "count": 54, "date": "2021-08-30" },
   { "count": 29, "date": "2021-08-29" },
   { "count": 16, "date": "2021-08-28" },
   { "count": 17, "date": "2021-08-27" },
   { "count": 12, "date": "2021-08-26" },
   { "count": 6, "date": "2021-08-25" }
   // { "count": 0, "date": "2021-08-24" },
 ]

如果只是日期和总商品的话,上面就足以显示对应的数据了,可我要根据星期进行分组的话,就需要替换 MongoDB 的时间转化函数了

星期分组

星期分组的话,其实也挺简单的,只需要把上面的

 $project: { day: { $dateToString: { format: "%Y-%m-%d", date: "$created_at" } } }

替换成

 $project: {
   week: {
     $dayOfWeek: {
       date: '$created_at';
     }
   }
 }

完整代码如下

 // 要获取的是一周前的零点时间
 let lastweekDay = dayjs(dayjs().add(-7, 'day').format('YYYY-MM-DD')).valueOf();
 ​
 let list = await this.goodsModel
   .aggregate([
     { $match: { created_at: { $gte: new Date(lastweekDay) } } }, //范围时间
     { $project: { week: { $dayOfWeek: { date: '$created_at' } } } },
     { $group: { _id: '$week', count: { $sum: 1 } } },
     { $project: { week: '$_id', _id: 0, count: 1 } }, // 再使用$project将_id改名为week
     { $sort: { week: 1 } }, // 根据星期正序
   ])
   .exec();

获取的结果如下

 [
   { count: 29, week: 1 }, // 星期七(日)
   { count: 54, week: 2 }, // 星期一
   { count: 1, week: 3 }, // 星期二
   { count: 9, week: 4 }, // 星期三
   { count: 12, week: 5 }, // 星期四
   { count: 17, week: 6 }, // 星期五
   { count: 16, week: 7 }, // 星期六
 ];

但是,细心的你可能会发现,貌似数据对不上,注当天时间为 2021-08-30,星期一

 [
   { “count”: 54, “date”: “2021-08-30” }, // 星期一
   { “count”: 29, “date”: “2021-08-29” }, // 星期七(日)
   { “count”: 16, “date”: “2021-08-28” }, // 星期六
   { “count”: 17, “date”: “2021-08-27” }, // 星期五
   { “count”: 12, “date”: “2021-08-26” }, // 星期四
   { “count”: 9, “date”: “2021-08-25” }, // 星期三
   { “count”: 1, “date”: “2021-08-24” } // 星期二
 ]

其实只需要把星期向后排序一位就行,因为星期本来就是将星期日作为第一天的,至此,按照星期分组总商品就算完毕了。同理,要按照月份,年份,甚至小时,分钟,都可以直接利用时间操作符转化时间来进行分组。

多商品

上述只是获取了总商品了,要细分为多个商品的话,就需要再次利用聚合函数来进行分组了。

这里先演示分组多个商品先,就和正常分组一样

 let list = await this.goodsModel.aggregate([
 { $group: { _id: "$type", count: { $sum: 1 } } },
 ]).exec()

结果如下(这里输出_id,是因为没有进行$project 改别名,商品所采用的是数字表示)

 [
   { “_id”: 1, “count”: 111 },
   { “_id”: 2, “count”: 18 },
   { “_id”: 4, “count”: 2 },
   { “_id”: 3, “count”: 16 }
 ]

可以看到统计的是直接是所有商品的总和。

但问题来了,怎么样能分组星期的同时,又对每个商品所在星期进行分组,并且到底是优先分组星期期呢,还是优先分组商品呢,这让我陷入深深的思考。

最终实现

首先,绝对不可能使用两次$group,要么没有星期分组,要么没有商品分组,于是我就把思路放在$project$group内,看看内部是否有其他方法可以实现。

其中$group可以将属性添加为数组,注意 goods: { $push: "$goods" }

 let list = await this.goodsModel
   .aggregate([
     { $match: { created_at: { $gte: new Date(lastweekDay) } } },
     { $project: { week: { $dayOfWeek: { date: '$created_at' } }, goods: 1 } },
     { $group: { _id: '$week', goods: { $push: '$goods' } } },
     { $project: { week: '$_id', _id: 0, goods: 1 } },
     { $sort: { week: 1 } },
   ])
   .exec();

可得到的数据却是这样的

 [
   {
     “goods”: [4, 4, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 4, 1, 1, 1, 1, 1, 1, 1],
     “week”: 1
   },
   {
     “goods”: [1, 1, 1, 1, 5, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 4, 1, 1, 1, 1, 1, 4, 1, 4, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
     “week”: 2
   },
   {
     “goods”: [1],
     “week”: 3
   },
   {
     “goods”: [3, 3, 3, 3, 3, 3, 3, 3, 4],
     “week”: 4
   },
   {
     “goods”: [3, 1, 1, 1, 3, 4, 1, 1, 1, 1, 1, 1],
     “week”: 5
   },
   {
     “goods”: [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 3, 3, 1, 1, 1, 1, 1],
     “week”: 6
   },
   {
     “goods”: [4, 3, 1, 1, 3, 3, 3, 3, 3, 1, 1, 1, 1, 1, 1, 1],
     “week”: 7
   }
 ]

数据很接近了,如果我能把对应的商品总和算起来就行了,但问题是怎么合起来。。。

待会,goods 既然是数组的话,那我能不能$unwind全部展开,然后我再来一次聚合,说干就干!

 let list = await this.goodsModel
   .aggregate([
     { $match: { created_at: { $gte: new Date(lastweekDay) } } },
     { $project: { week: { $dayOfWeek: { date: '$created_at' } }, goods: 1 } },
     { $group: { _id: '$week', goods: { $push: '$goods' } } },
     { $project: { week: '$_id', _id: 0, goods: 1 } },
     { $sort: { week: 1 } },
     { $unwind: '$goods' },
   ])
   .exec();

得到的数据(省略一堆)

 [
   { “goods”: 4, “week”: 1 },
   { “goods”: 4, “week”: 1 },
   { “goods”: 1, “week”: 1 },
   { “goods”: 1, “week”: 1 },
   { “goods”: 1, “week”: 2 },
   { “goods”: 1, “week”: 3 },
   { “goods”: 1, “week”: 4 }
 ]

然后我就卡住了,因为我无论如何都无法分组一个字段的时候,又加以限制条件,要么分组商品的时候,统计的是一周各商品总数据,要么就是分组星期的时候,统计的是总的商品数据。在搜索大量资料后,查看官方一些文档也未果,于是我决定自行写一个 js 函数来进行排序(实在是折腾不动了,能力有限 🥱)

最终完整代码

 let lastweekDay = dayjs(dayjs().add(-7, 'day').format('YYYY-MM-DD')).valueOf();
 ​
 let list = await this.goodsModel
   .aggregate([
     { $match: { created_at: { $gte: new Date(lastweekDay) } } },
     { $project: { week: { $dayOfWeek: { date: '$created_at' } }, goods: 1 } },
     { $group: { _id: '$week', goods: { $push: '$goods' } } },
     { $project: { week: '$_id', _id: 0, goods: 1 } },
     { $sort: { week: 1 } },
     // { $unwind: "$goods" },
   ])
   .exec();
 ​
 function getEleNums(data) {
   var map = {};
   data.forEach((e) => {
     if (map[e]) {
       map[e] += 1;
     } else {
       map[e] = 1;
     }
   });
   return map;
 }
 ​
 list = list.map((l) => {
   l.goods = getEleNums(l.goods);
   return l;
 });
 cosnole.log(list);

运行后的 list 结果为

 [
   { “goods”: { “1”: 26, “4”: 3 }, “week”: 1 },
   { “goods”: { “1”: 53, “4”: 3, “5”: 1 }, “week”: 2 },
   { “goods”: { “1”: 1 }, “week”: 3 },
   { “goods”: { “3”: 8, “4”: 1 }, “week”: 4 },
   { “goods”: { “1”: 9, “3”: 2, “4”: 1 }, “week”: 5 },
   { “goods”: { “1”: 15, “3”: 2 }, “week”: 6 },
   { “goods”: { “1”: 9, “3”: 6, “4”: 1 }, “week”: 7 }
 ]

如果是要 goods为分组的话,只需要把上面聚合代码中week和goods替换一下便可。

另一种实现方式

专门新建一个表,用于统计每天的销售记录,然后分组的时候就根据该表就行了,具体代码就实现了,思路是挺简单的,但是需要新建一个表,增加记录的时候有需要增加代码,如果业务复杂的话。。。

总结

到此这篇关于MongoDB按时间分组操作实战的文章就介绍到这了,更多相关MongoDB按时间分组内容请搜索IT俱乐部以前的文章或继续浏览下面的相关文章希望大家以后多多支持IT俱乐部!

本文收集自网络,不代表IT俱乐部立场,转载请注明出处。https://www.2it.club/code/python/8923.html
上一篇
下一篇
联系我们

联系我们

在线咨询: QQ交谈

邮箱: 1120393934@qq.com

工作时间:周一至周五,9:00-17:30,节假日休息

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部