MongoDB数据库去重

时间:2021-11-06 16:34:02

查询:

db.patents_texts.aggregate([
{
    $group:{_id:{Patent_num:'$Patent_num',Patent_name:'$Patent_name'},count:{$sum:1}
    }},
    {$match:{count:{$gt:1}}}
   ]);

删除:

db.patents_texts.aggregate([
  {
    $group:{_id:{Patent_num:'$Patent_num',Patent_name:'$Patent_name'},count:{$sum:1},dups:{$addToSet:'$_id'}}
  },
  {
    $match:{count:{$gt:1}}
  }
  ]).forEach(function(doc){
    doc.dups.shift();
    db.patents_texts.remove({_id:{$in:doc.dups}});
  });