Mongoose:Schema之路

时间:2025-01-18 11:03:56

说明:本文在个人博客地址为edwardesire.com,欢迎前来品尝。


  1. Mongoose学习

    Mongoose:Schema之路

    这里的Mongoose当然不是图片上的萌物,它是一个MongoDB对象建模工具(object modeling tool),以前在sails上用的Waterline是ORM (Object Relational Mapper)。当使用Mongoose时,我们不在需要在数据库中创建好结构(Schema)之后,再与后端代码中创建的对象或类进行映射这样繁琐的操作。在Mongoose的封装下,我们只需定义好JSON类型的数据结构即可。当然我没有在Nodejs直接使用过MongoDB,不过想想一定也是很麻烦的。

    Mongoose的优点还有很多,我比较笼统地说一下。它实用性在于与数据库的交互是一种结构化以及可重复的方式,有助于进行一些很普遍的数据库任务,也减少了嵌套回调的复杂性。还有的是它不像MongoDB直接返回一个JSON的字符串,而是返回JSON对象。当然,目前Mongoose对于Schema-less data、Random documents、Pure Key-Value pairs是无解的。

    • 1.1 connection

      第一步当然是连接数据库了。如图,连接数据库的配置文大致分为三步。

      Mongoose:Schema之路

      第一步是进行连接,连接字符串 mongodb://<db_user>:<db_password>@<hostname>:<port>/<dbname>中间必须填写的部分为server和hostname,我们可以使用两种方法来打开数据库连接(mongoose.connect和createConnection):我一般就使用mongoose.connect(db);,当我们需要使用多数据库连接时,我们就需要使用第二种方法了 var connectName = mongoose.createConnection(db#);第二步就是输出运行日志信息,在成功连接、断开连接或者报错时,监听相应的事件并在console输出运行信息;第三步是断开连接,一般的最佳实践是在程序运行时就打开连接,而程序停止或重启时就需要手动断开数据库连接。

    • 1.2 Schema Model

      Schema是一个文档的数据结构,正如我前面提到的,它在Mongoose是一个JSON对象。它最大的特点就是无需确定字段的大小,这特别适用于需要改变对象大小的情况。

      它支持8种数据类型(String、Number、Date、Boolean和Buffer、ObjectId、Mixed、ObjectId、Mixed、Array)。Buffer是用来存储2进制数据,ObjectId是不同于_id的特定的识别符。Mixed可以指定任意类型,不过Mongoose不会自动识别。Array用来存放基本数据类型,也可以是子文档。比如

        var childrenSchema = new Schema({
      //some structure
      });
      var fatherSchema = new Schema({
      //some structure
      children: [childrenSchema]
      });

      Model是对应Schema的编译版本,一个model的实例直接映射为数据库中的一个文档。基于这种关系,model处理所有的文档交互(也就是下文的CRUD)。我们通过 mongoose.model(modelname, schemaName)来构建model。这样一来我们就可以一鼓作气地将数据存入数据了。

        var mongoose = require('mongoose');
      var Schema = mongoose.Schema; //声明Schema
      var nodeSchema = new Schema({
      name: String,
      age: Number
      });
      //构建model
      mongoose.model('Node', nodeSchema);
      //简单的数据交互
      //创建两个实例
      var node = new Node({name: 'Edward', age: '23'});
      node.save(function(err){
      if(err){
      console.log(err);
      }else{
      console.log('The new node is saved');
      }
      });
    • 1.3 CRUD

      我们把Create、Read、Update、Delete操作一起称呼为CRUD,这4个操作是持久性存储的基本操作。在Mongoose中的模型方法(Model methods)对应的就有有Model.create(),Model.find(),Model.update(),Model.remove()方法,实例方法也是一样的,不过他作用于特定的实例罢了。

      • 1.3.1 Create Data

        首先是创建数据的模型方法 Model.create(),此方法直接将数据存入数据库。

          Node.create({name: 'Edward', age: '23'}, function(err, node, numAffected){
        if(err){
        res.send({'success':false,'err':err});
        }else{
        res.send({'success':true});
        console.log("node created and saved: " + node);
        res.redirect('/');
        }
        });

        而实例方法就是在创建实例就将数据以JSON对象传递给实例(如上一节的例子),当然我们也可以在实例创造之后再添加数据。

          var node = new Node();
        node.age = 23;

        但是这都只是保存在了应用,我们需要使用instance.save()保存。一步到位的写法如下。

          var node = new Node({name: 'Edward', age: '23'}).save(function(err){
        if(err){
        console.log(err);
        }else{
        console.log('The new node is saved');
        }
        });
      • 1.3.2 Read Data

        读取数据,模型方法有3种:Model.find()---找到所有符合添加的文档并返回一个表单, Model.findOne()---返回首先找到的单个文档,Model.findById()---通过ID(唯一)来查找。这3属于静态方法,我们也可以创建自己的静态方法。比如通过文档中的某个键来查找数据。

          Dtree.findByName(req.params.name, function(err, dtree){
        if(!err){
        //do something
        }else{
        console.log('Somthing wrong: ' + err);
        }
        });

        这些方法的完整参数为 Model.find(conditions, [fields], [options], [callback]),可选项fields为指定返回的值,options为指定序列等。具体的细节可以看文档MongooseAPI。需要注意的是,如果不定义回调函数的话,需要使用.exec()来显性调用更新函数。

      • 1.3.3 Update Data

        更新数据同样有3个静态模型方法:Model.update(),Model.findOneAndUpdate(),Model.findByIdAndUpdate()。他们的参数都有4个(conditions, update, ooptions,callback)。同样在文档MongooseAPI中可以查询到。

        但是这3种方法都无法使用一些自定义的运行机制。而这有一套标准做法:find-edit-save方法。我们来看看例子。

          //1.查找记录
        Dtree.findByName(req.params.name, function(err, dtree){
        if(!err){
        //成功读取dtree
        //读取JSON文件,获得需要添加的内容
        var json;
        fs.readFile('./public/javascripts/update.json', 'utf8', function (err, data) {
        if(err) throw err;
        json = JSON.parse(data);
        //2.修改dtree记录,将json插入到structure
        dtree.structure.push(json);
        //3.保存记录到数据库
        dtree.save(function(err, tree){
        if(err){
        console.log('Somthing wrong: ' + err);
        }else{
        console.log('Add a new node', tree);
        res.redirect('/dtree/json/Type00');
        }
        });
        });
        }else{
        console.log('Somthing wrong: ' + err);
        }
        });
      • 1.3.4 Delete Data

        删除数据同样需要查找到数据再删除:Model.remove(),Model.findOneAndRemove(),Model.findByIdAndRemove()。.remvoe()的参数就是可选择的callback,后面两个还多了一个option参数,具体可查询Mongoose API。而.remove()方法可以作为模型方法调用,也可以作为实例方法调用。

          //Model method
        Node.remove({name: 'Edward'} function(err){
        if(!err){
        //成功删除所有name为Edward的文档
        }
        }); //Instance method
        Node.findOne({name: 'Edward'}, function(err, node){
        if(!err){
        node.remove(function(err){
        //成功删除首位name为Edward的文档
        });
        }
        });

    好了,Mongoose的学习就暂时告一段落,接下来说说项目遇到的问题。


  1. 项目实战

    前端传到后台的内容为一个json结构的决策树,大致的结构如下。分为三大部分:config,parameter,structure。

    Mongoose:Schema之路

    前面两部分相对比较容易解决,最大的问题是structure中有个children子节点,而子节点还会增加新的子节点,具体层级也是随着问题变化的。在我的第一版Schema中很天真地这样定义。

     var dtreeSchema = new Schema{
    //其他数据结构
    structure: [chilldrenSchema]
    };
    var chilldrenSchema = new Schema{
    //其他数据结构
    children: [chilldrenSchema]
    };

    程序的控制是这样写的

     //params req.params.name
    exports.createDtreeChildren = function(req, res){
    //Find dtree by name
    Dtree.findByName(req.params.name, function(err, dtree){
    if(!err){
    //成功读取tree
    //读取新增结点
    var json;
    fs.readFile('./public/javascripts/update.json', 'utf8', function (err, data) {
    if(err)throw err;
    json = JSON.parse(data);
    //structure parse
    //structure 为一个数组
    //structure[i] 为首个结点
    //structure[i].children 为其子节点
    var newchildren = dtree.structure[0].children;
    //2.插入structure
    dtree.structure[0].children.push(json);
    console.log(dtree.structure[0].children);
    dtree.markModified(dtree.structure[0].children);
    //3.save to mongodb
    dtree.save(function(err, tree){
    if(err){
    console.log('Somthing wrong: ' + err);
    }else{
    console.log('Add a new node: '+ dtree.structure[0].children);
    res.redirect('/dtree/json/Type00');
    }
    });
    });
    }else{
    console.log('Somthing wrong: ' + err);
    }
    });
    };

    这样会出现一个问题,那就是输出(dtree.structure[0].children)的是正确修改后的数据,而却没有正确存入数据库。其中的原因是Mogoose对于结构的声明是有严格顺序的(Order of schema declarations)。同样的,我在第二次修改后,chilldrenSchema写到了dtreeSchema的前面,chilldrenSchema自己的children的[chilldrenSchema]类型如期望一样无法存入数据库,Mongoose把undefined(具体是[undefined]还是undefined我不确定)。我想到了一个十分丑陋的解决方法就是手动地添加足够大的层数。

     var ninethChilldrenSchema = new Schema{
    //其他数据结构
    //children: [nextLaryerChilldrenSchema]
    };
    var eighthChilldrenSchema = new Schema{
    //其他数据结构
    children: [ninethChilldrenSchema]
    };
    //中间依次类推到底
    var chilldrenSchema = new Schema{
    //其他数据结构
    children: [secondChilldrenSchema]
    };
    var dtreeSchema = new Schema{
    //其他数据结构
    structure: [chilldrenSchema]
    };

    这种类似于俄罗斯套娃结构的方法能解决一部分问题,但是无法适应真实应用环境。因为决策树的层数是可大可小的,也无法预估一个合适的最大值,况且代码也不美观。这个问题也一直悬在这里,希望有大神能够留下联系方式和解决方法,予人玫瑰,手留余香。而项目因为时间关系,估计就只能修改结构来逃避这个问题了。

  2. Next

    选择的替代方案是将这种树状结构变成简单的数组结构,然后在后端与前端交互时进行树结构的拼接和拆散。这种方法涉及到树与二叉树的转化以及二叉树的序列化两方面知识。好好学习