Node.js 15:《Mongodb 與 Mongoose 的使用》

2018-08-07 15:23 更新

目標(biāo)

無(wú)明確目標(biāo)

知識(shí)點(diǎn)

  1. 了解 mongodb (http://www.mongodb.org/ )
  2. 學(xué)習(xí) mongoose 的使用 (http://mongoosejs.com/ )

課程內(nèi)容

mongodb

mongodb 這個(gè)名詞相信大家不會(huì)陌生吧。有段時(shí)間 nosql 的概念炒得特別火,其中 hbase redis mongodb couchdb 之類(lèi)的名詞都相繼進(jìn)入了大眾的視野。

hbase 和 redis 和 mongodb 和 couchdb 雖然都屬于 nosql 的大范疇。但它們關(guān)注的領(lǐng)域是不一樣的。hbase 是存海量數(shù)據(jù)的,redis 用來(lái)做緩存,而 mongodb 和 couchdb 則試圖取代一些使用 mysql 的場(chǎng)景。

mongodb 的官網(wǎng)是這樣介紹自己的:

MongoDB (from "humongous") is an open-source document database, and the leading NoSQL database. Written in C++

開(kāi)源、文檔型、nosql。

其中文檔型是個(gè)重要的概念需要理解。

在 sql 中,我們的數(shù)據(jù)層級(jí)是:數(shù)據(jù)庫(kù)(db) -> 表(table) -> 記錄(record)-> 字段;在 mongodb 中,數(shù)據(jù)的層級(jí)是:數(shù)據(jù)庫(kù) -> collection -> document -> 字段。這四個(gè)概念可以對(duì)應(yīng)得上。

文檔型數(shù)據(jù)這個(gè)名字中,“文檔”兩個(gè)字很容易誤解。其實(shí)這個(gè)文檔就是 bson 的意思。bson 是 json 的超集,比如 json 中沒(méi)法儲(chǔ)存二進(jìn)制類(lèi)型,而 bson 拓展了類(lèi)型,提供了二進(jìn)制支持。mongodb 中存儲(chǔ)的一條條記錄都可以用 bson 來(lái)表示。所以你也可以認(rèn)為,mongodb 是個(gè)存 bson 數(shù)據(jù)的數(shù)據(jù)庫(kù),或是存哈希數(shù)據(jù)的數(shù)據(jù)庫(kù)。

mongodb 相對(duì)于它的競(jìng)爭(zhēng)對(duì)手們來(lái)說(shuō)——比如 couchdb,它的一大優(yōu)勢(shì)就是盡可能提供與 sql 對(duì)應(yīng)的概念。之前說(shuō)了,sql 中的記錄對(duì)應(yīng) mongodb 中的 document,記錄這東西是一維的,而 document 可以嵌套很多層。在某些場(chǎng)景下,比如存儲(chǔ)一個(gè)文章的 tags,mongodb 中的字段可以輕松存儲(chǔ)數(shù)組類(lèi)型,而 sql 中就需要設(shè)計(jì)個(gè)一對(duì)多的表關(guān)系出來(lái)。

假設(shè)有一個(gè) blog 應(yīng)用,其中有張 Post 表,表中有用戶發(fā)表的一些博客內(nèi)容(post)。

這些 post 文檔的樣子大概會(huì)是這樣:

var post = {
  title: '呵呵的一天',
  author: 'alsotang',
  content: '今天網(wǎng)速很差',
  tags: ['呵呵', '網(wǎng)速', '差'],
};

mongodb 中有個(gè)最亮眼的特性,就是 Auto-Sharding,sharding 的意思可以理解成我們 scale sql 時(shí)的分表。

在 mongodb 中,表與表之間是沒(méi)有聯(lián)系的,不像 sql 中一樣,可以設(shè)定外鍵,可以進(jìn)行表連接。mongodb 中,也無(wú)法支持事務(wù)。

所以這樣的表,無(wú)債一身輕。可以很輕易地 scale 至多個(gè)實(shí)例(假設(shè)實(shí)例都有不同的物理位置)上。在 mongodb 中,實(shí)時(shí)的那些查詢,也就只能進(jìn)行條件查詢:某某大于一個(gè)值或某某等于一個(gè)值。而 sql 中,如果一張表的數(shù)據(jù)存在了多個(gè)實(shí)例上的話,當(dāng)與其他表 join 時(shí)候,表之間的運(yùn)來(lái)運(yùn)去會(huì)是個(gè)很慢的過(guò)程,具體我也不太懂。

反正使用 mongodb 時(shí),一定要思考的兩點(diǎn)就是:表 join 到底要不要,事務(wù)支持到底要不要。

mongodb 中的索引特性跟 sql 中差不多,只是它對(duì)于嵌套的數(shù)據(jù)類(lèi)型也提供了支持。在建立復(fù)合索引時(shí),mongodb 可以指定不同字段的排序,比如兩個(gè)字段 is_top(置頂) 和 create_time(創(chuàng)建時(shí)間) 要建立復(fù)合索引,我們可以指定 is_top 按正序排,create_time 按逆序排。mysql 說(shuō)是有計(jì)劃支持這個(gè)特性,不過(guò)目前也沒(méi)什么消息。不過(guò)這點(diǎn)不重要。

mongodb 中,collection 是 schema-less 的。在 sql 中,我們需要用建表語(yǔ)句來(lái)表明數(shù)據(jù)應(yīng)該具有的形式,而 mongodb 中,可以在同一張里存各種各樣不同的形式的數(shù)據(jù)。同一個(gè) collection 中,可以有些 document 具有 100 個(gè)字段,而另一些,則只具有 5 個(gè)字段。如果你分不清這個(gè)特性的使用場(chǎng)景,那么請(qǐng)像使用 sql 一樣的,盡可能保證一個(gè) collection 中數(shù)據(jù)格式是統(tǒng)一的。這個(gè) schema-less 的特性,有個(gè)比較典型的場(chǎng)景是用來(lái)存儲(chǔ)日志類(lèi)型的數(shù)據(jù),可以搜搜看這方面的典型場(chǎng)景。

mongodb 和 mysql 要我選的話,無(wú)關(guān)緊要的應(yīng)用我會(huì)選擇 mongodb,就當(dāng)個(gè)簡(jiǎn)單的存 json 數(shù)據(jù)的數(shù)據(jù)庫(kù)來(lái)用;如果是線上應(yīng)用,肯定還是會(huì)選擇 mysql。畢竟 sql 比較成熟,而且各種常用場(chǎng)景的最佳實(shí)踐都有先例了。

我所在的阿里巴巴數(shù)據(jù)平臺(tái),有各種各樣的大數(shù)據(jù)系統(tǒng)。有些做離線計(jì)算,一算就是幾個(gè)小時(shí),算出來(lái)的結(jié)果被緩存起來(lái),查詢時(shí)候就可以實(shí)時(shí)得到結(jié)果,只是數(shù)據(jù)一致性上,不可避免會(huì)有 delay;有些做實(shí)時(shí)運(yùn)算,可以在 1s 內(nèi)從幾千萬(wàn)條數(shù)據(jù)中算出一個(gè)復(fù)雜條件的結(jié)果。但它們都提供了 sql 的接口,也就是說(shuō),無(wú)論底層他們是如何讓幾百臺(tái)機(jī)器 mapreduce,都讓你可以用已有的 sql 知識(shí)進(jìn)行查詢。所以還是選擇 sql 省事啊。

這里還有個(gè)很好玩的網(wǎng)站:http://www.mongodb-is-web-scale.com/

順便說(shuō)說(shuō) mongodb 與 redis 的不同。mongodb 是用來(lái)存非臨時(shí)數(shù)據(jù)的,可以認(rèn)為是存在硬盤(pán)上,而 redis 的數(shù)據(jù)可以認(rèn)為都在內(nèi)存中,存儲(chǔ)臨時(shí)數(shù)據(jù),丟了也無(wú)所謂。對(duì)于稍微復(fù)雜的查詢,redis 支持的查詢方式太少太少了,幾乎可以認(rèn)為是 key-value 的。據(jù)說(shuō) instagram 的數(shù)據(jù)就全部存在 redis 中,用了好幾個(gè)幾十 G 內(nèi)存的 aws ec2 機(jī)器在存。redis 也是支持把數(shù)據(jù)寫(xiě)入硬盤(pán)的,aof 貌似都過(guò)時(shí)了,好久沒(méi)關(guān)注了。

mongodb 與 hbase 的區(qū)別。如果說(shuō)你已經(jīng)在考慮使用 hbase 了的話,應(yīng)該也不用我介紹它們的區(qū)別了吧..

主題所限,就不展開(kāi)講了。這之間的選擇和權(quán)衡,說(shuō)起來(lái)真的是個(gè)很大的話題。

我對(duì)這方面的話題很感興趣,如果要討論這方面話題的話,可以去 https://cnodejs.org/ 發(fā)個(gè)帖,詳細(xì)描述一下場(chǎng)景然后 at 我(@alsotang)。

mongodb 的官網(wǎng)中有一些特性介紹:

其中標(biāo)有箭頭的是基本概念,圓圈的是進(jìn)階概念,畫(huà)叉的不必了解。

安裝 mongodb

課程到這,一直忘記說(shuō) mongodb 的安裝了。

ubuntu: http://docs.mongodb.org/manual/tutorial/install-mongodb-on-ubuntu/

mac: $ brew install mongodb

裝好以后,在命令行 $ mongod,然后另外開(kāi)個(gè) shell 窗口,輸入 $ mongo 就能使用了。

mongoose

mongoose 是個(gè) odm。odm 的概念對(duì)應(yīng) sql 中的 orm。也就是 ruby on rails 中的 activerecord 那一層。orm 全稱(chēng)是 Object-Relational Mapping,對(duì)象關(guān)系映射;而 odm 是 Object-Document Mapping,對(duì)象文檔映射。

它的作用就是,在程序代碼中,定義一下數(shù)據(jù)庫(kù)中的數(shù)據(jù)格式,然后取數(shù)據(jù)時(shí)通過(guò)它們,可以把數(shù)據(jù)庫(kù)中的 document 映射成程序中的一個(gè)對(duì)象,這個(gè)對(duì)象有 .save .update 等一系列方法,和 .title .author 等一系列屬性。在調(diào)用這些方法時(shí),odm 會(huì)根據(jù)你調(diào)用時(shí)所用的條件,自動(dòng)轉(zhuǎn)換成相應(yīng)的 mongodb shell 語(yǔ)句幫你發(fā)送出去。自然地,在程序中鏈?zhǔn)秸{(diào)用一個(gè)個(gè)的方法要比手寫(xiě)數(shù)據(jù)庫(kù)操作語(yǔ)句具有更大的靈活性和便利性。

mongoose 的官網(wǎng)給出了類(lèi)似這樣一個(gè)示例,我改造了一下:

// 首先引入 mongoose 這個(gè)模塊
var mongoose = require('mongoose');
// 然后連接對(duì)應(yīng)的數(shù)據(jù)庫(kù):mongodb://localhost/test
// 其中,前面那個(gè) mongodb 是 protocol scheme 的名稱(chēng);localhost 是 mongod 所在的地址;
// 端口號(hào)省略則默認(rèn)連接 27017;test 是數(shù)據(jù)庫(kù)的名稱(chēng)
// mongodb 中不需要建立數(shù)據(jù)庫(kù),當(dāng)你需要連接的數(shù)據(jù)庫(kù)不存在時(shí),會(huì)自動(dòng)創(chuàng)建一個(gè)出來(lái)。
// 關(guān)于 mongodb 的安全性,mongodb 我印象中安全機(jī)制很殘廢,用戶名密碼那套都做得不好,更
// 別提細(xì)致的用戶權(quán)限控制了。不過(guò)不用擔(dān)心,mongodb 的默認(rèn)配置只接受來(lái)自本機(jī)的請(qǐng)求,內(nèi)網(wǎng)都連不上。
// 當(dāng)需要在內(nèi)網(wǎng)中為其他機(jī)器提供 mongodb 服務(wù)時(shí),或許可以去看看 iptables 相關(guān)的東西。
mongoose.connect('mongodb://localhost/test');

// 上面說(shuō)了,我推薦在同一個(gè) collection 中使用固定的數(shù)據(jù)形式。
// 在這里,我們創(chuàng)建了一個(gè)名為 Cat 的 model,它在數(shù)據(jù)庫(kù)中的名字根據(jù)傳給 mongoose.model 的第一個(gè)參數(shù)決定,mongoose 會(huì)將名詞變?yōu)閺?fù)數(shù),在這里,collection 的名字會(huì)是 `cats`。
// 這個(gè) model 的定義是,有一個(gè) String 類(lèi)型的 name,String 數(shù)組類(lèi)型的 friends,Number 類(lèi)型的 age。
// mongodb 中大多數(shù)的數(shù)據(jù)類(lèi)型都可以用 js 的原生類(lèi)型來(lái)表示。至于說(shuō) String 的長(zhǎng)度是多少,Number 的精度是多少。String 的最大限度是 16MB,Number 的整型是 64-bit,浮點(diǎn)數(shù)的話,js 中 `0.1 + 0.2` 的結(jié)果都是亂來(lái)的。。就不指望什么了。。
// 這里可以看到各種示例:http://mongoosejs.com/docs/schematypes.html
var Cat = mongoose.model('Cat', {
  name: String,
  friends: [String],
  age: Number,
});

// new 一個(gè)新對(duì)象,名叫 kitty
// 接著為 kitty 的屬性們賦值
var kitty = new Cat({ name: 'Zildjian', friends: ['tom', 'jerry']});
kitty.age = 3;

// 調(diào)用 .save 方法后,mongoose 會(huì)去你的 mongodb 中的 test 數(shù)據(jù)庫(kù)里,存入一條記錄。
kitty.save(function (err) {
  if (err) // ...
  console.log('meow');
});

我們可以驗(yàn)證一下

$ mongo
MongoDB shell version: 2.6.4
connecting to: test
> show dbs
> use test
> show collections
> db.cats.find()

會(huì)發(fā)現(xiàn)里面就有一條記錄了。

設(shè)計(jì)個(gè)簡(jiǎn)單博客程序

如果要寫(xiě)個(gè)博客程序練手。數(shù)據(jù)庫(kù)可以這樣設(shè)計(jì)

var Post = mongoose.model('Post', {
  title: String,
  content: String,
  author: String,
  create_at: Date,
});

評(píng)論就不要自己做了,接入多說(shuō):http://duoshuo.com/

編輯器就純文本好了,用 markdown 寫(xiě)。

用戶系統(tǒng)也不做,硬編碼幾個(gè)管理員賬號(hào)在配置文件中,然后用 http basic auth:https://github.com/jshttp/basic-auth 來(lái)做驗(yàn)證。

示例程序

Nodeclub 是使用 Node.js 和 MongoDB 開(kāi)發(fā)的社區(qū)系統(tǒng)

https://github.com/cnodejs/nodeclub

完。

以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)