河北保定網(wǎng)站建設(shè)seo視頻教程百度網(wǎng)盤
MongoDB集群的介紹與搭建
一.MongoDB集群的介紹
注意:Mongodb是一個(gè)比較流行的NoSQL數(shù)據(jù)庫,它的存儲(chǔ)方式是文檔式存儲(chǔ),并不是Key-Value形式;
1.1集群的優(yōu)勢和特性
MongoDB集群的優(yōu)勢主要體現(xiàn)在以下幾個(gè)方面:
(1)高可用性
MongoDB集群支持主從復(fù)制和故障轉(zhuǎn)移機(jī)制,這確保了數(shù)據(jù)的高可用性和冗余性。當(dāng)主節(jié)點(diǎn)出現(xiàn)故障時(shí),集群可以自動(dòng)切換到從節(jié)點(diǎn),保證系統(tǒng)的持續(xù)運(yùn)行。這種故障轉(zhuǎn)移能力對于維護(hù)系統(tǒng)的穩(wěn)定性和可靠性至關(guān)重要。
(2)擴(kuò)展性
MongoDB集群具有出色的擴(kuò)展性,可以通過水平擴(kuò)展來增加系統(tǒng)的處理能力和存儲(chǔ)容量。隨著數(shù)據(jù)量的增加和訪問壓力的增大,只需簡單地添加新的節(jié)點(diǎn),即可輕松應(yīng)對。這種擴(kuò)展性使得MongoDB集群能夠適用于各種規(guī)模的數(shù)據(jù)存儲(chǔ)和處理需求。
(3)數(shù)據(jù)分片
MongoDB集群支持?jǐn)?shù)據(jù)分片功能,可以將數(shù)據(jù)劃分為多個(gè)分片,并部署在不同的節(jié)點(diǎn)上。這種數(shù)據(jù)分片機(jī)制不僅提高了系統(tǒng)的讀寫性能,還提供了更大的存儲(chǔ)容量。MongoDB能夠根據(jù)數(shù)據(jù)的分布情況,自動(dòng)將查詢請求分發(fā)到相應(yīng)的分片上進(jìn)行處理,從而進(jìn)一步優(yōu)化了系統(tǒng)的性能。
(4)彈性伸縮
MongoDB集群具有彈性伸縮的能力,可以根據(jù)系統(tǒng)的負(fù)載情況進(jìn)行自動(dòng)調(diào)整。當(dāng)負(fù)載過高時(shí),可以添加更多的節(jié)點(diǎn)來分擔(dān)壓力;當(dāng)負(fù)載較低時(shí),可以減少節(jié)點(diǎn)數(shù)量以節(jié)省資源。這種彈性伸縮機(jī)制使得MongoDB集群能夠靈活地應(yīng)對各種負(fù)載變化,保持系統(tǒng)的穩(wěn)定性和性能。
(5)靈活性
MongoDB集群提供了靈活的數(shù)據(jù)模型和查詢語言,可以存儲(chǔ)和處理各種類型的數(shù)據(jù)。它支持文檔型、關(guān)系型和圖形型數(shù)據(jù),并提供了強(qiáng)大的查詢和聚合功能,方便用戶對數(shù)據(jù)進(jìn)行分析和處理。這種靈活性使得MongoDB集群能夠適用于各種復(fù)雜的數(shù)據(jù)存儲(chǔ)和處理場景。
(6)數(shù)據(jù)安全與容災(zāi)
MongoDB集群通過數(shù)據(jù)冗余和備份機(jī)制,提供了數(shù)據(jù)的安全性和容災(zāi)功能。即使某個(gè)節(jié)點(diǎn)出現(xiàn)故障,其他節(jié)點(diǎn)仍然可以正常運(yùn)行,并保證數(shù)據(jù)的一致性和完整性。此外,MongoDB還支持跨地域的數(shù)據(jù)復(fù)制和容災(zāi)部署,進(jìn)一步提高了數(shù)據(jù)的安全性和可靠性。
然而,也需要注意到MongoDB集群的一些潛在挑戰(zhàn),如配置復(fù)雜性、成本較高以及數(shù)據(jù)一致性等問題。在實(shí)際應(yīng)用中,需要根據(jù)具體的需求和資源情況來選擇合適的集群類型和配置方案,并進(jìn)行合理的優(yōu)化和維護(hù)以確保系統(tǒng)的性能和穩(wěn)定性。
綜上所述,MongoDB集群具有高可用性、擴(kuò)展性、數(shù)據(jù)分片、彈性伸縮、靈活性和數(shù)據(jù)安全與容災(zāi)等優(yōu)勢,適用于各種大規(guī)模數(shù)據(jù)存儲(chǔ)和處理的場景。
二.MongoDB集群的搭建
主要介紹三種集群方式的搭建過程:
2.1Replica Set(副本集)方式
主節(jié)點(diǎn)-備節(jié)點(diǎn)-仲裁節(jié)點(diǎn)
是集群當(dāng)中包含了多份數(shù)據(jù),保證主節(jié)點(diǎn)掛掉了,備節(jié)點(diǎn)能繼續(xù)提供數(shù)據(jù)服務(wù),提供的前提就是數(shù)據(jù)需要和主節(jié)點(diǎn)一致。
其中,Mongodb(M)表示主節(jié)點(diǎn),Mongodb(S)表示備節(jié)點(diǎn),Mongodb(A)表示仲裁節(jié)點(diǎn)。主備節(jié)點(diǎn)存儲(chǔ)數(shù)據(jù),仲裁節(jié)點(diǎn)不存儲(chǔ)數(shù)據(jù)??蛻舳送瑫r(shí)連接主節(jié)點(diǎn)與備節(jié)點(diǎn),不連接仲裁節(jié)點(diǎn)。
默認(rèn)設(shè)置下,主節(jié)點(diǎn)提供所有增刪查改服務(wù),備節(jié)點(diǎn)不提供任何服務(wù)。但是可以通過設(shè)置使備節(jié)點(diǎn)提供查詢服務(wù),這樣就可以減少主節(jié)點(diǎn)的壓力,當(dāng)客戶端進(jìn)行數(shù)據(jù)查詢時(shí),請求自動(dòng)轉(zhuǎn)到備節(jié)點(diǎn)上。這個(gè)設(shè)置叫做Read Preference Modes,同時(shí)Java客戶端提供了簡單的配置方式,可以不必直接對數(shù)據(jù)庫進(jìn)行操作。
仲裁節(jié)點(diǎn)是一種特殊的節(jié)點(diǎn),它本身并不存儲(chǔ)數(shù)據(jù),主要的作用是決定哪一個(gè)備節(jié)點(diǎn)在主節(jié)點(diǎn)掛掉之后提升為主節(jié)點(diǎn),所以客戶端不需要連接此節(jié)點(diǎn)。這里雖然只有一個(gè)備節(jié)點(diǎn),但是仍然需要一個(gè)仲裁節(jié)點(diǎn)來提升備節(jié)點(diǎn)級(jí)別。我開始也不相信必須要有仲裁節(jié)點(diǎn),但是自己也試過沒仲裁節(jié)點(diǎn)的話,主節(jié)點(diǎn)掛了備節(jié)點(diǎn)還是備節(jié)點(diǎn),所以咱們還是需要它的。
(1)建立數(shù)據(jù)文件夾
一般情況下不會(huì)把數(shù)據(jù)目錄建立在mongodb的解壓目錄下,不過這里方便起見,就建在mongodb解壓目錄下吧。
mkdir -p /mongodb/data/master
mkdir -p /mongodb/data/slaver
mkdir -p /mongodb/data/arbiter
#三個(gè)目錄分別對應(yīng)主,備,仲裁節(jié)點(diǎn)
(2)建立配置文件
由于配置比較多,所以我們將配置寫到文件里。
#master.conf
dbpath=/mongodb/data/master
logpath=/mongodb/log/master.log
pidfilepath=/mongodb/master.pid
directoryperdb=true
logappend=true
replSet=testrs
bind_ip=10.10.148.130
port=27017
oplogSize=10000
fork=true
noprealloc=true
#slaver.conf
dbpath=/mongodb/data/slaver
logpath=/mongodb/log/slaver.log
pidfilepath=/mongodb/slaver.pid
directoryperdb=true
logappend=true
replSet=testrs
bind_ip=10.10.148.131
port=27017
oplogSize=10000
fork=true
noprealloc=true
#arbiter.conf
dbpath=/mongodb/data/arbiter
logpath=/mongodb/log/arbiter.log
pidfilepath=/mongodb/arbiter.pid
directoryperdb=true
logappend=true
replSet=testrs
bind_ip=10.10.148.132
port=27017
oplogSize=10000
fork=true
noprealloc=true
參數(shù)解讀: |
dbpath:數(shù)據(jù)存放目錄 |
port:mongodb進(jìn)程所使用的端口號(hào),默認(rèn)為27017 |
logpath:日志存放路徑、bind_ip:mongodb所綁定的ip地址 |
oplogSize:mongodb操作日志文件的最大大小。單位為Mb,默認(rèn)為硬盤剩余空間的5% |
pidfilepath:進(jìn)程文件,方便停止mongodb |
fork:以后臺(tái)方式運(yùn)行進(jìn)程 |
directoryperdb:為每一個(gè)數(shù)據(jù)庫按照數(shù)據(jù)庫名建立文件夾存放 |
noprealloc:不預(yù)先分配存儲(chǔ)、replSet:replica set的名字 |
logappend:以追加的方式記錄日志 |
(3)啟動(dòng)mongodb
進(jìn)入每個(gè)mongodb節(jié)點(diǎn)的bin目錄下
./monood -f master.conf
./mongod -f slaver.conf
./mongod -f arbiter.conf
(4)配置主,備,仲裁節(jié)點(diǎn)
可以通過客戶端連接mongodb,也可以直接在三個(gè)節(jié)點(diǎn)中選擇一個(gè)連接mongodb。
./mongo 10.10.148.130:27017 #ip和port是某個(gè)節(jié)點(diǎn)的地址
>use admin
>cfg={ _id:"testrs", members:[ {_id:0,host:'10.10.148.130:27017',priority:2}, {_id:1,host:'10.10.148.131:27017',priority:1},
{_id:2,host:'10.10.148.132:27017',arbiterOnly:true}] };
>rs.initiate(cfg) #使配置生效
cfg是可以任意的名字,當(dāng)然最好不要是mongodb的關(guān)鍵字,conf,config都可以。最外層的_id表示replica set的名字,members里包含的是所有節(jié)點(diǎn)的地址以及優(yōu)先級(jí)。優(yōu)先級(jí)最高的即成為主節(jié)點(diǎn),即這里的10.10.148.130:27017。特別注意的是,對于仲裁節(jié)點(diǎn),需要有個(gè)特別的配置——arbiterOnly:true。這個(gè)千萬不能少了,不然主備模式就不能生效。
? ? ? 配置的生效時(shí)間根據(jù)不同的機(jī)器配置會(huì)有長有短,配置不錯(cuò)的話基本上十幾秒內(nèi)就能生效,有的配置需要一兩分鐘。如果生效了,執(zhí)行rs.status()命令會(huì)看到如下信息:
{"set" : "testrs","date" : ISODate("2013-01-05T02:44:43Z"),"myState" : 1,"members" : [{"_id" : 0,"name" : "10.10.148.130:27017","health" : 1,"state" : 1,"stateStr" : "PRIMARY","uptime" : 200,"optime" : Timestamp(1357285565000, 1),"optimeDate" : ISODate("2013-01-04T07:46:05Z"),"self" : true},{"_id" : 1,"name" : "10.10.148.131:27017","health" : 1,"state" : 2,"stateStr" : "SECONDARY","uptime" : 200,"optime" : Timestamp(1357285565000, 1),"optimeDate" : ISODate("2013-01-04T07:46:05Z"),"lastHeartbeat" : ISODate("2013-01-05T02:44:42Z"),"pingMs" : 0},{"_id" : 2,"name" : "10.10.148.132:27017","health" : 1,"state" : 7,"stateStr" : "ARBITER","uptime" : 200,"lastHeartbeat" : ISODate("2013-01-05T02:44:42Z"),"pingMs" : 0}],"ok" : 1
}
如果配置正在生效,其中會(huì)包含如下信息:
"stateStr" : "RECOVERING"
同時(shí)可以查看對應(yīng)節(jié)點(diǎn)的日志,發(fā)現(xiàn)正在等待別的節(jié)點(diǎn)生效或者正在分配數(shù)據(jù)文件。
? ? ? ?現(xiàn)在基本上已經(jīng)完成了集群的所有搭建工作。至于測試工作,可以留給大家自己試試。一個(gè)是往主節(jié)點(diǎn)插入數(shù)據(jù),能從備節(jié)點(diǎn)查到之前插入的數(shù)據(jù)(查詢備節(jié)點(diǎn)可能會(huì)遇到某個(gè)問題,可以自己去網(wǎng)上查查看)。二是停掉主節(jié)點(diǎn),備節(jié)點(diǎn)能變成主節(jié)點(diǎn)提供服務(wù)。三是恢復(fù)主節(jié)點(diǎn),備節(jié)點(diǎn)也能恢復(fù)其備的角色,而不是繼續(xù)充當(dāng)主的角色。二和三都可以通過rs.status()命令實(shí)時(shí)查看集群的變化。
2.2Sharding方式
主節(jié)點(diǎn)-備節(jié)點(diǎn)-仲裁節(jié)點(diǎn)-路由節(jié)點(diǎn)
和Replica Set類似,都需要一個(gè)仲裁節(jié)點(diǎn),但是Sharding還需要配置節(jié)點(diǎn)和路由節(jié)點(diǎn)。就三種集群搭建方式來說,這種是最復(fù)雜的。
(1)啟動(dòng)數(shù)據(jù)節(jié)點(diǎn)
./mongod --fork --dbpath ../data/set1/ --logpath ../log/set1.log --replSet test #192.168.4.43
./mongod --fork --dbpath ../data/set2/ --logpath ../log/set2.log --replSet test #192.168.4.44
./mongod --fork --dbpath ../data/set3/ --logpath ../log/set3.log --replSet test #192.168.4.45 決策 不存儲(chǔ)數(shù)據(jù)
(2)啟動(dòng)配置節(jié)點(diǎn)
./mongod --configsvr --dbpath ../config/set1/ --port 20001 --fork --logpath ../log/conf1.log #192.168.4.30
./mongod --configsvr --dbpath ../config/set2/ --port 20002 --fork --logpath ../log/conf2.log #192.168.4.31
(3)啟動(dòng)路由節(jié)點(diǎn)
./mongos --configdb 192.168.4.30:20001,192.168.4.31:20002 --port 27017 --fork --logpath ../log/root.log #192.168.4.29
這里我們沒有用配置文件的方式啟動(dòng),其中的參數(shù)意義大家應(yīng)該都明白。一般來說一個(gè)數(shù)據(jù)節(jié)點(diǎn)對應(yīng)一個(gè)配置節(jié)點(diǎn),仲裁節(jié)點(diǎn)則不需要對應(yīng)的配置節(jié)點(diǎn)。注意在啟動(dòng)路由節(jié)點(diǎn)時(shí),要將配置節(jié)點(diǎn)地址寫入到啟動(dòng)命令里。
(4)配置Replica Set
? ? ? ?這里可能會(huì)有點(diǎn)奇怪為什么Sharding會(huì)需要配置Replica Set。其實(shí)想想也能明白,多個(gè)節(jié)點(diǎn)的數(shù)據(jù)肯定是相關(guān)聯(lián)的,如果不配一個(gè)Replica Set,怎么標(biāo)識(shí)是同一個(gè)集群的呢。這也是人家mongodb的規(guī)定,咱們還是遵守吧。配置方式和之前所說的一樣,定一個(gè)cfg,然后初始化配置。
./mongo 192.168.4.43:27017 #ip和port是某個(gè)節(jié)點(diǎn)的地址
>use admin
>cfg={ _id:"testrs", members:[ {_id:0,host:'192.168.4.43:27017',priority:2}, {_id:1,host:'192.168.4.44:27017',priority:1},
{_id:2,host:'192.168.4.45:27017',arbiterOnly:true}] };
>rs.initiate(cfg) #使配置生效
(5)?配置Sharding
./mongo 192.168.4.29:27017 #這里必須連接路由節(jié)點(diǎn)
>sh.addShard("test/192.168.4.43:27017") #test表示replica set的名字 當(dāng)把主節(jié)點(diǎn)添加到shard以后,會(huì)自動(dòng)找到set里的主,備,決策節(jié)點(diǎn)
>db.runCommand({enableSharding:"diameter_test"}) #diameter_test is database name
>db.runCommand( { shardCollection: "diameter_test.dcca_dccr_test",key:{"__avpSessionId":1}})
第一個(gè)命令很容易理解,第二個(gè)命令是對需要進(jìn)行Sharding的數(shù)據(jù)庫進(jìn)行配置,第三個(gè)命令是對需要進(jìn)行Sharding的Collection進(jìn)行配置,這里的dcca_dccr_test即為Collection的名字。另外還有個(gè)key,這個(gè)是比較關(guān)鍵的東西,對于查詢效率會(huì)有很大的影響,具體可以查看 Shard Key Overview
? ? ? ?到這里Sharding也已經(jīng)搭建完成了,以上只是最簡單的搭建方式,其中某些配置仍然使用的是默認(rèn)配置。如果設(shè)置不當(dāng),會(huì)導(dǎo)致效率異常低下,所以建議大家多看看官方文檔再進(jìn)行默認(rèn)配置的修改。
2.3Master-Slave方式
主節(jié)點(diǎn)-備節(jié)點(diǎn)
這個(gè)是最簡答的集群搭建,不過準(zhǔn)確說也不能算是集群,只能說是主備。并且官方已經(jīng)不推薦這種方式,所以在這里只是簡單的介紹下吧,搭建方式也相對簡單。
./mongod --master --dbpath /data/masterdb/ #主節(jié)點(diǎn)./mongod --slave --source <masterip:masterport> --dbpath /data/slavedb/ 備節(jié)點(diǎn)
基本上只要在主節(jié)點(diǎn)和備節(jié)點(diǎn)上分別執(zhí)行這兩條命令,Master-Slaver就算搭建完成了。我沒有試過主節(jié)點(diǎn)掛掉后備節(jié)點(diǎn)是否能變成主節(jié)點(diǎn),不過既然已經(jīng)不推薦了,大家就沒必要去使用了。
?三.自己親測過程
3.1.準(zhǔn)備工作
因?yàn)槲疫@里的數(shù)據(jù)量不大,所以一般使用帶仲裁節(jié)點(diǎn)的集群即可,沒必要使用帶有路由節(jié)點(diǎn)的;
(1)環(huán)境準(zhǔn)備(三臺(tái)Centos7的虛擬機(jī)):192.168.32.215 / 192.168.32.216 / 192.168.32.217
(2)機(jī)器分配:215為master節(jié)點(diǎn) , 217為slave節(jié)點(diǎn) , 216為仲裁節(jié)點(diǎn)
(3)安裝包下載:使用wget來下載,版本為4.4.5,想要其他的版本自己可以更換:
wget https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel70-4.4.5.tgz
將安裝包用scp命令傳輸?shù)搅硗鈨膳_(tái)上;?
3.2.進(jìn)行配置
(1)目錄準(zhǔn)備
三臺(tái)機(jī)器的目錄盡量一致,我這里都存放解壓后的目錄為/opt/hadoop
創(chuàng)建目錄:
215機(jī)器:
#在opt下創(chuàng)建hadoop
mkdir /opt/hadoop
#將安裝包解壓到hadoop下
tar -zxvf mongodb-linux-x86_64-rhel70-4.4.5.tgz -C /opt/hadoop/
#解壓的目錄形式為:/opt/hadoop/mongo4.4
#我這里修改為了:/opt/hadoop/mongodb4.4為了方便,然后就在mongodb4.4里面執(zhí)行下面的操作#數(shù)據(jù)存文的目錄
mkdir -p data/master
#日志目錄
mkdir logs
#配置目錄
mkdir conf
cd logs
#日志文件
touch master.log
cd conf
#配置文件
touch mongodb.conf
如同下面得圖中表現(xiàn):
217機(jī)器:
同上述節(jié)點(diǎn):
mkdir -p data/slave
mkdir logs
mkdir conf
cd logs
touch slave.log
cd conf
touch mongodb.conf
216機(jī)器:
同上述節(jié)點(diǎn):
mkdir -p data/arbite
mkdir logs
mkdir conf
cd logs
touch arbite.log
cd conf
touch mongodb.conf
(2)編輯配置文件
215節(jié)點(diǎn)(Master):
編輯mongodb.conf
#master配置
#數(shù)據(jù)存放路徑
dbpath=/opt/hadoop/mongodb4.4/data/master
#日志路徑
logpath=/opt/hadoop/mongodb4.4/logs/master.log
#以追加的方式記錄日志
logappend=true
#mongoDB進(jìn)程所綁定的ip地址
bind_ip=192.168.32.215
#端口號(hào),默認(rèn)端口號(hào)為27017
port=27017
#以后臺(tái)方式運(yùn)行進(jìn)程
fork=true
#4.33版本后已經(jīng)取消
#noprealloc=true
#集群名稱
replSet=test
217節(jié)點(diǎn)(Slave):
編輯mongodb.conf
#slave配置
dbpath=/opt/hadoop/mongodb4.4/data/slave
logpath=/opt/hadoop/mongodb4.4/logs/slave.log
logappend=true
bind_ip=192.168.32.217
port=27017
fork=true
#noprealloc=true
replSet=test
216節(jié)點(diǎn)(arbite仲裁節(jié)點(diǎn)):
編輯mongodb.conf
#仲裁節(jié)點(diǎn)配置
dbpath=/opt/hadoop/mongodb4.4/data/arbite
logpath=/opt/hadoop/mongodb4.4/logs/arbite.log
logappend=true
bind_ip=192.168.32.216
#注意仲裁節(jié)點(diǎn)我給的端口號(hào)是27018
port=27018
fork=true
#noprealloc=true
replSet=test
3.3啟用
分別啟動(dòng)mongodb
直接輸入如下命令即可,要保證路徑正確即可:
/opt/hadoop/mongodb4.4/bin/mongod -f /opt/hadoop/mongodb4.4/conf/mongodb.conf
?啟動(dòng)成功,如下
?(4)再進(jìn)一步簡單的配置
a.在任意一個(gè)節(jié)點(diǎn)上,連接到主節(jié)點(diǎn)
這里ip換成你們配置中的主節(jié)點(diǎn)即可
?b.輸入如下命令(里面ip換成你們自己的即可):
cfg={_id:"test", members: [ {_id:0,host:'192.168.32.215:27017',priority:2} ,{_id:1,host:'192.168.32.217:27017',priority:1} ,{_id:2,host:'192.168.32.216:27018',arbiterOnly:true}]};
c.初始化集群-讓配置生效
rs.initiate(cfg)?
當(dāng)你能看到代表成功ok:1
注意:如下是返回的初始化不成功的信息,需要關(guān)閉你們的機(jī)器防火墻即可;
?關(guān)閉防火墻的命令:
systemctl status firewalld
systemctl stop firewalld
systemctl disable firewalld
?再次執(zhí)行,發(fā)現(xiàn)返回狀態(tài)成功。
d.查看集群狀態(tài)
?OK,測試完畢。
四.總結(jié)
以上三種集群搭建方式首選Replica Set,只有真的是大數(shù)據(jù),Sharding才能顯現(xiàn)威力,畢竟備節(jié)點(diǎn)同步數(shù)據(jù)是需要時(shí)間的。Sharding可以將多片數(shù)據(jù)集中到路由節(jié)點(diǎn)上進(jìn)行一些對比,然后將數(shù)據(jù)返回給客戶端,但是效率還是比較低的說。大家在應(yīng)用的時(shí)候還是多多做下性能測試,畢竟不像Redis有benchmark。
? ? ? ?Mongodb現(xiàn)在用的還是比較多的,但是個(gè)人覺得配置太多了,我看官網(wǎng)都看了好多天,才把集群搭建的配置和注意要點(diǎn)弄明白。而且用過的人應(yīng)該知道m(xù)ongodb吃內(nèi)存的問題,解決辦法只能通過ulimit來控制內(nèi)存使用量,但是如果控制不好的話,mongodb會(huì)掛掉。