有什么軟件可以找客戶搜索引擎營銷與seo優(yōu)化
1.ZooKeeper簡介
ZooKeeper是一個分布式、高可用性的協(xié)調(diào)服務(wù)。在大數(shù)據(jù)產(chǎn)品中主要提供兩個功能:
- 幫助系統(tǒng)避免單點故障,建立可靠的應(yīng)用程序。
- 提供分布式協(xié)作服務(wù)和維護配置信息。
2.ZooKeeper結(jié)構(gòu)
ZooKeeper集群中的節(jié)點分為三種角色:Leader、Follower和Observer,其結(jié)構(gòu)和相互關(guān)系如下圖所示。通常來說,需要在集群中配置奇數(shù)個(2N+1)ZooKeeper服務(wù),至少(N+1)個投票才能成功的執(zhí)行寫操作。
ZooKeeper結(jié)構(gòu)
上圖中各部分的功能說明如下表所示。
名稱 | 描述 |
---|---|
Leader | 在ZooKeeper集群中只有一個節(jié)點作為集群的領(lǐng)導(dǎo)者,由各Follower通過ZooKeeper Atomic Broadcast(ZAB)協(xié)議選舉產(chǎn)生,主要負責(zé)接收和協(xié)調(diào)所有寫請求,并把寫入的信息同步到Follower和Observer。 |
Follower | Follower的功能有兩個:1.每個Follower都作為Leader的儲備,當(dāng)Leader故障時重新選舉Leader,避免單點故障。2.處理讀請求,并配合Leader一起進行寫請求處理。 |
Observer | Observer不參與選舉和寫請求的投票,只負責(zé)處理讀請求、并向Leader轉(zhuǎn)發(fā)寫請求,避免系統(tǒng)處理能力浪費。 |
Client | ZooKeeper集群的客戶端,對ZooKeeper集群進行讀寫操作。例如HBase可以作為ZooKeeper集群的客戶端,利用ZooKeeper集群的仲裁功能,控制其HMaster的“Active”和“Standby”狀態(tài)。 |
如果集群啟用了安全服務(wù),在連接ZooKeeper時需要進行身份認證,認證方式有以下兩種:
- keytab方式:需要從MRS集群管理員處獲取一個“人機”用戶,用于登錄MRS平臺并通過認證,并且獲取到該用戶的keytab文件。
- 票據(jù)方式:從MRS集群管理員處獲取一個“人機”用戶,用于后續(xù)的安全登錄,開啟Kerberos服務(wù)的renewable和forwardable開關(guān)并且設(shè)置票據(jù)刷新周期,開啟成功后重啟kerberos及相關(guān)組件。
注意:
- 默認情況下,用戶的密碼有效期是90天,所以獲取的keytab文件的有效期是90天。
- Kerberos服務(wù)的renewable、forwardable開關(guān)和票據(jù)刷新周期的設(shè)置在Kerberos服務(wù)的配置頁面的“系統(tǒng)”標(biāo)簽下,票據(jù)刷新周期的修改可以根據(jù)實際情況修改“kdc_renew_lifetime”和“kdc_max_renewable_life”的值。
3. ZooKeeper原理
寫請求
- Follower或Observer接收到寫請求后,轉(zhuǎn)發(fā)給Leader。
- Leader協(xié)調(diào)各Follower,通過投票機制決定是否接受該寫請求。
- 如果超過半數(shù)以上的Leader、Follower節(jié)點返回寫入成功,那么Leader提交該請求并返回成功,否則返回失敗。
- Follower或Observer返回寫請求處理結(jié)果。
只讀請求
客戶端直接向Leader、Follower或Observer讀取數(shù)據(jù)。
4. ZooKeeper和HDFS的關(guān)系
ZooKeeper與HDFS的關(guān)系如下圖所示。
ZKFC(ZKFailoverController)作為一個ZooKeeper集群的客戶端,用來監(jiān)控NameNode的狀態(tài)信息。ZKFC進程僅在部署了NameNode的節(jié)點中存在。HDFS NameNode的Active和Standby節(jié)點均部署有zkfc進程。
- HDFS NameNode的ZKFC連接到ZooKeeper,把主機名等信息保存到ZooKeeper中,即“/hadoop-ha”下的znode目錄里。先創(chuàng)建znode目錄的NameNode節(jié)點為主節(jié)點,另一個為備節(jié)點。HDFS NameNode Standby通過ZooKeeper定時讀取NameNode信息。
- 當(dāng)主節(jié)點進程異常結(jié)束時,HDFS NameNode Standby通過ZooKeeper感知“/hadoop-ha”目錄下發(fā)生了變化,NameNode會進行主備切換。
5. ZooKeeper和YARN的關(guān)系
ZooKeeper與YARN的關(guān)系如下圖所示。
- 在系統(tǒng)啟動時,ResourceManager會嘗試把選舉信息寫入ZooKeeper,第一個成功寫入ZooKeeper的ResourceManager被選舉為Active ResourceManager,另一個為Standby ResourceManager。Standby ResourceManager定時去ZooKeeper監(jiān)控Active ResourceManager選舉信息。
- Active ResourceManager還會在ZooKeeper中創(chuàng)建Statestore目錄,存儲Application相關(guān)信息。當(dāng)Active ResourceManager產(chǎn)生故障時,Standby ResourceManager會從Statestore目錄獲取Application相關(guān)信息,恢復(fù)數(shù)據(jù)。
6. ZooKeeper和HBase的關(guān)系
ZooKeeper與HBase的關(guān)系如下圖所示。
- HRegionServer以Ephemeral node的方式注冊到ZooKeeper中。其中ZooKeeper存儲HBase的如下信息:HBase元數(shù)據(jù)、HMaster地址。
- HMaster通過ZooKeeper隨時感知各個HRegionServer的健康狀況,以便進行控制管理。
- .HBase也可以部署多個HMaster,類似HDFS NameNode,當(dāng)HMaster主節(jié)點出現(xiàn)故障時,HMaster備用節(jié)點會通過ZooKeeper獲取主HMaster存儲的整個HBase集群狀態(tài)信息。即通過ZooKeeper實現(xiàn)避免HBase單點故障問題的問題。
7. Zookeeper和SmallFS的配合關(guān)系
FGCService的部署模式為HA模式。HA(High Availability)模式目的是防止單節(jié)點故障導(dǎo)致服務(wù)不可用。為了支持HA模式,FGCService依賴于ZooKeeper。
8. ZooKeeper和Kafka的配合關(guān)系
ZooKeeper與Kafka的關(guān)系如下圖 ZooKeeper和Kafka的關(guān)系所示。
- Broker端使用ZooKeeper用來注冊broker信息,并進行partition leader選舉
- Consumer端使用ZooKeeper用來注冊consumer信息,其中包括consumer·消費的partition列表等,同時也用來發(fā)現(xiàn)broker列表,并和partition leader建立socket連接,并獲取消息。