中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁 > news >正文

網(wǎng)站建設(shè)詢價文件無錫營銷型網(wǎng)站制作

網(wǎng)站建設(shè)詢價文件,無錫營銷型網(wǎng)站制作,中國菲律賓概念股,網(wǎng)站建設(shè)設(shè)計維片一、Hadoop HDFS的架構(gòu) HDFS:Hadoop Distributed File System,分布式文件系統(tǒng) 1,NameNode 存儲文件的metadata,運行時所有數(shù)據(jù)都保存到內(nèi)存,整個HDFS可存儲的文件數(shù)受限于NameNode的內(nèi)存大小一個Block在…

一、Hadoop HDFS的架構(gòu)

HDFS:Hadoop Distributed File System,分布式文件系統(tǒng)
在這里插入圖片描述

1,NameNode

  1. 存儲文件的metadata,運行時所有數(shù)據(jù)都保存到內(nèi)存,整個HDFS可存儲的文件數(shù)受限于NameNode的內(nèi)存大小
  2. 一個Block在NameNode中對應(yīng)一條記錄(一般一個block占用150字節(jié)),如果是大量的小文件,會消耗大量內(nèi)存。同時map task的數(shù)量是由splits來決定的,所以用MapReduce處理大量的小文件時,就會產(chǎn)生過多的map task,線程管理開銷將會增加作業(yè)時間。處理大量小文件的速度遠遠小于處理同等大小的大文件的速度。因此Hadoop建議存儲大文件
  3. 數(shù)據(jù)會定時保存到本地磁盤,但不保存block的位置信息,而是由DataNode注冊時上報和運行時維護(NameNode中與DataNode相關(guān)的信息并不保存到NameNode的文件系統(tǒng)中,而是NameNode每次重啟后,動態(tài)重建)
  4. NameNode失效則整個HDFS都失效了,所以要保證NameNode的可用性

2,Secondary NameNode

定時與NameNode進行同步(定期合并文件系統(tǒng)鏡像和編輯日志,然后把合并后的傳給NameNode,替換其鏡像,并清空編輯日志,類似于CheckPoint機制),但NameNode失效后仍需要手工將其設(shè)置成主機.

3,DataNode

  1. 保存具體的block數(shù)據(jù)
  2. 負責(zé)數(shù)據(jù)的讀寫操作和復(fù)制操作
  3. DataNode啟動時會向NameNode報告當(dāng)前存儲的數(shù)據(jù)塊信息,后續(xù)也會定時報告修改信息
  4. DataNode之間會進行通信,復(fù)制數(shù)據(jù)塊,保證數(shù)據(jù)的冗余性

4,Block數(shù)據(jù)塊

  1. 基本存儲單位,一般大小為64M(配置大的塊主要是因為:
    1)減少搜尋時間,一般硬盤傳輸速率比尋道時間要快,大的塊可以減少尋道時間;
    2)減少管理塊的數(shù)據(jù)開銷,每個塊都需要在NameNode上有對應(yīng)的記錄;
    3)對數(shù)據(jù)塊進行讀寫,減少建立網(wǎng)絡(luò)的連接成本)
  2. 一個大文件會被拆分成一個個的塊,然后存儲于不同的機器。如果一個文件少于Block大小,那么實際占用的空間為其文件的大小
  3. 基本的讀寫單位,類似于磁盤的頁,每次都是讀寫一個塊
  4. 每個塊都會被復(fù)制到多臺機器,默認復(fù)制3份
  5. HDFS2.x以后的block默認128M

二、Hadoop 讀文件

在這里插入圖片描述
1,客戶端向NameNode發(fā)送讀取請求
2,NameNode返回文件的所有block和這些block所在的DataNodes(包括復(fù)制節(jié)點)
3,客戶端直接從DataNode中讀取數(shù)據(jù),如果該DataNode讀取失敗(DataNode失效或校驗碼不對),則從復(fù)制節(jié)點中讀取(如果讀取的數(shù)據(jù)就在本機,則直接讀取,否則通過網(wǎng)絡(luò)讀取)

三、Hadoop 寫文件

在這里插入圖片描述

1,客戶端將文件寫入本地磁盤的 HDFS Client 文件中
2,當(dāng)臨時文件大小達到一個 block 大小時,HDFS client 通知 NameNode,申請寫入文件
3,NameNode 在 HDFS 的文件系統(tǒng)中創(chuàng)建一個文件,并把該 block id 和要寫入的 DataNode 的列表返回給客戶端
4,客戶端收到這些信息后,將臨時文件寫入 DataNodes
(1) 客戶端將文件內(nèi)容寫入第一個 DataNode(一般以 4kb 為單位進行傳輸)
(2) 第一個 DataNode 接收后,將數(shù)據(jù)寫入本地磁盤,同時也傳輸給第二個 DataNode
(3)依此類推到最后一個 DataNode,數(shù)據(jù)在 DataNode 之間是通過 pipeline 的方式進行復(fù)制的
(4)后面的 DataNode 接收完數(shù)據(jù)后,都會發(fā)送一個確認給前一個 DataNode,最終第一個 DataNode 返回確認給客戶端
(5)當(dāng)客戶端接收到整個 block 的確認后,會向 NameNode 發(fā)送一個最終的確認信息
(6)如果寫入某個 DataNode 失敗,數(shù)據(jù)會繼續(xù)寫入其他的 DataNode。然后 NameNode 會找另外一個好的 DataNode 繼續(xù)復(fù)制,以保證冗余性
(6) 每個 block 都會有一個校驗碼,并存放到獨立的文件中,以便讀的時候來驗證其完整性
5,文件寫完后(客戶端關(guān)閉),NameNode 提交文件(這時文件才可見,如果提交前,NameNode 垮掉,那文件也就丟失了。只保證數(shù)據(jù)的信息寫到 NameNode 上,但并不保證數(shù)據(jù)已經(jīng)被寫到DataNode 中)

http://www.risenshineclean.com/news/43708.html

相關(guān)文章:

  • 海爾集團電商網(wǎng)站建設(shè)百度網(wǎng)頁版進入
  • 怎樣在國外網(wǎng)站做推廣搜索關(guān)鍵詞排名一般按照什么收費
  • 做網(wǎng)站做軟件怎么賺錢嗎搜索量最大的關(guān)鍵詞
  • 咸秧草做哪些網(wǎng)站優(yōu)化大師免安裝版
  • 鄭州做網(wǎng)站推廣外包產(chǎn)品推廣方式
  • 鞍山網(wǎng)站制作公司優(yōu)化綠松石什么意思
  • 泉州建設(shè)網(wǎng)站開發(fā)快速排名優(yōu)化
  • 湖南做網(wǎng)站磐石網(wǎng)絡(luò)案例cba最新排名
  • 淘寶的網(wǎng)站建設(shè)seo分析報告怎么寫
  • 網(wǎng)站如何提高權(quán)重做百度推廣怎么做才能有電話
  • 響應(yīng)式網(wǎng)站建設(shè)效果迅雷下載磁力天堂
  • 萬網(wǎng)個人網(wǎng)站備案查詢東莞今天的最新通知
  • 有關(guān)做聚合物電池公司的網(wǎng)站網(wǎng)站優(yōu)化外包推薦
  • 如何再國外網(wǎng)站做折扣什么是seo?
  • 中關(guān)村在線官方網(wǎng)站電腦首頁關(guān)鍵詞排名
  • 愛站網(wǎng)排行榜武漢抖音seo搜索
  • 網(wǎng)站設(shè)計app微信推廣方式有哪些
  • sf網(wǎng)站怎么建設(shè)網(wǎng)站被禁用如何解決
  • 佛山網(wǎng)站建設(shè)策劃網(wǎng)站推廣模式
  • 自動化培訓(xùn)網(wǎng)站建設(shè)網(wǎng)絡(luò)營銷到底是干嘛的
  • 網(wǎng)站建設(shè)大概費用怎么建網(wǎng)站賺錢
  • 做h5頁面有哪些好網(wǎng)站廣州競價外包
  • 網(wǎng)站的運行與維護艾滋病阻斷藥有哪些
  • 建站寶盒開通百度seo培訓(xùn)班
  • 網(wǎng)頁游戲傳奇霸業(yè)攻略搜索引擎優(yōu)化的英語簡稱
  • 微商軟件商城24小時整站排名優(yōu)化品牌
  • 政務(wù)網(wǎng)站隊伍建設(shè)情況匯報怎么免費創(chuàng)建個人網(wǎng)站
  • 阿里云 多域名解析 到不同的網(wǎng)站網(wǎng)站的友情鏈接是什么意思
  • 建筑公司網(wǎng)站廣告宣傳語重慶 seo
  • 鎮(zhèn)江網(wǎng)站優(yōu)化哪家好百度推廣要自己建站嗎