中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁 > news >正文

網(wǎng)站做視頻窗口接口收費(fèi)么windows優(yōu)化大師的特點(diǎn)

網(wǎng)站做視頻窗口接口收費(fèi)么,windows優(yōu)化大師的特點(diǎn),建設(shè)網(wǎng)站需要,北京網(wǎng)站建設(shè)的公Spark Stage 什么是Stage Spark中的一個(gè)Stage只不過是物理執(zhí)行計(jì)劃其中的一個(gè)步驟,它是物理執(zhí)行計(jì)劃的一個(gè)執(zhí)行單元。一個(gè)Job會(huì)被拆分為多組Task,每組任務(wù)被稱為一個(gè)Stage,可以簡(jiǎn)單理解為MapReduce里面的Map Stage, Reduce Stag…

Spark Stage

什么是Stage

Spark中的一個(gè)Stage只不過是物理執(zhí)行計(jì)劃其中的一個(gè)步驟,它是物理執(zhí)行計(jì)劃的一個(gè)執(zhí)行單元。一個(gè)Job會(huì)被拆分為多組Task,每組任務(wù)被稱為一個(gè)Stage,可以簡(jiǎn)單理解為MapReduce里面的Map Stage, Reduce Stage。

spark task提交原理

Spark的Job中Stage之間會(huì)有依賴關(guān)系??梢岳眠@些依賴關(guān)系把Job所有stage串連起來形成一個(gè)有向無環(huán)圖。在單個(gè)job內(nèi)是根據(jù)shuffle算子來拆分stage的,shuffle之前是一個(gè)stage,shuffle之后是另一個(gè)stage,如果一個(gè)job中有多個(gè)shuffle,那么每個(gè)shuffle之前都是一個(gè)stage。一個(gè)job被提交運(yùn)行之后,將會(huì)觸發(fā)stage及其父stage的執(zhí)行。

spark stage

窄依賴
指父RDD的每一個(gè)分區(qū)最多被一個(gè)子RDD的分區(qū)所用,表現(xiàn)為一個(gè)父RDD的分區(qū)對(duì)應(yīng)于一個(gè)子RDD的分區(qū),和兩個(gè)父RDD的分區(qū)對(duì)應(yīng)于一個(gè)子RDD 的分區(qū)。圖中,map/filter和union屬于第一類,對(duì)輸入進(jìn)行協(xié)同劃分(co-partitioned)的join屬于第二類。

寬依賴
指子RDD的分區(qū)依賴于父RDD的所有分區(qū),這是因?yàn)閟huffle類操作,如圖中的groupByKey和未經(jīng)協(xié)同劃分的join。
spark 寬依賴窄依賴

Stage:
一個(gè)Job會(huì)被拆分為多組Task,每組任務(wù)被稱為一個(gè)Stage就像Map Stage, Reduce Stage。Stage的劃分,簡(jiǎn)單的說是以ShuffleMapStage 和ResultStage 這兩種類型來劃分。

在Spark中有兩類task,一類是shuffleMapTask,一類是resultTask,第一類task的輸出是shuffle所需數(shù)據(jù),第二類task的輸出是result,stage的劃分也以此為依據(jù),shuffle之前的所有變換是一個(gè)stage,shuffle之后的操作是另一個(gè)stage。

比如 rdd.parallize(1 to 10).foreach(println) 這個(gè)操作沒有shuffle,直接就輸出了,那么只有它的task是resultTask,stage也只有一個(gè);

如果是rdd.map(x => (x, 1)).reduceByKey(_ + _).foreach(println), 這個(gè)job因?yàn)橛衦educe,所以有一個(gè)shuffle過程,那么reduceByKey之前的是一個(gè)stage,執(zhí)行shuffleMapTask,輸出shuffle所需的數(shù)據(jù),reduceByKey到最后是一個(gè)stage,直接就輸出結(jié)果了。

如果job中有多次shuffle,那么每個(gè)shuffle之前都是一個(gè)stage。

Spark會(huì)根據(jù)RDD之間的依賴關(guān)系將DAG圖劃分為不同的階段,對(duì)于窄依賴,由于partition依賴關(guān)系的確定性,partition的轉(zhuǎn)換處理就可以在同一個(gè)線程里完成,窄依賴就被spark劃分到同一個(gè)stage中,而對(duì)于寬依賴,只能等父RDD shuffle處理完成后,下一個(gè)stage才能開始接下來的計(jì)算。之所以稱之為ShuffleMapTask是因?yàn)樗枰獙⒆约旱挠?jì)算結(jié)果通過shuffle到下一個(gè)stage中。

Spark Stage的分類

在Spark中,Stage可以分成兩種類型。分別是:

  • ShuffleMapStage
  1. 這種Stage是以Shuffle為輸出邊界
  2. 其輸入邊界可以是從外部獲取數(shù)據(jù),也可以是另一個(gè)ShuffleMapStage的輸出
  3. 其輸出可以是另一個(gè)Stage的開始
  4. ShuffleMapStage的最后Task就是ShuffleMapTask
  5. 在一個(gè)Job里可能有該類型的Stage,也可以能沒有該類型Stage
  • ResultStage
  1. 這種Stage是直接輸出結(jié)果
  2. 其輸入邊界可以是從外部獲取數(shù)據(jù),也可以是另一個(gè)ShuffleMapStage的輸出
  3. ResultStage的最后Task就是ResultTask
  4. 在一個(gè)Job里必定有該類型Stage

Stage類的定義

Stage類是一個(gè)抽象類,類的定義如下:

abstract class Stage {    def findMissingPartitions(): Seq[Int]}
http://www.risenshineclean.com/news/9251.html

相關(guān)文章:

  • 做服裝批發(fā)哪個(gè)網(wǎng)站比較好巨量引擎廣告投放平臺(tái)官網(wǎng)
  • 哪家公司建網(wǎng)站最好網(wǎng)站 推廣
  • 蘇州網(wǎng)頁制作與網(wǎng)站建設(shè)地址吸引顧客的營(yíng)銷策略
  • 優(yōu)秀的定制網(wǎng)站建設(shè)公司河北seo網(wǎng)絡(luò)優(yōu)化師
  • 微信小程序開通要錢嗎seo超級(jí)外鏈發(fā)布
  • 室內(nèi)設(shè)計(jì)培訓(xùn)教程seo實(shí)戰(zhàn)培訓(xùn)中心
  • 清爽css網(wǎng)站框架花關(guān)鍵詞排名系統(tǒng)
  • 小型電子商務(wù)網(wǎng)站開發(fā)百度愛采購(gòu)?fù)茝V怎么入駐
  • 裝修行業(yè)門戶網(wǎng)站模板交換友情鏈接
  • 做學(xué)徒哪個(gè)網(wǎng)站好周口搜索引擎優(yōu)化
  • wap網(wǎng)站e4a做appseo上首頁排名
  • 科訊網(wǎng)站首頁公告模板吉林seo外包
  • 北京網(wǎng)站建設(shè)網(wǎng)絡(luò)公司5118和百度指數(shù)
  • php手機(jī)網(wǎng)站如何制作google怎么推廣
  • vs2019怎么創(chuàng)建網(wǎng)站每日一則小新聞
  • 騰訊云網(wǎng)站建設(shè)流程sem搜索引擎營(yíng)銷
  • 寧波做網(wǎng)站價(jià)格網(wǎng)址域名
  • 網(wǎng)站建設(shè)合同內(nèi)容與結(jié)構(gòu)嗶哩嗶哩推廣網(wǎng)站
  • 鹽城網(wǎng)站app建設(shè)西安網(wǎng)站外包
  • 響應(yīng)式網(wǎng)站方案網(wǎng)站seo在線診斷
  • 大興網(wǎng)站開發(fā)網(wǎng)站建設(shè)哪家好谷歌搜索引擎入口
  • wordpress實(shí)訓(xùn)seo項(xiàng)目完整流程
  • 設(shè)計(jì)公司前十名aso排名優(yōu)化
  • 山東省兩學(xué)一做網(wǎng)站寫軟文怎么接單子
  • 網(wǎng)站做三屏合一百度一下電腦版網(wǎng)頁
  • 徐州睢寧網(wǎng)站建設(shè)seo教程搜索引擎優(yōu)化入門與進(jìn)階
  • 制作精美網(wǎng)站建設(shè)服務(wù)周到廣東東莞疫情最新情況
  • 女和男做搞基視頻網(wǎng)站國(guó)內(nèi)最新新聞事件
  • 龍巖建設(shè)局網(wǎng)站企業(yè)營(yíng)銷策劃書如何編寫
  • 智慧團(tuán)建網(wǎng)站首頁網(wǎng)站推廣建站