中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁 > news >正文

旅游平臺網(wǎng)站合作建設(shè)方案線上運營推廣

旅游平臺網(wǎng)站合作建設(shè)方案,線上運營推廣,西安做酒店用品的網(wǎng)站,xhinacd.wordpressSpark 磁盤作用磁盤作用性能價值失敗重試ReuseExchangeSpark 導(dǎo)航 磁盤作用 臨時文件、中間文件、緩存數(shù)據(jù),都會存儲到 spark.local.dir 中 在 Shuffle Map 時, 當(dāng)內(nèi)存空間不足,就會溢出臨時文件存儲到磁盤上溢出的臨時文件一起做歸并計算…

Spark 磁盤作用

  • 磁盤作用
  • 性能價值
    • 失敗重試
    • ReuseExchange

Spark 導(dǎo)航

磁盤作用

臨時文件、中間文件、緩存數(shù)據(jù),都會存儲到 spark.local.dir

  • 在 Shuffle Map 時, 當(dāng)內(nèi)存空間不足,就會溢出臨時文件存儲到磁盤上
  • 溢出的臨時文件一起做歸并計算,得到 Shuffle 中間文件存儲到磁盤上
  • 緩存分布式數(shù)據(jù)集 : DISK 的存儲模式,會把內(nèi)存中放不下的數(shù)據(jù)緩存到磁盤

在這里插入圖片描述

性能價值

spark.local.dir 配置到 SDD 或訪問高效的存儲系統(tǒng)

磁盤復(fù)用 :

  • 給執(zhí)行性能帶來更好的提升
  • 磁盤復(fù)用 : Shuffle Write 產(chǎn)生的中間文件被多次利用

失敗重試

一旦某個計算環(huán)節(jié)出錯,就會觸發(fā)失敗重試。失敗重試的觸發(fā)點是距離最新的 Shuffle 的中間文件

當(dāng) RDD4 的計算任務(wù)失敗時,會從 RDD4 向前回溯,回溯到 RDD3 (RDD2 輸出的中間文件 ) ,并重新開始計算

在這里插入圖片描述

ReuseExchange

ReuseExchange 是 Spark SQL 優(yōu)化一種 : 相同或相似的物理計劃能共享 Shuffle 中間文件

ReuseExchange 機制的觸發(fā)條件:

  • 多個查詢所依賴的分區(qū)規(guī)則要與 Shuffle 中間數(shù)據(jù)的分區(qū)規(guī)則保持一致
  • 多個查詢所涉及的字段(Attributes)要保持一致

在這里插入圖片描述

統(tǒng)計不同用戶的 PV(Page Views,頁面瀏覽量)、UV(Unique Views,網(wǎng)站獨立訪客),并把兩項統(tǒng)計結(jié)果合并:

//版本1:分別計算PV、UV,然后合并
// Data schema (userId: String, accessTime: Timestamp, page: String)
val filePath: String = _
val df: DataFrame = spark.read.parquet(filePath)val dfPV: DataFrame = df.groupBy("userId").agg(count("page").alias("value"))
val dfUV: DataFrame = df.groupBy("userId").agg(countDistinct("page").alias("value"))val resultDF: DataFrame = dfPV.Union(dfUV)
// Result樣例
| userId | metrics | value |
| user0 | PV | 25 |
| user0 | UV | 12 |

文件掃描/Shuffle 兩次 :

在這里插入圖片描述

以 userId 為分區(qū) ,調(diào)用 repartition :

//版本2:分別計算PV、UV,然后合并
// Data schema (userId: String, accessTime: Timestamp, page: String)
val filePath: String = _
val df: DataFrame = spark.read.parquet(filePath).repartition($"userId")val dfPV: DataFrame = df.groupBy("userId").agg(count("page").alias("value"))
val dfUV: DataFrame = df.groupBy("userId").agg(countDistinct("page").alias("value"))val resultDF: DataFrame = dfPV.Union(dfUV)
// Result樣例
| userId | metrics | value |
| user0 | PV | 25 |
| user0 | UV | 12 |

ReuseExchange :

  • 數(shù)據(jù)源只需掃描一遍
  • Shuffle 也只發(fā)生一次

在這里插入圖片描述

http://www.risenshineclean.com/news/52622.html

相關(guān)文章:

  • 網(wǎng)站建設(shè)反饋書模板成都網(wǎng)站seo排名優(yōu)化
  • 網(wǎng)頁投票鏈接怎么做汕頭seo優(yōu)化項目
  • wordpress的pingseo研究中心vip課程
  • 如何拿模板做網(wǎng)站網(wǎng)站seo案例
  • 做旅游網(wǎng)站推廣色盲怎么治療
  • 網(wǎng)站 擴展廣告平臺網(wǎng)站有哪些
  • 成都網(wǎng)站建設(shè)公司淺談百度一下百度知道
  • 網(wǎng)站的建設(shè)方法有哪些內(nèi)容seo營銷優(yōu)化軟件
  • 上海網(wǎng)站設(shè)計大連網(wǎng)絡(luò)整合營銷方案ppt
  • 住房與住房建設(shè)部網(wǎng)站如何搭建一個網(wǎng)站平臺
  • 怎么網(wǎng)站定制十大接單推廣app平臺
  • 網(wǎng)頁設(shè)計入門軟件排名優(yōu)化怎么做
  • 網(wǎng)站內(nèi)頁banner一般做多高百度一下搜索引擎
  • 醫(yī)療網(wǎng)站怎么做推廣成人再就業(yè)技能培訓(xùn)班
  • 織夢裝修網(wǎng)站模板湖南廣告優(yōu)化
  • 承德網(wǎng)站建設(shè)報價石家莊百度快速排名優(yōu)化
  • wordpress網(wǎng)站建小程序游戲優(yōu)化大師手機版
  • 有什么做設(shè)計接任務(wù)的網(wǎng)站搜索引擎有哪些分類
  • 寧波東錢湖建設(shè)局網(wǎng)站中國seo排行榜
  • 網(wǎng)站開發(fā)平臺的定義今日頭條新聞推薦
  • wordpress 分割線公司網(wǎng)站seo公司
  • 做國際網(wǎng)站的上海高端網(wǎng)站公司百度官網(wǎng)下載安裝
  • seo提高網(wǎng)站排名單頁網(wǎng)站制作教程
  • 中國企業(yè)報蘇州旺道seo
  • 做淘寶客網(wǎng)站掙錢瀏覽器網(wǎng)址
  • 蘇州專業(yè)做網(wǎng)站的公司有哪些在線代理瀏覽網(wǎng)站免費
  • 短視頻網(wǎng)站平臺怎么做seo研究中心怎么樣
  • 東坑網(wǎng)站建設(shè)東莞seo優(yōu)化公司
  • 建手機網(wǎng)站價格企業(yè)網(wǎng)站seo哪里好
  • 群暉nas可以做網(wǎng)站百度seo怎么提高排名