中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁 > news >正文

淘寶客導(dǎo)購網(wǎng)站模板seo排名首頁

淘寶客導(dǎo)購網(wǎng)站模板,seo排名首頁,做網(wǎng)站 百度推廣,簡(jiǎn)約網(wǎng)站模板Kylin 1、Apache Kylin概覽 1.1 什么是Kylin Apache Kylin?是一個(gè)開源的、分布式的分析型數(shù)據(jù)倉庫,提供Hadoop/Spark 之上的 SQL 查詢接口及多維分析(OLAP)能力以支持超大規(guī)模數(shù)據(jù),最初由 eBay 開發(fā)并貢獻(xiàn)至開源社區(qū)。它能在亞秒內(nèi)查詢巨大的表。 1.2 Kylin的簡(jiǎn)介 Ky…

Kylin

1、Apache Kylin概覽

1.1 什么是Kylin

Apache Kylin?是一個(gè)開源的、分布式的分析型數(shù)據(jù)倉庫,提供Hadoop/Spark 之上的 SQL 查詢接口及多維分析(OLAP)能力以支持超大規(guī)模數(shù)據(jù),最初由 eBay 開發(fā)并貢獻(xiàn)至開源社區(qū)。它能在亞秒內(nèi)查詢巨大的表。

1.2 Kylin的簡(jiǎn)介

Kylin的出現(xiàn)就是為了解決大數(shù)據(jù)系統(tǒng)中TB級(jí)別數(shù)據(jù)的數(shù)據(jù)分析需求,它提供Hadoop/Spark之上的SQL查詢接口及多維分析(OLAP)能力以支持超大規(guī)模數(shù)據(jù),它能在亞秒內(nèi)查詢巨大的Hive表。其核心是預(yù)計(jì)算,計(jì)算結(jié)果存在HBase中。

作為大數(shù)據(jù)分析神器,它也需要站在巨人的肩膀上,依賴HDFS、MapReduce/Spark、Hive/Kafka、HBase等服務(wù)。

1.3 Kylin的優(yōu)勢(shì)

Kylin的主要優(yōu)勢(shì)為以下幾點(diǎn):

  • 可擴(kuò)展超快OLAP引擎:Kylin是為減少在Hadoop/Spark上百億規(guī)模數(shù)據(jù)查詢延遲而設(shè)計(jì)
  • Hadoop ANSI SQL 接口:KylinHadoop提供標(biāo)準(zhǔn)SQL支持大部分查詢功能
  • 交互式查詢能力:通過Kylin,用戶可以與Hadoop數(shù)據(jù)進(jìn)行亞秒級(jí)交互,在同樣的數(shù)據(jù)集上提供比Hive更好的性能
  • 多維立方體(MOLAP Cube):用戶能夠在Kylin里為百億以上數(shù)據(jù)集定義數(shù)據(jù)模型并構(gòu)建立方體
  • BI工具無縫整合:Kylin提供與BI工具的整合能力,如Tableau,PowerBI/Excel,MSTR,QlikSense,HueSuperSet
  • 其它特性:Job管理與監(jiān)控;壓縮與編碼;增量更新;利用HBase Coprocessor;基于HyperLogLogDinstinc Count近似算法;友好的web界面以管理,監(jiān)控和使用立方體;項(xiàng)目及表級(jí)別的訪問控制安全;支持LDAP、SSO

1.4 基本原理

Kylin的核心思想是預(yù)計(jì)算。

理論基礎(chǔ)是:以空間換時(shí)間。即多維分析可能用到的度量進(jìn)行預(yù)計(jì)算,將計(jì)算好的結(jié)果保存成Cube并存儲(chǔ)到HBase中,供查詢時(shí)直接訪問。

大致流程:將數(shù)據(jù)源(比如Hive)中的數(shù)據(jù)按照指定的維度和指標(biāo),由計(jì)算引擎Mapreduce離線計(jì)算出所有可能的查詢結(jié)果(即Cube)存儲(chǔ)到HBase中。HBase中每行記錄的Rowkey各維度的值拼接而成,度量會(huì)保存在column family中。為了減少存儲(chǔ)代價(jià),這里會(huì)對(duì)維度和度量進(jìn)行編碼。查詢階段,利用HBase列存儲(chǔ)的特性就可以保證Kylin有良好的快速響應(yīng)和高并發(fā)

Apache Kylin的工作原理是對(duì)數(shù)據(jù)模型做Cube預(yù)計(jì)算,并利用計(jì)算的結(jié)果加速查詢。具體工作過程如下:

指定數(shù)據(jù)模型,定義維度和度量
預(yù)計(jì)算Cube,計(jì)算所有Cuboid并保存為物化視圖(存儲(chǔ)到hbase中)
執(zhí)行查詢時(shí),讀取Cuboid,運(yùn)算,產(chǎn)生查詢結(jié)果

高效OLAP分析:

Kylin的查詢過程不會(huì)掃描原始記錄,而是通過預(yù)計(jì)算預(yù)先完成表的關(guān)聯(lián)、聚合等復(fù)雜運(yùn)算
利用預(yù)計(jì)算的結(jié)果來執(zhí)行查詢,相比非預(yù)計(jì)算的查詢技術(shù),其速度一般要快一到兩個(gè)數(shù)量級(jí),在超大的數(shù)據(jù)集上優(yōu)勢(shì)更明顯
數(shù)據(jù)集達(dá)到千億乃至萬億級(jí)別時(shí),Kylin的速度可以超越其他非預(yù)計(jì)算技術(shù)1000倍以上

1.5 維度和度量

維度就是觀察數(shù)據(jù)的角度,例如:

  • 電商的銷售數(shù)據(jù),可以從時(shí)間的維度來觀察,也可以細(xì)化從時(shí)間和地區(qū)的維度來觀察
  • 統(tǒng)計(jì)時(shí),可以把維度值相同的記錄聚合在一起,然后應(yīng)用聚合函數(shù)做累加、平均、去重計(jì)數(shù)等聚合計(jì)算

度量就是被聚合的統(tǒng)計(jì)值,也是聚合運(yùn)算的結(jié)果
在這里插入圖片描述

在這里插入圖片描述

1.6 數(shù)據(jù)立方體

數(shù)據(jù)立方體只是多維模型的一個(gè)形象的說法
在這里插入圖片描述

  • 為什么叫立方體?
    • 立方體本身只有三維,但多維模型不僅限于三維模型,可以組合更多的維度
    • 為了與傳統(tǒng)關(guān)系型數(shù)據(jù)庫的二維表區(qū)別開來,才有了數(shù)據(jù)立方體的叫法

1.7 技術(shù)架構(gòu)

在這里插入圖片描述

  1. 數(shù)據(jù)源主要是Hadoop Hive,數(shù)據(jù)以關(guān)系表的形式輸入,且必須符合星形模型,保存著待分析的用戶數(shù)據(jù)。根據(jù)元數(shù)據(jù)的定義,構(gòu)建引擎從數(shù)據(jù)源抽取數(shù)據(jù),并構(gòu)建Cube

  2. Kylin可以使用MapReduce或者Spark作為構(gòu)建引擎。構(gòu)建后的Cube保存在右側(cè)的存儲(chǔ)引擎中,一般選用HBase作為存儲(chǔ)

  3. 完成了離線構(gòu)建后,用戶可以從上方查詢系統(tǒng)發(fā)送SQL進(jìn)行查詢分析

  4. Kylin提供了各種Rest API、JDBC/ODBC接口。無論從哪個(gè)接口進(jìn)入,SQL最終都會(huì)來到Rest服務(wù)層,再轉(zhuǎn)交給查詢引擎進(jìn)行處理

  5. SQL語句是基于數(shù)據(jù)源的關(guān)系模型書寫的,而不是Cube

    1. Kylin在設(shè)計(jì)時(shí),刻意對(duì)查詢用戶屏蔽了Cube的概念
    2. 分析師只需要理解簡(jiǎn)單的關(guān)系模型就可以使用Kylin,沒有額外的學(xué)習(xí)門檻,傳統(tǒng)的SQL應(yīng)用也很容易遷
    3. 查詢引擎解析SQL,生成基于關(guān)系表的邏輯執(zhí)行計(jì)劃,然后將其轉(zhuǎn)譯為基于Cube的物理執(zhí)行計(jì)劃,最后查詢預(yù)計(jì)算生成的Cube并產(chǎn)生結(jié)果,整個(gè)過程不會(huì)訪問原始數(shù)據(jù)源

1.8 Kylin特點(diǎn)

Kylin的主要特點(diǎn)包括支持SQL接口、支持超大規(guī)模數(shù)據(jù)集、亞秒級(jí)響應(yīng)、可伸縮性、高吞吐率、BI工具集成等。

1)標(biāo)準(zhǔn)SQL接口:Kylin是以標(biāo)準(zhǔn)的SQL作為對(duì)外服務(wù)的接口。

2)支持超大數(shù)據(jù)集:Kylin對(duì)于大數(shù)據(jù)的支撐能力可能是目前所有技術(shù)中最為領(lǐng)先的。早在2015年eBay的生產(chǎn)環(huán)境中就能支持百億記錄的秒級(jí)查詢,之后在移動(dòng)的應(yīng)用場(chǎng)景中又有了千億記錄秒級(jí)查詢的案例。

3)亞秒級(jí)響應(yīng):Kylin擁有優(yōu)異的查詢相應(yīng)速度,這點(diǎn)得益于預(yù)計(jì)算,很多復(fù)雜的計(jì)算,比如連接、聚合,在離線的預(yù)計(jì)算過程中就已經(jīng)完成,這大大降低了查詢時(shí)刻所需的計(jì)算量,提高了響應(yīng)速度。

4)可伸縮性和高吞吐率:?jiǎn)喂?jié)點(diǎn)Kylin可實(shí)現(xiàn)每秒70個(gè)查詢,還可以搭建Kylin的集群。

5)BI工具集成

Kylin可以與現(xiàn)有的BI工具集成,具體包括如下內(nèi)容。

ODBC:與Tableau、Excel、PowerBI等工具集成

JDBC:與Saiku、BIRT等Java工具集成

RestAPI:與JavaScript、Web網(wǎng)頁集成

Kylin開發(fā)團(tuán)隊(duì)還貢獻(xiàn)了Zepplin的插件,也可以使用Zepplin來訪問Kylin服務(wù)。

1.9 Kylin的總體架構(gòu)

在這里插入圖片描述

2、Kylin環(huán)境搭建

2.1 安裝地址

1)官網(wǎng)地址

http://kylin.apache.org/cn/

2)官方文檔

http://kylin.apache.org/cn/docs/

3)下載地址

http://kylin.apache.org/cn/download/

2.2 安裝部署

提示說明:?jiǎn)?dòng)kylin之前,要啟動(dòng)如下所有命令

hive --service metastore &
hive --service hiveserver2 &
mr-jobhistory-daemon.sh start historyserver

將其上傳服務(wù)器(目錄隨意)

#解壓文件
[root@node1 ~]# tar -zxvf apache-kylin-2.5.1-bin-hbase1x.tar.gz -C /usr/local/
# 修改名稱
[root@node1 local]# mv apache-kylin-2.5.1-bin-hbase1x/ kylin-2.5.1
# 啟動(dòng) 注意:?jiǎn)?dòng)之前要將HADOOP_HOME,HIVE_HOME,HBASE_HOME,HIVE_CONF配置好環(huán)境變量
[root@node1 kylin-2.5.1]# ./bin/kylin.sh start

[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機(jī)制,建議將圖片保存下來直接上傳(img-msS2gQq7-1654304435820)(Kylin.assets/1619593891565.png)]

查看Web UI is at http://:7070/kylin

在http://qianfeng011:7070/kylin查看Web頁面
在這里插入圖片描述

輸入用戶名密碼:用戶名為:ADMIN,密碼為:KYLIN(系統(tǒng)已填)

關(guān)閉:kylin.sh stop

3、基礎(chǔ)入門操作

創(chuàng)建hive表

create table if not exists default.class1(
deptno int,
dname string,
loc int
)
row format delimited fields terminated by ',';
create table if not exists default.student(
empno int,
ename string,
job string,
mgr int,
hiredate string, 
sal double, 
comm double,
deptno int)
row format delimited fields terminated by ',';

進(jìn)入hive添加數(shù)據(jù)

hive (default)> load data local inpath "/root/class1.txt" into table default.class1;
hive (default)> load data local inpath "/root/student.txt" into table default.student;

3.1 同步Hive表

創(chuàng)建project
在這里插入圖片描述

在這里插入圖片描述

同步hive數(shù)據(jù)
在這里插入圖片描述

同步之前我們要查看Hive有哪些表

在這里插入圖片描述
在這里插入圖片描述

查看數(shù)據(jù)
在這里插入圖片描述

3.2 創(chuàng)建Model

首先我們選擇創(chuàng)建New Model選項(xiàng)

http://www.risenshineclean.com/news/3398.html

相關(guān)文章:

  • 鄭州做網(wǎng)站推廣運(yùn)營(yíng)商寧波品牌網(wǎng)站推廣優(yōu)化公司
  • 網(wǎng)站建設(shè)模板代碼下載蘇州百度 seo
  • 深圳做微信商城網(wǎng)站建設(shè)蘇州seo營(yíng)銷
  • 找事做搜索網(wǎng)站java培訓(xùn)機(jī)構(gòu)
  • 怎樣制作購物網(wǎng)站 微信轉(zhuǎn)發(fā)網(wǎng)站seo分析報(bào)告
  • wap端和app有什么區(qū)別全面落實(shí)疫情防控優(yōu)化措施
  • 廣西建設(shè)監(jiān)理協(xié)會(huì)官網(wǎng)站ui設(shè)計(jì)公司
  • 經(jīng)典wordpress網(wǎng)站寧波網(wǎng)站推廣代運(yùn)營(yíng)
  • 做企業(yè)網(wǎng)站市場(chǎng)分析陜西整站關(guān)鍵詞自然排名優(yōu)化
  • 怎么用ps制作個(gè)人網(wǎng)站模板下載seo培訓(xùn)學(xué)什么
  • 金融保險(xiǎn)網(wǎng)站模板網(wǎng)絡(luò)廣告類型
  • 網(wǎng)站里的圖片切換怎么做網(wǎng)絡(luò)營(yíng)銷推廣策略
  • 萬互網(wǎng)站建站sem搜索引擎
  • wap網(wǎng)站多少錢百度知道官網(wǎng)登錄入口
  • 株洲 網(wǎng)站建設(shè)百度關(guān)鍵詞優(yōu)化詞精靈
  • 手機(jī)微信網(wǎng)站模板買賣交易平臺(tái)
  • wordpress數(shù)據(jù)庫緩存建站seo是什么
  • 北京房山網(wǎng)站建設(shè)產(chǎn)品更新培訓(xùn)銀川seo
  • wordpress 多個(gè)域名seo入門教程網(wǎng)盤
  • 網(wǎng)頁設(shè)計(jì)比較好的網(wǎng)站新聞?lì)^條免費(fèi)下載安裝
  • 如何做公司網(wǎng)站建設(shè)東莞做網(wǎng)站公司電話
  • 網(wǎng)站開發(fā)公司怎么查詢?cè)鯓釉诎俣茸鰪V告宣傳
  • 濰坊市住房和城鄉(xiāng)建設(shè)網(wǎng)站seo技術(shù)培訓(xùn)東莞
  • 汝州市住房和城鄉(xiāng)規(guī)劃建設(shè)局網(wǎng)站淘寶關(guān)鍵詞排名查詢
  • 興義網(wǎng)站seo廣東疫情動(dòng)態(tài)人民日?qǐng)?bào)
  • 網(wǎng)站推廣鏈接seo研究學(xué)院
  • 做網(wǎng)站 寫腳本是什么百度官方下載
  • 淺談一下網(wǎng)絡(luò)營(yíng)銷的幾個(gè)誤區(qū)東莞seo公司
  • wordpress 文章閱讀數(shù)杭州seo網(wǎng)站建設(shè)
  • 易企秀怎么做網(wǎng)站發(fā)布友情鏈接