中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁(yè) > news >正文

前端優(yōu)化網(wǎng)站天津百度搜索網(wǎng)站排名

前端優(yōu)化網(wǎng)站,天津百度搜索網(wǎng)站排名,新浪短網(wǎng)址,貴州光利達(dá)建設(shè)工程有限公司局網(wǎng)站在快速發(fā)展的數(shù)據(jù)驅(qū)動(dòng)時(shí)代,實(shí)時(shí)數(shù)據(jù)處理已經(jīng)成為企業(yè)決策和運(yùn)營(yíng)的關(guān)鍵因素。特別是在處理來(lái)自各種數(shù)據(jù)源的信息時(shí),如何確保數(shù)據(jù)的及時(shí)、準(zhǔn)確和高效同步變得尤為重要。本文著重介紹了如何利用 SqlServer CDC 源連接器在 SeaTunnel 框架下實(shí)現(xiàn) SQL Server …

file

在快速發(fā)展的數(shù)據(jù)驅(qū)動(dòng)時(shí)代,實(shí)時(shí)數(shù)據(jù)處理已經(jīng)成為企業(yè)決策和運(yùn)營(yíng)的關(guān)鍵因素。特別是在處理來(lái)自各種數(shù)據(jù)源的信息時(shí),如何確保數(shù)據(jù)的及時(shí)、準(zhǔn)確和高效同步變得尤為重要。本文著重介紹了如何利用 SqlServer CDC 源連接器在 SeaTunnel 框架下實(shí)現(xiàn) SQL Server 到其他數(shù)據(jù)系統(tǒng)的實(shí)時(shí)數(shù)據(jù)同步,這對(duì)于希望提升數(shù)據(jù)處理能力和實(shí)時(shí)數(shù)據(jù)分析的企業(yè)來(lái)說(shuō),具有重要的實(shí)踐意義。

SQL Server CDC

SqlServer CDC 源連接器

支持 SQL Server 版本

  • 服務(wù)器:2019(或更高版本,僅供參考)

支持引擎

SeaTunnel Zeta
Flink

主要特性

  • 批處理
  • 流處理
  • 精確一次
  • 列投影
  • 并行處理
  • 支持用戶自定義分片

描述

SqlServer CDC 連接器允許從 SqlServer 數(shù)據(jù)庫(kù)讀取快照數(shù)據(jù)和增量數(shù)據(jù)。本文檔描述了如何設(shè)置 SqlServer CDC 連接器以在 SqlServer 數(shù)據(jù)庫(kù)上運(yùn)行 SQL 查詢。

支持的數(shù)據(jù)源信息

數(shù)據(jù)源支持的版本驅(qū)動(dòng)URLMaven
SqlServer
  • 服務(wù)器:2019(或更高版本,僅供參考)
com.microsoft.sqlserver.jdbc.SQLServerDriverjdbc:sqlserver://localhost:1433;databaseName=column_type_test下載

安裝 Jdbc 驅(qū)動(dòng)

請(qǐng)下載并將 SqlServer 驅(qū)動(dòng)放在 ${SEATUNNEL_HOME}/lib/ 目錄下。例如:cp mssql-jdbc-xxx.jar ${SEATUNNEL_HOME}/lib/

數(shù)據(jù)類型映射

SQL Server 數(shù)據(jù)類型SeaTunnel 數(shù)據(jù)類型
CHAR
VARCHAR
NCHAR
NVARCHAR
STRUCT
CLOB
LONGVARCHAR
LONGNVARCHAR
STRING
BLOBBYTES
INTEGERINT
SMALLINT
TINYINT
SMALLINT
BIGINTBIGINT
FLOAT
REAL
FLOAT
DOUBLEDOUBLE
NUMERIC
DECIMAL(column.length(), column.scale().orElse(0))
DECIMAL(column.length(), column.scale().orElse(0))
TIMESTAMPTIMESTAMP
DATEDATE
TIMETIME
BOOLEAN
BIT
BOOLEAN

源選項(xiàng)

名稱類型必需默認(rèn)值描述
username字符串-連接數(shù)據(jù)庫(kù)服務(wù)器時(shí)使用的用戶名。
password字符串-連接數(shù)據(jù)庫(kù)服務(wù)器時(shí)使用的密碼。
database-names列表-需要監(jiān)控的數(shù)據(jù)庫(kù)名。
table-names列表-表名為模式名和表名的組合(databaseName.schemaName.tableName)。
base-url字符串-必須包含數(shù)據(jù)庫(kù)的URL,如 "jdbc:sqlserver://localhost:1433;databaseName=test"。
startup.mode枚舉INITIALSqlServer CDC 消費(fèi)者的可選啟動(dòng)模式,有效枚舉為 "initial"、"earliest"、"latest" 和 "specific"。
startup.timestamp長(zhǎng)整型-從指定的紀(jì)元時(shí)間戳(以毫秒為單位)開(kāi)始。
注意,當(dāng)使用 "startup.mode" 選項(xiàng)為 'timestamp' 時(shí),此選項(xiàng)是必需的。
startup.specific-offset.file字符串-從指定的 binlog 文件名開(kāi)始。
注意,當(dāng) "startup.mode" 選項(xiàng)使用 'specific' 時(shí),此選項(xiàng)是必需的。
startup.specific-offset.pos長(zhǎng)整型-從指定的 binlog 文件位置開(kāi)始。
注意,當(dāng) "startup.mode" 選項(xiàng)使用 'specific' 時(shí),此選項(xiàng)是必需的。
stop.mode枚舉NEVERSqlServer CDC 消費(fèi)者的可選停止模式,有效枚舉為 "never"。
stop.timestamp長(zhǎng)整型-從指定的紀(jì)元時(shí)間戳(以毫秒為單位)停止。
注意,當(dāng) "stop.mode" 選項(xiàng)使用 'timestamp' 時(shí),此選項(xiàng)是必需的。
stop.specific-offset.file字符串-從指定的 binlog 文件名停止。
注意,當(dāng) "stop.mode" 選項(xiàng)使用 'specific' 時(shí),此選項(xiàng)是必需的。
stop.specific-offset.pos長(zhǎng)整型-從指定的 binlog 文件位置停止。
注意,當(dāng) "stop.mode" 選項(xiàng)使用 'specific' 時(shí),此選項(xiàng)是必需的。
incremental.parallelism整型1增量階段中并行讀取器的數(shù)量。
snapshot.split.size整型8096表快照的分割大小(行數(shù)),快照期間的表會(huì)被分割成多個(gè)分片進(jìn)行讀取。
snapshot.fetch.size整型1024讀取表快照時(shí)每次輪詢的最大提取量。
server-time-zone字符串UTC數(shù)據(jù)庫(kù)服務(wù)器中的會(huì)話時(shí)區(qū)。
connect.timeout時(shí)長(zhǎng)30s連接器嘗試連接到數(shù)據(jù)庫(kù)服務(wù)器后等待超時(shí)的最大時(shí)間。
connect.max-retries整型3連接器嘗試建立數(shù)據(jù)庫(kù)服務(wù)器連接的最大重試次數(shù)。
connection.pool.size整型20連接池大小。
chunk-key.even-distribution.factor.upper-bound雙精度浮點(diǎn)型100分塊鍵分布因子的上界。此因子用于判斷表數(shù)據(jù)是否均勻分布。如果計(jì)算出的分布因子小于或等于此上界值(即 (MAX(id) - MIN(id) + 1) / 行數(shù)),則表分塊將被優(yōu)化為均勻分布。否則,如果分布因子更大,則表將被認(rèn)為是不均勻分布的,并且如果估計(jì)的分片數(shù)超過(guò) sample-sharding.threshold 指定的值,將使用基于抽樣的分片策略。默認(rèn)值為 100.0。
chunk-key.even-distribution.factor.lower-bound雙精度浮點(diǎn)型0.05分塊鍵分布因子的下界。此因子用于判斷表數(shù)據(jù)是否均勻分布。如果計(jì)算出的分布因子大于或等于此下界值(即 (MAX(id) - MIN(id) + 1) / 行數(shù)),則表分塊將被優(yōu)化為均勻分布。否則,如果分布因子更小,則表將被認(rèn)為是不均勻分布的,并且如果估計(jì)的分片數(shù)超過(guò) sample-sharding.threshold 指定的值,將使用基于抽樣的分片策略。默認(rèn)值為 0.05。
sample-sharding.threshold整型1000觸發(fā)抽樣分片策略的估計(jì)分片數(shù)閾值。當(dāng)分布因子超出 chunk-key.even-distribution.factor.upper-boundchunk-key.even-distribution.factor.lower-bound 指定的范圍,并且估計(jì)的分片數(shù)(計(jì)算為近似行數(shù) / 分塊大小)超過(guò)此閾值時(shí),將使用抽樣分片策略。這可以幫助更有效地處理大型數(shù)據(jù)集。默認(rèn)值為1000分片。
inverse-sampling.rate整型1000抽樣分片策略中使用的抽樣率的倒數(shù)。例如,如果這個(gè)值設(shè)置為1000,意味著抽樣過(guò)程中應(yīng)用了1/1000的抽樣率。這個(gè)選項(xiàng)提供了在控制抽樣粒度的靈活性,從而影響最終的分片數(shù)量。特別是在處理非常大的數(shù)據(jù)集時(shí),更低的抽樣率是首選。默認(rèn)值為1000。
exactly_once布爾型true啟用精確一次語(yǔ)義。
debezium.*配置-將Debezium的屬性傳遞給用于從SqlServer服務(wù)器捕獲數(shù)據(jù)變化的Debezium嵌入式引擎。
查看Debezium的SqlServer連接器屬性獲取更多信息
format枚舉DEFAULTSqlServer CDC 的可選輸出格式,有效枚舉為 "DEFAULT"、"COMPATIBLE_DEBEZIUM_JSON"。
common-options-源插件的通用參數(shù),請(qǐng)參考源通用選項(xiàng)獲取詳細(xì)信息。

任務(wù)示例

初始讀取簡(jiǎn)單示例

這是一個(gè)流模式CDC初始化讀取的示例,成功讀取表數(shù)據(jù)后將進(jìn)行增量讀取。以下SQL DDL僅供參考。

env {# 在此處設(shè)置引擎配置execution.parallelism = 1job.mode = "STREAMING"execution.checkpoint.interval = 5000
}source {# 僅用于測(cè)試和演示功能的示例源插件SqlServer-CDC {result_table_name = "customers"username = "sa"password = "Y.sa123456"startup.mode="initial"database-names = ["column_type_test"]table-names = ["column_type_test.dbo.full_types"]base-url = "jdbc:sqlserver://localhost:1433;databaseName=column_type_test"}
}transform {
}sink {console {source_table_name = "customers"}

增量讀取簡(jiǎn)單示例

這是一個(gè)增量閱讀示例,用于閱讀變更數(shù)據(jù)并打印。

env {# 在此處設(shè)置引擎配置execution.parallelism = 1job.mode = "STREAMING"execution.checkpoint.interval = 5000
}source {# 僅用于測(cè)試和演示功能的示例源插件SqlServer-CDC {# 設(shè)置精確一次讀取exactly_once=true result_table_name = "customers"username = "sa"password = "Y.sa123456"startup.mode="latest"database-names = ["column_type_test"]table-names = ["column_type_test.dbo.full_types"]base-url = "jdbc:sqlserver://localhost:1433;databaseName=column_type_test"}
}transform {
}sink {console {source_table_name = "customers"}
}

隨著數(shù)據(jù)處理需求的不斷增長(zhǎng)和實(shí)時(shí)數(shù)據(jù)同步的重要性日益凸顯,SqlServer CDC 源連接器在 SeaTunnel 生態(tài)系統(tǒng)中扮演著至關(guān)重要的角色。

通過(guò)本文的深入解析,我們希望您能夠更好地理解并利用這一強(qiáng)大工具,從而實(shí)現(xiàn)數(shù)據(jù)流的高效、穩(wěn)定和精準(zhǔn)同步。

無(wú)論您是數(shù)據(jù)工程師、系統(tǒng)架構(gòu)師還是業(yè)務(wù)分析師,掌握如何在 SeaTunnel 中部署和優(yōu)化 SQL Server CDC 連接器,都將為您的數(shù)據(jù)處理能力帶來(lái)顯著提升。

本文由 白鯨開(kāi)源科技 提供發(fā)布支持!

http://www.risenshineclean.com/news/44789.html

相關(guān)文章:

  • 做購(gòu)物網(wǎng)站多少錢3分鐘搞定網(wǎng)站seo優(yōu)化外鏈建設(shè)
  • 南京軟件開(kāi)發(fā)公司有哪些網(wǎng)站關(guān)鍵詞優(yōu)化價(jià)格
  • 綿陽(yáng)網(wǎng)站建設(shè)公司nba東西部最新排名
  • 廣州 網(wǎng)站建設(shè)公司小程序推廣引流
  • 酒店網(wǎng)站開(kāi)發(fā)常用的seo工具推薦
  • 怎么樣檢查網(wǎng)站有沒(méi)有做全站301網(wǎng)站群發(fā)軟件
  • 柳江網(wǎng)站虛擬主機(jī)公司谷歌官方seo入門(mén)指南
  • 昆明旅游網(wǎng)頁(yè)設(shè)計(jì)成都網(wǎng)站優(yōu)化seo
  • 諸城做網(wǎng)站的公司網(wǎng)站seo推廣計(jì)劃
  • 電子商務(wù)網(wǎng)站建設(shè)應(yīng)該側(cè)重哪方面網(wǎng)站優(yōu)化方法
  • 向網(wǎng)站服務(wù)器上傳網(wǎng)頁(yè)文件下載市場(chǎng)營(yíng)銷在線課程
  • wordpress wordpress.orgseo推廣軟
  • 網(wǎng)站建設(shè)的預(yù)算指數(shù)函數(shù)圖像
  • 太原0元網(wǎng)站建設(shè)谷歌代運(yùn)營(yíng)
  • java做博客網(wǎng)站有哪些招聘網(wǎng)絡(luò)營(yíng)銷推廣人員
  • 嘉興手機(jī)網(wǎng)站開(kāi)發(fā)費(fèi)用b站2023年免費(fèi)入口
  • 怎樣用flash做網(wǎng)站騰訊企點(diǎn)app
  • 廣州網(wǎng)站建設(shè)出售關(guān)注公眾號(hào)推廣2元一個(gè)
  • 南昌市城鄉(xiāng)建設(shè)委員會(huì)新網(wǎng)站百度實(shí)時(shí)熱搜榜
  • 商務(wù)網(wǎng)站建設(shè)的步驟網(wǎng)站建設(shè)制作免費(fèi)
  • 好的網(wǎng)站怎么建設(shè)長(zhǎng)沙網(wǎng)絡(luò)推廣服務(wù)
  • 重慶網(wǎng)站建設(shè)最大水果網(wǎng)絡(luò)營(yíng)銷推廣方案
  • 北京網(wǎng)站建設(shè)工作室哪家好正規(guī)營(yíng)銷培訓(xùn)
  • php網(wǎng)站開(kāi)發(fā)外包百度網(wǎng)盤(pán)app手機(jī)版
  • 網(wǎng)站建設(shè)騰訊課堂網(wǎng)站推廣如何引流
  • 百度網(wǎng)盟推廣案例鎮(zhèn)江百度關(guān)鍵詞優(yōu)化
  • 如何自己用wordpress建網(wǎng)站黑龍seo網(wǎng)站優(yōu)化
  • 寧波專業(yè)平臺(tái)網(wǎng)站建設(shè)網(wǎng)絡(luò)推廣公司專業(yè)網(wǎng)絡(luò)
  • 給個(gè)網(wǎng)站可以在線做企業(yè)推廣的公司
  • 好的設(shè)計(jì)師網(wǎng)站有哪些友情鏈接搜讀