中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁(yè) > news >正文

大連網(wǎng)站推廣怎么收費(fèi)整站seo排名費(fèi)用價(jià)格

大連網(wǎng)站推廣怎么收費(fèi),整站seo排名費(fèi)用價(jià)格,莆田個(gè)人外貿(mào)網(wǎng)站建設(shè),南陽(yáng)網(wǎng)站開發(fā)本章解答以下問題: ASN,團(tuán)體(community),屬性(attribute),最佳路徑這些BGP術(shù)語(yǔ)是什么疑似?在數(shù)據(jù)中心中應(yīng)該使用eBGP還是iBGP?在數(shù)據(jù)中心使用BGP時(shí),應(yīng)采用什…

本章解答以下問題:

  • ASN,團(tuán)體(community),屬性(attribute),最佳路徑這些BGP術(shù)語(yǔ)是什么疑似?
  • 在數(shù)據(jù)中心中應(yīng)該使用eBGP還是iBGP?
  • 在數(shù)據(jù)中心使用BGP時(shí),應(yīng)采用什么ASN編號(hào)方案?
  • 在數(shù)據(jù)中心使用BGP時(shí),應(yīng)如何修改BGP的計(jì)時(shí)器?

BGP 基本概念

BGP協(xié)議概述

BGP 是一種路徑矢量路由協(xié)議?!笆噶俊笔且粋€(gè)數(shù)組或列表。因此,路徑矢量路由協(xié)議是一種構(gòu)建并分發(fā)對(duì)象數(shù)組的協(xié)議,數(shù)組中的每個(gè)對(duì)象定義了從一個(gè)網(wǎng)絡(luò)地址(通常為IP地址)到另一地址的路徑。這里用的是“對(duì)象”而不是“路由器”,因?yàn)閷?duì)象是一種稱為 AS 的東西。

撰寫本書時(shí),BGP的當(dāng)前版本號(hào)為4,也稱為 BGP-4。BGP-4 的主要定義于RFC4271 中,但該文檔中的某些規(guī)范已被后面的一些 RFC (例如能力通告相關(guān)的 RFC)所覆蓋。

BGP基于TCP之上運(yùn)行,因此BGP 可以忽略例如分片、組裝、消息確認(rèn)、重傳及其他一些在別的路由協(xié)議中通常需要處理的問題。實(shí)際上 BGP 是唯一一種基于 TCP的路由協(xié)議。其他常見的路由協(xié)議要么基于 IP,要么甚至使用更原始的 L2 數(shù)據(jù)包。BGP在TCP端口 179 上接收新的連接或者發(fā)起連接請(qǐng)求。

BGP 眾所周知的復(fù)雜性源于其協(xié)議的通用性。BGP 支持交換多種網(wǎng)絡(luò)類型的路由信息,包括IPv4和IPv6,還支持網(wǎng)絡(luò)虛擬化技術(shù)如 MPLS 和VXLAN,因此BGP被稱為多協(xié)議路由協(xié)議。除此以外,由于 BGP 用于在多個(gè)管理域之間交換路由信息因此還支持應(yīng)用復(fù)雜的路由策略,這些策略可以控制 BGP 多方面的行為,例如計(jì)算到達(dá)目的地的最佳路徑,需要通告的路由,以及通告路由的哪些屬性。BGP 還支持第5章中介紹的 ECMP以及 UCMP (Unequal-Cost Multipath,非平衡多路徑),并不是所有的 BGP 實(shí)現(xiàn)都支持了 UCMP。

在不同的管理域(或按照 BGP 術(shù)語(yǔ)稱為自治系統(tǒng))之間交換路由信息的 BGP稱為eBGP (external BGP,外部 BGP)

在管理域內(nèi) (或在同一自治系統(tǒng)內(nèi))交換路由信息的 BGP稱為iBGP (internal BGP,內(nèi)部BGP)。

BGP 對(duì)于eBGP和iBGP的路由信息交換有著不同的規(guī)則。

BGP 是一種可擴(kuò)展性很強(qiáng)的協(xié)議,人們一直在為 BGP 提出各種新的想法。在很多方面來(lái)說(shuō),BGP就像是路由開發(fā)者的 HTTP 協(xié)議。它被用于在路由器之間傳送各種信息,這些信息可能與路由完全無(wú)關(guān),或者不是 BGP 最初設(shè)計(jì)用的目的。BGP的可擴(kuò)展性使其適應(yīng)性很廣并且功能強(qiáng)大,但是如果你嘗試使用它提供的所有功能,也將很難理解。因此這一點(diǎn)至關(guān)重要:應(yīng)該盡量簡(jiǎn)化對(duì) BGP 的使用,不要僅僅因?yàn)榭梢跃褪褂?BGP的某些特性。

BGP 對(duì)等連接

BGP 對(duì)等連接之間不是客戶端- 服務(wù)器關(guān)系,而是相互平等的對(duì)等關(guān)系。圖 14-1 展示了BGP 對(duì)等會(huì)話生命周期中的時(shí)間線序列。

image-20240610181451410

在進(jìn)行對(duì)等連接時(shí),BGP 兩端的任何一方都可以發(fā)起 TCP 連接。通常兩端發(fā)起的連接都會(huì)成功,這樣會(huì)導(dǎo)致 BGP兩側(cè)有兩個(gè)單獨(dú)的 TCP 連接在進(jìn)行相互通信。這種情況在 BGP 標(biāo)準(zhǔn)中被稱為連接沖突。BGP 提供了辦法來(lái)解決沖突,以將兩個(gè) TCP連接減少為單個(gè) TCP連接。BGP 發(fā)言者有一個(gè)唯一標(biāo)識(shí)符 router-id,這是一個(gè)32位的無(wú)符號(hào)數(shù)字。在發(fā)生連接沖突時(shí),具有較大 router-id 的發(fā)言者發(fā)起的連接會(huì)被選中獲勝。與某些其他協(xié)議不同的是,BGP 在會(huì)話初始化期間未定義優(yōu)先級(jí)字段,因?yàn)檫x用哪一方發(fā)起的連接是一個(gè)無(wú)關(guān)緊要的細(xì)節(jié),不會(huì)影響B(tài)GP做出的任何決策。

BGP標(biāo)淮還定義了“被動(dòng)”連接的方式,即 BGP對(duì)等方的其中一方并不主動(dòng)發(fā)起TCP連接,只在對(duì)方節(jié)點(diǎn)請(qǐng)求連接時(shí)做出響應(yīng)。當(dāng)運(yùn)行 Kube-router 或其他此類解決方案的節(jié)點(diǎn)與運(yùn)行在路由器上的 BGP 進(jìn)行對(duì)等連接時(shí),就采用了被動(dòng)連接。

BGP 狀態(tài)機(jī)

image-20240610194646164

BGP的狀態(tài)機(jī)非常簡(jiǎn)單,只包括三個(gè)主要階段:

  • TCP 連接建立
  • 解決連接沖突和能力交換
  • 路由交換

這些階段中包含一些更具體的狀態(tài),如圖 14-2 所示。圖中的虛線表示出現(xiàn)錯(cuò)誤時(shí)的狀態(tài)轉(zhuǎn)換,實(shí)線則表示正常情況下的狀態(tài)轉(zhuǎn)換。

自治系統(tǒng)編號(hào)

每個(gè)BGP發(fā)言者都有一個(gè)ASN(Autonomous System Number,自治系統(tǒng)編號(hào)),該ASN標(biāo)識(shí)了該發(fā)言者代表的組織。在BGP的上下文中,組織被定義為由單個(gè)實(shí)體控制并具有確定路由策略的一個(gè)網(wǎng)絡(luò)。通常會(huì)為一個(gè)服務(wù)提供商(例如Verizon、AT&T和T-Mobile)分配一個(gè)唯一的ASN,而一個(gè)大型企業(yè)(例如??松梨诤蛠嗰R遜)也會(huì)分配一個(gè)唯一的ASN。在某些情況下,一個(gè)組織可能有多個(gè)ASN,這可能由于企業(yè)并購(gòu)等原因?qū)е?。例?#xff0c;蘋果有3個(gè)ASN,而亞馬遜有14個(gè)。

網(wǎng)絡(luò)地址的路徑矢量是該地址經(jīng)過(guò)的ASN列表。ASN列表被用于識(shí)別路由環(huán)路、確定到某一網(wǎng)絡(luò)前綴的最佳路徑,以及對(duì)網(wǎng)絡(luò)應(yīng)用路由策略。在Internet上,每個(gè)ASN都只對(duì)特定的IP前綴具有權(quán)威性。

ASN有兩種格式:兩字節(jié)和四字節(jié)。兩字節(jié)的格式更為流行,因?yàn)檫@種格式出現(xiàn)的時(shí)間更長(zhǎng),并且也更易于閱讀(例如,與一個(gè)四字節(jié)的ASN 4200000000相比,兩字節(jié)ASN 64000在視覺上更容易接受)。如今,大多數(shù)路由協(xié)議套件都同時(shí)支持這兩種格式的ASN。

ASN有供內(nèi)部網(wǎng)絡(luò)使用的私有號(hào)碼空間,這些私有ASN號(hào)碼對(duì)Internet而言不可見。數(shù)據(jù)中心通常在其內(nèi)部使用私有ASN。

BGP 能力

作為一種不斷發(fā)展的協(xié)議,BGP 允許在每個(gè)對(duì)等會(huì)話中協(xié)商支持的能力,以確保只交換雙方都支持的信息。能力協(xié)商在 RFC 5492 定義。在 BGP Open 消息中進(jìn)行能力協(xié)商,能力類型包括每一方支持哪些地址族等內(nèi)容

BGP 屬性,團(tuán)體和擴(kuò)展團(tuán)體

BGP 有各種類型的屬性,具有不同的用途和語(yǔ)義。BGP 屬性使用類型,長(zhǎng)度和值(TLV) 的模型進(jìn)行編碼.

基本的 BGP-4 RFC定義了每個(gè)BGP 兼容實(shí)現(xiàn)都必須支持的七個(gè)路徑屬性。這些屬性用于 BGP 的最佳路徑計(jì)算。例如,其中的一個(gè)屬性 AS_PATH 用于攜帶一條路由關(guān)聯(lián)的路徑矢量。

BGP的一些屬性是強(qiáng)制性的。也就是說(shuō),這些屬性必須始終在消息中傳輸,而其他屬性可能并不總是出現(xiàn)在消息中。消息接收者必須能夠處理 BGP-4 RFC 中定義的七個(gè)基本路徑屬性。在該 RFC 之外定義的其他屬性稱為可選屬性,并非所有的實(shí)現(xiàn)都支持這些可選屬性。例如MP_RBACH_NLRI 屬性用于通告 MPLS 標(biāo)簽,但并非所有實(shí)現(xiàn)都支持該標(biāo)簽。對(duì)接收者的唯一要求是必須轉(zhuǎn)發(fā)被標(biāo)識(shí)為可傳遞的屬性,即使在不理解該屬性的情況下也是如此。

BGP還允許通過(guò)稱為團(tuán)體 (community) 的屬性定義用戶擴(kuò)展的路由分組。 community 是一種可傳遞的可選屬性。運(yùn)營(yíng)商使用 community 將一些路由組合在一起,以對(duì)這些路由應(yīng)用路由策略。路由策略會(huì)影響這些路由的 BGP 更新消息處理和最佳路徑計(jì)算。運(yùn)營(yíng)商可以使用其路由協(xié)議棧的特定配置命令為路由打上community 標(biāo)記,并通過(guò)community 的值來(lái)影響B(tài)GP的行為。一條更新消息可以攜帶多個(gè)community。

community 的值不是一個(gè)任意文本字符串,而具有四字節(jié)的固定長(zhǎng)度。前兩個(gè)字節(jié)是發(fā)起這個(gè) community的 BGP 發(fā)言者的ASN,后兩個(gè)字節(jié)則留給網(wǎng)絡(luò)運(yùn)營(yíng)商使用。和BGP的大部分內(nèi)容一樣,community 也是在Internet 剛出現(xiàn)時(shí)設(shè)計(jì)的。隨著4字節(jié)ASN的出現(xiàn)以及對(duì)2字節(jié)以上的操作填充需求,我們現(xiàn)在有了擴(kuò)展團(tuán)體 (extended community,使用8字節(jié)代替原先的4 字節(jié))和大型團(tuán)體 (large community,使用12 字節(jié)) 。采用兩字節(jié)ASN 編號(hào)的網(wǎng)絡(luò)虛擬化路由信息使用擴(kuò)展團(tuán)體屬性,而具有四字節(jié) ASN 的路由信息則使用大型團(tuán)體屬性。

BGP 最佳路徑計(jì)算

BGP路由器會(huì)為每個(gè)通告的路由計(jì)算從其自身出發(fā)的最佳路徑。當(dāng)從一個(gè)或多個(gè)對(duì)等方收到新的 UPDATE 消息時(shí),將觸發(fā) BGP 的最佳路徑計(jì)算。BGP 實(shí)現(xiàn)可以選擇對(duì)這些消息進(jìn)行緩沖,以便通過(guò)一次計(jì)算處理所有更新,而不至于由于頻繁的路徑計(jì)算觸發(fā)過(guò)快的路由更新。只有當(dāng)計(jì)算結(jié)果改變了 (添加,刪除或更新)到某一網(wǎng)絡(luò)的最佳路徑時(shí),BGP 才會(huì)對(duì)外進(jìn)行路由通告。

OSPF,IS-IS 和其他一些路由協(xié)議采用一個(gè)簡(jiǎn)單的度量標(biāo)準(zhǔn)來(lái)決定采用哪條路徑,而BGP有八個(gè)度量標(biāo)準(zhǔn)。

你可以使用這個(gè)精妙的句子來(lái)幫助記住 BGP 在計(jì)算最佳路徑時(shí)采用的這些度量的優(yōu)先級(jí):

Wise Lip Lovers Apply Oral Medication Every Night.(明智的戀人每晚都要口服藥物。)

表 14-1 說(shuō)明了助記符和實(shí)際度量指標(biāo)之間的對(duì)應(yīng)關(guān)系。最佳路徑是按優(yōu)先順序的度量指標(biāo)的值 (有關(guān)最佳路徑計(jì)算的詳細(xì)信息,請(qǐng)參閱 RFC 4271 的9.1 節(jié))。如一個(gè)更新和現(xiàn)有最佳路徑之間的某一個(gè)度量標(biāo)準(zhǔn)的值相同,則會(huì)按此順序比較下一個(gè)度量指標(biāo),直到打破平局。

Table 14-1. BGP best-path metrics

MnemonicBGP metric name
WiseWeight
LipLOCAL_PREFERENCE
LoversLocally originated
ApplyAS_PATH
OralORIGIN
MedicationMED
EveryeBGP over iBGP
NightNexthop IGP Cost

BGP在數(shù)據(jù)中心中只使用了 Locally originatedAS_PATH這兩個(gè)指標(biāo)來(lái)計(jì)算最佳路徑。 換句話說(shuō),節(jié)點(diǎn)本地生成的路由優(yōu)先級(jí)高于通過(guò) BGP 學(xué)習(xí)得到的路由,AS_PATH長(zhǎng)度較短的路由優(yōu)先級(jí)高于 AS_PATH 長(zhǎng)度較長(zhǎng)的路由。如果兩條路徑的 AS_PATH長(zhǎng)度相等,則認(rèn)為其路由成本相同。實(shí)際上,默認(rèn)的 BGP 實(shí)現(xiàn)不僅要求兩條AS_PATH的長(zhǎng)度相同,而且要求 AS_PATH 中的各個(gè) ASN 也必須相同,才會(huì)認(rèn)為其路由成本相同。如果想只使用 AS_PATH 長(zhǎng)度來(lái)判斷路徑的成本是否相同,則需要打開一個(gè)放松該限制的配置項(xiàng)。

多協(xié)議支持

BGP 不僅可以通告如何到達(dá)某個(gè) IP 地址的信息,還可以通告如何到達(dá) MPLS 標(biāo)簽、MAC 地址等其他信息。定義 BGP 多協(xié)議支持的基本標(biāo)準(zhǔn)是 RFC4760。BGP 支持的每種網(wǎng)絡(luò)協(xié)議都有其自己的標(biāo)識(shí),稱為 AFI (Address Family Indicator,地址族標(biāo)識(shí)符)。AFI標(biāo)識(shí)了主要的網(wǎng)絡(luò)協(xié)議。IP4 和IPv6 各自有自己的 AFI。但是,即使在 AFI內(nèi)部,也需要進(jìn)一步進(jìn)行區(qū)分。例如,單播和多播路由信息的區(qū)別就很大。

BGP 使用 SAFI(Subsequent Address Family Indicator,子地址標(biāo)識(shí)符) 來(lái)對(duì)單播和多播地址情況進(jìn)行進(jìn)一步區(qū)分。IPv4 Unicast AFI-SAFI是 RFC 中假定使用的地址標(biāo)識(shí)符。當(dāng)在描述時(shí)未指定 AFI/SAFI時(shí),則可認(rèn)為適用 IPv4 單播。BGP發(fā)言者需要關(guān)注的AFI/SAFI列表是通過(guò)BGPOPEN消息在能力協(xié)商時(shí)通告的僅當(dāng)雙方通告對(duì)其 AFI / SAFI 感興趣時(shí),兩個(gè) BGP 對(duì)等方才會(huì)交換有關(guān)網(wǎng)絡(luò)地的信息。

BGP消息

表 14-2 列出了 BGP 發(fā)送的各種消息類型及其特定用途

Table 14-2. BGP 消息類型及其用途

消息類型使用周期
Open在會(huì)話建立時(shí)發(fā)送,用于標(biāo)識(shí)路由器和交換能力一次
Update用于交換路由通告和撤回僅在信息發(fā)生變化時(shí)
Keepalive心跳,用于向遠(yuǎn)程對(duì)等端發(fā)出信號(hào),表明我們正在運(yùn)行已配置,通常為 60 秒
Notification在發(fā)生錯(cuò)誤或以管理方式關(guān)閉會(huì)話時(shí)發(fā)送在發(fā)生錯(cuò)誤或關(guān)閉時(shí)
Route Refresh請(qǐng)求遠(yuǎn)程對(duì)等節(jié)點(diǎn)重新發(fā)送所有路由僅在需要時(shí)進(jìn)行

每條BGP消息被編碼為一個(gè)TLV。一條BGP消息攜帶了一個(gè)固定長(zhǎng)度的頭部,頭部中也包含了BGP消息的類型。

BGP中主要的消息是 Update,Update 消息中包含發(fā)布的路由列表和撤銷的路由列表。

BGP中撤銷路由信息的機(jī)制與 OSPF 和IS-IS 不同: OSPF和IS-IS 通過(guò)鏈路狀態(tài)信息老化來(lái)撤銷路由,而 BGP 采用了顯式的撤消機(jī)制。BGP Update 消息的格式如圖14-3(a) 所示。BGP 使用術(shù)語(yǔ) NLRI (Network Layer Reachability Information,網(wǎng)絡(luò)層可達(dá)性信息) 來(lái)表示所發(fā)布的路由。 community 屬性則被編碼在“Path Attributes List”中。

BGP 采用一個(gè)稱為 MP_REACH_NLRI的屬性來(lái)保存非 IPv4 地址族的 NLRI,這是一個(gè)可選的,非傳遞路徑屬性,其內(nèi)部格式如圖 14-3 (b) 所示。如果該屬性存在,則位于圖 14-3 (a)的 BGP Update 消息中的“Path Attributes List”部分中。對(duì)于下一跳這種 NLRI中的關(guān)鍵屬性,IPv4 和其他協(xié)議有不同的編碼。在IPv4 中,下一跳是使用一個(gè)叫做 NEXTHOP 的路徑屬性編碼在 Update 消息的“Path Attribute List”部分中的。但是 IPv6 路由的編碼不同,IPv6 的下一跳和發(fā)布的路由按圖 14-3 (b)所示進(jìn)行編碼。

一條 BGP Update 消息中可以攜帶多個(gè) AFI /SAFI路由信息。例如,單個(gè) BGP Update 消息可以同時(shí)攜帶IPv4 和IPv6 的更新。在這種情況下,Update消息中將同時(shí)存在 MP_REACH_NLRI和標(biāo)準(zhǔn)的 NLRI屬性。如果該條消息中沒有IPv4 路由通告,則NEXTHOP屬性就不會(huì)出現(xiàn)在路徑屬性列表中,只會(huì)存在包含IPv6 路由的MP_REACH_NLRI 屬性。

圖14-3:BGP Update 消息和多協(xié)議網(wǎng)絡(luò)地址的格式

image-20240610212839238

使BGP適應(yīng)數(shù)據(jù)中心

數(shù)據(jù)中心密集的網(wǎng)絡(luò)連接與運(yùn)營(yíng)商管理域之間相對(duì)稀疏的連接有很大的區(qū)別。因此,在數(shù)據(jù)中心中部署 BGP有一些不同的權(quán)衡。BGP 在數(shù)據(jù)中心的使用情況可總結(jié)如下:

  • eBGP 被用作唯一的路由協(xié)議。
  • eBGP 與私有 ASN 一起使用
  • 使用合適的BGP的ASN編號(hào)方案,以避免BGP的路徑探索(Path hunting)問題
  • 與服務(wù)提供商網(wǎng)絡(luò)相比,數(shù)據(jù)中心中的 BGP 計(jì)時(shí)器適用于更積極的更新策略

eBGP 與 iBGP

鑒于整個(gè)數(shù)據(jù)中心都處于單個(gè)管理域內(nèi),使用iBGP似乎是一個(gè)顯而易見的選擇,但是,幾乎每個(gè)數(shù)據(jù)中心內(nèi)都選擇了部署eBGP。

導(dǎo)致這種現(xiàn)象的主要原因是eBGP比iBGP更容易理解和部署。在最佳路徑選擇算法、選擇和通告哪些路由的標(biāo)準(zhǔn),以及處理和忽略哪些前綴屬性的規(guī)則這些方面,iBGP讓人感到迷惑。在一些特定的情況下,iBGP對(duì)多路徑的支持也有局限性,特別是當(dāng)一條路由被兩個(gè)不同的節(jié)點(diǎn)通告時(shí)。我們可以克服這種限制,但是會(huì)非常麻煩。

iBGP比eBGP更容易讓一個(gè)新手感到困惑,因?yàn)橐獙?shí)現(xiàn)預(yù)期的行為,需要調(diào)整BGP中較多的配置選項(xiàng)。這些難以理解的眾多配置只會(huì)加劇新手的不安。

選擇eBGP還有一個(gè)強(qiáng)烈的非技術(shù)性原因:與iBGP相比,eBGP有更多功能完善和可靠的實(shí)現(xiàn)。多種實(shí)現(xiàn)的存在意味著客戶選擇eBGP可以避免供應(yīng)商鎖定。

私有 ASN

私有 ASN是在全球Internet 中不可見的 ASN。 它們用于企業(yè)內(nèi)部,類似私有 IP 地址(例如 10.0.0.0/8 )。 私有 ASN有2字節(jié)和4 字節(jié)兩種 ASN變體。兩字節(jié)的ASN支持 1023 個(gè)私有 ASN (64512-65534) ,而四字節(jié)的ASN 則支持近 9500萬(wàn)個(gè)私有 ASN(42000000004294967294),足以滿足當(dāng)今任何規(guī)模的數(shù)據(jù)中心的需求。

只要在與外界通信之前將其剝離,運(yùn)營(yíng)商也可以在數(shù)據(jù)中心內(nèi)部使用全局 ASN。但是由于以下兩個(gè)原因,這并不是一個(gè)好主意。首先,在數(shù)據(jù)中心內(nèi)部使用全局 ASN可能會(huì)誤導(dǎo)試圖將 ASN 解碼為名稱有意義的操作人員和工具。由于很多 ASN是眾所周知的,因此運(yùn)營(yíng)商在數(shù)據(jù)中心內(nèi)看到這些 ASN時(shí)可能會(huì)非常困惑。例如,在數(shù)據(jù)中心內(nèi)某個(gè)節(jié)點(diǎn)上看到 Verizon 的ASN時(shí)。

第二個(gè)原因是為了避免意外將內(nèi)部 BGP 信息泄漏到外部網(wǎng)絡(luò)。如果在內(nèi)部使用了全局 ASN,并且將路由信息泄漏到外部,將會(huì)對(duì) Internet造成嚴(yán)重破壞。 例如,如果某個(gè)數(shù)據(jù)中心在其內(nèi)部使用 Twitter的 ASN,并且不小心泄漏了一條路由,聲稱Twitter 是該數(shù)據(jù)中心內(nèi)一個(gè)可公開訪問的路由的 AS PATH 的一部分,則將導(dǎo)致對(duì)twitter 服務(wù)的大規(guī)模的全球劫持。錯(cuò)誤的配置是所有網(wǎng)絡(luò)中斷故障的頭號(hào)或者第二號(hào)原因,因此不應(yīng)該在數(shù)據(jù)中心內(nèi)使用公共 ASN,以避免發(fā)生這種情況。

BGP的 ASN 編號(hào)方案

image-20240610215508800

BGP的 ASN編號(hào)方案如下:

  • 每個(gè) leaf 節(jié)點(diǎn)都有自己的 ASN
  • 二層 Clos 中的所有 spine 都有自己獨(dú)立的 ASN。在三層 Clos 中,同一pod 內(nèi)的所有 spine 使用相同的 ASN,但每個(gè) pod 的ASN 不同。
  • 在三層 Clos中,所有的super spine都使用相同的ASN

BGP的路徑探索問題

困擾路徑矢量協(xié)議的一個(gè)問題是計(jì)數(shù)到無(wú)窮 (count-to-infinity)。盡管我們不能在這里涉及關(guān)路徑探索的所有細(xì)節(jié),但是你可以通過(guò)圖 14-5 中所示的拓?fù)渲胁榭丛搯栴}的一個(gè)簡(jiǎn)化的解釋。

在此拓?fù)渲?#xff0c;所有節(jié)點(diǎn)都有一個(gè)單獨(dú)的 ASN?,F(xiàn)在我們從 R1 的角度來(lái)考慮前綴為 10.1.1.1 的可達(dá)性。R2和R3 都會(huì)向R1 通告 10.1.1.1 的可達(dá)性: R2為10.1.1.1 通告的 AS_PATH是[R2,R4],R3 通告的AS PATH 則是[R3,R4]

image-20240610222701878

當(dāng)節(jié)點(diǎn)R4 下線時(shí),R2 失去了到達(dá) 10.1.1.1 的最佳路徑,它重新計(jì)算后將通過(guò)R1的AS_PATH[R1,R3,R4]作為最佳路徑。R2和R3還向R1發(fā)送 10.1.1.1的路由撤消消息。但是,如果R3 的路由撤消消息先于 R2 的到達(dá)R1,則R1會(huì)將其到 10.1.1.1 的最佳路徑切換到經(jīng)過(guò) R2的AS_PATH[R1,R2,R4],并將此路由對(duì)外進(jìn)行通告?,F(xiàn)在,R3 切換為使用通過(guò) R2 的路徑作為最佳路徑,并認(rèn)為 10.1.1.1仍然可以訪問。當(dāng) R2 的路由撤消消息到達(dá) R1時(shí),R1 撤銷到10.1.1.1 的路由并將撤消消息發(fā)送到 R3。由于節(jié)點(diǎn)之間數(shù)據(jù)轉(zhuǎn)發(fā)時(shí)間順序和每個(gè)BGP 實(shí)現(xiàn)的具體工作方法有所不同,事件的確切順序可能與此處描述的不完全一樣,但和此類似。

對(duì)這個(gè)問題的簡(jiǎn)短描述是; 因?yàn)橐粋€(gè)節(jié)點(diǎn)并不知道網(wǎng)絡(luò)中其他每個(gè)節(jié)點(diǎn)的物理鏈接狀態(tài),所以它不知道一條路由是真的消失了(路徑末端的節(jié)點(diǎn)自身掉線了)還是可以通過(guò)其他路徑到達(dá)。因此,節(jié)點(diǎn)會(huì)繼續(xù)通過(guò)所有其他可用路徑來(lái)探索目的地的可達(dá)性。這被稱為路徑探索。

在圖 14-5 的簡(jiǎn)單拓?fù)渲?#xff0c;這看起來(lái)并不是一個(gè)太大的問題。但是想象一下 R1和R4是Clos 拓?fù)渲械膌eaf 節(jié)點(diǎn),而 R2和R3是spine 的情況。常見的 Clos拓?fù)渲型ǔS?32或64個(gè)leaf和4到8個(gè)spine。每個(gè)leaf都可以選擇不同的spine作為最佳路徑。當(dāng)R4下線時(shí),每個(gè)spine會(huì)探索從任一leaf到達(dá)R4的路徑,因?yàn)槊總€(gè)leaf 選擇了不同的 spine 作為最佳路徑,因此需要進(jìn)行一些額外的搜尋。該問題可能會(huì)變得非常嚴(yán)重,因?yàn)槎嘤嗟南⒔粨Q過(guò)多,并且由于錯(cuò)誤路由信息在網(wǎng)絡(luò)中的長(zhǎng)時(shí)間傳播,會(huì)導(dǎo)致流量損失增加。

多路經(jīng)選擇

如果八個(gè)最佳路徑度量指標(biāo)的值分別都相等,則兩條路徑被視為等價(jià)的。這些標(biāo)準(zhǔn)之一是AS_PATH中的AS 編號(hào)必須完全匹配,而不僅僅只是路徑長(zhǎng)度相同,該要求破壞了數(shù)據(jù)中心內(nèi)兩種常見部署方案中的多路徑路由。

第一種部署場(chǎng)景如圖14-6所示。在該圖中,圓形表示綁定在一起的兩個(gè)端口通道,對(duì)上層協(xié)議來(lái)說(shuō),這兩個(gè)鏈接看起來(lái)像是一條高速邏輯鏈接。圖中的服務(wù)器被連接到了兩個(gè)TOR(Top of Rack) 交換機(jī)上,每個(gè)TOR 交換機(jī)有不同的ASN。在這種情況下,相同的路由會(huì)被采用不同的 ASN分別進(jìn)行通告。

image-20240610224249990

假設(shè)圖中服務(wù)器所在的子網(wǎng)為 10.1.1.0/24。兩個(gè)leaf都會(huì)對(duì)外通告到自己到10.1.1.0/24 子網(wǎng)的路由。在這種情況下,每個(gè) spine 會(huì)接收到兩條到10.1.1.0/24的路由,一個(gè)路由的AS_PATH為64600,另一個(gè)路由的AS_PATH為64601。根據(jù)等價(jià)路徑的判斷邏輯,BGP 不僅要求 AS_PATH的長(zhǎng)度相同,而且還要求 AS_PATH包含相同的ASN列表。因?yàn)檫@兩條路由的 ASN不相同,所以在 spine 上不會(huì)形成多路徑路由。相反,他們只會(huì)選擇兩條路線之一作為最佳路徑。

在第二種部署場(chǎng)景中,服務(wù)器上部署了虛擬服務(wù)(如 Kubernetes service) ,這種情況下多臺(tái)服務(wù)器都會(huì)通告同一個(gè)服務(wù)虛擬 IP 地址 (例如 Kubernetes Cluster IP)的可達(dá)性。并且為了確??煽啃院涂蓴U(kuò)展性,服務(wù)器連接到了不同的 leaf 上,因此spine 也會(huì)收到來(lái)自多個(gè)不同 ASN 的同一個(gè)服務(wù)的路由,這些路徑的 AS_PATH長(zhǎng)度相同,但某些 ASN 并不相同。

有多種解決此問題的方法,最簡(jiǎn)單的是通過(guò)配置來(lái)修改最佳路徑算法。在 FRR 和其他路由棧中有一條

bestpath as-path multipath-relax 配置命令,它的作用很簡(jiǎn)單:當(dāng)來(lái)自兩個(gè)不同來(lái)源的路由通告中的 AS_PATH長(zhǎng)度相同時(shí),最佳路徑算法會(huì)跳過(guò)對(duì)ASN 是否精確匹配的檢查,直接進(jìn)行下一個(gè)度量標(biāo)準(zhǔn)的判斷。

BGP 的收斂時(shí)間

BGP 通常用四個(gè)計(jì)時(shí)器來(lái)控制在發(fā)生故障時(shí)或從故障中恢復(fù)時(shí) (例如,鏈路斷開后再次可用) 收斂的速度。了解這些計(jì)時(shí)器很重要,因?yàn)樗鼈儠?huì)影響信息在網(wǎng)絡(luò)中傳播的速度。對(duì)這些計(jì)時(shí)器進(jìn)行適當(dāng)?shù)恼{(diào)整可以使 BGP 的收斂速度和其他內(nèi)部路由協(xié)議(如OSPF) 達(dá)到相同的水平。

Advertisement interval

在路由 Internet 流量時(shí),穩(wěn)定性遠(yuǎn)比快速更新更為重要。但在數(shù)據(jù)中心,情況恰恰相反。 負(fù)責(zé)確保進(jìn)行更新的主要 BGP 計(jì)時(shí)器是 advertisement interval。在向?qū)Φ确桨l(fā)送下一次更新之前,BGP會(huì)等待 advertisement interval 中配置的時(shí)間間隔。默認(rèn)情況下,該配置的值是 30 秒。在數(shù)據(jù)中心,此值必須設(shè)置為 0。就這一個(gè)更改就可以使eBGP 的收斂時(shí)間達(dá)到其他 IGP 協(xié)議 (例如 OSPF) 相同的水平。

Keepalive 和 Hold Timer

BGP 發(fā)言者會(huì)在每個(gè)已建立的會(huì)話中按 Keepalive 設(shè)置的時(shí)間周期定時(shí)發(fā)送 Keepalive 消息。如果遠(yuǎn)程對(duì)等方在 Hold 計(jì)時(shí)器配置的時(shí)間內(nèi) (通常是Keepalive 時(shí)間的三倍)未收到 Keepalive 消息,則它將宣布對(duì)等方死亡并終止對(duì)等會(huì)話。默認(rèn)情況下,Keepalive 時(shí)間為 60 秒。這意味著 BGP 在其對(duì)等方T線三分鐘后才能檢測(cè)到。缺省情況下,如果一個(gè) eBGP 會(huì)話的對(duì)等方只相隔一跳的距離,那么在鏈路發(fā)生故障后會(huì)立即重置該會(huì)話。Keepalive 和 Hold 計(jì)時(shí)器的作用是捕獲軟件層面的錯(cuò)誤,比如鏈路狀態(tài)雖然是 Up 的,但由于線纜故障而導(dǎo)致單通的情況。一些運(yùn)營(yíng)商啟用了稱為 BFD 的協(xié)議,可以在不到一秒鐘或最多一秒鐘的時(shí)間內(nèi)檢測(cè)到由于電纜問題引起的錯(cuò)誤。但是要捕獲 BGP 進(jìn)程自身的錯(cuò)誤,你就需要調(diào)整 Keepalive 和 Hold 計(jì)時(shí)器。在數(shù)據(jù)中心內(nèi),三分鐘的時(shí)間太長(zhǎng)了,相當(dāng)于一生。數(shù)據(jù)中心內(nèi)最常見的配置是 Keepalive 設(shè)置為 3秒,Hold 計(jì)時(shí)器設(shè)置為9秒。

Connect timer

這是四個(gè)計(jì)時(shí)器中最不重要的。當(dāng) BGP 嘗試與對(duì)等方建立連接但由于某些原而失敗時(shí),它會(huì)等待一段時(shí)間,然后再次嘗試連接。默認(rèn)情況下,此時(shí)間是 60秒,換句話說(shuō),如果 BGP 無(wú)法與其對(duì)等方建立會(huì)話,就會(huì)等待一分鐘,然后再嘗試再次建立會(huì)話。當(dāng)鏈路從故障中恢復(fù)或節(jié)點(diǎn)啟動(dòng)時(shí),這個(gè)缺省值可能會(huì)延遲會(huì)話的重建。在數(shù)據(jù)中心內(nèi),此計(jì)時(shí)器的值通常設(shè)置為 10 秒。

http://www.risenshineclean.com/news/2631.html

相關(guān)文章:

  • 哈爾濱網(wǎng)站備案地址關(guān)鍵詞優(yōu)化seo公司
  • 如何做網(wǎng)站網(wǎng)頁(yè)優(yōu)惠活動(dòng)推廣文案
  • 公眾號(hào)網(wǎng)站制作淘寶seo優(yōu)化怎么做
  • 招聘網(wǎng)站做銷售2024很有可能再次封城嗎
  • 網(wǎng)頁(yè)設(shè)計(jì)個(gè)人簡(jiǎn)歷長(zhǎng)春網(wǎng)站建設(shè)方案優(yōu)化
  • 祝賀網(wǎng)站上線百度貼吧人工客服
  • 福州免費(fèi)建站品牌企業(yè)滄州seo公司
  • wordpress加速樂沈陽(yáng)網(wǎng)絡(luò)seo公司
  • 最新淮北論壇windows優(yōu)化大師使用方法
  • 張家界做網(wǎng)站商品推廣軟文范例300字
  • 網(wǎng)站如何做支付寶接口seo 工具推薦
  • 移動(dòng)端網(wǎng)站模板怎么做友情鏈接交換的作用在于
  • 近期國(guó)內(nèi)新聞熱點(diǎn)事件高級(jí)seo
  • 濰坊網(wǎng)絡(luò)營(yíng)銷外包灰色行業(yè)關(guān)鍵詞優(yōu)化
  • 網(wǎng)站該怎么找到軟文代寫價(jià)格
  • WordPress添加live2dseo優(yōu)化包括哪些
  • 做網(wǎng)站有年費(fèi)嗎作品提示優(yōu)化要?jiǎng)h嗎
  • 上海做網(wǎng)站優(yōu)化哪家好關(guān)鍵詞工具有哪些
  • 東莞做網(wǎng)站樂云seo今天晚上19點(diǎn)新聞聯(lián)播直播回放
  • 政務(wù)門戶網(wǎng)站建設(shè)方案怎么設(shè)計(jì)網(wǎng)站
  • 做網(wǎng)站賣東西seo優(yōu)化培訓(xùn)公司
  • 做一個(gè)大型網(wǎng)站aso搜索排名優(yōu)化
  • 在靜安正規(guī)的設(shè)計(jì)公司網(wǎng)站使用軟件提高百度推廣排名
  • 高端網(wǎng)站建設(shè)蘇州廣東seo推廣
  • 中國(guó)十大權(quán)威新聞媒體谷歌優(yōu)化教程
  • 南京網(wǎng)頁(yè)網(wǎng)站制作網(wǎng)站推廣的意義和方法
  • 蘋果網(wǎng)站用flash做百度西安分公司地址
  • 企業(yè)做網(wǎng)站有用嗎天涯今日足球賽事數(shù)據(jù)
  • 做網(wǎng)站單線程CPU和多線程cpu浙江網(wǎng)站建設(shè)推廣
  • 桂林建設(shè)網(wǎng)站公司營(yíng)銷推廣有哪些形式