家居類企業(yè)響應(yīng)式網(wǎng)站軟文廣告經(jīng)典案例200字
基本信息
論文題目: Building height calculation for an urban area based on street view images and deep learning
中文題目: 基于街景圖像和深度學(xué)習(xí)的城區(qū)建筑高度計算
作者及單位:
– Zhen Xu Furong Zhang Yingying Wu Yajun Yang Yuan Wu
– 北京科技大學(xué)城市與安全研究所
,土木與資源工程學(xué)院,北京,中國
錄用時間: 2023年
期刊: Computer-Aided Civil and Infrastructure Engineering
中國科學(xué)院SCI分區(qū) 1區(qū)
摘要
這篇文章提出了一種利用街景圖像
和深度學(xué)習(xí)技術(shù)
計算城市建筑高度
的新方法。
- 通過
優(yōu)化觀察點位置
的遺傳算法和基于Mask R-CNN
的深度學(xué)習(xí)模型 - 該方法能夠高效地
檢測建筑
并精確計算其高度
- 實驗表明,平均高度誤差為0.78米,證明了該方法的高精度和可行性
背景
城市建筑高度數(shù)據(jù) 在土地利用
、城市規(guī)劃
、人口估算
、能源消耗分析
等多個領(lǐng)域具有重要價值
- 傳統(tǒng)的
高度測量方法
包括土地測量、遙感圖像處理等,但這些方法在高密度低層建筑
或特殊建筑形狀
的地區(qū)往往失效
難點
- 觀察點選擇困難:
觀察點過多
會浪費資源,而過少會導(dǎo)致建筑信息不完整。 - 全景圖像檢測難度高:
全景圖像
中建筑形狀復(fù)雜且失真嚴(yán)重
,傳統(tǒng)算法難以有效檢測。 - 高度計算復(fù)雜:需要精確建立
建筑的邊界
和實際位置
之間的 映射關(guān)系
希望提出一種能夠結(jié)合街景圖像
和深度學(xué)習(xí)
的自動化方法,解決觀察點選擇、建筑檢測和高度計算的難題
數(shù)據(jù)集和評價指標(biāo)
數(shù)據(jù)集
- 來源:
百度
街景圖像,包含校園
、新北川鎮(zhèn)
和如皋市
的建筑數(shù)據(jù)。 - 標(biāo)注方式:使用
LabelMe
手動標(biāo)注建筑的邊界曲線
。
5.2
評價指標(biāo)
- mAP@.50 IOU:評估
Mask R-CNN
檢測結(jié)果的精度。 - 誤差分析:通過
實際測量值
驗證計算高度的誤差,平均誤差為0.78米,平均相對誤差為4.43%
方法
這張圖展示了該論文提出的用于計算建筑高度
的整個方法框架,清晰地描述了從數(shù)據(jù)輸入
到案例研究
的完整流程
圖中5個部分的詳細解釋
- 數(shù)據(jù)輸入(Data Input)
- 使用街景地圖(如
百度街景
)獲取建筑立面圖像
。 - 從GIS平臺獲取
建筑足跡
和道路線
信息。 - 數(shù)據(jù)輸入為整個框架提供了必要的初始信息,結(jié)合街景圖像和空間數(shù)據(jù)
為后續(xù)步驟打下基礎(chǔ)
- 使用街景地圖(如
- 圖像采集(Image Acquisition)
- 流程:
確定備選觀察點
:通過遺傳算法(GA)
優(yōu)化選擇觀察點,以覆蓋所有建筑
并減少下載數(shù)量。
街景爬蟲
:從街景地圖中自動獲取
360°全景圖像。 - 作用:
提高了
圖像采集的效率,確保了數(shù)據(jù)的覆蓋性
和完整性
。
- 流程:
- 建筑檢測(Building Detection)
- 步驟:
創(chuàng)建樣本集并對圖像進行標(biāo)注
。
訓(xùn)練Mask R-CNN模型
檢測建筑。
使用mAP@.50 IOU
評價檢測結(jié)果。 - 關(guān)鍵技術(shù): Mask R-CNN可以
精確分割建筑邊
界,為高度計算
提供了準(zhǔn)確的輸入數(shù)據(jù)。
- 步驟:
- 高度計算(Height Calculation)
- 流程:
將檢測到的建筑
與實際建筑
進行映射。
采用邊界搜索算法
定位建筑頂部。
構(gòu)建數(shù)學(xué)模型
,基于圖像中的邊界點
計算建筑高度。 - 意義: 這一階段是核心部分,結(jié)合檢測結(jié)果和數(shù)學(xué)模型實現(xiàn)了
精確的高度計算
。
- 流程:
- 案例研究(Case Study)
- 驗證場景:
北京科技大學(xué)校園
:用于驗證方法的基本準(zhǔn)確性
。
新北川鎮(zhèn)
:證明方法在中型城市
的適用性。
如皋市
:展示方法在大規(guī)模城市環(huán)境中
的擴展能力。 - 圖例解讀: 圖中用不同顏色表示建筑高度范圍,例如:
黃色
:建筑高度小于24米。
綠色
:高度在24米至50米之間。
藍色
:高度超過50米。
- 驗證場景:
確定建筑觀察點
(a):定義建筑與觀察點的關(guān)系,判斷建筑是否在觀察范圍內(nèi)
(表示為 s i j s_{ij} sij?)
(b):連接觀察點與建筑轉(zhuǎn)角點
,分析可視性。
(c ):基于視線和建筑輪廓的交互關(guān)系,確定建筑是否被完整觀察到
(表示為 q i j q_{ij} qij?)
Buildings(棕色):建筑的輪廓區(qū)域。
Observation locations(黃色圓點):觀察點的位置
。
Observation range(綠色圓圈):觀察點的覆蓋范圍
。
Turning points of buildings(綠色菱形):建筑的轉(zhuǎn)角點
,用于判斷可視性
確定建筑觀察點是否能夠有效觀察到建筑立面
的流程如下:
- 判斷建筑是否在觀察范圍內(nèi)((a)部分)
- 步驟:
- 以
觀察點
為圓心,半徑為
有效觀察距離 R R R,繪制圓形觀察范圍
。 - 如果建筑與觀察范圍
有重疊
,設(shè) s i j = 1 s_{ij}=1 sij?=1,否則 s i j = 0 s_{ij}=0 sij?=0
- 以
- 目的: 這一部分用于篩選哪些建筑在某個觀察點的有效范圍內(nèi),從而減少后續(xù)的計算工作量。
- 步驟:
- 分析可視性((b)部分)
- 步驟:
- 連接
觀察點
與建筑轉(zhuǎn)角點
,生成多條視線
。 - 判斷視線
是否穿過其他建筑
或被遮擋
。 - 如果視線與建筑輪廓
無交點
,則認(rèn)為該轉(zhuǎn)角點是可見的
。
- 連接
- 作用: 通過視線分析,進一步確認(rèn)建筑的哪些部分可以被觀察到。
- 步驟:
- 確定是否完整觀察到建筑((c )部分)
- 步驟:
如果一個建筑的所有轉(zhuǎn)角點
都在觀察范圍內(nèi)且可見
,則設(shè)定 q i j = 1 q_{ij}=1 qij?=1,表示該建筑被完整觀察到
。否則 q i j = 0 q_{ij}=0 qij?=0 - 意義: 這一部分的判斷結(jié)果直接影響后續(xù)建筑檢測和高度計算的準(zhǔn)確性
- 步驟:
示例 -- 北京市科技大學(xué)西校區(qū)的觀察點分布圖
綠色區(qū)域代表建筑物的分布
。
黃色圓點標(biāo)記了街景數(shù)據(jù)的觀察點位置
。
橙色線條表示街道網(wǎng)絡(luò)
,即街景數(shù)據(jù)的采集范圍。
證明了:
- 數(shù)據(jù)采集優(yōu)化
通過優(yōu)化觀察點分布
,減少冗余采集
,降低數(shù)據(jù)獲取成本。 - 提升覆蓋效果
確保建筑區(qū)域被完整觀察
,保證街景圖像采集的全面性。 - 應(yīng)用于復(fù)雜場景
優(yōu)化方法適用于更大范圍
或更復(fù)雜建筑布局
的場景
比較了均勻分布方法和文章提出的優(yōu)化方法在不同場景中的所需的觀察點數(shù)量
均勻分布方法:
– 校園場景
需要25個觀察點。
– 新北川鎮(zhèn)場景
需要596個觀察點。
提出的方法:
– 校園場景
僅需9個觀察點。
– 新北川鎮(zhèn)場景
僅需245個觀察點。
對比結(jié)果:
– 在兩個場景中,提出的方法顯著減少了
所需的觀察點數(shù)量
街景全景圖及其分割網(wǎng)格示例
圖像來源:
– 圖像為典型的街景全景圖
,來源于數(shù)據(jù)采集階段,通過街景爬蟲工具
獲取。
– 其主要特點是通過球面投影
顯示所有方向的信息
。
網(wǎng)格劃分:
– 全景圖被劃分為多個均勻的矩形網(wǎng)格
,每個網(wǎng)格代表街景圖像的一部分。
– 每個網(wǎng)格的劃分是為了方便后續(xù)的區(qū)域化處理
,如檢測目標(biāo)建筑物
和分析建筑邊界
網(wǎng)格化的目的
- 區(qū)域分塊處理:
由于街景圖像為全景形式,圖像分辨率較高
且信息量大
。
將圖像分割為多個子區(qū)域
后,可以針對每個區(qū)域
單獨進行檢測和分析。 - 定位精確性:
網(wǎng)格劃分有助于快速定位建筑物
的具體位置,同時減少冗余計算
。
網(wǎng)格編號與處理流程
- 編號含義:
每個編號
對應(yīng)一個矩形子區(qū)域
,用于標(biāo)記建筑物所在的具體位置。 - 處理步驟:
- 輸入全景圖像:以
球面形式
展開街景數(shù)據(jù),形成水平和垂直視野完整的圖像。 - 劃分網(wǎng)格:將圖像
分割為16個相等
的矩形區(qū)域。 - 區(qū)域處理:針對
每個網(wǎng)格
運行建筑檢測算法
,如Mask R-CNN。 - 結(jié)果合并:將各個網(wǎng)格中的檢測結(jié)果
整合
,形成全局建筑物檢測結(jié)果
。
- 輸入全景圖像:以
街景爬蟲的實現(xiàn)流程
該圖是一個流程圖,詳細描述了利用百度地圖API
抓取街景全景圖像
的實現(xiàn)步驟,包括初始化請求、抓取圖像以及拼接存儲的全過程:
初始化與請求
- 流程:
根據(jù)觀察點的坐標(biāo)
和全景圖的水平及俯仰角度
初始化參數(shù)。
創(chuàng)建HTTP請求
,將所有請求放入隊列
中。 - 作用:
將街景爬取任務(wù)轉(zhuǎn)化為API調(diào)用
的可操作形式。
利用隊列機制
為后續(xù)批量處理打下基礎(chǔ)。
爬取圖像
- 流程:
判斷隊列是否為空
:
–如果為空
,則結(jié)束爬取任務(wù)。
–如果不為空
,取出一個HTTP請求。
利用百度地圖API發(fā)送請求并嘗試爬取圖像。
檢查圖像是否成功爬取
:
–如果成功
,刪除隊列中對應(yīng)的請求。
–如果失敗
,保留該請求以便重試。 - 作用:
通過循環(huán)機制確保每個請求都得到處理。
提高數(shù)據(jù)爬取的成功率,避免由于網(wǎng)絡(luò)問題
導(dǎo)致的任務(wù)丟失。
拼接與存儲
- 流程:
將成功爬取的子圖像按照全景圖的拼接規(guī)則
組合成完整的街景全景圖
。
將拼接完成的全景圖存儲至本地
或數(shù)據(jù)庫
中。 - 作用:
生成高質(zhì)量的全景圖,為后續(xù)建筑檢測和高度計算提供輸入數(shù)據(jù)
手動標(biāo)注建筑物輪廓
該圖展示了標(biāo)注建筑物輪廓
的過程,圖中不同建筑
被標(biāo)注為不同的顏色區(qū)域
,輪廓線明確地勾勒出每個建筑物的邊界
標(biāo)注工具:使用了一種支持全景圖像操作的標(biāo)注軟件(例如LabelMe)
標(biāo)注內(nèi)容的用途
- Mask R-CNN 模型訓(xùn)練:
– 標(biāo)注的圖像作為訓(xùn)練樣本
,用于指導(dǎo)模型
學(xué)習(xí)如何分割建筑物
。 - 提升檢測精度:
– 通過高質(zhì)量標(biāo)注
,提高模型對復(fù)雜背景下
建筑物邊界的識別能力
檢測到的建筑與實際建筑之間的映射關(guān)系
(a)部分:展示了建筑在實際地理空間
中的位置與觀察點的幾何關(guān)系
,基于球面坐標(biāo)系統(tǒng)描述
。
(b)部分:展示了檢測到的建筑在圖像坐標(biāo)系
中的表示以及從圖像像素坐標(biāo)
到地理位置
的映射過程。
(a) 地理空間中的建筑位置與觀察點關(guān)系
- 元素解釋:
黃色圓點
O ′ O' O′ : 觀察點的位置。
綠色菱形
:建筑的轉(zhuǎn)角點
。
紅色邊界線
:建筑物在當(dāng)前視角下
的可觀察部分。
ρ 1 , ρ 2 \rho_1,\rho_2 ρ1?,ρ2?:建筑與觀察點之間的距離范圍
。
D ( ρ ) D(\rho) D(ρ):建筑物邊界的測量距離。 - 幾何關(guān)系:建筑在地理空間中通過球面坐標(biāo)系統(tǒng)描述,其位置和輪廓與觀察點的位置密切相關(guān)。
(b) 圖像空間中的建筑表示
- 元素解釋:
W i m g W_{img} Wimg?和 H i m g H_{img} Himg?:圖像的寬度
和高度
(像素單位)
( x j , y j ) (x_j, y_j) (xj?,yj?):建筑頂點
在圖像中的像素坐標(biāo)
映射關(guān)系:將圖像中的像素點
( x j , y j ) (x_j, y_j) (xj?,yj?)轉(zhuǎn)換為地理空間坐標(biāo)
( ρ j , ? j ) (\rho_j,\phi_j) (ρj?,?j?)
ρ j = 2 π ? ( x j W i m g ? 1 2 ) φ j = π ? ( 1 2 ? y j H i m g ) \rho_j=2\pi\cdot\left(\frac{x_j}{W_\mathrm{img}}-\frac12\right)\text{}\\\varphi_j=\pi\cdot\left(\frac12-\frac{y_j}{H_\mathrm{img}}\right)\text{} ρj?=2π?(Wimg?xj???21?)φj?=π?(21??Himg?yj??)
此公式表示: 如何將街景圖像中的矩形坐標(biāo)(像素坐標(biāo))
映射到球面坐標(biāo)系下的方位角和仰角
- 圖像像素坐標(biāo)系:
橫坐標(biāo) x x x:圖像寬度方向(從左至右)
縱坐標(biāo) y y y:圖像高度方向(從上至下)
建筑檢測與預(yù)處理
(a) 檢測前的圖像
內(nèi)容:
– 使用Mask R-CNN
模型對街景圖像進行建筑檢測
,標(biāo)注了建筑的邊界框
(Bounding Box)。
– 檢測結(jié)果顯示在綠色框內(nèi)
的建筑區(qū)域,框外的背景區(qū)域未被標(biāo)注。
– 邊界框內(nèi)顯示了置信度(“blg: 100%”)
,表明模型對建筑檢測結(jié)果的高度信任
。
作用:
– 提供建筑的初步檢測結(jié)果,為后續(xù)的預(yù)處理奠定基礎(chǔ)。
(b) 預(yù)處理后的圖像
內(nèi)容:
– 經(jīng)過預(yù)處理,僅保留建筑的二值化掩碼
,建筑區(qū)域為白色
,其他背景區(qū)域為黑色。
– 去除了圖像中的背景信息
,確保輸入數(shù)據(jù)更為簡潔。
作用:
– 為高度計算
和邊界檢測
提供更干凈的數(shù)據(jù)
– 減少冗余信息對后續(xù)分析的干擾
邊界搜索
該圖展示了建筑頂部邊界點
的搜索
與確定
過程
(a) 預(yù)處理圖像
內(nèi)容:
– 預(yù)處理后的二值化圖像
,背景為黑色,建筑區(qū)域為白色
。
– 中間的綠色虛線
表示圖像的參考中心線
(通常是觀察點的視線)。
作用:
– 提供建筑的輪廓信息,作為邊界搜索的輸入。
(b) 搜索可能的觀察角度
內(nèi)容:
– 從不同的角度投射視線
,搜索建筑頂部
可能的邊界點
。
– 藍色錐形區(qū)域
表示視線范圍
。
– 黑色箭頭
指示視線的搜索方向
。
作用:
– 通過多視角分析,避免單一視角可能導(dǎo)致的邊界誤差。
(c ) 確定上邊界點
內(nèi)容:
– 根據(jù)視線和建筑輪廓的交點
,計算出建筑的頂部邊界
。
– 紫色直線表示最終確定的邊界點連接
。
作用:
– 精確定位建筑頂部,為高度計算
提供可靠的數(shù)據(jù)支持。
固定相機高度下建筑高度計算的測量模型
該圖展示了如何通過幾何關(guān)系推導(dǎo)建筑物高度的計算公式
觀測結(jié)構(gòu):
右側(cè)的相機
表示觀察點,固定安裝在某一高度 H c a m H_{cam} Hcam?。
藍色虛線
表示觀察點與建筑的視線
。
黃色虛線
表示建筑的中心軸線
,用于表示高度的測量路徑
符號說明1:
H ( ρ ) H(\rho) H(ρ):建筑物的總高度
。
H 1 ( ρ ) H_1(\rho) H1?(ρ):建筑頂部到相機
的高度。
H 2 ( ρ ) = H c a m H_2(\rho) = H_{cam} H2?(ρ)=Hcam?:建筑底部到相機
的高度,等于相機安裝的固定高度
。
關(guān)系:
建筑物總高度為頂部高度和底部相機高度之和:
H ( ρ ) = H 1 ( ρ ) + H 2 ( ρ ) H(\rho) = H_1(\rho) + H_2(\rho) H(ρ)=H1?(ρ)+H2?(ρ)
符號說明2:
D ( ρ ) D(\rho) D(ρ): 觀察點到建筑的水平距離
φ 1 \varphi_1 φ1?: 從觀察點到建筑頂部
的仰角
φ 2 \varphi_2 φ2?: 從觀察點到建筑底部
的仰角
關(guān)系:
根據(jù)三角函數(shù),頂部和底部的高度可以通過仰角和水平距離
計算
H 1 ( ρ ) = D ( ρ ) ? tan ? ( φ 1 ) H 2 ( ρ ) = D ( ρ ) ? tan ? ( φ 2 ) H_1(\rho)=D(\rho)\cdot\tan(\varphi_1)\\H_2(\rho)=D(\rho)\cdot\tan(\varphi_2) H1?(ρ)=D(ρ)?tan(φ1?)H2?(ρ)=D(ρ)?tan(φ2?)
計算建筑高度與實際測量建筑高度之間的對比
第一列:建筑編號(Building no.),標(biāo)記19棟建筑
的序號
第二列:通過提出的方法計算出的建筑高度
H a H^a Ha(單位:米)
第三列:實際測量的建筑高度
H m H^m Hm(單位:米)
第四列:計算高度與測量高度之間的絕對誤差(Error)
,單位為米。
表格底部 顯示了整體的平均相對誤差(Mean relative error)
,為4.43%。
較大誤差現(xiàn)象:
– 編號9的誤差為2.35米,這是表格中最大的誤差
。
– 表明在部分較高
或復(fù)雜建筑
的高度計算中仍存在改進空間
盡管建筑高度和結(jié)構(gòu)復(fù)雜性不同,該方法在所有19棟建筑上均表現(xiàn)出較好的精度
北京科技大學(xué)西校區(qū)建筑高度分布的三維可視化結(jié)果
該圖展示了校園內(nèi)所有建筑的三維結(jié)構(gòu)
及其對應(yīng)的高度分類
。
建筑的高度被劃分為三個范圍,并以不同顏色表示:
– 黃色:高度小于15米。
– 綠色:高度在15米至30米之間。
– 藍色:高度大于30米。
藍色圓點 標(biāo)記了街景數(shù)據(jù)的觀察點分布
新北川鎮(zhèn)的建筑高度計算結(jié)果
該圖展示了新北川鎮(zhèn)
的建筑高度
計算結(jié)果,以三維形式
顯示了不同建筑的高度分布情況
高度低于5米 的建筑:灰色。
高度在5米到24米之間 的建筑:綠色。
高度在24米到50米之間 的建筑:黃色。
高度高于50米 的建筑:紅色。
通過真實場景的三維可視化,驗證了文章提出的方法在建筑高度計算中
的適用性和精確性