河北漢佳 做網(wǎng)站的公司百度地圖網(wǎng)頁版
申請?zhí)?/td> | CN202311568976.4 |
公開號(公開) | CN117576413A |
申請日 | 2023.11.22 |
申請人(公開) | 超音速人工智能科技股份有限公司 |
發(fā)明人(公開) | 張俊峰(總); 楊培文(總); 沈俊羽; 張小村 |
我的理解
步驟一:獲取涂布邊緣圖像并提取對應的關(guān)鍵點特征;
步驟二:采用卷積以及全連接操作對所述關(guān)鍵點特征進行分析,通過分類頭確定關(guān)鍵點的縱坐標、橫坐標以及可見性;
步驟三:構(gòu)建全連接網(wǎng)絡分類模型并訓練至損失函數(shù)收斂,將所述關(guān)鍵點的縱坐標、橫坐標以及可見性輸入到所述全連接網(wǎng)絡分類模型,提取出虛邊、融合邊和實邊在涂布邊緣圖像邊緣處的關(guān)鍵點坐標;
步驟四:將涂布邊緣圖像的關(guān)鍵點的縱坐標、橫坐標以及可見性并輸入到完成訓練的全連接網(wǎng)絡分類模型進行檢測并獲取虛邊、融合邊和實邊在涂布邊緣圖像邊緣處的關(guān)鍵點坐標,根據(jù)關(guān)鍵點坐標確定虛邊、融合邊和實邊的位置。
2.根據(jù)權(quán)利要求1所述的基于全連接網(wǎng)絡分類模型的AI涂布抓邊處理方法,其特征在于,所述獲取涂布邊緣圖像并提取對應的關(guān)鍵點特征,包含以下步驟:
獲取涂布原始圖像并進行預處理將圖片轉(zhuǎn)換為統(tǒng)一的格式,所述預處理包括以下一種或多種方式:縮放、裁剪、灰度增強、對比度增強;
通過邊緣提取算法確定預處理后的涂布原始圖像的第一邊緣位置,以第一邊緣位置為中心對涂布原始圖像進行裁剪,生成涂布邊緣圖像;
對所述涂布邊緣圖像進行數(shù)據(jù)標注,使用帶有預訓練模型的特征提取網(wǎng)絡提取所述涂布邊緣圖像的關(guān)鍵點特征。
步驟四.根據(jù)權(quán)利要求1所述的基于全連接網(wǎng)絡分類模型的AI涂布抓邊處理方法,其特征在于,所述采用卷積以及全連接操作對所述關(guān)鍵點特征進行分析,通過分類頭確定關(guān)鍵點的縱坐標、橫坐標以及可見性,包括:
所述分類頭包含縱坐標分類頭、橫坐標分類頭以及可見性分類頭;
通過縱坐標分類頭確定關(guān)鍵點的縱坐標,通過橫坐標分類頭確定關(guān)鍵點的橫坐標,通過可見性分類頭確定關(guān)鍵點的可見性。
步驟五.根據(jù)權(quán)利要求3所述的基于全連接網(wǎng)絡分類模型的AI涂布抓邊處理方法,其特征在于,所述采用卷積以及全連接操作對所述關(guān)鍵點特征進行分析,通過分類頭確定關(guān)鍵點的縱坐標、橫坐標以及可見性,還包含:
縱坐標分類頭通過一維卷積以及全連接操作將圖像特征變換成N個一維向量,表示關(guān)鍵點的縱坐標;
橫坐標分類頭通過一維卷積以及全連接操作將圖像特征變換成N個一維向量,表示關(guān)鍵點的橫坐標;
可見性分類頭通過二維卷積以及全連接操作將圖像特征變換成一個長度為N的一維向量,表示關(guān)鍵點的可見性。
步驟六.根據(jù)權(quán)利要求4所述的基于全連接網(wǎng)絡分類模型的AI涂布抓邊處理方法,其特征在于,所述通過縱坐標分類頭確定關(guān)鍵點的縱坐標,通過橫坐標分類頭確定關(guān)鍵點的橫坐標,通過可見性分類頭確定關(guān)鍵點的可見性,還包含:
縱坐標分類頭首先對提取的關(guān)鍵點特征通過二維卷積和ReLU激活函數(shù)壓縮特征;將壓縮特征的橫坐標方向特征進行展平,進行全連接操作及ReLU激活函數(shù),將其特征維度轉(zhuǎn)變?yōu)橥坎歼吘増D像高度的ɑ倍;進行尺度不變的橫坐標方向一維卷積操作,得到關(guān)鍵點的縱坐標分類頭輸出結(jié)果;
橫坐標分類頭首先對提取的關(guān)鍵點特征通過二維卷積和ReLU激活函數(shù)壓縮特征;接下來將壓縮特征的縱坐標方向特征進行展平,進行全連接操作及ReLU激活函數(shù),將其特征維度轉(zhuǎn)變?yōu)樵瓐D像寬度的ɑ倍;最后,進行尺度不變的縱坐標方向一維卷積操作,得到關(guān)鍵點的橫坐標分類頭輸出結(jié)果;
可見性分類頭首先對提取的關(guān)鍵點特征經(jīng)過兩次二維卷積將特征長寬進行壓縮,再將其進行全局池化、展平、以及全連接操作后得到關(guān)鍵點的可見性分類頭輸出結(jié)果。
步驟七.根據(jù)權(quán)利要求1所述的基于全連接網(wǎng)絡分類模型的AI涂布抓邊處理方法,其特征在于,所述獲取涂布邊緣圖像并提取對應的關(guān)鍵點特征,包含:
獲取涂布邊緣圖像,在圖像邊緣逐漸向外填充特定顏色的像素,每一圈像素的顏色均相同,并保持相鄰圈層之間的色度差和飽和度差設定在特定范圍內(nèi);
將圖像標注數(shù)據(jù)中位于圖像邊緣的關(guān)鍵點標簽移至填充的像素區(qū)域最外圈。
步驟八.根據(jù)權(quán)利要求6所述的基于全連接網(wǎng)絡分類模型的AI涂布抓邊處理方法,其特征在于,包含:
所述全連接網(wǎng)絡分類模型進行推理時需要根據(jù)不同關(guān)鍵點類型將預測的關(guān)鍵點移至圖像邊緣處;
所述全連接網(wǎng)絡分類模型提取的關(guān)鍵點包括虛邊、實邊、融合邊在圖像邊緣位置的兩個關(guān)鍵點坐標,根據(jù)兩點確定一條直線的原理確定虛邊、融合邊和實邊的位置。
步驟九.一種基于全連接網(wǎng)絡分類模型的AI涂布抓邊處理系統(tǒng),包括:
處理模塊,用于獲取涂布邊緣圖像并提取對應的關(guān)鍵點特征;
分析模塊,采用卷積以及全連接操作對所述關(guān)鍵點特征進行分析,通過分類頭確定關(guān)鍵點的縱坐標、橫坐標以及可見性;
訓練模塊,構(gòu)建全連接網(wǎng)絡分類模型并訓練至損失函數(shù)收斂,將所述關(guān)鍵點的縱坐標、橫坐標以及可見性輸入到所述全連接網(wǎng)絡分類模型,提取出虛邊、融合邊和實邊在涂布邊緣圖像邊緣處的關(guān)鍵點坐標;
檢測模塊,將涂布邊緣圖像的關(guān)鍵點的縱坐標、橫坐標以及可見性并輸入到完成訓練的全連接網(wǎng)絡分類模型進行檢測并獲取虛邊、融合邊和實邊在涂布邊緣圖像邊緣處的關(guān)鍵點坐標,根據(jù)關(guān)鍵點坐標確定虛邊、融合邊和實邊的位置。
步驟十.一種計算機設備,其特征在于,包括處理器和存儲器,所述存儲器用于存儲可執(zhí)行的指令,所述指令用于控制所述處理器執(zhí)行根據(jù)權(quán)利要求1至7中任一項所述的方法。
步驟十二.一種計算機可讀存儲介質(zhì),其特征在于,其上存儲有計算機程序,所述計算機程序在被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至7中任一項所述的方法。
如果有不明白的,請加文末QQ群。
擴展閱讀
視頻課程
先學簡單的課程,請移步CSDN學院,聽白銀講師(也就是鄙人)的講解。
https://edu.csdn.net/course/detail/38771
如何你想快速形成戰(zhàn)斗了,為老板分憂,請學習C#入職培訓、C++入職培訓等課程
https://edu.csdn.net/lecturer/6176
相關(guān)推薦
我想對大家說的話 |
---|
《喜缺全書算法冊》以原理、正確性證明、總結(jié)為主。 |
按類別查閱鄙人的算法文章,請點擊《算法與數(shù)據(jù)匯總》。 |
有效學習:明確的目標 及時的反饋 拉伸區(qū)(難度合適) 專注 |
聞缺陷則喜(喜缺)是一個美好的愿望,早發(fā)現(xiàn)問題,早修改問題,給老板節(jié)約錢。 |
子墨子言之:事無終始,無務多業(yè)。也就是我們常說的專業(yè)的人做專業(yè)的事。 |
如果程序是一條龍,那算法就是他的是睛 |
測試環(huán)境
操作系統(tǒng):win7 開發(fā)環(huán)境: VS2019 C++17
或者 操作系統(tǒng):win10 開發(fā)環(huán)境: VS2022 C++17
如無特殊說明,本算法用**C++**實現(xiàn)。