企業(yè)網(wǎng)站網(wǎng)絡(luò)推廣百度安裝免費下載
為了提升無人機(jī)視角下目標(biāo)檢測效果,基于YOLOv5算法,在YOLOv5主干中實現(xiàn)了Omnidimensional Convolution(ODConv),以在不增加網(wǎng)絡(luò)寬度和深度的情況下提高精度,還在YOLOv5骨干網(wǎng)中用ConvNeXt塊替換了原始的C3塊,以加快檢測速度。
1 Omni-dimensional dynamic convolution
YOLOv5使用傳統(tǒng)的二維卷積來生成特征。圖1(a)顯示了二維卷積如何在具有四個濾波器的卷積層中工作。卷積層的輸出通道數(shù)等于濾波器數(shù),每個濾波器的維數(shù)取決于輸入特征的維數(shù)。傳統(tǒng)的二維卷積可以描述為:???????????? (??) = ?? ? ??,其中?? 表示輸入特征?? 表示卷積層;*表示卷積運算。很明顯,每個濾波器的卷積核不會隨著不同的輸入而改變。因此,為了獲得更多的特征,通常需要增加濾波器的數(shù)量,這效率較低。為了解決這個問題,在我們的網(wǎng)絡(luò)中利用了動態(tài)卷積,它可以提高輕量級CNN的準(zhǔn)確性,同時保持高效的推理。
Omni-dimensional Dynamic Convolution(ODConv