簡(jiǎn)單的招聘網(wǎng)站怎么做電商網(wǎng)站設(shè)計(jì)
文獻(xiàn)閱讀筆記 | ||
簡(jiǎn)介 | 題目 | Fast R-CNN |
作者 | Ross Girshick | |
原文鏈接 | https://arxiv.org/pdf/1504.08083.pdf 目標(biāo)檢測(cè)系列——開山之作RCNN原理詳解-CSDN博客 Fast R-CNN講解_fast rcnn-CSDN博客 Rcnn、FastRcnn、FasterRcnn理論合集_rcnn fastrcnn fasterrcnn_沫念·的博客-CSDN博客 | |
關(guān)鍵詞 | NUll | |
研究問題 | 目標(biāo)檢測(cè)任務(wù)背景:首先確定大量候選對(duì)象位置;其次對(duì)候選對(duì)象細(xì)化以確定目標(biāo)位置。這些問題的解決往往折中了速度、精度或者簡(jiǎn)單性。 之前的方法: RCNN提取2000個(gè)候選框冗余工作太多。 SPP算法也有缺點(diǎn):僅使用log損失函數(shù)微調(diào)無法更新空間金字塔池化前的卷積層,限制了非常深的網(wǎng)絡(luò)的準(zhǔn)確性。 | |
研究方法 | Fast R - CNN:用全連接層分類。 ROI pooling:感興趣區(qū)域池化。使用最大池化將任何有效感興趣區(qū)域內(nèi)的特征轉(zhuǎn)換為具有固定空間范圍H × W (例如, 7 × 7)的小特征映射,其中H和W是獨(dú)立于任何特定RoI的層超參數(shù)。每個(gè)RoI由一個(gè)四元組特征(r,c,h,w)定義,該(r,c,h,w)指定其左上角(r,c)及其高度和寬度(h,w)。是SSp的特例,其中只有一個(gè)金字塔層。 從預(yù)訓(xùn)練的網(wǎng)絡(luò)中初始化:將最后一個(gè)最大池化層替換為RoI池化層,通過設(shè)置H和W與網(wǎng)絡(luò)的第一個(gè)全連接層(例如,對(duì)于VGG16 , H = W = 7)兼容來配置RoI池化層。其次,將網(wǎng)絡(luò)的最后一個(gè)全連接層和softmax (分別訓(xùn)練用于1000 - way ImageNet分類)替換為前面描述的兩個(gè)兄弟層( K + 1個(gè)類別上的全連接層和softmax以及類別特定的邊界框回歸)。第三,修改網(wǎng)絡(luò)以獲取兩個(gè)數(shù)據(jù)輸入:圖像列表和這些圖像中的RoIs列表。 Multi-task loss. Mini-batch sampling. | |
研究結(jié)論 | 1.比R - CNN、SPPnet擁有更高的檢測(cè)質(zhì)量 2.訓(xùn)練是單階段的,使用多任務(wù)損失3.訓(xùn)練可以更新所有的網(wǎng)絡(luò)層4.特征緩存不需要磁盤存儲(chǔ) | |
創(chuàng)新不足 | 候選區(qū)域的選擇仍然不是很高效 | |
額外知識(shí) | RCNN網(wǎng)絡(luò) |