dota2max網(wǎng)站怎么做壁紙西安百度公司官網(wǎng)
目錄
- 一、卷積神經(jīng)網(wǎng)絡(luò)概述:
- 1.卷積層:
- 1.1卷積核與神經(jīng)元:
- 1.2卷積層作用:
- 1.3多輸出通道概念:
- 2.池化層:
- 2.1池化層作用:
- 3.隱藏層與卷積層、池化層關(guān)系:
一、卷積神經(jīng)網(wǎng)絡(luò)概述:
- 傳統(tǒng)的多層感知機(jī)每個神經(jīng)元都與上一層的所有神經(jīng)元相連接,因此擁有大量超參數(shù)。而卷積神經(jīng)網(wǎng)絡(luò)(CNN)引入了卷積層和池化層的結(jié)構(gòu),幫助減少了參數(shù)數(shù)量,提高了網(wǎng)絡(luò)的擬合能力和泛化能力。
- CNN是為了更好地處理高維數(shù)據(jù)、保留空間結(jié)構(gòu)信息并減少參數(shù)數(shù)量而設(shè)計的。
1.卷積層:
1.1卷積核與神經(jīng)元:
-
一個卷積核可以被看作是一個神經(jīng)元的參數(shù),而該神經(jīng)元通過其卷積核來進(jìn)行卷積操作以提取特征,并將這些特征作為該神經(jīng)元的輸出。這個輸出特征圖隨后可以作為下一層卷積層或全連接層的輸入。
-
同時每個神經(jīng)元的卷積核作為參數(shù)通過反向傳播進(jìn)行更新。
-
單輸入輸出通道下,對于二分圖像數(shù)據(jù),卷積核通常是二維;對于三維視頻數(shù)據(jù),卷積核通常是三維的。
-
二維卷積核的卷積如下:
這是一個神經(jīng)元的卷積核執(zhí)行的卷積操作。
最后三個神經(jīng)元的輸出特征圖組合成該層隱藏層的輸出(單輸入通道多輸出通道):
-
1.2卷積層作用:
- 特征提取:卷積操作可以提取輸入數(shù)據(jù)的特征,通過濾波器 (卷積核)對輸入數(shù)據(jù)進(jìn)行卷積操作,從而捕捉到圖像或其他數(shù)據(jù)中的局部特征。
- 參數(shù)共享:每個卷積核在整個輸入數(shù)據(jù)的不同位置進(jìn)行卷積操作時使用的是相同的權(quán)重,這種參數(shù)共享的方式有助于減少參數(shù)數(shù)量,提高模型的泛化能力。
- 保留空間結(jié)構(gòu)信息:卷積操作通過卷積核在輸入數(shù)據(jù)上按位置進(jìn)行卷積,并且輸出也是按位置對應(yīng)的,這樣可以保持輸入數(shù)據(jù)的空間結(jié)構(gòu),有助于捕捉數(shù)據(jù)中的空間關(guān)系。
1.3多輸出通道概念:
一個神經(jīng)元對應(yīng)一個卷積核,同一隱藏層的多個神經(jīng)元會使用各自的卷積核對輸入數(shù)據(jù)進(jìn)行特征提取,從而得到不同的輸出特征圖。每個特征圖對應(yīng)一個通道,多個神經(jīng)元提取的各自不同的特征圖構(gòu)成了多通道。
如上圖所示,該隱藏層為三通道輸出,即使用三個神經(jīng)元從三個方面提取到了數(shù)據(jù)的特征。每一個隱藏層輸出的通道數(shù)等于該隱藏層中卷積核的個數(shù)。
特別的,對于輸入數(shù)據(jù)的通道數(shù),例如圖片數(shù)據(jù),若輸入通道數(shù)為3,則三通道分別表示該張圖片賬本的R、G、B三個方向的像素。
2.池化層:
2.1池化層作用:
- 降維和減少參數(shù):池化操作通過對輸入數(shù)據(jù)進(jìn)行采樣和匯聚,有效減少特征圖的大小,減少計算量和參數(shù)數(shù)量,有助于防止過擬合。
- 平移不變性:池化操作可以使特征對位置的變化更加穩(wěn)定,即使輸入數(shù)據(jù)發(fā)生平移,模型也能夠提取到相同的特征或者對象。這使得模型對于位置的微小變化更加魯棒,提高模型的泛化能力。(舉例來說,假設(shè)我們有一張狗的圖片,當(dāng)在這張圖片左上角提取到一只狗,那么不管狗的位置上下左右如何變化,依然能夠提取到這只狗。)
- 增強(qiáng)特征(Feature Map):通過池化操作,可以更加突出重要的特征,保留主要的特征信息(最大池化中,將每個區(qū)域內(nèi)的最大值作為輸出),有助于提高模型對于關(guān)鍵特征的識別能力。
3.隱藏層與卷積層、池化層關(guān)系:
隱藏層是指除輸入層和輸出層以外的所有層,用來進(jìn)行中間數(shù)據(jù)的處理和特征的抽取。因此:一個卷積層就是一個隱藏層,一個池化層也是一個隱藏層。
其中,卷積層的參數(shù)為卷積核和偏置項,池化層不包含可學(xué)習(xí)的參數(shù),在最大池化中,它在每個池化窗口內(nèi)選擇最大值作為輸出;而在平均池化中,它在每個池化窗口內(nèi)計算平均值作為輸出。