當(dāng)前位置：首頁(yè) > news >正文

網(wǎng)站沒有問題但是一直做不上首頁(yè)seo托管

news 2025/7/7 6:34:08

網(wǎng)站沒有問題但是一直做不上首頁(yè),seo托管,寧波seo哪家好快速推廣,羽毛球賽事安排目錄寫在開頭一、CNN的原理 1. 概述 2. 卷積層內(nèi)參數(shù)（卷積核本身） 外參數(shù)（填充和步幅） 輸入與輸出的尺寸關(guān)系 3. 多通道問題多通道輸入多通道輸出 4. 池化層平均匯聚最大值匯聚二、手寫數(shù)字識(shí)別 1. 任務(wù)…

寫在開頭

一、CNN的原理

1. 概述

2. 卷積層

內(nèi)參數(shù)（卷積核本身）

外參數(shù)（填充和步幅）

輸入與輸出的尺寸關(guān)系?

3. 多通道問題?

多通道輸入

多通道輸出

4. 池化層

平均匯聚

最大值匯聚

二、手寫數(shù)字識(shí)別

1. 任務(wù)描述和數(shù)據(jù)集加載

2. 網(wǎng)絡(luò)結(jié)構(gòu)（LeNet-5）

3. 模型訓(xùn)練

4. 模型測(cè)試

5. 直觀顯示預(yù)測(cè)結(jié)果

寫在最后

寫在開頭

? ? 本文將將介紹如何使用PyTorch框架搭建卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型。簡(jiǎn)易介紹卷積神經(jīng)網(wǎng)絡(luò)的原理，并實(shí)現(xiàn)模型的搭建、數(shù)據(jù)集加載、模型訓(xùn)練、測(cè)試、網(wǎng)絡(luò)的保存等。實(shí)現(xiàn)機(jī)器學(xué)習(xí)領(lǐng)域的Hello world——手寫數(shù)字識(shí)別。本文的講解參考了B站兩位up主：爆肝杰哥、炮哥帶你學(xué)。有關(guān)Pytorch環(huán)境配置和CNN具體原理大家可以自行查閱資料，本文多數(shù)圖片也來自于爆肝杰哥的講解。這里也放上兩位up主的視頻鏈接：

從0開始擼代碼--手把手教你搭建LeNet-5網(wǎng)絡(luò)模型_嗶哩嗶哩_bilibili

?Python深度學(xué)習(xí)：安裝Anaconda、PyTorch（GPU版）庫(kù)與PyCharm_嗶哩嗶哩_bilibili

? ? 本文使用的PyTorch為1.12.0版本，Numpy為1.21版本，相近的版本語(yǔ)法差異很小。有關(guān)數(shù)組的數(shù)據(jù)結(jié)構(gòu)教程、神經(jīng)網(wǎng)絡(luò)的基本原理（前向傳播/反向傳播）、神經(jīng)網(wǎng)絡(luò)作為“函數(shù)模擬器”直觀感受、深度神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)DNN詳見本專欄的前三篇文章，鏈接如下：?

【深度學(xué)習(xí)基礎(chǔ)】NumPy數(shù)組庫(kù)的使用-CSDN博客

【深度學(xué)習(xí)基礎(chǔ)】用PyTorch從零開始搭建DNN深度神經(jīng)網(wǎng)絡(luò)_如何搭建一個(gè)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)dnn pytorch-CSDN博客

【深度學(xué)習(xí)基礎(chǔ)】使用Pytorch搭建DNN深度神經(jīng)網(wǎng)絡(luò)與手寫數(shù)字識(shí)別_dnn網(wǎng)絡(luò)模型代碼-CSDN博客

? ? 基于深度神經(jīng)網(wǎng)絡(luò)DNN實(shí)現(xiàn)的手寫數(shù)字識(shí)別，將灰度圖像轉(zhuǎn)換后的二維數(shù)組展平到一維，將一維的784個(gè)特征作為模型輸入。在“展平”的過程中必然會(huì)失去一些圖像的形狀結(jié)構(gòu)特征，因此基于DNN的實(shí)現(xiàn)方式并不能很好的利用圖像的二維結(jié)構(gòu)特征，而卷積神經(jīng)網(wǎng)絡(luò)CNN對(duì)于處理圖像的位置信息具有一定的優(yōu)勢(shì)。因此卷積神經(jīng)網(wǎng)絡(luò)經(jīng)常被用于圖像識(shí)別/處理領(lǐng)域。下面我們將對(duì)CNN進(jìn)行具體介紹。

一、CNN的原理

1. 概述

? ? 在上一篇博客介紹的深度神經(jīng)網(wǎng)絡(luò)DNN中，網(wǎng)絡(luò)的每一層神經(jīng)元相互直接都有鏈接，每一層都是全連接層，我們的目標(biāo)就是訓(xùn)練這個(gè)全連接層的權(quán)重w和偏執(zhí)b，最終得到預(yù)測(cè)效果良好的網(wǎng)絡(luò)結(jié)構(gòu)。

? ? DNN的全連接層對(duì)應(yīng)于CNN中的卷積層，而池化層（匯聚）其實(shí)與激活函數(shù)的作用類似。CNN中完整的卷積層的結(jié)構(gòu)是：卷積-激活函數(shù)-池化（匯聚），其中池化層也有時(shí)可以省略。一個(gè)卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如下：

? ? 如上圖所示，CNN的優(yōu)勢(shì)在于可以處理多為輸入數(shù)據(jù)，并同樣以多維數(shù)據(jù)的形式輸出至下一層，保留了更多的空間信息特征。而DNN卻只能將多維數(shù)據(jù)展平成一維數(shù)據(jù)，必然會(huì)損失一些空間特征。

2. 卷積層

內(nèi)參數(shù)（卷積核本身）

? ? CNN中的卷積層和DNN中的全連接層是平級(jí)關(guān)系，在DNN中，我們訓(xùn)練的內(nèi)參數(shù)是全連接層的權(quán)重w和偏置b，CNN也類似，CNN訓(xùn)練的是卷積核，也就相當(dāng)于包含了權(quán)重和偏置兩個(gè)內(nèi)部參數(shù)。下面我們首先描述什么是卷積運(yùn)算。當(dāng)輸入數(shù)據(jù)進(jìn)入卷積層后，輸入數(shù)據(jù)會(huì)與卷積核進(jìn)行卷積運(yùn)算，運(yùn)算方法如下圖所示：

? ? ?輸入一個(gè)多維數(shù)據(jù)（上圖為二維），與卷積核進(jìn)行運(yùn)算，即輸入中與卷積核形狀相同的部分，分別與卷積核進(jìn)行逐個(gè)元素相乘再相加。例如計(jì)算結(jié)果中坐上角的15是根據(jù)如下過程計(jì)算得到的：

逐個(gè)元素相乘再相加，即：

1 * 2 + 2 * 0 + 3* 1 + 0 * 0 + 1 * 1 + 2 * 2 + 3 * 1 + 0 * 0 + 1 * 2 = 15?

? ? ?卷積核本身相當(dāng)于權(quán)重，再卷積運(yùn)算的過程中也可以存在偏置，如下：

? ? 卷積核（即CNN的權(quán)重和偏置）本身為內(nèi)參數(shù)，（具體里面的數(shù)字）是我們通過訓(xùn)練得出的，我們寫代碼的時(shí)候只要關(guān)注一些外部設(shè)定的參數(shù)即可。下面我們將介紹一些外參數(shù)。

外參數(shù)（填充和步幅）

? ?填充（padding）

? ?顯然，只要卷積核的大小＞1*1，必然會(huì)導(dǎo)致圖像越卷越小，為了防止輸入經(jīng)過多個(gè)卷積層后變得過小，可以在發(fā)生卷積層之前，先向輸入圖像的外圍填入固定的數(shù)據(jù)（比如0），這個(gè)步驟稱之為填充，如下圖：

? ? ?在我們使用Pytorch搭建卷積層的時(shí)候，需要在對(duì)應(yīng)的接口中添加這個(gè)padding參數(shù)，向上圖中這種情況，相當(dāng)于在3*3的卷積核外圍添加了“一圈”，則padding = 1，卷積層的接口中就要這樣寫：

nn.Conv2d(in_channels=1, out_channels=6, kernel_size=3, paddding=1)

? ? ??參數(shù)in_channels和out_channels是對(duì)應(yīng)于這個(gè)卷積層輸入和輸出的通道數(shù)參數(shù)，這里我們先放一放。

? ?步幅（stride）

? ?步幅指的是使用卷積核的位置間隔，即輸入中參與運(yùn)算的那個(gè)范圍每次移動(dòng)的距離。前面幾個(gè)示意圖中的步幅均為1，即每次移動(dòng)一格，如果設(shè)置stride=2，kernel_size=2，則效果如下：

? ? ?此時(shí)需要在卷積層接口中添加參數(shù)stride=2。

輸入與輸出的尺寸關(guān)系?

? ?綜上所述，結(jié)合外參數(shù)（步幅、填充）和內(nèi)參數(shù)（卷積核），可以看出如下規(guī)律：

卷積核越大，輸出越小。

步幅越大，輸出越小。

填充越大，輸出越大。

? ? ?用公式表示定量關(guān)系：

? ? ? 如果輸入和卷積核均為方陣，設(shè)輸入尺寸為W*W，輸出尺寸為N*N，卷積核尺寸為F*F，填充的圈數(shù)為P，步幅為S，則有關(guān)系：

$N = \frac{W+2P-F}{S} + 1$

? ? 這個(gè)關(guān)系大家要重點(diǎn)掌握，也可以自己推導(dǎo)一下，并不復(fù)雜。如果輸入和卷積核不為方陣，設(shè)輸入尺寸是H*W，輸出尺寸是OH*OW，卷積核尺寸為FH*FW，填充為P，步幅為S，則輸出尺寸OH*OW的計(jì)算公式是：

$OH = \frac{H+2P-FH}{S} + 1$

$OW = \frac{W+2P-FW}{S} + 1$ ?

3. 多通道問題?

多通道輸入

? ? 對(duì)于手寫數(shù)字識(shí)別這種灰度圖像，可以視為僅有（高*長(zhǎng)）二維的輸入。然而，對(duì)于彩色圖像，每一個(gè)像素點(diǎn)都相當(dāng)于是RGB的三個(gè)值的組合，因此對(duì)于彩色的圖像輸入，除了高*長(zhǎng)兩個(gè)維度外，還有第三個(gè)維度——通道，即紅、綠、藍(lán)三個(gè)通道，也可以視為3個(gè)單通道的二維圖像的混合疊加。

當(dāng)輸入數(shù)據(jù)僅為二維時(shí)，卷積層的權(quán)重往往被稱作卷積核（Kernel）;

當(dāng)輸入數(shù)據(jù)為三維或更高時(shí)，卷積層的權(quán)重往往被稱作濾波器（Filter）。

? ? ?對(duì)于多通道輸入，輸入數(shù)據(jù)和濾波器的通道數(shù)必須保持一致。這樣會(huì)導(dǎo)致輸出結(jié)果降維成二維，如下圖：

? ? ?對(duì)形狀進(jìn)行一下抽象，則輸入數(shù)據(jù)C*H*W和濾波器C*FH*FW都是長(zhǎng)方體，結(jié)果是一個(gè)長(zhǎng)方形1*OH*OW，注意C,H,W是固定的順序，通道數(shù)要寫在最前。

多通道輸出

?? ?如果要實(shí)現(xiàn)多通道輸出，那么就需要多個(gè)濾波器，讓三維輸入與多個(gè)濾波器進(jìn)行卷積，就可以實(shí)現(xiàn)多通道輸出，輸出的通道數(shù)FN就是濾波器的個(gè)數(shù)FN，如下圖：

? ? 和單通道一樣，卷積運(yùn)算后也有偏置，如果進(jìn)一步追加偏置，則結(jié)果如下：每個(gè)通道都有一個(gè)單獨(dú)的偏置。?

4. 池化層

? ?池化，也叫匯聚（Pooling）。池化層通常位于卷積層之后（有時(shí)也可以不設(shè)置池化層），其作用僅僅是在一定范圍內(nèi)提取特征值，所以并不存在要學(xué)習(xí)的內(nèi)部參數(shù)。池化僅僅對(duì)圖像的高H和寬W進(jìn)行特征提取，并不改變通道數(shù)C。

平均匯聚

一般有平均匯聚和最大值匯聚兩種。平均匯聚如下：

? ? 如上圖，池化的窗口大小為2*2，對(duì)應(yīng)的步幅為2，因此對(duì)于上圖這種情況，對(duì)應(yīng)的Pytorch接口如下：

nn.AvgPool2d(kernel_size=2, stride=2)?

最大值匯聚

? ?同理，如果使用最大值匯聚，如下圖所示：

? ? 此處Pytorch函數(shù)就這么寫：

nn.MaxPool2d(kernel_size=2, stride=2)?

二、手寫數(shù)字識(shí)別

1. 任務(wù)描述和數(shù)據(jù)集加載

? ? 此處和上一篇博客類似，詳情見：

【深度學(xué)習(xí)基礎(chǔ)】使用Pytorch搭建DNN深度神經(jīng)網(wǎng)絡(luò)與手寫數(shù)字識(shí)別_dnn網(wǎng)絡(luò)模型代碼-CSDN博客

? ? ?接下來我們實(shí)現(xiàn)機(jī)器學(xué)習(xí)領(lǐng)域的Hello World——手寫數(shù)字識(shí)別。使用的數(shù)據(jù)集MNIST是機(jī)器學(xué)習(xí)領(lǐng)域的標(biāo)準(zhǔn)數(shù)據(jù)集，其中的每一個(gè)樣本都是一副二維的灰度圖像，尺寸為28*28：

? ?輸入就相當(dāng)于一個(gè)單通道的圖像，是二維的。我們?cè)趯?shí)現(xiàn)的時(shí)候，要將每個(gè)樣本圖像轉(zhuǎn)換為28*28的張量，作為輸入，此處和上一篇DNN都一致。數(shù)據(jù)集則通過包torchvision中的datasets庫(kù)進(jìn)行下載。這里我快速給一段代碼好了，詳情可見上一篇博客。

import torch
from torchvision import datasets, transforms# 設(shè)定下載參數(shù) （數(shù)據(jù)集轉(zhuǎn)換參數(shù)）,將圖像轉(zhuǎn)換為張量
data_transform = transforms.Compose([transforms.ToTensor()
])# 加載訓(xùn)練數(shù)據(jù)集
train_dataset = datasets.MNIST(root='D:\\Jupyter\\dataset\\minst',  # 下載路徑，讀者請(qǐng)自行設(shè)置train=True,   # 是訓(xùn)練集download=True,   # 如果該路徑?jīng)]有該數(shù)據(jù)集，則進(jìn)行下載transform=data_transform   # 數(shù)據(jù)集轉(zhuǎn)換參數(shù)
)# 批次加載器,在接下來的訓(xùn)練中進(jìn)行小批次（16批次）的載入數(shù)據(jù)，有助于提高準(zhǔn)確度，對(duì)訓(xùn)練集的樣本進(jìn)行打亂，
train_dataloader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=16, shuffle=True)# 加載測(cè)試數(shù)據(jù)集
test_dataset = datasets.MNIST(root='D:\\Jupyter\\dataset\\minst',  # 下載路徑train=False,   # 是訓(xùn)練集download=True,   # 如果該路徑?jīng)]有該數(shù)據(jù)集，則進(jìn)行下載transform=data_transform   # 數(shù)據(jù)集轉(zhuǎn)換參數(shù)
)test_dataloader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=16, shuffle=True)

2. 網(wǎng)絡(luò)結(jié)構(gòu)（LeNet-5）

? ?本文搭建的LeNet-5起源于1998年，在手寫數(shù)字識(shí)別上非常成功。其結(jié)構(gòu)如下：

再列一個(gè)表格，具體結(jié)構(gòu)如下：

? ? ?注:輸出層的激活函數(shù)目前已經(jīng)被Softmax取代。

? ? ?至于這些尺寸關(guān)系，我舉個(gè)兩例子吧：

? ?以第一層C1的輸入和輸出為例。輸入尺寸W是28*28，卷積核F尺寸為5*5，步幅S為1，填充P為2，那么輸出N的28*28怎么來的呢？按照公式如下：

$N = \frac{W + 2P - F}{S} + 1= \frac{28 + 2*2 - 5}{1} + 1 = 28$

? ?我們也可以觀察到第一層的卷積核個(gè)數(shù)為6，則輸出的通道數(shù)也為6。

? 再看一下第一個(gè)池化層S2，輸入尺寸是28*28，卷積核F大小為2*2（此處的“卷積核”實(shí)際上指的是采樣范圍），步幅S=2，填充P為0，則輸出的14*14是這么算出來的：

$N = \frac{W + 2P - F}{S} + 1= \frac{28 + 2*0 - 2}{2} + 1 = 14$

? 其他的沒啥好說的，讀者們可以自行計(jì)算這個(gè)尺寸關(guān)系。接下來我們給出完整的CNN網(wǎng)絡(luò)代碼，net.py如下：

import torch
from torch import nn# 定義網(wǎng)絡(luò)模型
class MyLeNet5(nn.Module):# 初始化網(wǎng)絡(luò)def __init__(self):super(MyLeNet5, self).__init__()self.net = nn.Sequential(nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5, padding=2), nn.Tanh(),nn.AvgPool2d(kernel_size=2, stride=2),nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5), nn.Tanh(),nn.AvgPool2d(kernel_size=2, stride=2),nn.Conv2d(in_channels=16, out_channels=120, kernel_size=5),  nn.Tanh(),nn.Flatten(),nn.Linear(120, 84),  nn.Tanh(),nn.Linear(84, 10))# 前向傳播def forward(self, x):y = self.net(x)return y# 以下為測(cè)試代碼，也可不添加
if __name__ == '__main__': x1 = torch.rand([1, 1, 28, 28])model = MyLeNet5()y1 = model(x1)print(x1)print(y1)

? ? ?這里我還在'__main__'添加了一些測(cè)試代碼，正如表格中所示，假設(shè)我們向網(wǎng)絡(luò)中輸入一個(gè)1*1*28*28的向量，模擬批次大小為1，一個(gè)單通道28*28的灰度圖輸入。最終y應(yīng)該是由10個(gè)數(shù)字組成的張量，結(jié)果如下：

? ? ?從輸出我們可以直觀的看到輸入經(jīng)過神經(jīng)網(wǎng)絡(luò)前向傳播后的結(jié)果。另外特別注意這個(gè)網(wǎng)絡(luò)的結(jié)構(gòu)中的參數(shù)，其中卷積層的搭建API有5個(gè)外參數(shù)：

in_channels：輸入通道數(shù)

out_channels：輸出通道數(shù)

kernel_size: 卷積核尺寸

padding: 填充，不寫則默認(rèn)0

stride: 步幅，不寫則默認(rèn)1

? ? ?這個(gè)LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)就長(zhǎng)這樣，我們一定要嚴(yán)格遵守，否則有可能出現(xiàn)無論怎么訓(xùn)練，都始終欠擬合的情況。我就曾經(jīng)試過更改/添加不同的激活函數(shù)，結(jié)果無論是訓(xùn)練還是測(cè)試，準(zhǔn)確率都在10%徘徊，相當(dāng)于隨機(jī)瞎猜的效果，因此大家一定要嚴(yán)格遵循這個(gè)網(wǎng)絡(luò)結(jié)構(gòu)。?

3. 模型訓(xùn)練

? ? 網(wǎng)絡(luò)搭建好之后，所有的內(nèi)參數(shù)（即卷積核）都是隨機(jī)的，下面我們要通過訓(xùn)練盡可能提高網(wǎng)絡(luò)的預(yù)測(cè)能力。在訓(xùn)練前，我們首先要選擇損失函數(shù)（這里使用交叉熵?fù)p失函數(shù)），定義優(yōu)化器、進(jìn)行學(xué)習(xí)率調(diào)整等，代碼如下：

import torch
from torch import nn
from net import MyLeNet5
from torch.optim import lr_scheduler# 判斷是否有g(shù)pu
device = "cuda" if torch.cuda.is_available() else "cpu"# 調(diào)用net，將模型數(shù)據(jù)轉(zhuǎn)移到gpu
model = MyLeNet5().to(device)# 選擇損失函數(shù)
loss_fn = nn.CrossEntropyLoss()    # 交叉熵?fù)p失函數(shù)，自帶Softmax激活函數(shù)# 定義優(yōu)化器
optimizer = torch.optim.SGD(model.parameters(), lr=1e-3, momentum=0.9)# 學(xué)習(xí)率每隔10輪次， 變?yōu)樵瓉淼?.1
lr_scheduler = lr_scheduler.StepLR(optimizer, step_size=10, gamma=0.1)

? ? 然后我們可以寫一個(gè)用于訓(xùn)練網(wǎng)絡(luò)的函數(shù)，四個(gè)參數(shù)分別是批次加載器、模型、損失函數(shù)、優(yōu)化器，代碼如下：

# 定義模型訓(xùn)練的函數(shù)
def train(dataloader, model, loss_fn, optimizer):loss, current, n = 0.0, 0.0, 0for batch, (X, y) in enumerate(dataloader):# 前向傳播X, y = X.to(device), y.to(device)output = model(X)cur_loss = loss_fn(output, y)# 用_和pred分別接收輸出10個(gè)元素中的最大值和對(duì)應(yīng)下標(biāo)位置_, pred = torch.max(output, dim=1)# 計(jì)算當(dāng)前輪次時(shí)，訓(xùn)練集的精確度，將所有標(biāo)簽值與預(yù)測(cè)值（即下標(biāo)位置）cur_acc = torch.sum(y == pred)/output.shape[0]# 反向傳播，對(duì)內(nèi)部參數(shù)（卷積核）進(jìn)行優(yōu)化optimizer.zero_grad()cur_loss.backward()optimizer.step()# 計(jì)算準(zhǔn)確率和損失，這里只是為了實(shí)時(shí)顯示訓(xùn)練集的擬合情況。也可以不寫loss += cur_loss.item()current += cur_acc.item()n = n + 1print("train_loss: ", str(loss/n))print("train_acc: ", str(current/n))

只要調(diào)用這個(gè)函數(shù)，即可實(shí)現(xiàn)模型訓(xùn)練：

train(train_dataloader, model, loss_fn, optimizer)

當(dāng)然，我們最好是設(shè)定一個(gè)輪次epoch，我們后續(xù)會(huì)寫這樣一個(gè)循環(huán)，每訓(xùn)練一個(gè)epoch，就進(jìn)行一次測(cè)試，實(shí)時(shí)顯示一定輪次后訓(xùn)練集和測(cè)試集的擬合情況。

4. 模型測(cè)試

? ?這里和模型訓(xùn)練類似，只不過我們要觀察訓(xùn)練好的模型，在測(cè)試集的預(yù)測(cè)效果。與訓(xùn)練的代碼相似，只是沒有了反向傳播優(yōu)化參數(shù)的過程。用于測(cè)試的函數(shù)代碼如下：

def test(dataloader, model, loss_fn):model.eval()loss, current, n = 0.0, 0.0, 0# 該局部關(guān)閉梯度計(jì)算功能，提高運(yùn)算效率with torch.no_grad():  for batch, (X, y) in enumerate(dataloader):# 前向傳播X, y = X.to(device), y.to(device)output = model(X)cur_loss = loss_fn(output, y)_, pred = torch.max(output, dim=1)# 計(jì)算當(dāng)前輪次時(shí)，訓(xùn)練集的精確度cur_acc = torch.sum(y == pred) / output.shape[0]loss += cur_loss.item()current += cur_acc.item()n = n + 1print("test_loss: ", str(loss / n))print("test_acc: ", str(current / n))return current/n    # 返回精確度

? ? 如上代碼，將測(cè)試集的精確度作為返回值，我們?cè)谕鈬{(diào)用這個(gè)函數(shù)時(shí)，可以通過循環(huán)找到測(cè)試集最大的精確度。

? ? 最終我們?cè)O(shè)定一個(gè)訓(xùn)練輪次epochs，此處epochs=50，每經(jīng)過一個(gè)epoch的訓(xùn)練，就進(jìn)行測(cè)試，實(shí)時(shí)打印觀察訓(xùn)練集和測(cè)試集的擬合情況。當(dāng)測(cè)試集的精確度是當(dāng)前的最大值時(shí)，我們就保存這個(gè)模型的參數(shù)到save_model/best_model.pth，代碼如下：

import os# 開始訓(xùn)練
epoch = 50
max_acc = 0
for t in range(epoch):print(f"epoch{t+1}\n---------------")# 訓(xùn)練模型train(train_dataloader, model, loss_fn, optimizer)# 測(cè)試模型a = test(test_dataloader, model, loss_fn)# 保存最好的模型參數(shù)if a > max_acc:folder = 'save_model'if not os.path.exists(folder):os.mkdir(folder)max_acc = aprint("current best model acc = ", a)torch.save(model.state_dict(), 'save_model/best_model.pth')
print("Done!")

? ? 運(yùn)行之后可以發(fā)現(xiàn)，測(cè)試集的精度經(jīng)過1個(gè)epochs就達(dá)到了90%以上，最終經(jīng)過50輪次的訓(xùn)練，測(cè)試集精度達(dá)到了99%左右：

? ?模型參數(shù)也得以保存：

? ? 最后給出用于訓(xùn)練和測(cè)試的完整代碼train.py，如下所示：

import torch
from torch import nn
from net import MyLeNet5
from torch.optim import lr_scheduler
from torchvision import datasets, transforms
import os# 將圖像轉(zhuǎn)換為張量形式
data_transform = transforms.Compose([transforms.ToTensor()
])# 加載訓(xùn)練數(shù)據(jù)集
train_dataset = datasets.MNIST(root='D:\\Jupyter\\dataset\\minst',  # 下載路徑train=True,   # 是訓(xùn)練集download=True,   # 如果該路徑?jīng)]有該數(shù)據(jù)集，則進(jìn)行下載transform=data_transform   # 數(shù)據(jù)集轉(zhuǎn)換參數(shù)
)# 批次加載器
train_dataloader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=16, shuffle=True)# 加載測(cè)試數(shù)據(jù)集
test_dataset = datasets.MNIST(root='D:\\Jupyter\\dataset\\minst',  # 下載路徑train=False,   # 是訓(xùn)練集download=True,   # 如果該路徑?jīng)]有該數(shù)據(jù)集，則進(jìn)行下載transform=data_transform   # 數(shù)據(jù)集轉(zhuǎn)換參數(shù)
)
test_dataloader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=16, shuffle=True)# 判斷是否有g(shù)pu
device = "cuda" if torch.cuda.is_available() else "cpu"# 調(diào)用net，將模型數(shù)據(jù)轉(zhuǎn)移到gpu
model = MyLeNet5().to(device)# 選擇損失函數(shù)
loss_fn = nn.CrossEntropyLoss()    # 交叉熵?fù)p失函數(shù)，自帶Softmax激活函數(shù)# 定義優(yōu)化器
optimizer = torch.optim.SGD(model.parameters(), lr=1e-3, momentum=0.9)# 學(xué)習(xí)率每隔10輪次， 變?yōu)樵瓉淼?.1
lr_scheduler = lr_scheduler.StepLR(optimizer, step_size=10, gamma=0.1)# 定于訓(xùn)練函數(shù)
def train(dataloader, model, loss_fn, optimizer):loss, current, n = 0.0, 0.0, 0for batch, (X, y) in enumerate(dataloader):# 前向傳播X, y = X.to(device), y.to(device)output = model(X)cur_loss = loss_fn(output, y)_, pred = torch.max(output, dim=1)# 計(jì)算當(dāng)前輪次時(shí)，訓(xùn)練集的精確度cur_acc = torch.sum(y == pred)/output.shape[0]# 反向傳播optimizer.zero_grad()cur_loss.backward()optimizer.step()loss += cur_loss.item()current += cur_acc.item()n = n + 1print("train_loss: ", str(loss/n))print("train_acc: ", str(current/n))def test(dataloader, model, loss_fn):model.eval()loss, current, n = 0.0, 0.0, 0# 該局部關(guān)閉梯度計(jì)算功能，提高運(yùn)算效率with torch.no_grad():for batch, (X, y) in enumerate(dataloader):# 前向傳播X, y = X.to(device), y.to(device)output = model(X)cur_loss = loss_fn(output, y)_, pred = torch.max(output, dim=1)# 計(jì)算當(dāng)前輪次時(shí)，訓(xùn)練集的精確度cur_acc = torch.sum(y == pred) / output.shape[0]loss += cur_loss.item()current += cur_acc.item()n = n + 1print("test_loss: ", str(loss / n))print("test_acc: ", str(current / n))return current/n    # 返回精確度# 開始訓(xùn)練
epoch = 50
max_acc = 0
for t in range(epoch):print(f"epoch{t+1}\n---------------")train(train_dataloader, model, loss_fn, optimizer)a = test(test_dataloader, model, loss_fn)# 保存最好的模型參數(shù)if a > max_acc:folder = 'save_model'if not os.path.exists(folder):os.mkdir(folder)max_acc = aprint("current best model acc = ", a)torch.save(model.state_dict(), 'save_model/best_model.pth')
print("Done!")

5. 直觀顯示預(yù)測(cè)結(jié)果

? ? ?截至目前，我們已經(jīng)完成了手寫數(shù)字識(shí)別這個(gè)任務(wù)，但是我們好像對(duì)于數(shù)據(jù)集長(zhǎng)什么樣并不是很了解，似乎僅僅是用torchvision中的datasets庫(kù)下載了一下。因此本小節(jié)，我們的目標(biāo)是從數(shù)據(jù)集取出幾個(gè)特定的手寫數(shù)字圖片，并查看我們模型對(duì)其的預(yù)測(cè)效果。

? ?首先我們還是加載數(shù)據(jù)集，和之前的代碼一樣，這里省略。然后我們加載模型：

from net import  MyLeNet5# 調(diào)用net，將模型數(shù)據(jù)轉(zhuǎn)移到gpu
model = MyLeNet5().to(device)
model.load_state_dict(torch.load('./save_model/best_model.pth'))

? ? ?我們?nèi)〕鰷y(cè)試集中的前5長(zhǎng)圖片做一個(gè)展示即可，完整代碼show.py如下：

import torch
from net import MyLeNet5
from torchvision import datasets, transforms
from torchvision.transforms import ToPILImagedata_transform = transforms.Compose([transforms.ToTensor()
])# 加載訓(xùn)練數(shù)據(jù)集
train_dataset = datasets.MNIST(root='D:\\Jupyter\\dataset\\minst',  # 下載路徑train=True,   # 是訓(xùn)練集download=True,   # 如果該路徑?jīng)]有該數(shù)據(jù)集，則進(jìn)行下載transform=data_transform   # 數(shù)據(jù)集轉(zhuǎn)換參數(shù)
)# 加載測(cè)試數(shù)據(jù)集
test_dataset = datasets.MNIST(root='D:\\Jupyter\\dataset\\minst',  # 下載路徑train=False,   # 是訓(xùn)練集download=True,   # 如果該路徑?jīng)]有該數(shù)據(jù)集，則進(jìn)行下載transform=data_transform   # 數(shù)據(jù)集轉(zhuǎn)換參數(shù)
)# 判斷是否有g(shù)pu
device = "cuda" if torch.cuda.is_available() else "cpu"# 調(diào)用net，將模型數(shù)據(jù)轉(zhuǎn)移到gpu
model = MyLeNet5().to(device)
model.load_state_dict(torch.load('./save_model/best_model.pth'))# 獲取結(jié)果
classes = ["0","1","2","3","4","5","6","7","8","9"
]# 把tensor轉(zhuǎn)化為圖片，方便可視化
image = ToPILImage()# 進(jìn)入驗(yàn)證
for i in range(5):X, y = test_dataset[i][0], test_dataset[i][1]      # X，y對(duì)應(yīng)第i張圖片和標(biāo)簽# image是ToPILImage的實(shí)例，將Pytorch張量轉(zhuǎn)換為PIL圖像，.show()方法會(huì)打開圖像查看器并顯示圖像image(X).show()'''unsqueeze 方法在指定的 dim 維度上擴(kuò)展張量的維度。這里 dim=0，所以它會(huì)在第0維添加一個(gè)維度.例如，原來的 X 形狀是 (1, 28, 28)，經(jīng)過 unsqueeze 處理后，形狀變?yōu)?(1, 1, 28, 28)。這樣做的目的是將單張圖像擴(kuò)展成批次大小為1的形式，這樣模型可以接收單張圖像作為輸入。'''X = torch.unsqueeze(X, dim=0).float().to(device)with torch.no_grad():# 前向傳播獲得預(yù)測(cè)結(jié)果pred（由10個(gè)元素組成的張量）pred = model(X)print(pred)# 將預(yù)測(cè)值和標(biāo)簽轉(zhuǎn)化為對(duì)應(yīng)的數(shù)字分類結(jié)果，pred中的最大值視為預(yù)測(cè)分類predicted, actual = classes[torch.argmax(pred[0])], classes[y]print(f"predicted: {predicted}, actual: {actual}")

? ?運(yùn)行結(jié)果如下，我們可以看到測(cè)試集中的前五張圖片分別是7，2，1，0，4，且我們的模型都能對(duì)其進(jìn)行成功預(yù)測(cè)分類。

? ?預(yù)測(cè)結(jié)果均正確，如下：

寫在最后

? ? ? ? 本文介紹了如何使用PyTorch框架搭建卷積神經(jīng)網(wǎng)絡(luò)模型CNN。將CNN與DNN進(jìn)行了類比。CNN中的卷積層與DNN的全連接層是平級(jí)關(guān)系。我們實(shí)現(xiàn)了LeNet-5的模型的搭建、模型訓(xùn)練、測(cè)試、網(wǎng)絡(luò)的復(fù)用、直觀查看數(shù)據(jù)集的圖片預(yù)測(cè)結(jié)果等，實(shí)現(xiàn)了機(jī)器學(xué)習(xí)領(lǐng)域的Hello world——手寫數(shù)字識(shí)別。在CNN原理中，讀者應(yīng)當(dāng)重點(diǎn)關(guān)注輸入輸出的尺寸關(guān)系，并可以對(duì)照LeNet-5結(jié)構(gòu)示意圖寫出對(duì)應(yīng)Pytorch代碼。至于模型訓(xùn)練和測(cè)試基本都是固定的代碼形式。

? ? ? 這篇文章到這里就結(jié)束了，后續(xù)我還會(huì)繼續(xù)更新深度學(xué)習(xí)的相關(guān)知識(shí)，另外近期我個(gè)人的研究方向涉及到圖神經(jīng)網(wǎng)絡(luò)，回頭也會(huì)更新一些相關(guān)博客。如果讀者有相關(guān)建議或疑問也歡迎評(píng)論區(qū)與我共同探討，我一定知無不言?？偨Y(jié)不易，還請(qǐng)讀者多多點(diǎn)贊關(guān)注支持！

查看全文

http://www.risenshineclean.com/news/34240.html

中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

網(wǎng)站沒有問題但是一直做不上首頁(yè)seo托管

寫在開頭

一、CNN的原理

1. 概述

2. 卷積層

內(nèi)參數(shù)（卷積核本身）

外參數(shù)（填充和步幅）

輸入與輸出的尺寸關(guān)系?

3. 多通道問題?

多通道輸入

多通道輸出

4. 池化層

平均匯聚

最大值匯聚

二、手寫數(shù)字識(shí)別

1. 任務(wù)描述和數(shù)據(jù)集加載

2. 網(wǎng)絡(luò)結(jié)構(gòu)（LeNet-5）

3. 模型訓(xùn)練

4. 模型測(cè)試

5. 直觀顯示預(yù)測(cè)結(jié)果

寫在最后

相關(guān)文章：

中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

寫在開頭

一、CNN的原理

1. 概述

2. 卷積層

內(nèi)參數(shù)（卷積核本身）

外參數(shù)（填充和步幅）

輸入與輸出的尺寸關(guān)系?

3. 多通道問題?

多通道輸入

多通道輸出

4. 池化層

平均匯聚

最大值匯聚

二、手寫數(shù)字識(shí)別

1. 任務(wù)描述和數(shù)據(jù)集加載

2. 網(wǎng)絡(luò)結(jié)構(gòu)（LeNet-5）

3. 模型訓(xùn)練

4. 模型測(cè)試

5. 直觀顯示預(yù)測(cè)結(jié)果

寫在最后

相關(guān)文章：

一、CNN的原理