找設(shè)計(jì)案例的網(wǎng)站接推廣app任務(wù)的平臺(tái)
說明:這是一個(gè)機(jī)器學(xué)習(xí)實(shí)戰(zhàn)項(xiàng)目(附帶數(shù)據(jù)+代碼+文檔+視頻講解),如需數(shù)據(jù)+代碼+文檔+視頻講解可以直接到文章最后獲取。
1.項(xiàng)目背景
螢火蟲算法(Fire-fly algorithm,FA)由劍橋大學(xué)Yang于2009年提出 , 作為最新的群智能優(yōu)化算法之一,該算法具有更好的收斂速度和收斂精度,且易于工程實(shí)現(xiàn)等優(yōu)點(diǎn)。
本項(xiàng)目通過FA螢火蟲優(yōu)化算法優(yōu)化循環(huán)神經(jīng)網(wǎng)絡(luò)分類模型。
2.數(shù)據(jù)獲取
本次建模數(shù)據(jù)來源于網(wǎng)絡(luò)(本項(xiàng)目撰寫人整理而成),數(shù)據(jù)項(xiàng)統(tǒng)計(jì)如下:
編號(hào) | 變量名稱 | 描述 |
1 | x1 | |
2 | x2 | |
3 | x3 | |
4 | x4 | |
5 | x5 | |
6 | x6 | |
7 | x7 | |
8 | x8 | |
9 | x9 | |
10 | x10 | |
11 | y | 因變量 |
數(shù)據(jù)詳情如下(部分展示):
3.數(shù)據(jù)預(yù)處理
3.1?用Pandas工具查看數(shù)據(jù)
使用Pandas工具的head()方法查看前五行數(shù)據(jù):
關(guān)鍵代碼:
3.2 數(shù)據(jù)缺失查看
使用Pandas工具的info()方法查看數(shù)據(jù)信息:
???
從上圖可以看到,總共有11個(gè)變量,數(shù)據(jù)中無缺失值,共2000條數(shù)據(jù)。
關(guān)鍵代碼: ?
3.3?數(shù)據(jù)描述性統(tǒng)計(jì)
通過Pandas工具的describe()方法來查看數(shù)據(jù)的平均值、標(biāo)準(zhǔn)差、最小值、分位數(shù)、最大值。
關(guān)鍵代碼如下: ???
4.探索性數(shù)據(jù)分析
4.1?y變量柱狀圖
用Matplotlib工具的plot()方法繪制柱狀圖:
4.2 y=1樣本x1變量分布直方圖
用Matplotlib工具的hist()方法繪制直方圖:
4.3 相關(guān)性分析
從上圖中可以看到,數(shù)值越大相關(guān)性越強(qiáng),正值是正相關(guān)、負(fù)值是負(fù)相關(guān)。
5.特征工程
5.1 建立特征數(shù)據(jù)和標(biāo)簽數(shù)據(jù)
關(guān)鍵代碼如下:
5.2 數(shù)據(jù)集拆分
通過train_test_split()方法按照80%訓(xùn)練集、20%測(cè)試集進(jìn)行劃分,關(guān)鍵代碼如下:
5.3 數(shù)據(jù)樣本增維
數(shù)據(jù)樣本增加維度后的數(shù)據(jù)形狀:
??
6.構(gòu)建FA螢火蟲優(yōu)化算法優(yōu)化LSTM分類模型
主要使用FA螢火蟲優(yōu)化算法優(yōu)化LSTM分類算法,用于目標(biāo)分類。
6.1 FA螢火蟲優(yōu)化算法尋找最優(yōu)的參數(shù)值???
最優(yōu)參數(shù):
??
6.2 最優(yōu)參數(shù)值構(gòu)建模型
編號(hào) | 模型名稱 | 參數(shù) |
1 | LSTM分類模型 | units=best_units |
2 | epochs=best_epochs |
6.3 最優(yōu)參數(shù)模型摘要信息
6.4 最優(yōu)參數(shù)模型網(wǎng)絡(luò)結(jié)構(gòu)
6.5 最優(yōu)參數(shù)模型訓(xùn)練集測(cè)試集損失和準(zhǔn)確率曲線圖
7.模型評(píng)估
7.1 評(píng)估指標(biāo)及結(jié)果
評(píng)估指標(biāo)主要包括準(zhǔn)確率、查準(zhǔn)率、查全率、F1分值等等。
模型名稱 | 指標(biāo)名稱 | 指標(biāo)值 |
測(cè)試集 | ||
LSTM分類模型 | 準(zhǔn)確率 | 0.8350 |
查準(zhǔn)率 | 0.8533 | |
查全率 | 0.801 | |
F1分值 | 0.8263 |
從上表可以看出,F1分值為0.8350,說明模型效果較好。
關(guān)鍵代碼如下:
7.2 分類報(bào)告
???
從上圖可以看出,分類為0的F1分值為0.84;分類為1的F1分值為0.83。
7.3 混淆矩陣
從上圖可以看出,實(shí)際為0預(yù)測(cè)不為0的 有27個(gè)樣本;實(shí)際為1預(yù)測(cè)不為1的 有39個(gè)樣本,整體預(yù)測(cè)準(zhǔn)確率良好。 ?
8.結(jié)論與展望
綜上所述,本文采用了FA螢火蟲優(yōu)化算法尋找循環(huán)神經(jīng)網(wǎng)絡(luò)LSTM算法的最優(yōu)參數(shù)值來構(gòu)建分類模型,最終證明了我們提出的模型效果良好。此模型可用于日常產(chǎn)品的預(yù)測(cè)。
# 本次機(jī)器學(xué)習(xí)項(xiàng)目實(shí)戰(zhàn)所需的資料,項(xiàng)目資源如下:# 項(xiàng)目說明:鏈接:https://pan.baidu.com/s/18fd5YEIMAAiuBWnzuC7BBQ
提取碼:3uwj
更多項(xiàng)目實(shí)戰(zhàn),詳見機(jī)器學(xué)習(xí)項(xiàng)目實(shí)戰(zhàn)合集列表:
機(jī)器學(xué)習(xí)項(xiàng)目實(shí)戰(zhàn)合集列表_機(jī)器學(xué)習(xí)實(shí)戰(zhàn)項(xiàng)目_胖哥真不錯(cuò)的博客-CSDN博客