做美圖+網(wǎng)站有哪些可以免費做網(wǎng)站推廣的平臺
基于WIN10的64位系統(tǒng)演示
一、寫在前面
我們繼續(xù)往下看,首先例行回顧文章:
《PLoS One》雜志的2023年一篇題目為《A comparative study of three models to analyze the impact of air pollutants on the number of pulmonary tuberculosis cases in Urumqi, Xinjiang》文章的公開數(shù)據(jù)做案例。
這文章做的是用:空氣污染物對新疆烏魯木齊肺結(jié)核病例數(shù)影響的比較研究。
這一步我們繼續(xù)弄ARIMAX模型,首先回顧上一步我的總結(jié):
以肺結(jié)核和SO2構(gòu)建ARIMAX模型為例,首先,單獨使用肺結(jié)核的時序數(shù)據(jù)構(gòu)建最優(yōu)的ARIMA模型(叫做ARIMA-MTB),拿到該模型的殘差白噪聲序列,叫做S1;其次,單獨使用SO2的時序數(shù)據(jù)構(gòu)建最優(yōu)的ARIMA模型(叫做ARIMA-SO2),拿到該模型的殘差白噪聲序列,叫做S2;接著,利用S1和S2序列繪制交叉相關函數(shù)(CCF)圖,找到S2序列滯后多少個月(本例是1個月)與S1序列呈現(xiàn)相關關系;最后,把滯后1個月的S2序列納入ARIMA-MTB模型,就是最終的ARIMAX模型了,這里的X,就是滯后1個月的S2序列。注意哦,納入的是SO2的白噪聲殘差序列,而不是原始序列!!!
這一步,我們使用SPSS把ARIMAX模型構(gòu)建完畢。
二、學習和復現(xiàn):結(jié)果三
咱們一步一步來吧:
(1)上一步,我們拿到了ARIMA-MTB和ARIMA-SO2的殘差白噪聲虛列,兩個都是ARIMA(0,1,1)(0,1,0):
(2)進入ARIMAX模型建立界面,跟單純的ARIMA不同的是,需要把SO2的殘差序列作為自變量加入:
這里的延遲就填1,為啥?就是之前做的相關分析,滯后一個月有顯著性差異。
然后翻車了,因為存在缺失值哈,先試試無腦填充0吧:
看看結(jié)果如何:
跟單純的ARIMA模型做對比:
有點詭異的是:除了BIC值,ARIMAX模型在平穩(wěn)R方、MAE、MAPE、RMSE等性能參數(shù)均稍微優(yōu)于單純的ARIMA模型。
(3)試一試SO2殘差序列的中位數(shù)或者平均值填充,再進行ARIMAX建模:
① 平均值填充,填充-0.0097:
結(jié)果大同小異吧,畢竟平均值跟0基本沒啥差別。
② 中位數(shù)填充,填充-0.0247:
也是大同小異。
(4)最后看看文章對于結(jié)果的描述:
翻譯翻譯:
在接下來的部分中,這五種相對空氣污染物SO2、PM10、PM2.5、NO2和CO被納入到多變量ARIMA模型中,以建立相應的ARIMAX模型。七個ARIMAX模型中只有三個通過了殘差和參數(shù)測試,它們的AIC和MAPE值分別被計算出來(見表6)。如表6所示,包含空氣污染物的ARIMAX模型的AIC和MAPE值低于ARIMA模型。特別是,ARIMAX(1,1,2)×(0,1,1)12+PM2.5,帶有12個月的滯后,具有最小的AIC值(AIC = 479.32)和MAPE值(MAPE = 6.766%),這是最優(yōu)的ARIMAX模型。
就有一句話解讀:
“七個ARIMAX模型中只有三個通過了殘差和參數(shù)測試,”:也就是SO2等空氣污染的殘差序列作為自變量納入ARIMAX模型,也還需要通過參數(shù)檢驗的,P值小于0.05。我們的例子中,SO2的殘差序列的P值等于0.025:
三、一點補充
可以看到,用SPSS做的ARIMAX模型在性能提升方面,沒有文章中使用R語言做的那么明顯。SPSS做的ARIMAX模型的MAPE大約在16.60%左右,而文獻中可達到12.728%,可謂遙遙領先。兩個軟件建模算法的區(qū)別我也是不太了解,有可能是參數(shù)設定方面的差別,也不得而知。不過,SPSS操作簡單,我覺得也是可以用的,把建模過程描述清晰就行。
有沒有想過,使用傳統(tǒng)的ARIMAX模型構(gòu)建方法,效果如何?
我試了一下,由于數(shù)據(jù)不夠多,做相關分析,之后36個月都沒啥差異的,哈哈。
好了,這篇文章的ARIMAX模型構(gòu)建部分,就解讀完了。下一步,我們換另一篇文章來解讀解讀。
四、數(shù)據(jù)
鏈接:https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0277314