網(wǎng)站是否必須做可信網(wǎng)站認證seo自動優(yōu)化軟件下載
說明:這是一個機器學(xué)習(xí)實戰(zhàn)項目(附帶數(shù)據(jù)+代碼+文檔+視頻講解),如需數(shù)據(jù)+代碼+文檔+視頻講解可以直接到文章最后獲取。
1.項目背景
時間序列分析中的平穩(wěn)性檢驗是評估一個時間序列是否具有穩(wěn)定的均值和方差。在經(jīng)濟學(xué)、金融學(xué)以及其他諸多領(lǐng)域中,對數(shù)據(jù)進行平穩(wěn)性檢驗是進行有效建模的前提條件,特別是對于使用ARIMA等模型進行預(yù)測時。
ADF檢驗(Augmented Dickey-Fuller Test): ADF檢驗是一種常見的單位根檢驗方法,用于檢測時間序列是否存在單位根,即序列是否是非平穩(wěn)的。如果ADF檢驗結(jié)果顯示序列存在單位根,則說明序列是非平穩(wěn)的,可能需要通過一階或更高階差分來使其變?yōu)槠椒€(wěn)序列。adfuller函數(shù)通常被用來執(zhí)行這種檢驗,并返回統(tǒng)計量、臨界值以及檢驗結(jié)果的判定(如:拒絕原假設(shè)意味著序列不包含單位根,可能是平穩(wěn)的或趨勢平穩(wěn)的)。
KPSS檢驗(Kwiatkowski-Phillips-Schmidt-Shin Test): KPSS檢驗則是另一種平穩(wěn)性檢驗的方法,它測試的是序列是否為水平平穩(wěn)序列,即檢驗序列是否存在恒定均值或者確定的趨勢。如果KPSS檢驗結(jié)果顯示序列是平穩(wěn)的,那么序列的均值和方差在時間上是相對固定的。當(dāng)KPSS檢驗結(jié)果拒絕原假設(shè)時,表明序列可能是非平穩(wěn)的,需要進一步處理(例如添加趨勢項或進行差分)。
總的來說,ADF和KPSS檢驗分別從不同的角度對時間序列平穩(wěn)性進行了評估,而差分去趨勢是一種將非平穩(wěn)序列轉(zhuǎn)化為平穩(wěn)序列的技術(shù)手段,以滿足后續(xù)分析模型對平穩(wěn)性的要求。
本項目通過ADF和KPSS算法來進行時間序列分析進行平穩(wěn)性檢驗和和差分去趨勢。???????????
2.數(shù)據(jù)獲取
本次建模數(shù)據(jù)來源于網(wǎng)絡(luò)(本項目撰寫人整理而成),數(shù)據(jù)項統(tǒng)計如下:
編號 | 變量名稱 | 描述 |
1 | YEAR | |
2 | SUNACTIVITY |
數(shù)據(jù)詳情如下(部分展示):
3.數(shù)據(jù)預(yù)處理
3.1?用Pandas工具查看數(shù)據(jù)
使用Pandas工具的head()方法查看前五行數(shù)據(jù):
關(guān)鍵代碼:
3.2 數(shù)據(jù)缺失查看
使用Pandas工具的info()方法查看數(shù)據(jù)信息:
??????
從上圖可以看到,總共有1個變量,數(shù)據(jù)中無缺失值,共309條數(shù)據(jù)。
關(guān)鍵代碼:
3.3?數(shù)據(jù)描述性統(tǒng)計
通過Pandas工具的describe()方法來查看數(shù)據(jù)的平均值、標準差、最小值、分位數(shù)、最大值。?
關(guān)鍵代碼如下: ???
??
4.探索性數(shù)據(jù)分析
4.1?變量直方圖
用Matplotlib工具的hist()方法繪制直方圖:
從上圖可以看到,變量主要集中在10~150之間。 ?
4.2 折線圖
從上圖中可以看到,數(shù)據(jù)有一定的波動性。
5.進行平穩(wěn)性檢驗(ADF和KPSS)?
主要使用ADF和KPSS算法,用于時間序列分析進行平穩(wěn)性檢驗(ADF和KPSS)和差分去趨勢。???????
5.1 構(gòu)建模型
編號 | 模型名稱 | 參數(shù) |
1 | 平穩(wěn)性檢驗和差分去趨勢 | 默認參數(shù) |
5.2?ADF檢驗結(jié)果
基于顯著性水平0.05和ADF檢驗的p值,原假設(shè)不能被否定。因此,該系列是非平穩(wěn)的。
5.3?KPSS檢驗結(jié)果
根據(jù)0.05的顯著性水平和KPSS檢驗的p值,有證據(jù)支持否定原假設(shè),支持備選方案。因此,根據(jù) KPSS 測試,該系列是非平穩(wěn)的。
6.模型評估
6.1 差分去趨勢
進行差分后的折線圖:
6.2 ADF檢驗結(jié)果
根據(jù)ADF檢驗的p值,有證據(jù)支持否定原假設(shè),支持備選方案。因此,該系列現(xiàn)在是平穩(wěn)的。
6.3 KPSS檢驗結(jié)果
基于KPSS檢驗的p值,原假設(shè)不能被否定。因此,該系列是平穩(wěn)的。
7.結(jié)論與展望
綜上所述,本文采用了ADF和KPSS算法來進行時間序列分析進行平穩(wěn)性檢驗和差分去趨勢,最終證明了我們提出的模型效果良好。此模型可用于日常產(chǎn)品的預(yù)測。?
# 本次機器學(xué)習(xí)項目實戰(zhàn)所需的資料,項目資源如下:# 項目說明:# 獲取方式一:# 項目實戰(zhàn)合集導(dǎo)航:https://docs.qq.com/sheet/DTVd0Y2NNQUlWcmd6?tab=BB08J2# 獲取方式二:鏈接:https://pan.baidu.com/s/1CE0c2btC0_0zxWTjwQuymA
提取碼:d56i