外文網(wǎng)站建設(shè)完成如何自建網(wǎng)站?
目錄
前言
一、題目理解
背景
解析
字段含義:
建模要求
二、建模思路
?灰色預(yù)測:
?編輯
?二次指數(shù)平滑法:
person相關(guān)性
只希望各位以后遇到建模比賽可以艾特認(rèn)識(shí)一下我,我可以提供免費(fèi)的思路和部分源碼,以后的數(shù)模比賽只要我還有時(shí)間肯定會(huì)第一時(shí)間寫出免費(fèi)開源思路,你們的關(guān)注和點(diǎn)贊就是我寫作的動(dòng)力!!!想要了解更多的歡迎聯(lián)系博主,免費(fèi)獲取代碼和更多細(xì)化思路。
前言
美賽補(bǔ)全計(jì)劃第二篇了屬實(shí)是,正好今天是周五下班晚上通宵研究美滋滋,想當(dāng)年上一次參加美賽的時(shí)候還有兩個(gè)學(xué)妹在給我加油打勁,現(xiàn)在已經(jīng)孤身一人社畜995,時(shí)光一去不復(fù)返啊。(要是有學(xué)妹給我評(píng)論加油,我直接狀態(tài)拉滿哈哈)
對(duì)美賽A題感興趣的同學(xué)去看:2023年美國大學(xué)生數(shù)學(xué)建模A題:受干旱影響的植物群落建模詳解+模型代碼(一)
?還是老樣子,思路和模型代碼都是免費(fèi)的,純愛好。博主參與過十余次數(shù)學(xué)建模大賽,三次美賽獲得過二次M獎(jiǎng)一次H獎(jiǎng),國賽二等獎(jiǎng)。建模的部分后續(xù)將會(huì)寫出,想要了解更多的歡迎聯(lián)系博主,免費(fèi)獲取代碼和更多細(xì)化思路,只希望各位以后遇到建模比賽可以艾特認(rèn)識(shí)一下我,我可以提供免費(fèi)的思路和部分源碼,以后的數(shù)模比賽只要我還有時(shí)間肯定會(huì)第一時(shí)間寫出免費(fèi)開源思路,你們的關(guān)注和點(diǎn)贊就是我寫作的動(dòng)力!!!大家可以參考。
一、題目理解
首先做MCM要從背景入手了解要做的事情,題目背景:
背景
Wordle是《紐約時(shí)報(bào)》目前每天提供的一個(gè)流行的謎題。玩家試圖通過不超過六次的時(shí)間猜 測一個(gè)五個(gè)字母的單詞來解決謎題,每次猜測都會(huì)得到反饋。對(duì)于這個(gè)版本,每個(gè)猜測都必 須是一個(gè)真實(shí)的英語單詞。不允許猜測不被比賽認(rèn)定為單詞的結(jié)果。
《紐約時(shí)報(bào)》網(wǎng)站上的Wordle說明指出,在你提交文字后,瓷磚的顏色將會(huì)改變。黃色 平貼表示該貼中的字母在單詞中,但它在錯(cuò)誤的位置。綠色的貼表示該貼中的字母在單 詞中并且在正確的位置。
圖1是一個(gè)示例解決方案,在三次嘗試中都找到了正確的結(jié)果。
?玩家可以在常規(guī)模式或困難模式下玩。Wordle的困難模式讓玩家的游戲更加困難,因?yàn)?一旦玩家找到了一個(gè)單詞中正確的字母 (平鋪是黃色或綠色的) ,這些字母必須在隨后 的猜測中使用。
解析
首先我們可以得到該游戲的基本規(guī)則,也就是能夠在26個(gè)字母之類,挑選出五個(gè)字母。困難模式下,如果第一次猜中了某個(gè)字母,該字母是綠的話那么不用挪動(dòng),若該字母為黃的,那么接下來五個(gè)位置中必定得填上該字母,當(dāng)然字母和單詞之間也有一定的邏輯關(guān)系。那么我們再去看數(shù)據(jù)集和數(shù)據(jù)集的解釋:
字段含義:
Data:日期
Contest number:比賽編號(hào)
Word:比賽單詞
Number of? reported results:提交人數(shù)
Number in hard mode:hrad模型下提交人數(shù)
提交次數(shù):
Percent in? | ||||||
1 try | 2 tries | 3 tries | 4 tries | 5 tries | 6 tries | 7 or more tries (X) |
?由于每天的單詞是固定的,根據(jù)題意說例如,在圖2中,2022年7月20日的單詞是“TRITE”,結(jié)果是通過挖掘Twitter獲得。盡管圖2中的百分比總和為100%,但在某些情況下由于四舍五入,這可能不是真的。上一句信息不重要,可能就是解釋一下為什么概率是整數(shù)而已。
建模要求
- 1.報(bào)告結(jié)果的數(shù)量每天都在變化。建立一個(gè)模型來解釋這種變化,使用該模型能為2023年3月1日?qǐng)?bào)告的結(jié)果數(shù)量創(chuàng)建一個(gè)預(yù)測概率區(qū)間序列,單詞的任何屬性是否會(huì)影響在hard模式下游戲人數(shù)?解釋這種情況。
- 2.對(duì)于給定的未來解決方案,在未來的某個(gè)日期,開發(fā)一個(gè)模型預(yù)測報(bào)告結(jié)果的分布。換句話說,預(yù)測未來日期的百分比(1、2、3、4、5、6、X)。挖掘出模型的預(yù)測結(jié)果到底存在哪些影響預(yù)測準(zhǔn)確性的因素,舉一個(gè)你對(duì)這個(gè)詞的預(yù)測的具體例子‘EERIE’于2023年3月1日發(fā)布。去校驗(yàn)?zāi)P偷臏?zhǔn)確性。
- 3.開發(fā)和總結(jié)一個(gè)模型,按難度分類解決方案詞,并識(shí)別與每個(gè)分類關(guān)聯(lián)的給定單詞 的屬性?;谀愕哪P?#xff0c;ERNIE這個(gè)詞有多難?討論你的分類模型的準(zhǔn)確性。
- 4. 列出并描述此數(shù)據(jù)集的其他一些特性。
二、建模思路
首先對(duì)Number of? reported results提出來觀察時(shí)序序列數(shù)據(jù)波動(dòng):
可以看出游戲一開始推出的時(shí)候是一個(gè)很明顯的上升曲線,直到四月達(dá)到峰值之后,游玩人數(shù)開始逐漸下降,也就是過了游戲的吸引時(shí)期。后面的數(shù)據(jù)相對(duì)于比較平緩,我們僅取最近三個(gè)月的數(shù)據(jù)觀察,其中有個(gè)別很明顯的噪音我們將它用均值填補(bǔ):
?很明顯的一個(gè)下降趨勢,這里直接使用灰色時(shí)序預(yù)測最好了,當(dāng)然你也可以選擇用其他的時(shí)序預(yù)測模型:
?灰色預(yù)測:
?二次指數(shù)平滑法:
這里我建議還是用二次指數(shù)平滑法,不然灰色預(yù)測級(jí)比校驗(yàn)過不了:
該數(shù)據(jù)未通過級(jí)比檢驗(yàn) 灰參數(shù)a: 0.00318897487491340454746069354996507172472774982452392578125 ,灰參數(shù)u: 30374.0096777603102964349091053009033203125 原數(shù)據(jù)樣本標(biāo)準(zhǔn)差: 2104.8922894686443 殘差樣本標(biāo)準(zhǔn)差: 1804.1606900649451 后驗(yàn)差比: 0.8571273214746702 小誤差概率p: 0.7142857142857143
?對(duì)Word這行數(shù)據(jù)處理,首先我把我考慮到的因素列出:
單詞難度-參考元音以及輔音區(qū)別劃分,將該word直接切分,而且每個(gè)單詞都是獨(dú)一無二的,359天一個(gè)單詞都沒重復(fù):
?
person相關(guān)性
?從而去對(duì)元音和輔音計(jì)數(shù)劃分單詞每個(gè)不同的含義,而且再對(duì)hard進(jìn)行關(guān)聯(lián)分析,這里還是老樣子使用person分析即可:
?有數(shù)據(jù)做這題屬實(shí)簡單啊,接著我們下一步再對(duì)整個(gè)預(yù)測區(qū)間做一個(gè)模型即可:
?
?