工體商城網(wǎng)站建設(shè)揭陽新站seo方案
賽題名稱:Linking Writing Processes to Writing Quality
賽題鏈接:https://www.kaggle.com/competitions/linking-writing-processes-to-writing-quality
賽題背景
寫作過程中存在復(fù)雜的行為動作和認(rèn)知活動,不同作者可能采用不同的計劃修訂技術(shù)、展示不同的停頓模式或在全過程中策略性地分配時間,這些都可能影響寫作質(zhì)量。過去的研究探索了與停頓、添加刪除和修訂等行為相關(guān)的多種過程特征,但是使用的數(shù)據(jù)集較小,且只研究了少數(shù)特征。
本次競賽使用鍵盤日志的數(shù)據(jù)過程特征來預(yù)測總體寫作質(zhì)量,可能識別學(xué)習(xí)者寫作行為與表現(xiàn)之間的關(guān)系。鑒于當(dāng)前寫作評估工具主要關(guān)注最終產(chǎn)出,這可能幫助學(xué)習(xí)者關(guān)注文本產(chǎn)出過程,增強(qiáng)寫作的自主性、元認(rèn)知意識和自我調(diào)節(jié)。
賽題任務(wù)
本次競賽的目標(biāo)是預(yù)測寫作整體質(zhì)量。寫作方式是否會影響作文結(jié)果?參賽者將在一個大規(guī)模鍵盤日志數(shù)據(jù)集上訓(xùn)練模型,該數(shù)據(jù)集捕獲了書寫過程特征。
參賽者的工作將幫助探索學(xué)習(xí)者的書寫行為與書寫表現(xiàn)之間的關(guān)系,這可能為書寫指導(dǎo)、自動書寫評估技術(shù)和智能輔導(dǎo)系統(tǒng)的發(fā)展提供有價值的見解。
評價指標(biāo)
我們使用均方根誤差來評分提交項,定義為:
其中是預(yù)測值,是n個實例中每個實例i的原始值。
提交文件
對測試集中的每個id
,你必須預(yù)測對應(yīng)的score
(參見數(shù)據(jù)頁面的描述)。文件應(yīng)包含一個表頭,格式如下:
id,score
0000aaaa,1.0
2222bbbb,2.0
4444cccc,3.0
...
數(shù)據(jù)描述
競賽數(shù)據(jù)集包含了大約5000份用戶輸入日志,如鍵盤和鼠標(biāo)點(diǎn)擊,這些都是在作文過程中捕獲的。每篇作文的評分在0到6的范圍內(nèi)。參賽者的目標(biāo)是根據(jù)用戶輸入日志來預(yù)測一篇作文的評分。
文件和字段信息:
train_logs.csv
- 用于訓(xùn)練的數(shù)據(jù)輸入日志。-
id
- 文章的唯一ID -
event_id
- 事件的索引,按時間順序排列 -
down_time
- 鍵盤/鼠標(biāo)按下的時間,毫秒 -
up_time
- 鍵盤/鼠標(biāo)釋放的時間,毫秒 -
action_time
- 事件持續(xù)時間(down_time和up_time之差)
-
activity
- 事件所屬的活動類別-
Nonproduction
- 事件不會改變文本 -
Input
- 事件向文檔添加文本 -
Remove/Cut
- 事件從文檔中刪除文本 -
Paste
- 事件通過粘貼輸入改變文本 -
Replace
- 事件用另一個字符串替換一段文本
-
-
Move From [x1, y1] To [x2, y2]
- 事件將文本從字符索引x1,y1移動到新的位置x2,y2 -
down_event
- 鍵盤/鼠標(biāo)按下時的事件名稱 -
up_event
- 鍵盤/鼠標(biāo)釋放時的事件名稱 -
text_change
- 事件導(dǎo)致的文本更改(如果有) -
cursor_position
- 事件后文本光標(biāo)的字符索引 -
word_count
- 事件后文檔的詞數(shù)
注意測試集中可能存在訓(xùn)練集中沒有出現(xiàn)過的事件。
-
test_logs.csv
- 用于測試的數(shù)據(jù)輸入日志。 train_scores.csv
-
id
- 文章的唯一ID -
score
- 文章的分?jǐn)?shù)(滿分6分,預(yù)測目標(biāo))
-
-
sample_submission.csv
- 正確格式的提交文件示例。
時間安排
-
2023 年 10 月 2 日 - 開始日期
-
2024 年 1 月 2 日 - 報名截止日期
-
2024 年 1 月 2 日 - 合并截止日期
-
2024 年 1 月 9 日 - 提交截止日期
賽題獎金
排行榜
-
第一名 - 12,000美元
-
第二名 - 8,000美元
-
第三名 - 5,000美元
效率獎
-
第一名 - 15,000美元
-
第二名 - 10,000美元
-
第三名 - 5,000美元
關(guān)注下方【學(xué)姐帶你玩AI】🚀🚀🚀
回復(fù)“比賽”獲取190+場比賽top方案(kaggle、天池、ccf...)
碼字不易,歡迎大家點(diǎn)贊評論收藏!