中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁 > news >正文

大芬地鐵站附近做網(wǎng)站百度收錄規(guī)則

大芬地鐵站附近做網(wǎng)站,百度收錄規(guī)則,鄭州企業(yè)建網(wǎng)站制作,免費(fèi)的好網(wǎng)站Optiver股票大賽Top2開源! ↑↑↑關(guān)注后"星標(biāo)"kaggle競賽寶典 作者:杰少 Optiver第二名方案解讀 簡介 Optiver競賽已經(jīng)于今天結(jié)束了,競賽也出現(xiàn)了極端情況,中間斷崖式的情況,在Kaggle過往的競賽中&#…

Optiver股票大賽Top2開源!

↑↑↑關(guān)注后"星標(biāo)"kaggle競賽寶典?

作者:杰少

Optiver第二名方案解讀

簡介

Optiver競賽已經(jīng)于今天結(jié)束了,競賽也出現(xiàn)了極端情況,中間斷崖式的情況,在Kaggle過往的競賽中,一般出現(xiàn)這種情況的情況有三種:

  • 過擬合排行榜數(shù)據(jù),例如一些回歸問題中,極值的測試;

  • 匿名數(shù)據(jù)中存在某些特定的關(guān)系,常見于數(shù)據(jù)被特殊處理的問題中,逆向特征工程;

  • 特殊指標(biāo)的問題,一些后處理技巧等;

而本次比賽,也不例外,從賽后和前五的選手交流以及目前第二名選手的開源的來看,幾乎全部都涉及到了時間信息的逆向特征工程。本篇文章,我們就一起解讀一下該次競賽。

開源的代碼可以在后臺回復(fù):Optiver獲取,當(dāng)然也可以去kaggle code處尋找。

方案解讀

01

時間逆向特征

逆向的思路是:在本次競賽中,因?yàn)楦傎悢?shù)據(jù)是經(jīng)過匿名化的,但是我們可以使用tick size來恢復(fù)在匿名之前的真實(shí)價格;

  • tick size:是報價中最小的價格增量。https://en.wikipedia.org/wiki/Tick_size

使用計算得到的price,展開成下面的矩陣:

其中為time_id的個數(shù),S是股票的個數(shù),然后每個值是某個股票在某個時間點(diǎn)的price,剩下的就是基于該矩陣還原time_id的真實(shí)順序,該處直接使用了TSNE將其壓縮到qin

圖片

03

特征工程

3.1 特征構(gòu)建

如果我們能以非常高的精度得到我們的數(shù)據(jù)產(chǎn)出順序,那么未來階段的RV很明顯就是非常重要的特征,這邊,使用許都距離metric來尋找最近的N個時間并計算RV的平均值等特征。

圖片

target_feature?=?'book.log_return1.realized_volatility'
n_max?=?40#?make?neighbors
pivot?=?df.pivot('time_id',?'stock_id',?'price')
pivot?=?pivot.fillna(pivot.mean())
pivot?=?pd.DataFrame(minmax_scale(pivot))nn?=?NearestNeighbors(n_neighbors=n_max,?p=1)
nn.fit(pivot)
neighbors?=?nn.kneighbors(pivot)#?aggregatedef?make_nn_feature(df,?neighbors,?f_col,?n=5,?agg=np.mean,?postfix=''):pivot_aggs?=?pd.DataFrame(agg(neighbors[1:n,:,:],?axis=0),?columns=feature_pivot.columns,?index=feature_pivot.index)dst?=?pivot_aggs.unstack().reset_index()dst.columns?=?['stock_id',?'time_id',?f'{f_col}_cluster{n}{postfix}_{agg.__name__}']return?dstfeature_pivot?=?df.pivot('time_id',?'stock_id',?target_feature)
feature_pivot?=?feature_pivot.fillna(feature_pivot.mean())neighbor_features?=?np.zeros((n_max,?*feature_pivot.shape))for?i?in?range(n):neighbor_features[i,?:,?:]?+=?feature_pivot.values[neighbors[:,?i],?:]for?n?in?[2,?3,?5,?10,?20,?40]:dst?=?make_nn_feature(df,?neighbors,?feature_pivot,?n)df?=?pd.merge(df,?dst,?on=['stock_id',?'time_id'],?how='left')

3.2 特征處理

基于時間序列的對抗驗(yàn)證,我們發(fā)現(xiàn)非常多的特征隨著時間的變化影響很大,例如order_count和total_volume這些,所以我們將其轉(zhuǎn)化為在某個時間點(diǎn)的rank進(jìn)行處理,與此同時,使用np.log1p對大的skew大的值進(jìn)行處理。

04

建模

模型處和開源的是類似的,1DCNN+MLP+LGB,其實(shí)我們發(fā)現(xiàn)TabNet在本次競賽中效果也非常不錯,不過考慮到時間原因,沒有再使用。

圖片

這些模型影響應(yīng)該不是非常大,應(yīng)該也不是核心。

參考文獻(xiàn)

圖片

  1. public 2nd place solution

  2. Public 2nd Place Solution - Nearest Neighbors

http://www.risenshineclean.com/news/23048.html

相關(guān)文章:

  • b2b網(wǎng)站用戶體驗(yàn)重慶網(wǎng)站seo多少錢
  • 如何阿里巴巴網(wǎng)站做推廣方案seo外鏈工具源碼
  • 安卓手機(jī)做網(wǎng)站seo建站平臺哪家好
  • 河北漢佳 做網(wǎng)站的公司百度地圖網(wǎng)頁版
  • 網(wǎng)站建設(shè)基本流程重慶關(guān)鍵詞優(yōu)化
  • 做設(shè)計需要素材的常用網(wǎng)站有哪些營銷助手下載app下載
  • 設(shè)計網(wǎng)站公司地址深圳全網(wǎng)營銷系統(tǒng)
  • 合肥市門窗工程在哪個網(wǎng)站接活做百度seo點(diǎn)擊工具
  • 如何建立免費(fèi)網(wǎng)站的步驟太原建站seo
  • 哪里有做網(wǎng)站服務(wù)商seo研究學(xué)院
  • WordPress與其它谷歌sem和seo區(qū)別
  • 網(wǎng)站建設(shè)和網(wǎng)袷宣傳參考網(wǎng)是合法網(wǎng)站嗎?
  • 內(nèi)容展示類網(wǎng)站seo中文意思是
  • 北京軟件開發(fā)公司排紹興seo
  • 外貿(mào)soho 網(wǎng)站建設(shè)熱狗網(wǎng)站排名優(yōu)化外包
  • 學(xué)做軟件的網(wǎng)站谷歌瀏覽器免費(fèi)入口
  • 企業(yè)做網(wǎng)站需要花多少錢搜索引擎seo關(guān)鍵詞優(yōu)化效果
  • 怎么做網(wǎng)站生意線上宣傳渠道有哪些
  • 商丘網(wǎng)站制作軟件西安seo外包優(yōu)化
  • 豐臺網(wǎng)站制作營銷網(wǎng)站定制
  • 如何找人幫我做網(wǎng)站推廣網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)軟件
  • 公司做網(wǎng)站合肥網(wǎng)站制作推廣
  • 期刊網(wǎng)站建設(shè)湘潭網(wǎng)頁設(shè)計
  • 什么網(wǎng)站做ppt模板百度電話號碼查詢平臺
  • 盧灣企業(yè)微信網(wǎng)站制作seo實(shí)戰(zhàn)密碼在線閱讀
  • 手機(jī)網(wǎng)站設(shè)計案濟(jì)南百度快照推廣公司
  • 基礎(chǔ)建設(shè)龍頭股seo做的比較牛的公司
  • 網(wǎng)站效果圖怎么做seo查詢愛站
  • 怎么申請免費(fèi)企業(yè)郵箱賬號上海優(yōu)化公司有哪些
  • 服務(wù)專業(yè)建設(shè)武漢官網(wǎng)優(yōu)化公司