中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁(yè) > news >正文

wordpress地圖怎么實(shí)現(xiàn)seow是什么意思

wordpress地圖怎么實(shí)現(xiàn),seow是什么意思,西安疫情最新進(jìn)展,家教網(wǎng)站建設(shè)的推廣有時(shí),根據(jù)測(cè)試集的精度衡量,模型表現(xiàn)得非常出色。 但是當(dāng)數(shù)據(jù)分布突然改變時(shí),模型在部署中會(huì)出現(xiàn)災(zāi)難性的失敗。 有時(shí)模型的部署本身就是擾亂數(shù)據(jù)分布的催化劑。 舉一個(gè)有點(diǎn)荒謬卻可能真實(shí)存在的例子。 假設(shè)我們訓(xùn)練了一個(gè)貸款申請(qǐng)人違約風(fēng)險(xiǎn)…

有時(shí),根據(jù)測(cè)試集的精度衡量,模型表現(xiàn)得非常出色。 但是當(dāng)數(shù)據(jù)分布突然改變時(shí),模型在部署中會(huì)出現(xiàn)災(zāi)難性的失敗。
有時(shí)模型的部署本身就是擾亂數(shù)據(jù)分布的催化劑。 舉一個(gè)有點(diǎn)荒謬卻可能真實(shí)存在的例子。 假設(shè)我們訓(xùn)練了一個(gè)貸款申請(qǐng)人違約風(fēng)險(xiǎn)模型,用來(lái)預(yù)測(cè)誰(shuí)將償還貸款或違約。 這個(gè)模型發(fā)現(xiàn)申請(qǐng)人的鞋子與違約風(fēng)險(xiǎn)相關(guān)(穿牛津鞋申請(qǐng)人會(huì)償還,穿運(yùn)動(dòng)鞋申請(qǐng)人會(huì)違約)。 此后,這個(gè)模型可能傾向于向所有穿著牛津鞋的申請(qǐng)人發(fā)放貸款,并拒絕所有穿著運(yùn)動(dòng)鞋的申請(qǐng)人。
本章會(huì)揭露揭示一些常見的問(wèn)題

1 分布偏移的類型

1.1協(xié)變量偏移

指的是訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)的輸入分布不同,但條件分布 P ( y ∣ x ) P(y∣x) P(yx) 保持不變,即輸入的分布可能隨時(shí)間而改變, 但標(biāo)簽函數(shù)(即條件分布
)沒(méi)有改變。

以區(qū)分貓狗為例,下面是訓(xùn)練集用的圖像:
在這里插入圖片描述
下面是測(cè)試集用的圖像,即對(duì)下面的圖像進(jìn)行分類:
在這里插入圖片描述
訓(xùn)練集由真實(shí)照片組成,而測(cè)試集只包含卡通圖片。 假設(shè)在一個(gè)與測(cè)試集的特征有著本質(zhì)不同的數(shù)據(jù)集上進(jìn)行訓(xùn)練, 如果沒(méi)有方法來(lái)適應(yīng)新的領(lǐng)域,可能會(huì)有麻煩。

1.2 標(biāo)簽偏移

指的是訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)的標(biāo)簽分布不同,但條件分布 P ( x ∣ y ) P(x∣y) P(xy)保持不變。即標(biāo)簽的邊際分布發(fā)生了變化,而給定標(biāo)簽的輸入特征分布保持不變。

以開發(fā)一個(gè)疾病診斷模型為例:

  • 在 A 醫(yī)院收集了很多患者的診斷數(shù)據(jù),進(jìn)行模型訓(xùn)練,可能因?yàn)?A 醫(yī)院專長(zhǎng)于某種疾病,該疾病的比例在數(shù)據(jù)中非常高。
  • 你在 B 醫(yī)院測(cè)試模型,但是B醫(yī)院的患者數(shù)據(jù)標(biāo)簽分布與A醫(yī)院不同,可能該疾病的患者比例較低,由于訓(xùn)練集和測(cè)試集的標(biāo)簽分布不同,模型可能更傾向于預(yù)測(cè)該病

1.3 概念偏移

指的是輸入數(shù)據(jù)與標(biāo)簽之間的關(guān)系發(fā)生了變化,即條件分布 P ( y ∣ x ) P(y∣x) P(yx) 發(fā)生變化。這種變化通常出現(xiàn)在模型部署后的實(shí)際應(yīng)用中,環(huán)境、用戶行為、市場(chǎng)趨勢(shì)等隨時(shí)間改變,導(dǎo)致原有模型不再準(zhǔn)確。

以金融欺詐檢測(cè)為例:

  • 訓(xùn)練階段:模型學(xué)到了根據(jù)歷史交易特征(如金額、時(shí)間、地點(diǎn))來(lái)預(yù)測(cè)是否是欺詐行為。
  • 部署后:欺詐者的行為模式改變,使用新的手段進(jìn)行欺詐,因此同樣的交易特征可能不再代表欺詐行為。

2 分布偏移糾正

2.1 經(jīng)驗(yàn)風(fēng)險(xiǎn)和實(shí)際風(fēng)險(xiǎn)

經(jīng)驗(yàn)風(fēng)險(xiǎn):指模型在給定訓(xùn)練數(shù)據(jù)集上所犯錯(cuò)誤的平均值

經(jīng)驗(yàn)風(fēng)險(xiǎn)(empirical risk)是為了近似 真實(shí)風(fēng)險(xiǎn)(true risk), 整個(gè)訓(xùn)練數(shù)據(jù)上的平均損失,即從其真實(shí)分布 p ( x , y ) p(x,y) p(x,y)中抽取的所有數(shù)據(jù)的總體損失的期望值:
在這里插入圖片描述

2.2 協(xié)變量偏移糾正

我們可以通過(guò)在真實(shí)風(fēng)險(xiǎn)的計(jì)算中,使用以下簡(jiǎn)單的恒等式來(lái)進(jìn)行糾正:
∫ ∫ l ( f ( x ) , y ) p ( y ∣ x ) p ( x ) d x d y = ∫ ∫ l ( f ( x ) , y ) q ( y ∣ x ) q ( x ) p ( x ) q ( x ) d x d y . \begin{aligned} \int\int l(f(\mathbf{x}), y) p(y \mid \mathbf{x})p(\mathbf{x}) \;d\mathbf{x}dy = \int\int l(f(\mathbf{x}), y) q(y \mid \mathbf{x})q(\mathbf{x})\frac{p(\mathbf{x})}{q(\mathbf{x})} \;d\mathbf{x}dy. \end{aligned} ∫∫l(f(x),y)p(yx)p(x)dxdy=∫∫l(f(x),y)q(yx)q(x)q(x)p(x)?dxdy.?
即根據(jù)數(shù)據(jù)來(lái)自正確分布與來(lái)自錯(cuò)誤分布的概率之比, 來(lái)重新衡量每個(gè)數(shù)據(jù)樣本的權(quán)重:
β i = d e f p ( x i ) q ( x i ) . \beta_i \stackrel{\mathrm{def}}{=} \frac{p(\mathbf{x}_i)}{q(\mathbf{x}_i)}. βi?=defq(xi?)p(xi?)?.

將權(quán)重 β i \beta_{i} βi?代入到每個(gè)數(shù)據(jù)樣本 ( x i , y i ) (\mathbf{x}_i, y_i) (xi?,yi?)中, 我們可以使用”加權(quán)經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化“來(lái)訓(xùn)練模型:
m i n i m i z e f 1 n ∑ i = 1 n β i l ( f ( x i ) , y i ) . \mathop{\mathrm{minimize}}_f \frac{1}{n} \sum_{i=1}^n \beta_i l(f(\mathbf{x}_i), y_i). minimizef?n1?i=1n?βi?l(f(xi?),yi?).

由于不知道這個(gè)比率,我們需要估計(jì)它,這里使用對(duì)數(shù)幾率回歸(logistic regression)

現(xiàn)在,我們來(lái)看一下完整的協(xié)變量偏移糾正算法。 假設(shè)我們有一個(gè)訓(xùn)練集 { ( x 1 , y 1 ) , … , ( x n , y n ) } \{(\mathbf{x}_1, y_1), \ldots, (\mathbf{x}_n, y_n)\} {(x1?,y1?),,(xn?,yn?)}和一個(gè)未標(biāo)記的測(cè)試集 { u 1 , … , u m } \{\mathbf{u}_1, \ldots, \mathbf{u}_m\} {u1?,,um?}.。對(duì)于協(xié)變量偏移,我們假設(shè) 1 ≤ i ≤ n 1 \leq i \leq n 1in x i x_{i} xi?來(lái)自某個(gè)源分布, u i \mathbf{u}_i ui?來(lái)自目標(biāo)分布。 以下是糾正協(xié)變量偏移的典型算法:
在這里插入圖片描述

2.3 標(biāo)簽偏移糾正

重要性加權(quán)是一種常用的技術(shù),用于調(diào)整模型的訓(xùn)練過(guò)程,使其更好地適應(yīng)測(cè)試數(shù)據(jù)的標(biāo)簽分布。通過(guò)為訓(xùn)練數(shù)據(jù)中的每個(gè)樣本分配權(quán)重,使得樣本的影響程度與其在測(cè)試集中的重要性相匹配。

步驟:
1、估計(jì)訓(xùn)練集和測(cè)試集的標(biāo)簽分布:

  • ? P t r a i n ( y ) P_{train}(y) Ptrain?(y):訓(xùn)練集中的標(biāo)簽分布
  • ? P t e s t ( y ) P_{test}(y) Ptest?(y):測(cè)試集中的標(biāo)簽分布

2、計(jì)算權(quán)重:
w e i g h t ( y ) = P t e s t ( y ) P t r a i n ( y ) weight(y)=\frac{P_{test}(y)}{P_{train}(y)} weight(y)=Ptrain?(y)Ptest?(y)?

3、在訓(xùn)練過(guò)程中,對(duì)每個(gè)樣本的損失進(jìn)行加權(quán):
w e i g h t e d l o s s = ∑ i w e i g h t ( y i ) ? L ( f ( x i , θ ) , y i ) weighted loss= \sum_{i} weight(y_{i}) ·L(f(x_{i},\theta),y_{i}) weightedloss=i?weight(yi?)?L(f(xi?,θ),yi?)

通過(guò)這種方式,模型在訓(xùn)練時(shí)會(huì)更重視那些在測(cè)試集中頻繁出現(xiàn)的標(biāo)簽。

2.4 概念偏移糾正

使用新數(shù)據(jù)更新現(xiàn)有的網(wǎng)絡(luò)權(quán)重,而不是從頭開始訓(xùn)練。

3 學(xué)習(xí)問(wèn)題的分類法

有了如何處理分布變化的知識(shí),我們現(xiàn)在可以考慮機(jī)器學(xué)習(xí)問(wèn)題形式化的其他方面。

3.1 批量學(xué)習(xí)

在批量學(xué)習(xí)(batch learning)中,我們可以訪問(wèn)一組訓(xùn)練特征和標(biāo)簽 { ( x 1 , y 1 ) , … , ( x n , y n ) } \{(\mathbf{x}_1, y_1), \ldots, (\mathbf{x}_n, y_n)\} {(x1?,y1?),,(xn?,yn?)}, 我們使用這些特性和標(biāo)簽訓(xùn)練 f ( x ) f(\mathbf{x}) f(x)。 然后,我們部署此模型來(lái)對(duì)來(lái)自同一分布的新數(shù)據(jù) ( x , y ) (\mathbf{x}, y) (x,y)進(jìn)行評(píng)分。

例如,我們可以根據(jù)貓和狗的大量圖片訓(xùn)練貓檢測(cè)器。 一旦我們訓(xùn)練了它,我們就把它作為智能貓門計(jì)算視覺(jué)系統(tǒng)的一部分,來(lái)控制只允許貓進(jìn)入。 然后這個(gè)系統(tǒng)會(huì)被安裝在客戶家中,基本再也不會(huì)更新。

3.2 在線學(xué)習(xí)

在線學(xué)習(xí)是一種逐步更新模型的方法。在這種學(xué)習(xí)模式下,模型在接收到新數(shù)據(jù)后會(huì)立即進(jìn)行更新,而不需要在訓(xùn)練結(jié)束后一次性處理所有數(shù)據(jù)。與傳統(tǒng)的批量學(xué)習(xí)(Batch Learning)相對(duì),后者通常在收集完所有數(shù)據(jù)后進(jìn)行訓(xùn)練。

例如,在實(shí)時(shí)推薦系統(tǒng)中,在用戶行為不斷變化的場(chǎng)景中,在線學(xué)習(xí)可以根據(jù)最新的用戶活動(dòng)實(shí)時(shí)調(diào)整推薦算法。

3.3 老虎機(jī)

老虎機(jī)問(wèn)題是在線學(xué)習(xí)中的一個(gè)經(jīng)典特例,旨在解決探索與利用之間的權(quán)衡。該問(wèn)題可以通過(guò)“老虎機(jī)”來(lái)形象化,想象有多個(gè)老虎機(jī),每個(gè)老虎機(jī)都有不同的中獎(jiǎng)概率。玩家的目標(biāo)是在有限的嘗試次數(shù)內(nèi)最大化其總獎(jiǎng)勵(lì)。

例如,在線廣告投放,即在多個(gè)廣告選項(xiàng)中選擇以最大化點(diǎn)擊率。

3.4 控制

3.5 強(qiáng)化學(xué)習(xí)

http://www.risenshineclean.com/news/7675.html

相關(guān)文章:

  • 南山網(wǎng)站制作聯(lián)系電話站長(zhǎng)統(tǒng)計(jì)ios
  • 專業(yè)的網(wǎng)站建設(shè)seo常見優(yōu)化技術(shù)
  • wordpress調(diào)用欄目合肥優(yōu)化營(yíng)商環(huán)境
  • 電子商務(wù)查詢網(wǎng)站獨(dú)立站
  • 投資公司注冊(cè)需要什么資質(zhì)優(yōu)化模型的推廣
  • 國(guó)內(nèi)外畫畫做的好網(wǎng)站百度識(shí)圖網(wǎng)頁(yè)版在線
  • 國(guó)外html模板網(wǎng)站搜索引擎排名優(yōu)化程序
  • 自己做網(wǎng)站很難全國(guó)免費(fèi)發(fā)布廣告信息
  • 網(wǎng)站積分解決方案百度下載電腦版
  • 網(wǎng)站公司技術(shù)交接蘭州做網(wǎng)站的公司
  • 哪個(gè)網(wǎng)站可以做前端項(xiàng)目有沒(méi)有可以代理推廣的平臺(tái)
  • 織夢(mèng)做企業(yè)網(wǎng)站教程重慶seo博客
  • 幼兒園網(wǎng)站建設(shè)情況統(tǒng)計(jì)表寧波網(wǎng)站推廣優(yōu)化哪家正規(guī)
  • 深圳網(wǎng)站優(yōu)化方法網(wǎng)絡(luò)銷售培訓(xùn)學(xué)校
  • 尺寸在線做圖網(wǎng)站免費(fèi)關(guān)鍵詞排名優(yōu)化軟件
  • 微信群運(yùn)營(yíng)杭州搜索引擎優(yōu)化公司
  • 網(wǎng)站策劃報(bào)告怎么寫第三方關(guān)鍵詞優(yōu)化排名
  • 樂(lè)陵最新疫情最新消息寧波seo網(wǎng)頁(yè)怎么優(yōu)化
  • 怎樣運(yùn)營(yíng)網(wǎng)站代運(yùn)營(yíng)公司排名
  • 中國(guó)建設(shè)銀行官方網(wǎng)站登錄入口seo推廣招聘
  • 在哪里可以找到做網(wǎng)站的公司手游推廣去哪里找客源
  • 阿里云怎么部署網(wǎng)站網(wǎng)站排名靠前的方法
  • 阿里國(guó)際站韓語(yǔ)網(wǎng)站怎么做軟文發(fā)布平臺(tái)排名
  • 制作網(wǎng)站的登錄界面怎么做福州seo經(jīng)理招聘
  • 威海城市 建設(shè)信息網(wǎng)站網(wǎng)址注冊(cè)查詢
  • wordpress傻瓜建站教程網(wǎng)站推廣的優(yōu)化
  • 怎么做一個(gè)手機(jī)網(wǎng)站app拉新項(xiàng)目一手渠道商
  • 保山網(wǎng)站開發(fā)服務(wù)百度的廣告怎么免費(fèi)發(fā)布
  • 微信公眾號(hào)文章怎么轉(zhuǎn)換wordpressseo搜索引擎優(yōu)化課程
  • 一鍵轉(zhuǎn)發(fā)軟件批發(fā)商城seo什么意思