中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁 > news >正文

云南房產(chǎn)網(wǎng)站建設(shè)seo的理解

云南房產(chǎn)網(wǎng)站建設(shè),seo的理解,嘉興建設(shè)中學(xué)網(wǎng)站,網(wǎng)站建設(shè)步驟一、前言 本文章作為學(xué)習(xí)2023年《李宏毅機器學(xué)習(xí)課程》的筆記,感謝臺灣大學(xué)李宏毅教授的課程,respect!!! 讀這篇文章必須先了解self-attention,可參閱我上一篇。 二、大綱 Transformer問世原理剖析模型訓(xùn)…

一、前言

本文章作為學(xué)習(xí)2023年《李宏毅機器學(xué)習(xí)課程》的筆記,感謝臺灣大學(xué)李宏毅教授的課程,respect!!!
讀這篇文章必須先了解self-attention,可參閱我上一篇。

二、大綱

  • Transformer問世
  • 原理剖析
  • 模型訓(xùn)練

三、Transformer問世

2017 年在文章《Attention Is All You Need》被提出的。應(yīng)用于seq2seq模型,當(dāng)時直接轟動。

四、原理剖析

兩部分組成:Encoder 和 Decoder

  • Encoder 結(jié)構(gòu)
    接下來從大到小一層層剝開:

剝一下:
輸入一排向量,輸出一排向量
在這里插入圖片描述
剝兩下:
Encoder 由多個Block組成,串聯(lián)起來
在這里插入圖片描述
剝?nèi)?#xff1a;
Block裝的是啥?原來是Self-attention!
在這里插入圖片描述
剝四下:
Self-attention原來加入了residual和Layer Normal,至此剝完了。
在這里插入圖片描述

說明:
上圖自底向上看,關(guān)鍵點:
1、residual結(jié)構(gòu),輸入接到輸出送入下一層,殘差結(jié)構(gòu);
2、Layer Normal,具體如下圖:
在這里插入圖片描述
算出標(biāo)準(zhǔn)差和均值后,套用公式計算即可。

以上就是Encoder的全部了!
論文中是這么畫圖表達(dá)的:
在這里插入圖片描述
注:Positional Encoding是self-attention的位置資訊。

  • Decoder 結(jié)構(gòu)
    有兩種方法生成輸出:Auto Regressive 和 Non Auto Regressive。

Auto Regressive
在這里插入圖片描述
給個START符號,把本次輸出當(dāng)做是下一次的輸入,依序進行下去。

Non Auto Regressive
在這里插入圖片描述
輸入是一排的START符號,一下子梭哈突出一排輸出。

Encoder結(jié)構(gòu)長啥樣?

接下來看下結(jié)構(gòu)長啥樣,先遮住不一樣的部分,其他部分結(jié)構(gòu)基本一致,只不過這里用上了Masked Multi-Head Attention
在這里插入圖片描述

Masked Multi-Head Attention
啥是Masked Multi-Head Attention?Masked有啥含義?
可以直接理解為單向的Multi-Head Attention,而且是從左邊開始:
在這里插入圖片描述
說明:這也很好理解,右邊的字符都還沒輸出出來怎么做運算,因此只能是已經(jīng)吐出來的左邊的內(nèi)容做self-attention,這就是masked的含義。

遮住的部分是啥?(cross attention)

最后這邊遮住的部分到底是啥玩意?
別想太復(fù)雜,就還是self-attention。
corss的意思就是v,k來自Encoder,q來自Decoder,僅此而已。
在這里插入圖片描述
在這里插入圖片描述
其實也好理解,Decoder是去還原結(jié)果的,那可不得抽下Encoder編碼時候的資訊和上下文語義信息才能還原,缺一不可。
比喻下,前者讓輸出緊扣題意,后者讓其說人話。

小結(jié)
至此,Transformer的結(jié)構(gòu)就闡述完了,無非就是Encoder + Decoder,建議自己在草稿紙上畫畫能夠加深印象。

五、模型訓(xùn)練

transformer的模型訓(xùn)練用的還是cross entropy。
在這里插入圖片描述
實戰(zhàn)過程中的tips

  • copy mechanism
    例如:
    Machine Translation(機器翻譯),可能使用原文復(fù)制這個技能對于模型而言比較容易,畢竟它不需要創(chuàng)造新詞匯了嘛,這就是copy mechanism。
  • Guided Attention
    在這里插入圖片描述

意思就是不要亂Attention,有的放矢地讓模型做attention。

  • Beam Search
    在這里插入圖片描述
    基本思想就是不要步步好,有可能短期不好但是長期更好。說的和人生似的。
    如果模型需要有點創(chuàng)造力,不適合用此方法,這是實做后的結(jié)論。

訓(xùn)練過程記得讓模型看些負(fù)樣本,不至于模型一步錯步步錯,(schedule sampling方法)。

五、小結(jié)

最基本的掌握好Encoder和Decoder就很可以了,其他的在實做過程中遇到問題再問問AI工具。

http://www.risenshineclean.com/news/62318.html

相關(guān)文章:

  • 鹽城z做網(wǎng)站上海專業(yè)的seo公司
  • 專業(yè)網(wǎng)站建設(shè)策劃網(wǎng)絡(luò)營銷和網(wǎng)絡(luò)推廣
  • 做測算的網(wǎng)站影視后期培訓(xùn)機構(gòu)全國排名
  • 湖南網(wǎng)站建設(shè) 真好磐石網(wǎng)絡(luò)免費推廣網(wǎng)址
  • 山東青島網(wǎng)站建設(shè)樂天seo視頻教程
  • 做門窗投標(biāo)網(wǎng)站優(yōu)化模型
  • 小學(xué)課程建設(shè)網(wǎng)站目標(biāo)新網(wǎng)域名查詢
  • 百度免費做網(wǎng)站百度在線使用網(wǎng)頁版
  • spring boot 做網(wǎng)站關(guān)鍵詞優(yōu)化推廣公司
  • 手機網(wǎng)站自動適應(yīng)短鏈接在線生成器
  • 山東平臺網(wǎng)站建設(shè)制作百度網(wǎng)頁版下載安裝
  • 住建部網(wǎng)站2015年城市建設(shè)統(tǒng)計seo優(yōu)化的優(yōu)點
  • 奉賢區(qū)網(wǎng)站建設(shè)收錄網(wǎng)站排名
  • 福田祥菱q雙排小貨車報價及圖片廈門seo推廣外包
  • 天津自己制作網(wǎng)站網(wǎng)站新站整站排名
  • 網(wǎng)站開發(fā)網(wǎng)頁設(shè)計游戲代理加盟平臺
  • seo兼職論壇手機優(yōu)化大師官網(wǎng)
  • 怎么快速推廣網(wǎng)站萬網(wǎng)域名交易
  • 建行信用卡網(wǎng)站登錄網(wǎng)站域名查詢系統(tǒng)
  • 那個網(wǎng)站做外貿(mào)好百度大搜是什么
  • dw做的網(wǎng)站鏈接不會跳轉(zhuǎn)什么是搜索引擎優(yōu)化
  • 做期貨網(wǎng)站微營銷平臺系統(tǒng)
  • 西寧網(wǎng)站設(shè)計制作公司品牌推廣軟文200字
  • 只做襯衫的網(wǎng)站關(guān)鍵詞采集軟件
  • 沈陽網(wǎng)站建設(shè)找哪家系統(tǒng)優(yōu)化軟件哪個好
  • 企業(yè)網(wǎng)站建設(shè)方案書范本域名批量查詢
  • 網(wǎng)站 續(xù)費商業(yè)策劃公司十大公司
  • 網(wǎng)站后端都需要什么意思網(wǎng)站交換鏈接的常見形式
  • 企業(yè)展示型電商網(wǎng)站模板google關(guān)鍵詞規(guī)劃師
  • php和什么語言做網(wǎng)站豬肉價格最新消息