中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁(yè) > news >正文

app開發(fā)定制軟件公司站長(zhǎng)之家seo一點(diǎn)詢

app開發(fā)定制軟件公司,站長(zhǎng)之家seo一點(diǎn)詢,下載京東購(gòu)物商城app,asp網(wǎng)站下用php欄目本文是LLM系列文章,針對(duì)《LM-INFINITE: SIMPLE ON-THE-FLY LENGTH GENERALIZATION FOR LARGE LANGUAGE MODELS》的翻譯。 LM-INFiNITE:大語(yǔ)言模型的一個(gè)簡(jiǎn)單長(zhǎng)度上推廣 摘要1 引言2 相關(guān)工作3 LLMs中OOD因素的診斷4 LM-INFINITE5 評(píng)估6 結(jié)論和未來(lái)工作 …

本文是LLM系列文章,針對(duì)《LM-INFINITE: SIMPLE ON-THE-FLY LENGTH GENERALIZATION FOR LARGE LANGUAGE MODELS》的翻譯。

LM-INFiNITE:大語(yǔ)言模型的一個(gè)簡(jiǎn)單長(zhǎng)度上推廣

  • 摘要
  • 1 引言
  • 2 相關(guān)工作
  • 3 LLMs中OOD因素的診斷
  • 4 LM-INFINITE
  • 5 評(píng)估
  • 6 結(jié)論和未來(lái)工作

摘要

近年來(lái),基于Transformer的大型語(yǔ)言模型(LLM)在各個(gè)領(lǐng)域的性能都有了顯著的進(jìn)步。隨著這些LLM被部署用于越來(lái)越復(fù)雜的任務(wù),它們通常需要進(jìn)行更長(zhǎng)的推理過(guò)程或理解更大的上下文。在這些情況下,LLM在長(zhǎng)序列上的長(zhǎng)度泛化失敗變得更加突出。大多數(shù)預(yù)訓(xùn)練方案將訓(xùn)練序列截?cái)酁楣潭ㄩL(zhǎng)度(例如對(duì)于LLaMa為2048)。LLM通常很難在較長(zhǎng)的上下文后生成流暢的文本,更不用說(shuō)執(zhí)行下游任務(wù)了,即使是為了解決這個(gè)問(wèn)題而設(shè)計(jì)的相對(duì)位置編碼。常見(jiàn)的解決方案,如在較長(zhǎng)的語(yǔ)料庫(kù)上進(jìn)行微調(diào),通常涉及令人生畏的硬件和時(shí)間成本,并且需要仔細(xì)的訓(xùn)練過(guò)程設(shè)計(jì)。為了更有效地利用現(xiàn)有LLM的生成能力,我們從理論和實(shí)證上研究了導(dǎo)致這一問(wèn)題的主要分布外(OOD)因素。受此診斷的啟發(fā),我們提出了一種簡(jiǎn)單而有效的飛行長(zhǎng)度泛化解決方案LM Infinite,它只涉及 Λ \Lambda Λ形注意力掩碼和距離限制,而不需要參數(shù)更新或?qū)W習(xí)。我們發(fā)現(xiàn)它適用于使用相對(duì)位置編碼方法的各種LLM。LM Infinite在 O ( n ) \mathcal{O}(n) O(n)時(shí)間和空間上具有計(jì)算效率,并在ArXiv和OpenWebText2數(shù)據(jù)集上對(duì)多達(dá)32k個(gè)token表現(xiàn)出一致的流暢性和生成質(zhì)量,解碼速度提高了2.72倍。在諸如密鑰檢索之類的下游任務(wù)中,它繼續(xù)處理比普通模型立即失敗的訓(xùn)練長(zhǎng)度長(zhǎng)得多的輸入。

1 引言

2 相關(guān)工作

3 LLMs中OOD因素的診斷

4 LM-INFINITE

5 評(píng)估

6 結(jié)論和未來(lái)工作

在本文中,我們對(duì)具有相對(duì)位置編碼的基于Transformer的LLM中的長(zhǎng)度泛化問(wèn)題提供了解釋和簡(jiǎn)單的即時(shí)解決方案。我們首先對(duì)可能導(dǎo)致長(zhǎng)度泛化失敗的OOD(分布外)因素進(jìn)行理論和實(shí)證分析?;谶@些直覺(jué),我們提出了LM Infinite,一種無(wú)需任何參數(shù)更新的即插即用的治療方法。我們的經(jīng)驗(yàn)評(píng)估表明,我們可以讓多個(gè)開源SoTA LLM保持其原始生成質(zhì)量,類似于明確微調(diào)后的性能。LM Infinite還將任務(wù)求解能力擴(kuò)展到比訓(xùn)練樣本長(zhǎng)得多的序列。未來(lái)的工作可以探索如何讓LM Infinite更好地感知被掩蓋的注意力區(qū)域中的信息。我們希望LM Infinite的計(jì)算效率和易用性使沒(méi)有大量計(jì)算資源的研究人員也能在長(zhǎng)序列上使用LLM。

http://www.risenshineclean.com/news/9648.html

相關(guān)文章:

  • 南陽(yáng)seo網(wǎng)站推廣費(fèi)用國(guó)外服務(wù)器免費(fèi)ip地址
  • 常州網(wǎng)站制作企業(yè)百度平臺(tái)我的訂單
  • 卡盟網(wǎng)站建設(shè)搜索引擎優(yōu)化排名技巧
  • 電商網(wǎng)站設(shè)計(jì)周志如何寫軟文賺錢
  • 網(wǎng)站上面的內(nèi)容里面放照片怎么做的網(wǎng)絡(luò)域名怎么查
  • 做網(wǎng)站建設(shè)百度網(wǎng)站的域名地址
  • 怎么對(duì)網(wǎng)站做壓力測(cè)試seo排名優(yōu)化價(jià)格
  • wordpress靜態(tài)ip上海優(yōu)化外包
  • 合肥政務(wù)新區(qū)建設(shè)局網(wǎng)站百度搜索引擎的功能
  • 莆田有哪幾家做網(wǎng)站設(shè)計(jì)的全球網(wǎng)站排名前100
  • 建筑工程有限責(zé)任公司搜索引擎優(yōu)化教程
  • 公司網(wǎng)站的建站要點(diǎn)seo還有前景嗎
  • 西安網(wǎng)站設(shè)計(jì)品牌詞優(yōu)化
  • 華碩路由器做網(wǎng)站什么軟件可以發(fā)帖子做推廣
  • 做電商有哪些網(wǎng)站推廣平臺(tái)收費(fèi)標(biāo)準(zhǔn)
  • 上海網(wǎng)站改版服務(wù)百度葷seo公司
  • 小米手機(jī)做網(wǎng)站服務(wù)器嗎網(wǎng)站排名優(yōu)化公司
  • 哈爾濱快速建站案例百度識(shí)圖網(wǎng)頁(yè)版入口
  • 彩票網(wǎng)站怎么做的營(yíng)銷模式
  • 凡科做網(wǎng)站不要錢seo搜索引擎入門教程
  • 做報(bào)名網(wǎng)站中國(guó)國(guó)家培訓(xùn)網(wǎng)是真的嗎
  • spd2007怎么創(chuàng)建網(wǎng)站品牌推廣的意義
  • 網(wǎng)站開發(fā)代理報(bào)價(jià)表成都私人網(wǎng)站制作
  • 北京做網(wǎng)站在線html5制作網(wǎng)站
  • 泰安人力資源招聘長(zhǎng)沙靠譜關(guān)鍵詞優(yōu)化服務(wù)
  • 獨(dú)立設(shè)計(jì)購(gòu)物網(wǎng)站網(wǎng)絡(luò)推廣方案范例
  • 網(wǎng)站seo優(yōu)化關(guān)鍵詞國(guó)內(nèi)外搜索引擎大全
  • 學(xué)校網(wǎng)站設(shè)計(jì)的作用營(yíng)銷平臺(tái)建設(shè)
  • wordpress限制站點(diǎn)使用時(shí)間河南品牌網(wǎng)站建設(shè)
  • 最基本的網(wǎng)絡(luò)營(yíng)銷站點(diǎn)西安優(yōu)化網(wǎng)站公司