中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁 > news >正文

網(wǎng)站設(shè)計培訓(xùn)seo信息優(yōu)化

網(wǎng)站設(shè)計培訓(xùn),seo信息優(yōu)化,網(wǎng)頁廣告屏蔽,沈陽鴻晟服裝有限公司的案例Contents IntroductionMethodExperimentsReferences Introduction CoT 推理可以有效提升 LLM 推理能力,但 few-shot prompting 無法發(fā)揮 CoT 的全部潛力,訓(xùn)練能夠生成中間推理步驟 (i.e., rationale) 的 LLM 又需要大量人工標注 rationale,為…

Contents

  • Introduction
  • Method
  • Experiments
  • References

Introduction

  • CoT 推理可以有效提升 LLM 推理能力,但 few-shot prompting 無法發(fā)揮 CoT 的全部潛力,訓(xùn)練能夠生成中間推理步驟 (i.e., rationale) 的 LLM 又需要大量人工標注 rationale,為此作者提出 STaR (Self-Taught Reasoner),可以僅利用少量含有 rationale 的標注數(shù)據(jù)和大量不含 rationale 的標注數(shù)據(jù),迭代式地生成大量含有 rationale 的數(shù)據(jù)集并基于此訓(xùn)練能夠生成 rationale 的 LLM,有效提升 LLM 的復(fù)雜推理能力

Method

在這里插入圖片描述

  • Rationale Generation Bootstrapping (STaR Without Rationalization). 給定預(yù)訓(xùn)練 LLM M M M 和 small prompt set P = { ( x i p , r i p , y i p ) } i = 1 P \mathcal{P}=\{(x_{i}^{p},r_{i}^{p},y_{i}^{p})\}_{i=1}^{P} P={(xip?,rip?,yip?)}i=1P? (e.g. P = 10 P = 10 P=10),其中 x x x 為問題, r r r 為中間推理步驟, y y y 為問題回答,可以利用 few-shot prompting 為一個更大的數(shù)據(jù)集 D = { ( x i , y i ) } i = 1 D \mathcal D=\{(x_i,y_i)\}_{i=1}^D D={(xi?,yi?)}i=1D? 生成中間推理步驟 r ^ i \hat r_i r^i? 和答案 y ^ i \hat y_i y^?i?,這樣就得到了含有中間推理步驟的大規(guī)模數(shù)據(jù)集。此外,作者只保留其中 y ^ i = y i \hat y_i=y_i y^?i?=yi? 的樣本,因為這些樣本對應(yīng)的中間推理步驟質(zhì)量總體來說會更高一些,由此得到 filtered dataset,在此數(shù)據(jù)集上微調(diào) M M M 得到可以直接生成中間推理步驟的 LLM. 上述步驟為 1 個循環(huán),STaR 會重復(fù)上述循環(huán)多次,每次都用上一輪循環(huán)中得到的最新的生成中間推理步驟的 LLM M n ? 1 M_{n-1} Mn?1? D \mathcal D D 生成中間推理步驟得到 filtered dataset,然后在該數(shù)據(jù)集上基于預(yù)訓(xùn)練 LLM M M M 重新訓(xùn)練得到新的生成中間推理步驟的 LLM M n M_n Mn?;上述優(yōu)化過程可以被近似看作 policy gradient,其中 J ( M , X , Y ) J(M,X,Y) J(M,X,Y) 為 total expected reward across the dataset
    在這里插入圖片描述
  • Rationalization. 上述步驟還有一個缺點,就是如果 D \mathcal D D 中某些難樣本始終無法生成正確答案,那么這些樣本將永遠無法加入 filtered dataset,無法被有效學(xué)習(xí);為此,作者給生成錯誤答案的樣本 prompt 中加入提示正確答案的 hint 來引導(dǎo)模型生成中間推理步驟和最終答案
    在這里插入圖片描述
  • STaR.
    在這里插入圖片描述

Experiments

  • Symbolic Reasoning: Results on Arithmetic.
    在這里插入圖片描述在這里插入圖片描述
  • Natural Language Reasoning: Commonsense Question Answering.
    在這里插入圖片描述
  • Mathematical Reasoning in Language: Grade School Math.
    在這里插入圖片描述

References

  • Zelikman, Eric, et al. “Star: Bootstrapping reasoning with reasoning.” Advances in Neural Information Processing Systems 35 (2022): 15476-15488.
http://www.risenshineclean.com/news/56583.html

相關(guān)文章:

  • dw做網(wǎng)站怎么發(fā)布全網(wǎng)營銷的公司
  • 網(wǎng)站升級維護汕頭seo網(wǎng)站推廣
  • 網(wǎng)站開發(fā)建設(shè)培訓(xùn)推廣軟文300字
  • 網(wǎng)站優(yōu)化 圖片每天新聞早知道
  • 最新網(wǎng)站域名seo關(guān)鍵詞排名優(yōu)化哪家好
  • wifi管理網(wǎng)站百度seo規(guī)則
  • 服務(wù)器2003怎么做網(wǎng)站開戶推廣競價開戶
  • 北京網(wǎng)站優(yōu)化診斷網(wǎng)站推廣怎么推廣
  • html5移動網(wǎng)站開發(fā)流程怎么建網(wǎng)站平臺賣東西
  • 做網(wǎng)站哪個系統(tǒng)最好今日短新聞20條
  • 上海做門戶網(wǎng)站的公司app推廣活動策劃方案
  • 怎樣做網(wǎng)站賺流量太原百度搜索排名優(yōu)化
  • 網(wǎng)站開發(fā)中怎么樣對接接口新媒體運營工作是什么
  • 如何做淘寶店網(wǎng)站設(shè)計網(wǎng)頁
  • 網(wǎng)站制作設(shè)計方案百度關(guān)鍵詞推廣公司
  • lnmp 網(wǎng)站開發(fā)總結(jié)站長工具站長之家
  • wordpress grace7 破解深圳百度快照優(yōu)化
  • 做網(wǎng)站帶來好處網(wǎng)站優(yōu)化排名方法
  • 網(wǎng)站建設(shè)實現(xiàn)功能wix網(wǎng)站制作
  • 超級seo外鏈seo的推廣技巧
  • 做設(shè)計的有什么網(wǎng)站西安網(wǎng)絡(luò)推廣seo0515
  • 星子網(wǎng)今天最新新聞北京百度推廣排名優(yōu)化
  • 做商城的網(wǎng)站用什么框架好網(wǎng)絡(luò)營銷五個主要手段
  • wordpress 重裝win7優(yōu)化工具哪個好用
  • wordpress手機登錄跳轉(zhuǎn)頁面模板商丘seo教程
  • 清苑區(qū)建設(shè)網(wǎng)站找那家公司可以商用的電視app永久軟件
  • 可信賴的做網(wǎng)站發(fā)帖子最好的幾個網(wǎng)站
  • 做搜狗手機網(wǎng)站快速網(wǎng)站開發(fā)與設(shè)計
  • 網(wǎng)站做自簽發(fā)證書黃金網(wǎng)站軟件免費
  • dede怎么做網(wǎng)站日記搜索點擊軟件