中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁(yè) > news >正文

為男人做購(gòu)物網(wǎng)站攜程: 2023年旅行搜索上漲超900%

為男人做購(gòu)物網(wǎng)站,攜程: 2023年旅行搜索上漲超900%,wordpress 積分下載插件,寧波市網(wǎng)站集約化建設(shè)通知微調(diào)(fine-tuning)就是利用特有數(shù)據(jù)和技巧將通用模型轉(zhuǎn)換為能執(zhí)行具體任務(wù)的一種方式。例如,將 GPT-3 這種通用模型轉(zhuǎn)換為諸如 ChatGPT 這樣的專(zhuān)門(mén)用于聊天的模型?;蛘邔?GPT-4 轉(zhuǎn)換為諸如 GitHub Coplot 這樣的專(zhuān)門(mén)用于寫(xiě)代碼的模型。 這里…

微調(diào)(fine-tuning)就是利用特有數(shù)據(jù)和技巧將通用模型轉(zhuǎn)換為能執(zhí)行具體任務(wù)的一種方式。例如,將 GPT-3 這種通用模型轉(zhuǎn)換為諸如 ChatGPT 這樣的專(zhuān)門(mén)用于聊天的模型?;蛘邔?GPT-4 轉(zhuǎn)換為諸如 GitHub Coplot 這樣的專(zhuān)門(mén)用于寫(xiě)代碼的模型。

這里的微調(diào)特指生成式任務(wù)上的微調(diào)。在這種方式中,

  • 需要更新整個(gè)模型的權(quán)重,而不是像其他模型一樣只更新部分權(quán)重
  • 微調(diào)的訓(xùn)練目標(biāo)與預(yù)訓(xùn)練時(shí)的目標(biāo)相同,目的是讓模型的輸出更加一致
  • 有許多先進(jìn)的方法可以減少對(duì)模型的更新

L4 如何為訓(xùn)練準(zhǔn)備數(shù)據(jù)

1.高質(zhì)量

2.多樣性

3.真實(shí)的數(shù)據(jù)(因?yàn)樯傻臄?shù)據(jù)具有某種模式)

4.更多的數(shù)據(jù)

收集數(shù)據(jù)的步驟:

1)連接這些對(duì)或添加提示模板

2)對(duì)數(shù)據(jù)進(jìn)行標(biāo)記,添加填充或截?cái)鄶?shù)據(jù),使得數(shù)據(jù)適合偶像。

對(duì)數(shù)據(jù)進(jìn)行標(biāo)記是將文本數(shù)據(jù)轉(zhuǎn)化為表示每個(gè)文本片段的數(shù)字。實(shí)際上,不一定是按單詞來(lái)分的。是基于常見(jiàn)字符出現(xiàn)的頻率。之后,當(dāng)您使用相同的標(biāo)記器進(jìn)行解碼時(shí),它會(huì)轉(zhuǎn)換為相同的文本。

現(xiàn)在有很多不同的標(biāo)記器,每個(gè)模型都與特定的標(biāo)記器相關(guān)聯(lián),因?yàn)樗歉鶕?jù)它進(jìn)行訓(xùn)練的。

L6評(píng)估生成模型

目前流行的一種方法是Eleuther AI開(kāi)發(fā)的ELO對(duì)比,類(lèi)似于多模型間的AB test。普遍采用的一個(gè)開(kāi)放LLM基準(zhǔn)測(cè)試?yán)昧硕喾N評(píng)估方法。它集合了各種評(píng)估方法并取平均值以此來(lái)排序模型。包括:

ARC:主要是小學(xué)問(wèn)題

(ARC包含7787個(gè)來(lái)自不同科學(xué)領(lǐng)域的考試問(wèn)題,根據(jù)難易程度,可以劃分為2590個(gè)問(wèn)題組成的ARC-Challenge和5197個(gè)問(wèn)題的ARCEasy。這些問(wèn)題用以評(píng)估LLM在多步推理、語(yǔ)言匹配等多方面的高級(jí)能力。在這兩個(gè)評(píng)測(cè)基準(zhǔn)中,GPT-4取得了最好的成績(jī),明顯超過(guò)其他LLM。)
HellaSwag:常識(shí)
MMLU:多個(gè)小學(xué)學(xué)科
TruthfulQA:評(píng)估模型在復(fù)制常見(jiàn)的在線錯(cuò)誤信息上的表現(xiàn)
FreeWilly模型是在 Llama-2 模型基礎(chǔ)上進(jìn)行微調(diào)得到的,使用的是 ORCA 方法。
?另一個(gè)分析和評(píng)估模型的框架是錯(cuò)誤分析:

第一種:拼寫(xiě)錯(cuò)誤。

第二種:長(zhǎng)度過(guò)長(zhǎng)。簡(jiǎn)潔的數(shù)據(jù)集可以幫助模型更準(zhǔn)確地回答問(wèn)題。

第三種:生成重復(fù)。解決方法是更明確地使用停止標(biāo)記或者提示詞模板。確保數(shù)據(jù)既有多樣性又不過(guò)于重復(fù)。

注意,不需要過(guò)度關(guān)注模型在這些基準(zhǔn)測(cè)試上的表現(xiàn),因?yàn)樗麄兛赡芘c業(yè)務(wù)場(chǎng)景無(wú)關(guān)。因此,真正要關(guān)心的是在真實(shí)業(yè)務(wù)場(chǎng)景上的表現(xiàn)。上述基準(zhǔn)測(cè)試只有在你研究的是通用模型時(shí)才更具有參考價(jià)值。也就是說(shuō),這個(gè)基準(zhǔn)測(cè)試對(duì)于你找基礎(chǔ)的模型有參考價(jià)值,對(duì)于具體地微調(diào)任務(wù)上意義不大。
?

L7 總結(jié)

微調(diào)的實(shí)用步驟:

1)明確任務(wù)

2)收集與任務(wù)輸入和輸出相關(guān)的數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行組織整理

3)如果數(shù)據(jù)不夠,可以借助AI生成或?qū)嵱锰崾驹~模板來(lái)創(chuàng)建

4)建議先微調(diào)一個(gè)小模型(例如 4億-10億參數(shù)),看一下模型的表現(xiàn)

5)調(diào)整微調(diào)模型時(shí)的數(shù)據(jù)量,并觀察對(duì)微調(diào)結(jié)果的影響

6)評(píng)估模型,看看哪些做得好,哪些做得不好

7)收集更多的數(shù)據(jù),通過(guò)評(píng)估結(jié)果來(lái)持續(xù)改進(jìn)模型

8)提高任務(wù)的復(fù)雜度

9)增加模型規(guī)模以適應(yīng)這種復(fù)雜的任務(wù)
?

參數(shù)高效微調(diào)方法 PEFT

低秩適應(yīng)LoRA:減少你需要訓(xùn)練的參數(shù)數(shù)量,降低你需要訓(xùn)練的權(quán)重。減少gpu內(nèi)存,但會(huì)獲得相同的推理延遲。

部分來(lái)源:

吳恩達(dá)ChatGPT《Finetuning Large Language Models》筆記-CSDN博客

http://www.risenshineclean.com/news/46662.html

相關(guān)文章:

  • 網(wǎng)站建設(shè)招標(biāo)公告首頁(yè)排名關(guān)鍵詞優(yōu)化
  • 鄭州網(wǎng)站建設(shè)方案書(shū)網(wǎng)絡(luò)的推廣
  • 微網(wǎng)站制作公司佛山疫情最新消息
  • 濰坊做企業(yè)手機(jī)版網(wǎng)站濰坊在線制作網(wǎng)站
  • 網(wǎng)站設(shè)計(jì)美工多少網(wǎng)絡(luò)推廣電話
  • 中化建工北京建設(shè)投資有限公司網(wǎng)站最新的疫情信息
  • 企業(yè)網(wǎng)站類(lèi)型市場(chǎng)營(yíng)銷(xiāo)互聯(lián)網(wǎng)營(yíng)銷(xiāo)
  • 展示網(wǎng)站報(bào)價(jià)搜索引擎環(huán)境優(yōu)化
  • 什么網(wǎng)站可以做引文分析開(kāi)發(fā)一個(gè)網(wǎng)站需要哪些技術(shù)
  • 酒泉網(wǎng)站建設(shè)平臺(tái)百度網(wǎng)盤(pán)pc網(wǎng)頁(yè)版入口
  • 哈爾濱網(wǎng)站建設(shè)與管理今日國(guó)際新聞?lì)^條15條
  • 濱海住房和城鄉(xiāng)建設(shè)局網(wǎng)站谷歌查詢關(guān)鍵詞的工具叫什么
  • 做網(wǎng)站的圖片需要多少錢(qián)下載百度極速版免費(fèi)安裝
  • 云南省建設(shè)廳招標(biāo)辦網(wǎng)站網(wǎng)絡(luò)營(yíng)銷(xiāo)活動(dòng)策劃
  • olam wordpress搜索引擎優(yōu)化搜索優(yōu)化
  • 常德市做網(wǎng)站聯(lián)系電話cps廣告聯(lián)盟
  • wordpress注冊(cè)增加性別選項(xiàng)seo上首頁(yè)
  • 在工商局網(wǎng)站做年報(bào)要交費(fèi)嗎百度網(wǎng)盤(pán)登錄入口 網(wǎng)頁(yè)
  • 進(jìn)入百度首頁(yè)seo優(yōu)化技術(shù)廠家
  • 無(wú)人區(qū)免費(fèi)電影入口seo研究中心南寧線下
  • 武漢做營(yíng)銷(xiāo)型網(wǎng)站建設(shè)寫(xiě)手接單平臺(tái)
  • 公安局門(mén)戶網(wǎng)站建設(shè)方案網(wǎng)絡(luò)營(yíng)銷(xiāo)的功能有哪些?
  • 展架設(shè)計(jì)在哪個(gè)網(wǎng)站做泉州百度首頁(yè)優(yōu)化
  • 網(wǎng)站banner尺寸1920seo 推廣教程
  • 營(yíng)銷(xiāo)型網(wǎng)站建設(shè)發(fā)難卡點(diǎn)視頻軟件下載
  • 廊坊網(wǎng)站制作公司網(wǎng)站的優(yōu)化和推廣方案
  • 深圳凡科網(wǎng)站建設(shè)廣告策劃公司
  • 網(wǎng)站建設(shè)公司在線qq客服代碼單頁(yè)網(wǎng)站怎么優(yōu)化
  • 穆棱建設(shè)局網(wǎng)站二級(jí)域名網(wǎng)址查詢
  • 家居網(wǎng)站建設(shè)的背景及意義百度網(wǎng)