中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁 > news >正文

怎么在word里做網(wǎng)站百度競價代運營公司

怎么在word里做網(wǎng)站,百度競價代運營公司,開發(fā)公司網(wǎng)站建設(shè),營銷型網(wǎng)站建設(shè)公司是干嘛的微調(diào)模型是為了讓模型在特殊領(lǐng)域表現(xiàn)良好,幫助其學(xué)習(xí)到專業(yè)術(shù)語等。 本文采用llama_index框架微調(diào)BGE模型,跑通整個流程,并學(xué)習(xí)模型微調(diào)的方法。 已開源:https://github.com/stay-leave/enhance_llm 一、環(huán)境準(zhǔn)備 Linux環(huán)境,GPU L20 48G,Python3.8.10。 pip該庫即可?!?article class="baidu_pl">

微調(diào)模型是為了讓模型在特殊領(lǐng)域表現(xiàn)良好,幫助其學(xué)習(xí)到專業(yè)術(shù)語等。

本文采用llama_index框架微調(diào)BGE模型,跑通整個流程,并學(xué)習(xí)模型微調(diào)的方法。
已開源:https://github.com/stay-leave/enhance_llm

一、環(huán)境準(zhǔn)備

Linux環(huán)境,GPU L20 48G,Python3.8.10。
pip該庫即可。

二、數(shù)據(jù)準(zhǔn)備

該框架實現(xiàn)了讀取各種類型的文件,給的示例就是pdf。
在這里插入圖片描述
因此準(zhǔn)備了一些網(wǎng)絡(luò)輿情相關(guān)的論文pdf,選擇70%作為訓(xùn)練數(shù)據(jù),剩下作為驗證數(shù)據(jù)。都放在data文件夾下。
在這里插入圖片描述

三、微調(diào)腳本編寫

1.讀取數(shù)據(jù)

使用SimpleDirectoryReader類讀取文件。
讀取到文本后,使用SentenceSplitter將一個很長的文檔切分為若干塊。
每一塊設(shè)置的有token數(shù)和重疊token數(shù),在
在這里插入圖片描述可以自選,默認的chunk_size大小沒找到在哪,重疊的是200.
在這里插入圖片描述以上是庫的源碼實現(xiàn),我們調(diào)用是很簡單的。VAL_CORPUS_FPATH 我一開始以為是在load_corpus里的某個類自動保存,結(jié)果根本沒有。所以自己寫了導(dǎo)出為json的函數(shù),是將其text數(shù)據(jù)保存了。

# 源文件 列表
my_list = [i for i in os.listdir('project_2/data') if i.endswith('pdf')]
# 隨機抽取70%的數(shù)據(jù),作為訓(xùn)練集
random.shuffle(my_list) # 打亂
num_to_sample = int(len(my_list) * 0.7) # 閾值
# 構(gòu)造本地文件路徑
training_set = [f"project_2/data/{file}" for file in my_list[:num_to_sample]] # 訓(xùn)練集文件list
validation_set = [f"project_2/data/{file}" for file in my_list[num_to_sample:]] # 驗證集文件list# 最終形成的訓(xùn)練和驗證語料
TRAIN_CORPUS_FPATH = 'project_2/data/corpus/train_corpus.json'
VAL_CORPUS_FPATH = 'project_2/data/corpus/val_corpus.json'# 讀取pdf數(shù)據(jù),節(jié)點
def load_corpus(files, verbose=False):if verbose:print(f"正在加載文件 {files}")reader = SimpleDirectoryReader(input_files=files)docs = reader.load_data()if verbose:print(f"已加載 {len(docs)} 個文檔")parser = SentenceSplitter()nodes = parser.get_nodes_from_documents(docs, show_progress=verbose)if verbose:print(f"已解析 
http://www.risenshineclean.com/news/30224.html

相關(guān)文章:

  • 綜合社區(qū)網(wǎng)站開發(fā)費用公司網(wǎng)站建設(shè)費
  • 電銷防封號系統(tǒng)seo入門到精通
  • 娛樂公司網(wǎng)站建設(shè)價格電腦培訓(xùn)學(xué)校排名
  • 成都企業(yè)網(wǎng)站建站大數(shù)據(jù)精準(zhǔn)營銷的策略
  • 新疆建設(shè)管理局網(wǎng)站seo基礎(chǔ)教程使用
  • 網(wǎng)絡(luò)營銷推廣的優(yōu)劣勢深圳短視頻seo教程
  • 怎么增加網(wǎng)站的外鏈?zhǔn)謾C系統(tǒng)優(yōu)化
  • 煙臺網(wǎng)站建設(shè)公司鏈接推廣平臺
  • 鹽城網(wǎng)站開發(fā)招代理最火的網(wǎng)絡(luò)推廣平臺
  • dede網(wǎng)站模版百度app優(yōu)化
  • 國外優(yōu)秀設(shè)計網(wǎng)站推薦seo關(guān)鍵字排名優(yōu)化
  • 中國公司排行榜前十名seo怎么發(fā)布外鏈
  • wordpress網(wǎng)站添加背景音樂自助建站系統(tǒng)個人網(wǎng)站
  • 網(wǎng)站建設(shè)功能是什么意思萬詞優(yōu)化
  • web模板免費下載網(wǎng)站常見的推廣平臺有哪些
  • 臨海網(wǎng)站制作費用如何記賬網(wǎng)站優(yōu)化 福州
  • 網(wǎng)頁設(shè)計與制作06386自考真題windows優(yōu)化大師官方下載
  • 免費com域名注冊網(wǎng)站上海seo推廣整站
  • 天津平臺網(wǎng)站建設(shè)哪家好如何免費建立一個網(wǎng)站
  • 做網(wǎng)站代理怎么樣成人本科報考官網(wǎng)
  • wordpress add_filter青島seo網(wǎng)絡(luò)優(yōu)化公司
  • 揚州城鄉(xiāng)建設(shè)局網(wǎng)站移動端優(yōu)化
  • 做任務(wù)懸賞網(wǎng)站百度網(wǎng)頁版登錄入口官網(wǎng)
  • 企業(yè)網(wǎng)盤是什么優(yōu)化關(guān)鍵詞排名seo
  • 源碼網(wǎng)站下載網(wǎng)絡(luò)推廣培訓(xùn)去哪里好
  • 無錫大型網(wǎng)站建設(shè)公司谷歌網(wǎng)站優(yōu)化
  • 上海鴻鵠設(shè)計公司seo頁面內(nèi)容優(yōu)化
  • 安徽做政府網(wǎng)站的企業(yè)日結(jié)app推廣聯(lián)盟
  • 做網(wǎng)站需要公司嗎建網(wǎng)站軟件工具
  • 濟南網(wǎng)站建設(shè)方案托管福州百度推廣排名優(yōu)化