中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁 > news >正文

怎樣做百度網(wǎng)站推廣百度6大核心部門

怎樣做百度網(wǎng)站推廣,百度6大核心部門,網(wǎng)站app封裝怎么做,邯鄲有建網(wǎng)站嗎哪個公司好些無論是開源的LLaMA 2還是閉源的GPT系列模型,功能雖然很強大,但對語言的支持和擴展比較差,例如,二者都是以英語為主的大模型。 為了提升大模型語言的多元化,慕尼黑大學(xué)、赫爾辛基大學(xué)等研究人員聯(lián)合開源了,…

無論是開源的LLaMA 2還是閉源的GPT系列模型,功能雖然很強大,但對語言的支持和擴展比較差,例如,二者都是以英語為主的大模型。

為了提升大模型語言的多元化,慕尼黑大學(xué)、赫爾辛基大學(xué)等研究人員聯(lián)合開源了,目前支持語言最多的大模型之一MaLA-500。

MaLA-500以LLaMA 2為基礎(chǔ)模型,再用多語言數(shù)據(jù)庫Glot500-c進行語言擴展訓(xùn)練,支持語言達到了驚人的534種。

開源地址:https://huggingface.co/MaLA-LM/mala-500

論文地址:https://arxiv.org/abs/2401.13303

圖片

訓(xùn)練數(shù)據(jù)

研究人員選用了開源數(shù)據(jù)集Glot500-c對MaLA-500進行了語言擴展訓(xùn)練。該數(shù)據(jù)集包含了534種語言,涵蓋47種不同種族語言,數(shù)據(jù)量高達2萬億tokens。

研究人員表示,選擇Glot500-c數(shù)據(jù)集的原因在于,可以大幅擴展現(xiàn)有語言模型的語言覆蓋范圍,并包含極其豐富的語言家族,這對于模型學(xué)習(xí)語言內(nèi)在的語法和語義規(guī)律幫助巨大。

此外,雖然一些高資源語言的比例相對較低,但Glot500-c的整體數(shù)據(jù)量對訓(xùn)練大規(guī)模語言模型而言足夠用。在后續(xù)的預(yù)處理中,又對語料數(shù)據(jù)集進行了加權(quán)隨機采樣,以增加低資源語言在訓(xùn)練數(shù)據(jù)中的比例,讓模型更加聚焦特定語言。

基礎(chǔ)模型LLaMA 2

MaLA-500選擇了目前最知名的開源大語言模型之一LLaMA 2-7B作為基礎(chǔ)模型,并進行了兩大技術(shù)點創(chuàng)新。

1)增強詞匯表,研究人員通過Glot500-c數(shù)據(jù)集,訓(xùn)練了一個多語言分詞器,將LLaMA 2的原英文詞匯表擴展到了260萬,大幅增強了模型對非英語和低資源語言的適配能力。

圖片

2)模型增強,使用了LoRA技術(shù)在LLaMA 2的基礎(chǔ)上進行低秩適配。只訓(xùn)練適配矩陣而凍結(jié)基礎(chǔ)模型權(quán)重,可以高效地實現(xiàn)模型在新語言上的持續(xù)學(xué)習(xí)能力,同時保留模型原有的知識。

訓(xùn)練流程

訓(xùn)練方面,研究人員用了24張N卡A100 GPU進行訓(xùn)練,并使用了包括Transformers、PEFT和DeepSpeed三個主流深度學(xué)習(xí)框架。

其中,DeepSpeed提供了分布式訓(xùn)練的支持,可以實現(xiàn)模型并行;PEFT實現(xiàn)了高效的模型微調(diào);Transformers提供了模型功能的實現(xiàn),例如,文本生成、提示詞理解等。

為了提升訓(xùn)練的高效性,MaLA-500還使用了各種顯存和計算優(yōu)化算法,如ZeRO冗余優(yōu)化器,可最大化利用GPU算力資源;以及混合精度訓(xùn)練的bfloat16數(shù)格式加速訓(xùn)練流程

此外,研究人員還對模型參數(shù)進行了大量優(yōu)化,使用了學(xué)習(xí)率為2e-4的常規(guī)SGD訓(xùn)練,并使用了0.01的L2權(quán)重衰減以防止模型過大,出現(xiàn)過擬合、內(nèi)容輸出不穩(wěn)定等情況。

圖片

為了測試MaLA-500的性能,研究人員在SIB-200等數(shù)據(jù)集上進行了綜合實驗。

結(jié)果顯示,相比原始LLaMA 2模型,MaLA-500在主題分類等評測任務(wù)上的準(zhǔn)確率提高了12.16%,這說明MaLA-500的多語言優(yōu)于,現(xiàn)有的眾多開源大語言模型。

本文素材來源MaLA-500論文,如有侵權(quán)請聯(lián)系刪除

END

http://www.risenshineclean.com/news/27025.html

相關(guān)文章:

  • visual studio做網(wǎng)站哪個公司做網(wǎng)站推廣最好
  • 網(wǎng)站關(guān)鍵詞可以添加嗎seo關(guān)鍵詞外包
  • 獵頭公司應(yīng)堅持的原則有超級優(yōu)化空間
  • 東莞建站seo怎么收費的
  • 網(wǎng)站中flash怎么做的游戲推廣怎么做引流
  • 做網(wǎng)站什么商品好軟文網(wǎng)站模板
  • 河田鎮(zhèn)建設(shè)局網(wǎng)站百度知道app
  • 建設(shè)部網(wǎng)站四庫一平臺best網(wǎng)絡(luò)推廣平臺
  • 在公司做網(wǎng)站是什么職位網(wǎng)頁搜索
  • 二手房在哪個網(wǎng)站做合同互聯(lián)網(wǎng)營銷師培訓(xùn)大綱
  • 敦煌網(wǎng)站銷售員怎么做濰坊今日頭條新聞
  • pb 做網(wǎng)站網(wǎng)站排名怎么優(yōu)化
  • 橙子建站驗證碼是詐騙嗎長沙靠譜seo優(yōu)化
  • 網(wǎng)站建設(shè)方案新聞鄭州網(wǎng)絡(luò)營銷公司
  • wordpress停用react如何做谷歌seo推廣
  • c 手機網(wǎng)站開發(fā)模板國家衛(wèi)生健康委
  • 信息系統(tǒng)軟件有哪些優(yōu)化的概念
  • 外貿(mào)公司網(wǎng)站模板免費阿里云搜索引擎網(wǎng)址
  • 做網(wǎng)站用的圖標(biāo)必應(yīng)搜索引擎入口官網(wǎng)
  • 成都專業(yè)做游戲網(wǎng)站個人網(wǎng)頁在線制作
  • 濱州 網(wǎng)站建設(shè)互聯(lián)網(wǎng)運營培訓(xùn)課程
  • 湖南人工智能建站系統(tǒng)軟件搜索引擎排名查詢
  • 站長平臺驗證網(wǎng)站什么建站程序最利于seo
  • 個人怎么做網(wǎng)站優(yōu)化百度愛采購怎樣入駐
  • 做家教一般在哪個網(wǎng)站企業(yè)網(wǎng)站制作費用
  • 網(wǎng)站開發(fā) 渠道百度seo排名優(yōu)化助手
  • 萊蕪區(qū)組織部網(wǎng)站淘寶指數(shù)入口
  • 網(wǎng)站設(shè)計與網(wǎng)頁制作項目教程天津優(yōu)化代理
  • 大嶺山仿做網(wǎng)站seo推廣 課程
  • 各大房產(chǎn)網(wǎng)站廈門seo排名