中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當前位置: 首頁 > news >正文

網(wǎng)站公司技術(shù)交接蘭州做網(wǎng)站的公司

網(wǎng)站公司技術(shù)交接,蘭州做網(wǎng)站的公司,外貿(mào)網(wǎng)站建設(shè)公司咨詢,網(wǎng)站建設(shè)公司價近期聽了不少與AI相關(guān)的播客,有理想轉(zhuǎn)型AI的分享,有Character.ai出來同事的分享等,結(jié)合對Transformer架構(gòu)的理解嘗試大致還原大語言模型的訓(xùn)練過程。不過,當我這樣的“中國大媽”也能夠大致琢磨明白大語言模型是如何訓(xùn)練出來的時候…

近期聽了不少與AI相關(guān)的播客,有理想轉(zhuǎn)型AI的分享,有Character.ai出來同事的分享等,結(jié)合對Transformer架構(gòu)的理解嘗試大致還原大語言模型的訓(xùn)練過程。不過,當我這樣的“中國大媽”也能夠大致琢磨明白大語言模型是如何訓(xùn)練出來的時候,大語言模型的神話大概見頂了吧。^-^當然,與底座大模型相比,基于大語言模型的應(yīng)用前景更為廣闊。

1. 語料集,李想提到理想做LLM底座模型用的都是公開語料集,合理推測比如Kaggle上、各家提供框架的公司(TensorFlow、PyTorch、PaddlePaddle等)都開放了不少語料集,比如raw.githubusercontent.com/karpathy/char-rnn/master/data/tinyshakespeare/input.txt就有莎士比亞所有文章的內(nèi)容。仔細研究應(yīng)該能夠整理出所有可用的公開語料集。

2. 對數(shù)據(jù)做進一步處理并基于Transfomer模型(編碼器、解碼器、注意力機制)進行大模型預(yù)訓(xùn)練。

3. 因為是基于概率的模型,預(yù)訓(xùn)練出來的大語言模型一般不能夠滿足用戶像文心一言、ChatGPT對話的體驗,比如用戶如果輸入“今天星期幾”,按照概率大語言模型應(yīng)該輸出的是“?”,但顯然這并不符合用戶的期望。要基于高質(zhì)量的預(yù)料來對預(yù)訓(xùn)練出來的模型進行微調(diào)或者說后訓(xùn)練。

4. 后訓(xùn)練的方法應(yīng)該有不少技巧,一種樸素的思路是將處理好的高質(zhì)量語料對預(yù)訓(xùn)練大模型神經(jīng)網(wǎng)絡(luò)的較高層的節(jié)點參數(shù)進行重新訓(xùn)練以優(yōu)化模型。高質(zhì)量語料需要搜集,也有專門的公司負責(zé)清洗和銷售,OpenAI之前傳出的是在肯尼亞有數(shù)千人幫助標注預(yù)料應(yīng)該就是在準備高質(zhì)量語料。

5. 如果要達到文心一言和ChatGPT的水平還需要進一步優(yōu)化,一種優(yōu)化是根據(jù)用戶的輸入調(diào)用多個模型同時協(xié)同合作,最基本的比如用戶上傳一張圖片先調(diào)用OCR模型識別文字后再調(diào)用大語言模型進行處理。另一種優(yōu)化是通過編程來進行提示詞優(yōu)化、加入更多的Context信息(比如用戶問今天有什么大事發(fā)生,聊天機器人先調(diào)用網(wǎng)絡(luò)搜索來匯總信息后再通過大語言模型輸出)。

6. 大語言模型進一步優(yōu)化的空間一個是原始的訓(xùn)練語料上有優(yōu)化空間?,F(xiàn)在的說法是所謂互聯(lián)網(wǎng)的數(shù)據(jù)已經(jīng)用完了,這個說法不準確,互聯(lián)網(wǎng)每天會產(chǎn)生EB級別的數(shù)據(jù),大語言模型訓(xùn)練級別估計在PB級別,不可能用完互聯(lián)網(wǎng)數(shù)據(jù)。大語言模型使用的語料合理猜測包括所有的人類書本數(shù)據(jù)、所有GitHub等代碼庫的代碼數(shù)據(jù)、Facebook等社交媒體上的帶用戶反饋(喜歡、踩)標注的數(shù)據(jù)、新聞網(wǎng)站數(shù)據(jù)、博客數(shù)據(jù)、論文數(shù)據(jù)等。企業(yè)內(nèi)部的數(shù)據(jù)肯定拿不到,加了限制爬取的數(shù)據(jù)大概率也拿不到,網(wǎng)站放到歷史庫的數(shù)據(jù)大多也拿不到,社交媒體、新聞網(wǎng)站、博客等等數(shù)據(jù)拿的很可能也不全,所以如何在原始語料上進行優(yōu)化肯定是有空間。

7. 大語言模型另外優(yōu)化的空間還有強化學(xué)習(xí)、多模態(tài)等。

http://www.risenshineclean.com/news/7664.html

相關(guān)文章:

  • 哪個網(wǎng)站可以做前端項目有沒有可以代理推廣的平臺
  • 織夢做企業(yè)網(wǎng)站教程重慶seo博客
  • 幼兒園網(wǎng)站建設(shè)情況統(tǒng)計表寧波網(wǎng)站推廣優(yōu)化哪家正規(guī)
  • 深圳網(wǎng)站優(yōu)化方法網(wǎng)絡(luò)銷售培訓(xùn)學(xué)校
  • 尺寸在線做圖網(wǎng)站免費關(guān)鍵詞排名優(yōu)化軟件
  • 微信群運營杭州搜索引擎優(yōu)化公司
  • 網(wǎng)站策劃報告怎么寫第三方關(guān)鍵詞優(yōu)化排名
  • 樂陵最新疫情最新消息寧波seo網(wǎng)頁怎么優(yōu)化
  • 怎樣運營網(wǎng)站代運營公司排名
  • 中國建設(shè)銀行官方網(wǎng)站登錄入口seo推廣招聘
  • 在哪里可以找到做網(wǎng)站的公司手游推廣去哪里找客源
  • 阿里云怎么部署網(wǎng)站網(wǎng)站排名靠前的方法
  • 阿里國際站韓語網(wǎng)站怎么做軟文發(fā)布平臺排名
  • 制作網(wǎng)站的登錄界面怎么做福州seo經(jīng)理招聘
  • 威海城市 建設(shè)信息網(wǎng)站網(wǎng)址注冊查詢
  • wordpress傻瓜建站教程網(wǎng)站推廣的優(yōu)化
  • 怎么做一個手機網(wǎng)站app拉新項目一手渠道商
  • 保山網(wǎng)站開發(fā)服務(wù)百度的廣告怎么免費發(fā)布
  • 微信公眾號文章怎么轉(zhuǎn)換wordpressseo搜索引擎優(yōu)化課程
  • 一鍵轉(zhuǎn)發(fā)軟件批發(fā)商城seo什么意思
  • 網(wǎng)站seo 優(yōu)化重慶seo小潘大神
  • wordpress手機底部導(dǎo)航愛采購seo
  • 哪些網(wǎng)站是動態(tài)的教育機構(gòu)加盟
  • 谷歌海外推廣衡陽seo優(yōu)化
  • 網(wǎng)站做ulr跳轉(zhuǎn)網(wǎng)絡(luò)銷售好做嗎
  • 網(wǎng)站做302重定向會怎么樣極速建站網(wǎng)站模板
  • 做網(wǎng)站都需要哪些費用四川seo關(guān)鍵詞工具
  • wordpress jq網(wǎng)站推廣優(yōu)化技巧
  • 網(wǎng)站建設(shè)完成外網(wǎng)無法訪問站長工具高清
  • 免費軟件下載官方網(wǎng)站google搜索