項(xiàng)目建設(shè)管理福州百度seo排名軟件
在本課程的其余部分中,您將學(xué)習(xí)開發(fā)和部署LLM驅(qū)動(dòng)應(yīng)用所需的技巧。在這個(gè)視頻中,您將了解一個(gè)能幫助您完成此工作的生成式AI項(xiàng)目生命周期。此框架列出了從構(gòu)思到啟動(dòng)項(xiàng)目所需的任務(wù)。到課程結(jié)束時(shí),您應(yīng)該對(duì)您需要做的重要決策、可能遇到的困難以及需要開發(fā)和部署應(yīng)用程序的基礎(chǔ)設(shè)施有一些良好的直覺(jué)。這是整個(gè)生命周期的圖表。
我們將逐步討論它。
任何項(xiàng)目最重要的步驟是盡可能準(zhǔn)確和具體地定義范圍。
正如您在這門課程中看到的,LLMs能夠執(zhí)行許多任務(wù),但它們的能力在很大程度上取決于模型的大小和架構(gòu)。您應(yīng)該思考LLM在您特定應(yīng)用中的功能。
您是否需要模型能夠執(zhí)行許多不同的任務(wù),包括長(zhǎng)文本生成或具有高度的能力,
還是任務(wù)更為具體,例如命名實(shí)體識(shí)別,所以您的模型只需要擅長(zhǎng)一件事.
正如您在課程的其余部分中所看到的,真正明確您需要模型做什么可以為您節(jié)省時(shí)間,更重要的是,計(jì)算成本。一旦您滿意,并且已經(jīng)足夠確定了模型的要求,就可以開始開發(fā)。
您的第一個(gè)決定將是從零開始訓(xùn)練自己的模型還是使用現(xiàn)有的基礎(chǔ)模型。通常,您將從一個(gè)現(xiàn)有的模型開始,盡管在某些情況下,您可能會(huì)發(fā)現(xiàn)有必要從頭開始訓(xùn)練一個(gè)模型。
您將在本周稍后了解關(guān)于此決策背后的考慮因素,以及一些經(jīng)驗(yàn)法則,以幫助您估計(jì)訓(xùn)練自己的模型的可行性。
擁有了模型后,下一步是評(píng)估其性能并進(jìn)行額外的訓(xùn)練,以滿足您的應(yīng)用程序的需求。
正如您本周早些時(shí)候所看到的,提示工程有時(shí)足以使您的模型表現(xiàn)得很好,所以您可能會(huì)首先嘗試上下文學(xué)習(xí),使用適合您的任務(wù)和用例的例子。
但是,仍然存在一些情況,即使在一個(gè)或幾個(gè)短的推理中,模型也可能無(wú)法像您所希望的那樣表現(xiàn)得很好,那么您可以嘗試微調(diào)模型。
這種有監(jiān)督的學(xué)習(xí)過(guò)程將在第2周詳細(xì)介紹,您將有機(jī)會(huì)在第2周的實(shí)驗(yàn)室中自己嘗試微調(diào)一個(gè)模型。
隨著模型變得更加強(qiáng)大,確保它們?cè)诓渴鹬斜憩F(xiàn)良好并與人類的偏好一致變得越來(lái)越重要。在第3周,您將學(xué)習(xí)一種稱為“與人類反饋的強(qiáng)化學(xué)習(xí)”的額外微調(diào)技巧,這可以幫助確保您的模型表現(xiàn)得很好。
所有這些技術(shù)的一個(gè)重要方面是評(píng)估。下周,您將探索一些可以用來(lái)確定模型的性能或與您的偏好有多么一致的指標(biāo)和基準(zhǔn)。
請(qǐng)注意,這種適應(yīng)和對(duì)齊應(yīng)用程序開發(fā)的階段可能是高度迭代的。
您可能會(huì)首先嘗試提示工程和評(píng)估輸出,
然后使用微調(diào)來(lái)提高性能,
然后再次回顧和評(píng)估提示工程,以獲得所需的性能。
最后,當(dāng)您擁有滿足您的性能需求并且對(duì)齊得很好的模型時(shí),您可以將其部署到您的基礎(chǔ)設(shè)施中并將其與您的應(yīng)用程序集成。
在此階段,一個(gè)重要的步驟是優(yōu)化模型以供部署。這可以確保您最大限度地利用您的計(jì)算資源,并為應(yīng)用程序的用戶提供最佳的體驗(yàn)。
最后但同樣重要的一步是考慮您的應(yīng)用程序需要正常工作的任何其他基礎(chǔ)設(shè)施。
LLM存在一些基本的局限性,僅通過(guò)培訓(xùn)很難克服,例如當(dāng)它們不知道答案時(shí)發(fā)明信息,或者它們執(zhí)行復(fù)雜的推理和數(shù)學(xué)的能力有限。
在本課程的最后部分,您將學(xué)習(xí)一些可以用來(lái)克服這些局限性的強(qiáng)大技巧。
我知道這里有很多事情要考慮,但是現(xiàn)在不用擔(dān)心一次性吸收所有內(nèi)容。在您探索每個(gè)階段的詳細(xì)信息時(shí),您將在課程中一次又一次地看到這個(gè)架構(gòu)。
參考
https://www.coursera.org/learn/generative-ai-with-llms/lecture/21Nwn/generative-ai-project-lifecycle