vr 全景 網(wǎng)站建設(shè)/廣州搜索排名優(yōu)化
:::info 本文是“在Serverless平臺(tái)上構(gòu)建AIGC應(yīng)用”系列文章的第一篇文章。 :::
前言
隨著ChatGPT 以及 Stable Diffusion,Midjourney 這些新生代 AIGC 應(yīng)用的興起,圍繞AIGC應(yīng)用的相關(guān)開(kāi)發(fā)變得越來(lái)越廣泛,有呈井噴之勢(shì),從長(zhǎng)遠(yuǎn)看這波應(yīng)用的爆發(fā)不僅僅是停留在形式之上,更是在各個(gè)領(lǐng)域產(chǎn)生實(shí)際的生產(chǎn)力價(jià)值,比如辦公領(lǐng)域有copilot system 365,釘釘智能; 代碼編程領(lǐng)域有 github copilot ,cursor ide; 文娛領(lǐng)域的妙鴨相機(jī);可以肯定的是未來(lái) AIGC 的應(yīng)用數(shù)量會(huì)更多,類型也會(huì)更加豐富,企業(yè)的內(nèi)部軟件或者SOP都會(huì)盡可能的跟AI進(jìn)行融合,這必然催生出海量的AIGC應(yīng)用開(kāi)發(fā)需求,這也代表著巨大的市場(chǎng)機(jī)會(huì)。
開(kāi)發(fā) AIGC 應(yīng)用的挑戰(zhàn)
AIGC 的應(yīng)用前景如此誘人,可能決定企業(yè)未來(lái)的發(fā)展走向。然而對(duì)很多中小企業(yè)及開(kāi)發(fā)者而言,上手進(jìn)行aigc應(yīng)用的開(kāi)發(fā)依然有著非常高昂的成本:
- 基礎(chǔ)模型服務(wù)的獲取:chatgpt提供了非常完善的api 開(kāi)發(fā)體系,然而并不開(kāi)放給國(guó)內(nèi)客戶使用,開(kāi)源的模型進(jìn)行服務(wù)的部署非常困難
- 高昂的費(fèi)用, GPU 短缺導(dǎo)致 GPU 的費(fèi)用急劇飆升,本地購(gòu)買(mǎi)高規(guī)格顯卡需要一次性花費(fèi)不少的成本,并且并不能提供在線服務(wù)。
- 端到端的對(duì)接:單純模型服務(wù)的api無(wú)法變成直接的生產(chǎn)力,需要完成【企業(yè)數(shù)據(jù)&企業(yè)SOP】-> LLM 服務(wù) -> 各種端側(cè)的完整鏈路
函數(shù)計(jì)算AIGC應(yīng)用的解決方案
函數(shù)計(jì)算圍繞創(chuàng)建和使用AIGC,從基礎(chǔ)設(shè)施到應(yīng)用生態(tài),開(kāi)發(fā)端到使用端提供的完整的配套
主要包含三個(gè)部分:
- 一 、模型服務(wù)底座,函數(shù)計(jì)算可以部署來(lái)自魔搭,huggingface等開(kāi)元社區(qū)的ai模型,我們針對(duì) LLM, Bert等智能知識(shí)庫(kù)/助手 場(chǎng)景做了專門(mén)的定制,接入OpenAI兼容的api規(guī)范,提供一鍵部署的模版和可視化的web訪問(wèn)界面,幫助開(kāi)發(fā)者或者企業(yè)快速上手 llama2,chatglm2,通義千問(wèn)等模型的部署
- 二、業(yè)務(wù)連接層 ,串聯(lián)業(yè)務(wù)需求以及的模型服務(wù),安全服務(wù),數(shù)據(jù)庫(kù)服務(wù)等基礎(chǔ)資源,這部分有在AIGC應(yīng)用部分有很多相同的邏輯,比如賬號(hào)體系,數(shù)據(jù)集管理,提示詞模版,工具管理,模型服務(wù)管理等,從各業(yè)務(wù)側(cè)視角看,不一樣的部分只是 提示詞,知識(shí)庫(kù)以及工具集,底層的模型服務(wù),安全服務(wù),數(shù)據(jù)庫(kù)服務(wù)則是共享的,這層可以簡(jiǎn)化業(yè)務(wù)里面構(gòu)建不同智能場(chǎng)景的流程,快速,低成本的可以構(gòu)建不同業(yè)務(wù)的AIGC應(yīng)用
- 三、客戶端側(cè),客戶端是AI應(yīng)用的使用部分,也是最接近業(yè)務(wù)的部分,這部分更多的考慮是如何將AI服務(wù)融入已有的使用端,比如釘釘,企業(yè)微信等辦公I(xiàn)M系統(tǒng),以及web瀏覽器插件等,通過(guò) 函數(shù)計(jì)算+eventbridge可以快速幫助ai服務(wù)接入到這些客戶端
本篇教程先來(lái)分享一下第一個(gè)部分,如何通過(guò)函數(shù)計(jì)算快速部署 AIGC相關(guān)模型服務(wù)包括LLM模型 和Embedding(Bert) 模型
LLM模型及Embedding服務(wù)部署教程
前期準(zhǔn)備
使用該項(xiàng)目,您需要有開(kāi)通以下服務(wù):
對(duì) AIGC 進(jìn)行 CPU/GPU 推理計(jì)算
https://free.aliyun.com/?pipCode=fc存儲(chǔ)大語(yǔ)言模型以及Embedding服務(wù)所需要的模型, 新用戶請(qǐng)先領(lǐng)取免費(fèi)試用資源包
https://free.aliyun.com/?product=9657388&crowd=personal
應(yīng)用介紹
應(yīng)用詳情
使用阿里云函數(shù)計(jì)算部署開(kāi)源大模型應(yīng)用,提供兼容openai規(guī)范的接口和ChatGPT-Next-Web客戶端.
操作文檔
llm應(yīng)用模版
登錄到阿里云函數(shù)計(jì)算控制臺(tái)->應(yīng)用->創(chuàng)建應(yīng)用-> 人工智能 選擇AI大語(yǔ)言模型API服務(wù)應(yīng)用模板點(diǎn)擊"立即創(chuàng)建"
應(yīng)用模版設(shè)置
設(shè)置好知道點(diǎn)擊"創(chuàng)建并部署默認(rèn)環(huán)境"
等待部署
該過(guò)程您會(huì)自動(dòng)完成
服務(wù)訪問(wèn)
服務(wù)部署成功之后會(huì)返回兩個(gè)鏈接
1、llm-server 為大語(yǔ)言模型的api服務(wù)界面,基于swagger,
2、llm-client則是訪問(wèn)客戶端,訪問(wèn)客戶端需要您輸入前面填寫(xiě)的客戶端私有密碼,填寫(xiě)好之后就可以測(cè)試使用了
embedding模版
登錄到阿里云函數(shù)計(jì)算控制臺(tái)->應(yīng)用->創(chuàng)建應(yīng)用-> 人工智能 選擇“開(kāi)源Bert模型服務(wù)”應(yīng)用模板點(diǎn)擊"立即創(chuàng)建"
應(yīng)用模版設(shè)置
選擇好地域創(chuàng)建即可
等待部署
該過(guò)程您會(huì)自動(dòng)完成
服務(wù)訪問(wèn)
測(cè)試embedding接口
總結(jié)
部署好LLM服務(wù)意味著您已經(jīng)開(kāi)啟了AIGC應(yīng)用的開(kāi)發(fā)旅程,接下來(lái)我會(huì)繼續(xù)跟大家分享更多關(guān)于AIGC相關(guān)的內(nèi)容,包括如何構(gòu)建知識(shí)庫(kù)問(wèn)答應(yīng)用,如何調(diào)用工具完善大語(yǔ)言模型的能力,如何接入自己的IM系統(tǒng)和構(gòu)建web的集成插件。
宇宙漫游,阿里云 x 森馬 AIGC T恤設(shè)計(jì)大賽
一、
**【森馬X阿里云 AIGC T恤設(shè)計(jì)大賽】**程序員AIGC 自己的T恤,贏Airpods,圖案定制T恤!
通過(guò)函數(shù)計(jì)算FC 快捷部署 Stable Diffusion:內(nèi)置模型庫(kù)+常用插件+ControlNet,支持 SDXL1.0
立即參加:https://developer.aliyun.com/adc/series/activity/aigc_design
可贏取Airpods三代,作品定制聯(lián)名體恤,森馬行李箱等周邊!
二、
還可以參加話題活動(dòng),一起討論 AIGC 的未來(lái)發(fā)展趨勢(shì),用戶可從任意角度交流分享,可以贏得護(hù)眼臺(tái)燈、數(shù)據(jù)線、靜音凈化器獎(jiǎng)品!
話題:《相比優(yōu)秀的服裝設(shè)計(jì)師,AIGC 可以如何突破設(shè)計(jì)靈感的界限?是純粹的機(jī)械語(yǔ)言還是一點(diǎn)點(diǎn)的靈光乍現(xiàn)?》
https://developer.aliyun.com/ask/548537?spm=a2c6h.13148508.setting.14.4a894f0esFcznR