如何修改管理網(wǎng)站搜索引擎優(yōu)化排名seo
DeepSeek-R1在開(kāi)源版本發(fā)布的第二天就登陸了亞馬遜云科技AWS云平臺(tái),這個(gè)速度另小李哥十分震驚。這又讓我想起了在亞馬遜云科技全球云計(jì)算大會(huì)re:Invent2025里,亞馬遜CEO Andy Jassy說(shuō)過(guò)的:隨著目前生成式AI應(yīng)用規(guī)模的擴(kuò)大,云計(jì)算的成本變得至關(guān)重要,大家都在尋求具有高性?xún)r(jià)比的AI模型。其次開(kāi)發(fā)一個(gè)真正優(yōu)質(zhì)生成式AI應(yīng)用真的不容易,當(dāng)我們自由選擇 AI 模型開(kāi)發(fā)應(yīng)用時(shí),最終會(huì)形成多元化的模型生態(tài)。這說(shuō)明:不會(huì)存在一個(gè)通用模型能滿(mǎn)足所有需求。
同時(shí)他也提到了亞馬遜云科技提供的廣泛而深入的模型選擇,讓客戶(hù)可以精準(zhǔn)匹配業(yè)務(wù)需求。通過(guò)密切關(guān)注客戶(hù)需求與技術(shù)發(fā)展,亞馬遜云科技也在不斷擴(kuò)展精選模型庫(kù),既包括行業(yè)領(lǐng)先的主流模型,也引入了最新的優(yōu)秀模型。這種高性能、差異化的模型組合,幫助開(kāi)發(fā)者和企業(yè)始終站在AI 創(chuàng)新的前沿。這就是DeepSeek-R1能這么快登錄亞馬遜云科技平臺(tái)的核心原因。
DeepSeek-R1模型現(xiàn)已登陸亞馬遜云科技
位于杭州的AI初創(chuàng)公司DeepSeek于2024年12月發(fā)布了DeepSeek-V3,隨后在2025年1月20日推出 DeepSeek-R1、DeepSeek-R1-Zero(6710 億參數(shù))和DeepSeek-R1-Distill(1.5–70 億參數(shù)),并在1月27日推出了視覺(jué)AI模型Janus-Pro-7B。這些模型現(xiàn)已全面開(kāi)放,并比同類(lèi)模型的成本便宜90-95%!同時(shí)DeepSeek模型以卓越的推理能力從各大海外的AI模型中脫穎而出,一發(fā)沖天,這得益于其強(qiáng)化學(xué)習(xí)(RL)等創(chuàng)新的訓(xùn)練方法。
好消息是現(xiàn)在大家可以在Amazon Bedrock和Amazon SageMaker AI訓(xùn)練、部署和使用DeepSeek-R1模型了:
- Amazon Bedrock適合希望通過(guò)API快速集成DeepSeek預(yù)訓(xùn)練基礎(chǔ)模型的開(kāi)發(fā)者。
- Amazon SageMaker AI適用于需要深度定制、訓(xùn)練和部署DeepSeek,并希望直接訪(fǎng)問(wèn)底層基礎(chǔ)設(shè)施的開(kāi)發(fā)者。
- AWS Trainium和AWS Inferentia芯片目前也支持DeepSeek-R1-Distill蒸餾模型,可在Amazon EC2或Amazon SageMaker AI上經(jīng)濟(jì)高效地運(yùn)行推理任務(wù)。
借助亞馬遜云科技,大家可以以最低的云計(jì)算基礎(chǔ)設(shè)施投入,利用DeepSeek-R1模型構(gòu)建、測(cè)試,并安全地?cái)U(kuò)展大家的生成式AI應(yīng)用。大家還可以結(jié)合Amazon Bedrock Guardrails,為AI應(yīng)用提供額外的安全防護(hù),確保符合開(kāi)發(fā)者們業(yè)務(wù)場(chǎng)景的AI安全策略。目前大家可以通過(guò)以下方式,在亞馬遜云科技上部署DeepSeek-R1:
Amazon Bedrock Marketplace(適用于DeepSeek-R1模型)
Amazon SageMaker JumpStart(適用于DeepSeek-R1模型)
Amazon Bedrock 自定義模型導(dǎo)入(適用于DeepSeek-R1-Distill)
Amazon EC2 Trn1實(shí)例(適用于DeepSeek-R1-Distill)
在Amazon Bedrock Marketplace模型市場(chǎng)里部署DeepSeek-R1
Amazon Bedrock Marketplace目前提供全球超過(guò)100+個(gè)熱門(mén)、新興及專(zhuān)業(yè)化基礎(chǔ)模型,涵蓋各種行業(yè)領(lǐng)先的AI模型。大家可以在控制臺(tái)的模型目錄中快速發(fā)現(xiàn)、訂閱并部署適合大家需求的模型。
使用ApplyGuardrail API實(shí)現(xiàn)DeepSeek-R1的安全調(diào)用
Amazon Bedrock也允許大家引入安全防護(hù)措施更安全的訪(fǎng)問(wèn)DeepSeek模型,防止生成有害內(nèi)容,并針對(duì)關(guān)鍵安全指標(biāo)評(píng)估模型。大家也可以使用代碼調(diào)用Amazon Bedrock ApplyGuardrail API,為 DeepSeek-R1模型實(shí)現(xiàn)安全防護(hù)措施,評(píng)估用戶(hù)輸入和模型響應(yīng)。大家可以使用 Amazon Bedrock控制臺(tái)或直接通過(guò)代碼API創(chuàng)建安全防護(hù)策略。創(chuàng)建安全防護(hù)的示例代碼可以在亞馬遜云科技GitHub示例代碼倉(cāng)庫(kù)找到。Guardrail的工作流程原理如下:
- 系統(tǒng)接收用戶(hù)輸入,并將其發(fā)送至ApplyGuardrail API進(jìn)行審核。
- 輸入通過(guò)審核后,才會(huì)發(fā)送到模型進(jìn)行推理。
- 模型返回輸出后,再次經(jīng)過(guò)ApplyGuardrail API對(duì)輸出進(jìn)行安全檢查。
- 如果輸出通過(guò)審核,最終結(jié)果會(huì)返回給用戶(hù)。
- 如果輸入或輸出未通過(guò)審核,系統(tǒng)會(huì)返回一條消息,說(shuō)明攔截原因,并指明干預(yù)發(fā)生在輸入階段還是輸出階段。
?
開(kāi)始部署DeepSeek-R1
如果大家想要在Amazon Bedrock中訪(fǎng)問(wèn)DeepSeek-R1,請(qǐng)完成以下步驟:
1. 在Amazon Bedrock控制臺(tái)的導(dǎo)航面板中,選擇Foundation models下的Model catalog。大家同樣也可以使用亞馬遜云科技SDK,通過(guò)代碼中的InvokeModel API調(diào)用該模型。該模型目前不支持Converse API或其他 Amazon Bedrock功能。
2. 篩選提供商為DeepSeek,并選擇DeepSeek-R1模型。
模型詳細(xì)信息頁(yè)面提供了有關(guān)模型功能、定價(jià)結(jié)構(gòu)和實(shí)施指南的多種基本信息。大家可以找到詳細(xì)的使用說(shuō)明,包括示例API調(diào)用語(yǔ)句代和集成的代碼片段。該模型利用強(qiáng)化學(xué)習(xí)優(yōu)化和CoT推理能力,支持多種文本生成任務(wù),包括內(nèi)容創(chuàng)作、代碼生成和問(wèn)答。
該頁(yè)面同時(shí)還包含部署選項(xiàng)和許可信息,幫助大家在應(yīng)用程序中快速使用上手DeepSeek-R1。
3. 接下來(lái)點(diǎn)擊Deploy開(kāi)始使用DeepSeek-R1
系統(tǒng)將提示大家需要為DeepSeek-R1的部署進(jìn)行資源配置,模型的ID將被自動(dòng)填充進(jìn)配置。
4. 在Endpoint name字段輸入一個(gè)端點(diǎn)名稱(chēng)(1–50 個(gè)字母數(shù)字字符)。
5. 在Number of instances字段輸入要部署的計(jì)算服務(wù)器數(shù)量(1–100 之間)。
6. 在Instance type字段選擇的計(jì)算服務(wù)器實(shí)例類(lèi)型。如果想體驗(yàn)DeepSeek-R1的最佳性能,建議大家使用GPU實(shí)例類(lèi)型,例如ml.p5e.48xlarge。
7. 同時(shí)建議大家在高級(jí)選項(xiàng)中,也進(jìn)行安全和底層環(huán)境的配置,包括虛擬私有云(VPC)網(wǎng)絡(luò)、IAM訪(fǎng)問(wèn)角色權(quán)限和數(shù)據(jù)加密設(shè)置。對(duì)于大多數(shù)場(chǎng)景,默認(rèn)的設(shè)置就已經(jīng)足夠了。但對(duì)于生產(chǎn)環(huán)境的部署,大家需要設(shè)計(jì)好這些設(shè)置,以確保它們符合大家業(yè)務(wù)和組織內(nèi)部的安全和合規(guī)要求。
8. 選擇 Deploy 以開(kāi)始使用該模型。
9. 在部署完成后,大家就可以直接在Amazon Bedrock playground中測(cè)試DeepSeek-R1的輸出和性能。先選擇Open in playground進(jìn)入用戶(hù)交互式界面,我們輸入提示詞,并調(diào)整模型參數(shù),如 temperature 和 maximum length等。
在Bedrock中使用R1時(shí),我建議大家使用DeepSeek的預(yù)制聊天提示詞模板,這樣可以獲得更好的回復(fù)效果。模板如下:
<|begin▁of▁sentence|><|User|>content for inference<|Assistant|>
在大家集成DeepSeek到AI應(yīng)用之前,可以通過(guò)playground快速測(cè)試模型的響應(yīng),并優(yōu)化提示詞。
使用Python代碼調(diào)用DeepSeek-R1生成推理回復(fù)
以下的代碼段介紹了如何通過(guò)Python的形式調(diào)用Amazon Bedrock的invoke_model和ApplyGuardrail API兩個(gè)API進(jìn)行推理生成回復(fù)。該P(yáng)ython代碼段初始化了bedrock_runtime客戶(hù)端,配置了推理參數(shù),并發(fā)送包含提示詞的請(qǐng)求生成文本。
import boto3
import json
from enum import Enum# Initialize Bedrock client
bedrock_runtime = boto3.client("bedrock-runtime")# Configuration
MODEL_ID = "your-model-id" # Bedrock model ID
GUARDRAIL_ID = "your-guardrail-id"
GUARDRAIL_VERSION = "your-guardrail-version"class ChatTemplate(Enum):LLAMA = "llama"QWEN = "qwen"DEEPSEEK = "deepseek"def format_prompt(prompt, template):"""Format prompt according to model chat template"""templates = {ChatTemplate.LLAMA: f"""<|begin_of_text|><|start_header_id|>system<|end_header_id|>
You are a helpful assistant<|eot_id|><|start_header_id|>user<|end_header_id|>
{prompt}<|eot_id|><|start_header_id|>assistant<|end_header_id|>""",ChatTemplate.QWEN: f"""<|im_start|>user\n{prompt}<|im_end|>\n<|im_start|>assistant""",ChatTemplate.DEEPSEEK: f"""You are a helpful assistant <|User|>{prompt}<|Assistant|>"""}return templates[template]def invoke_with_guardrails(prompt, template=ChatTemplate.DEEPSEEK, max_tokens=1000, temperature=0.6, top_p=0.9):"""Invoke Bedrock model with input and output guardrails"""# Apply input guardrailsinput_guardrail = bedrock_runtime.apply_guardrail(guardrailIdentifier=GUARDRAIL_ID,guardrailVersion=GUARDRAIL_VERSION,source='INPUT',content=[{"text": {"text": prompt}}])if input_guardrail['action'] == 'GUARDRAIL_INTERVENED':return f"Input blocked: {input_guardrail['outputs'][0]['text']}"# Format prompt with selected templateformatted_prompt = format_prompt(prompt, template)# Prepare model inputrequest_body = {"inputs": formatted_prompt,"parameters": {"max_new_tokens": max_tokens,"top_p": top_p,"temperature": temperature}}# Invoke modelresponse = bedrock_runtime.invoke_model(modelId=MODEL_ID,body=json.dumps(request_body))# Parse model responsemodel_output = json.loads(response['body'].read())['generated_text']# Apply output guardrailsoutput_guardrail = bedrock_runtime.apply_guardrail(guardrailIdentifier=GUARDRAIL_ID,guardrailVersion=GUARDRAIL_VERSION,source='OUTPUT',content=[{"text": {"text": model_output}}])if output_guardrail['action'] == 'GUARDRAIL_INTERVENED':return f"Output blocked: {output_guardrail['outputs'][0]['text']}"return model_output# Example usage
if __name__ == "__main__":prompt = "What's 1+1?"result = invoke_with_guardrails(prompt, template=ChatTemplate.DEEPSEEK)print(result)
以上就是在亞馬遜云科技上云原生部署DeepSeek-R1模型的上篇內(nèi)容,我們?cè)诒酒型ㄟ^(guò)Amazon Bedrock部署并測(cè)試了DeepSeek模型,在下篇中小李哥將繼續(xù)介紹,如何利用Amazon Sagemaker JumpStart通過(guò)腳本的形式輕松一鍵部署DeepSeek預(yù)訓(xùn)練模型,請(qǐng)大家關(guān)注小李哥,不要錯(cuò)過(guò)云原生AI開(kāi)發(fā)方案的更多精彩內(nèi)容。