網(wǎng)站備案添加APP備案怎樣做推廣是免費(fèi)的
文章目錄
- 前言
- 一、主機(jī)配置
- 二、工具下載
- Ollama下載安裝
- 退出Ollama
- 下載DeepSeek R1模型
- 下載安裝ChatBox實(shí)現(xiàn)可視化交互
- ChatBox設(shè)置模型
前言
最近的國產(chǎn)大模型DeepSeek橫空出事,筆者也關(guān)注了下。網(wǎng)頁版的免費(fèi)而且推理速度很快,重量級(jí)的是它把自己詳細(xì)的推理思考過程展示了出來,回答的問題和給出的各種解決方案更詳細(xì)、完善,可以說是碾壓了其他所有的國產(chǎn)大模型。但是網(wǎng)頁版的總是服務(wù)器爆滿,最近受到的西方國家黑客攻擊又很多,體驗(yàn)不是很好。所以想著能本地部署下自己一個(gè)人使用就好了,于是筆者上網(wǎng)搜索了下資料,在自己的主機(jī)上搞了一套,但是結(jié)果卻差強(qiáng)人意,將就著能用吧,就是慢了點(diǎn),下面把安裝部署的詳細(xì)步驟展示給大家,感興趣的可以自己試著部署玩一玩。
一、主機(jī)配置
筆者的主機(jī)基本配置如下
操作系統(tǒng):windows11專業(yè)版
顯卡:4090(24G顯存)
處理器:Intel? Core? i9-14900KF 3.20 GHz
這個(gè)配置可以說不錯(cuò)了,盡管市面上5090出來了,但是其實(shí)效果都一樣,只有英偉達(dá)的計(jì)算顯卡(H100、A100、RTX 6000 Ada等)才行,不過價(jià)格都是幾萬到十幾萬元,最新的GB200售價(jià)在3萬-4萬美元。普通消費(fèi)級(jí)游戲顯卡算力完全不行。我們平時(shí)玩游戲的顯卡圖形渲染能力強(qiáng),專門用來玩各種3A大作。
-
游戲顯卡:
主要針對游戲、圖形渲染、視頻編輯等消費(fèi)級(jí)場景,優(yōu)化實(shí)時(shí)圖形性能(如高幀率、光線追蹤)。 -
計(jì)算顯卡:
面向科學(xué)計(jì)算、深度學(xué)習(xí)、AI訓(xùn)練、工程模擬等專業(yè)領(lǐng)域,注重并行計(jì)算能力和穩(wěn)定性。
二、工具下載
Ollama下載安裝
Ollama官網(wǎng)地址
下載windows上的,其他操作系統(tǒng)下載對應(yīng)的即可
這個(gè)由于是外網(wǎng)下載很慢的,筆者通過一些其他手段下了下來,已經(jīng)上傳到文章頂部的資源壓縮包了,可以自己下載解壓,或者愿意等的自己從官網(wǎng)上慢慢下載就行
這個(gè)Ollama應(yīng)用程序點(diǎn)擊安裝,默認(rèn)直接是安裝到C盤的,也沒法設(shè)置其他自定義路徑。。。
安裝好后默認(rèn)是運(yùn)行的,電腦右下角隱藏圖標(biāo)多一個(gè)小豬頭,鼠標(biāo)放上去有兩個(gè)選項(xiàng)
- View Logs:查看日志的
- Quit Ollama: 退出Ollama
安裝好后,管理員身份打開CMD,鍵入以下命令
ollama -v
可以看到Ollama安裝成功了
退出Ollama
上面的步驟說了,右下角的圖標(biāo)有個(gè)Quit Ollama,退出Ollama,點(diǎn)一下后,再次在cmd中輸入ollama -v
找不到正在運(yùn)行的Ollama實(shí)例了,怎么辦呢,當(dāng)我們關(guān)機(jī)后開機(jī)怎么重新運(yùn)行Ollama服務(wù)?莫急,只需要在電腦左下角搜索框輸入Ollama就可以找到剛才添加的應(yīng)用,鼠標(biāo)左鍵點(diǎn)擊一下,就可以了。
cmd再次查看運(yùn)行情況
當(dāng)然你也可以把這個(gè)Ollama應(yīng)用發(fā)送快捷方式到桌面上去,方便下次使用。
下載DeepSeek R1模型
- 選擇模型:Ollama軟件安裝完成后,便要獲取DeepSeek R1模型。再次打開Ollama官網(wǎng),點(diǎn)擊“Models”,在眾多模型中,“deepseek - r1”位列榜首,十分醒目。
可以看到有1.5b,7b,14b,32b,70b,621b這些不同參數(shù)個(gè)數(shù)的模型,分別代表15億,70億,140億,320億,700億,6210億。當(dāng)然訓(xùn)練參數(shù)個(gè)數(shù)越多,模型的能力越強(qiáng)了。點(diǎn)擊進(jìn)入,一般的電腦你就下載7b、14b就差不多了,像筆者的配置就可以下載32b。不過筆者一開始下載的是70b,也能跑,但是速度很慢,所以后面就又下載了32b。
選擇32b,復(fù)制后面的運(yùn)行命令
把復(fù)制的命令在cmd中執(zhí)行,注意執(zhí)行期間ollama不能退出,否則就會(huì)像我一樣下載失敗,再次運(yùn)行命令
下載安裝ChatBox實(shí)現(xiàn)可視化交互
上面的交互是在cmd上進(jìn)行的,不是很友好,這里有個(gè)工具ChatBox,集成了很多大模型,實(shí)現(xiàn)可視化交互
ChatBox下載地址
這個(gè)下載速度比較快了,不過筆者也在文章頂部的資源壓縮包里一并提供了,點(diǎn)擊安裝即可
ChatBox設(shè)置模型
選擇Ollama API,模型選擇deepseek-r1:70b(或者下載的32b就選32b)
上面的設(shè)置好后就可以使用ChatBox進(jìn)行可視化交互了
70b的運(yùn)行速度比較慢,32b可能會(huì)好點(diǎn)吧,不明白的評(píng)論區(qū)找我!