部署自己的AI程序Ollama以供UPage调用API

发表于2025-10-24 | 更新于 2025-10-25 | 部署教程

| 字数总计: 2108 | 阅读时长: 1分钟 | 阅读量:207

这篇文章距离最后更新已过132 天,如果文章内容或图片资源失效，请留言反馈，我会及时处理，谢谢！

简介

能够运行大型语言模型的程序

安装

同Upage可以部署在自己电脑或者服务器
在自己电脑中部署的好处是可以使用GPU来一起运算
依旧推荐使用docker

个人电脑

Windows:
官网下载

MacOS:
官网下载

服务器

Linux

curl -fsSL https://ollama.com/install.sh | sh

Docker

直接拖取官方的Docker镜像 ollama/ollama

下载运行模型库

以deepseek示例

ollama run deepseek-r1

模型库地址 ollama.com/library

常用的模型列表

模型	参数	大小	在ollama下载运行模型库的命令
Gemma 3	1B	815MB	ollama run gemma3:1b
Gemma 3	4B	3.3GB	ollama run gemma3
Gemma 3	12B	8.1GB	ollama run gemma3:12b
Gemma 3	27B	17GB	ollama run gemma3:27b
QwQ	32B	20GB	ollama run qwq
DeepSeek-R1	7B	4.7GB	ollama run deepseek-r1
DeepSeek-R1	671B	404GB	ollama run deepseek-r1:671b
Llama 4	109B	67GB	ollama run llama4:scout
Llama 4	400B	245GB	ollama run llama4:maverick
Llama 3.3	70B	43GB	ollama run llama3.3
Llama 3.2	3B	2.0GB	ollama run llama3.2
Llama 3.2	1B	1.3GB	ollama run llama3.2:1b
Llama 3.2 Vision	11B	7.9GB	ollama run llama3.2-vision
Llama 3.2 Vision	90B	55GB	ollama run llama3.2-vision:90b
Llama 3.1	8B	4.7GB	ollama run llama3.1
Llama 3.1	405B	231GB	ollama run llama3.1:405b
Phi 4	14B	9.1GB	ollama run phi4
Phi 4 Mini	3.8B	2.5GB	ollama run phi4-mini
Mistral	7B	4.1GB	ollama run mistral
Moondream 2	1.4B	829MB	ollama run moondream
Neural Chat	7B	4.1GB	ollama run neural-chat
Starling	7B	4.1GB	ollama run starling-lm
Code Llama	7B	3.8GB	ollama run codellama
Llama 2 Uncensored	7B	3.8GB	ollama run llama2-uncensored
LLaVA	7B	4.5GB	ollama run llava
Granite-3.3	8B	4.9GB	ollama run granite3.3

8GB的内存可运行7B参数的模型, 16GB的内存运行13B参数的模型, 16GB的内存运行33B参数的模型. 以此类推

停止运行模型命令

ollama stop deepseek-r1

当然也可以是其他正在运行的模型

作者: Shadow

文章链接: https://b.130305.xyz/20251024/6.html

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自黑影笔记！

无标签

评论