Ollama：大模型一键部署工具，轻松安装DeepSeek到本地

小半 • 2025年2月6日下午5:03 • 技术分享 • 阅读 212

Ollama是什么？
Ollama是一款开源的本地大语言模型（LLM）运行框架，支持Linux/macOS/Windows多平台。它通过简单的命令行工具，让用户无需复杂配置就能在本地运行Llama、DeepSeek、Phi等前沿AI模型。通过智能化的依赖检测、自动GPU加速支持，以及轻量级架构设计，Ollama将大模型部署门槛降到新低。

核心功能亮点

开箱即用：预置Llama3、DeepSeek-R1等20+热门模型库，支持ollama run命令直接调用
硬件适配：自动识别NVIDIA/AMD显卡，智能安装CUDA/ROCM驱动组件
跨平台：支持Docker部署，提供Python/JavaScript客户端库
自定义扩展：允许通过Modelfile修改模型参数、添加个性对话模板
资源友好：最小1.4B参数的moondream模型仅需829MB内存即可运行

三步完成安装（以Linux为例）

# 执行自动化安装脚本（支持amd64/arm64架构）
curl -fsSL https://ollama.com/install.sh | sh

# 验证安装结果（显示版本号即成功）
ollama --version

安装过程自动完成以下关键步骤：

创建/usr/local/bin/ollama可执行文件
配置systemd服务实现开机自启
检测NVIDIA显卡时自动部署CUDA驱动
对WSL2环境进行特殊适配

实战：部署DeepSeek-R1模型

# 拉取最新版DeepSeek模型（约5.6GB）
ollama pull deepseek-r1

# 启动交互式对话
ollama run deepseek-r1
>>> 请用七言绝句描写江南春色

性能需求参考表

模型规模	推荐内存	典型响应时间
3B参数	2GB+	0.8秒/词
7B参数	8GB+	1.2秒/词
13B参数	16GB+	2.1秒/词
70B参数	32GB+	4.5秒/词

开发者进阶技巧

混合精度加速：在Modelfile中添加PARAMETER fp16 true启用FP16计算
多模态支持：使用llava模型解析图片ollama run llava "描述这张图 /path/to/image.png"
API集成：通过REST接口调用模型服务

import requests
response = requests.post('http://localhost:11434/api/generate', json={
  "model": "deepseek-r1",
  "prompt": "解释量子纠缠现象"
})

总结
Ollama重新定义了本地大模型部署的便捷标准。无论是开发者快速搭建AI原型，还是研究者进行模型对比测试，亦或是普通用户探索生成式AI，通过其简洁的命令行交互和智能化的资源管理，让每个人都能在个人电脑上轻松驾驭前沿AI技术。配合DeepSeek等中文优化模型，更可解锁符合本土需求的智能应用场景。

项目地址：https://github.com/ollama/ollama