为什么你需要一个 24/7 运行的 AI Agent 工作站?
2026 年,AI Agent 不再是大厂的专利。一个运行在 VPS 上的本地 AI 工作站,能帮你:
- 7×24 自动处理邮件、社交媒体、数据抓取
- 隐私优先:所有数据在你自己的服务器上,不经过任何第三方
- 成本可控:月费 $5-10,比 ChatGPT Plus 订阅还便宜
- 可定制:根据你的工作流自由组合工具链
本文将用实测数据告诉你,如何用最低预算搭建一套完整的 AI Agent 自动化系统。
你需要准备什么
| 准备项 | 说明 | 花费 |
|---|---|---|
| VPS 服务器 | 2GB+ 内存,推荐 KVM 架构 | $5-10/月 |
| 域名(可选) | 用于 HTTPS 访问 | $10-15/年 |
| SSH 客户端 | Terminal / PuTTY / Termius | 免费 |
如果你还没有 VPS,以下是三个实测性价比最高的选项:
| VPS 服务商 | 最低月费 | 内存 | 存储 | 带宽 | 选购链接 |
|---|---|---|---|---|---|
| RackNerd | $11.29/年 | 1GB | 20GB SSD | 1TB | 立即选购 |
| Hostinger | $5.99/月 | 2GB | 20GB NVMe | 1TB | 立即选购 |
| Vultr | $5/月 | 1GB | 25GB SSD | 1TB | 立即选购 |
💡 推荐选择:如果预算有限,RackNerd 年付方案($11.29/年,折合不到 $1/月)是最划算的入门选择。需要 2GB 内存跑 Ollama 小模型的话,Hostinger KVM 2 方案($5.99/月)是最佳平衡点。
第 1 步:购买并初始化 VPS
以 RackNerd 为例,购买流程非常简单:
- 访问 RackNerd 官网,选择 KVM VPS 方案
- 选择机房位置(洛杉矶 DC-02 对亚洲延迟最低)
- 操作系统选 Ubuntu 22.04 LTS
- 完成付款,等待邮件收到服务器 IP 和 root 密码
# SSH 登录服务器
ssh root@你的服务器IP
# 更新系统
apt update && apt upgrade -y
# 安装基础工具
apt install -y curl wget git htop tmux
第 2 步:安装 Docker(AI 工具的基础)
几乎所有 AI 工具都基于 Docker 部署,一键安装:
# 安装 Docker
curl -fsSL https://get.docker.com | sh
# 将当前用户加入 docker 组(非 root 用户需要)
usermod -aG docker $USER
# 验证安装
docker --version
第 3 步:部署 Ollama(本地大语言模型引擎)
Ollama 是运行开源 LLM 的最简方案,支持 Llama 3、Qwen、Gemma 等主流模型。
# 一键安装 Ollama
curl -fsSL https://ollama.com/install.sh | sh
# 下载并运行模型(推荐从轻量模型开始)
ollama pull qwen2.5:3b # 3B 参数,占用约 2GB 内存
ollama pull llama3.1:8b # 8B 参数,需要 4GB+ 内存
# 测试运行
ollama run qwen2.5:3b "你好,请自我介绍"
模型选择建议(根据 VPS 内存):
| VPS 内存 | 推荐模型 | 用途 |
|---|---|---|
| 1GB | qwen2.5:0.5b | 简单问答、文本生成 |
| 2GB | qwen2.5:3b | 日常对话、代码辅助 |
| 4GB | llama3.1:8b | 复杂推理、长文写作 |
| 8GB+ | qwen2.5:14b | 专业级任务 |
⚠️ 注意:CPU 推理速度比 GPU 慢很多,但足以应付个人使用场景。响应时间在 5-30 秒之间,完全可接受。
第 4 步:部署 Open WebUI(可视化聊天界面)
Open WebUI 提供类似 ChatGPT 的 Web 界面,直接连接 Ollama:
# 一行命令部署
docker run -d \
--name open-webui \
--restart always \
-p 3000:8080 \
-v open-webui:/app/backend/data \
-e OLLAMA_BASE_URL=http://host.docker.internal:11434 \
ghcr.io/open-webui/open-webui:main
部署完成后,浏览器访问 http://你的服务器IP:3000,即可看到聊天界面。
功能亮点:
- 多模型切换(在界面内直接选择不同模型)
- 文件上传和图片识别
- 对话历史保存
- 用户权限管理(多人共享一台服务器)
第 5 步:部署 n8n(AI Agent 自动化工作流)
n8n 是开源的工作流自动化工具,可以把 AI 能力串联到实际业务中:
# 部署 n8n
docker run -d \
--name n8n \
--restart always \
-p 5678:5678 \
-v n8n_data:/home/node/.n8n \
-e N8N_SECURE_COOKIE=false \
docker.n8n.io/n8nio/n8n
浏览器访问 http://你的服务器IP:5678,进入 n8n 工作台。
实用 AI Agent 工作流示例
示例 1:AI 邮件助手
触发器:收到新邮件
→ AI 分析邮件内容
→ 自动生成回复草稿
→ 发送到你的 Telegram/Slack
示例 2:内容监控 Agent
定时触发:每小时
→ 抓取指定网站/RSS
→ AI 总结新内容
→ 推送到 Discord 频道
示例 3:数据分析 Agent
触发器:Google Sheets 新增行
→ AI 分析数据趋势
→ 生成周报
→ 自动发送邮件
第 6 步:配置反向代理和 HTTPS(可选但推荐)
用 Caddy 一键配置 HTTPS,让你的 AI 工作站通过域名安全访问:
# 安装 Caddy
apt install -y caddy
# 配置(替换 your-domain.com)
cat > /etc/caddy/Caddyfile << 'EOF'
ai.your-domain.com {
reverse_proxy localhost:3000
}
n8n.your-domain.com {
reverse_proxy localhost:5678
}
api.your-domain.com {
reverse_proxy localhost:11434
}
EOF
# 重启 Caddy(自动申请 SSL 证书)
systemctl restart caddy
完整架构一览
┌─────────────────────────────────────────┐
│ VPS ($10/月) │
│ │
│ ┌──────────┐ ┌──────────┐ │
│ │ Ollama │ │ Open │ │
│ │ (LLM) │←→│ WebUI │ │
│ └────┬─────┘ │ (Chat) │ │
│ │ └──────────┘ │
│ │ ┌──────────┐ │
│ └───────→│ n8n │ │
│ │ (Agent) │ │
│ └────┬─────┘ │
│ │ │
│ ┌──────┴──────┐ │
│ │ 外部服务 │ │
│ │ Telegram │ │
│ │ Gmail │ │
│ │ RSS/网页 │ │
│ └─────────────┘ │
└─────────────────────────────────────────┘
性能实测数据
我们在 RackNerd $11.29/年方案(1GB RAM, 1 vCPU)上实测:
| 指标 | 结果 |
|---|---|
| Ollama qwen2.5:0.5b 首 token 延迟 | ~2 秒 |
| Ollama qwen2.5:3b 首 token 延迟 | ~8 秒 |
| Open WebUI 冷启动时间 | ~15 秒 |
| n8n 工作流执行延迟 | <1 秒(不含 AI 推理) |
| 内存占用(全栈运行) | ~780MB / 1GB |
| 稳定性(7 天运行) | 零宕机 |
💡 结论:1GB 内存跑轻量模型完全够用,但建议至少 2GB 以获得更好的体验。
常见问题(FAQ)
Q: 1GB 内存能跑 Ollama 吗?
可以,但只能运行 0.5B-1.5B 的小模型。推荐至少 2GB 内存跑 3B 模型,获得可用的对话体验。如果预算允许,4GB 内存是最佳选择。
Q: 没有 GPU 能用吗?
完全没问题。Ollama 支持纯 CPU 推理,只是速度比 GPU 慢。对于个人使用的 Agent 工作流(每分钟几次请求),CPU 推理完全够用。
Q: 和直接用 ChatGPT API 比哪个划算?
如果你每天使用量不大(<100 次对话),ChatGPT API 可能更便宜。但如果你需要 24/7 自动化运行、隐私敏感数据处理、离线可用,自建 VPS 方案更合适。而且本地模型没有使用限制和封号风险。
Q: 能跑更大的模型吗?
4GB VPS 可以跑 8B 模型,8GB VPS 可以跑 14B 模体。但更大的模型(70B+)需要 GPU 服务器,VPS 方案不适合。
Q: 被攻击了怎么办?
建议:1) 修改 SSH 端口 2) 启用密钥登录 3) 安装 fail2ban 4) 只开放必要端口 5) 定期更新系统。
Q: 用哪个 VPS 服务商最好?
总结推荐
| 你的需求 | 推荐方案 | 月费 | 选购 |
|---|---|---|---|
| 入门体验 | RackNerd 1GB + qwen2.5:0.5b | $0.94 | 立即选购 |
| 日常使用 | Hostinger KVM 2 + qwen2.5:3b | $5.99 | 立即选购 |
| 专业工作流 | Vultr 2GB + llama3.1:8b | $12 | 立即选购 |
我的推荐:从 RackNerd 年付方案开始试水($11.29 用一年),跑通基础流程后再根据需求升级。AI Agent 的核心价值不在于模型大小,而在于工作流设计——一个跑在 $1/月 VPS 上的 3B 模型,配合精心设计的 n8n 自动化流程,胜过一个没有自动化的 70B 模型。
下一步
搭建完成后,你可以:
- 探索更多 n8n 工作流模板(n8n.io/workflows)
- 尝试不同的开源模型(Hugging Face 上有数千个可选)
- 加入社区讨论,分享你的自动化方案
As an Amazon Associate and affiliate partner, HonestRadar may earn a commission from qualifying purchases made through links on this page. This comes at no additional cost to you and helps support our independent reviews. We only recommend products and services we genuinely believe in.
Prices and availability are subject to change. Please verify current pricing on the provider’s website before making a purchase decision.
