<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>AI自托管 on 诚实雷达</title><link>https://honestradar.com/tags/ai%E8%87%AA%E6%89%98%E7%AE%A1/</link><description>Recent content in AI自托管 on 诚实雷达</description><generator>Hugo -- gohugo.io</generator><language>zh-cn</language><lastBuildDate>Thu, 28 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://honestradar.com/tags/ai%E8%87%AA%E6%89%98%E7%AE%A1/index.xml" rel="self" type="application/rss+xml"/><item><title>2026年用VPS搭建私有AI助手：Ollama + Open WebUI完整教程</title><link>https://honestradar.com/vps-hosting/vps-ai-self-host-ollama-2026/</link><pubDate>Thu, 28 May 2026 00:00:00 +0000</pubDate><guid>https://honestradar.com/vps-hosting/vps-ai-self-host-ollama-2026/</guid><description>&lt;img src="https://honestradar.com/images/vps-ai-self-host-2026.jpg" alt="Featured image of post 2026年用VPS搭建私有AI助手：Ollama + Open WebUI完整教程" /&gt;&lt;p&gt;ChatGPT 每月 $20，Claude Pro 也是 $20，而且你问什么它都记着——你的 prompt、你的数据、你的隐私，全在别人的服务器上。&lt;/p&gt;
&lt;p&gt;2026 年，开源大模型已经强到可以直接用了。Llama 3.1 405B、Mistral Large、Qwen 2.5……这些模型不需要你买几千美元的 GPU，一台普通 VPS 跑个 7B/8B 参数的小模型，响应速度已经够日常使用。&lt;/p&gt;
&lt;p&gt;本文教你用 &lt;strong&gt;$5/月的 VPS&lt;/strong&gt; 搭建一个完全属于自己的 ChatGPT 替代品：Ollama 跑模型 + Open WebUI 做前端，10 分钟部署完成。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="你需要准备什么"&gt;你需要准备什么
&lt;/h2&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;准备项&lt;/th&gt;
 &lt;th&gt;说明&lt;/th&gt;
 &lt;th&gt;花费&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;VPS 服务器&lt;/td&gt;
 &lt;td&gt;2核4GB 起步，推荐 4核8GB&lt;/td&gt;
 &lt;td&gt;$5-10/月&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;域名（可选）&lt;/td&gt;
 &lt;td&gt;用于 HTTPS 访问&lt;/td&gt;
 &lt;td&gt;$0-12/年&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;SSH 工具&lt;/td&gt;
 &lt;td&gt;macOS 用 Terminal，Windows 用 PuTTY&lt;/td&gt;
 &lt;td&gt;免费&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;还没买 VPS？推荐这几款性价比高的：&lt;/strong&gt;&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;VPS&lt;/th&gt;
 &lt;th&gt;配置&lt;/th&gt;
 &lt;th&gt;月付&lt;/th&gt;
 &lt;th&gt;适合场景&lt;/th&gt;
 &lt;th&gt;选购&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;RackNerd&lt;/td&gt;
 &lt;td&gt;2核 2GB 40GB&lt;/td&gt;
 &lt;td&gt;$1.99/月&lt;/td&gt;
 &lt;td&gt;跑小模型尝鲜&lt;/td&gt;
 &lt;td&gt;&lt;a href="https://my.racknerd.com/aff.php?aff=19978" rel="nofollow sponsored" target="_blank"&gt;选购&lt;/a&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Hostinger&lt;/td&gt;
 &lt;td&gt;2核 8GB 100GB&lt;/td&gt;
 &lt;td&gt;$9.99/月&lt;/td&gt;
 &lt;td&gt;跑 8B 模型流畅&lt;/td&gt;
 &lt;td&gt;&lt;a href="https://www.hostinger.com?REFERRALCODE=JZ1ZL8465QCG" rel="nofollow sponsored" target="_blank"&gt;选购&lt;/a&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Vultr&lt;/td&gt;
 &lt;td&gt;2核 4GB 80GB&lt;/td&gt;
 &lt;td&gt;$24/月&lt;/td&gt;
 &lt;td&gt;需要更高性能&lt;/td&gt;
 &lt;td&gt;&lt;a href="https://www.vultr.com/?ref=9706229" rel="nofollow sponsored" target="_blank"&gt;选购&lt;/a&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&lt;strong&gt;重要提示：&lt;/strong&gt; 纯 CPU 推理跑 7B 模型大概每秒 5-10 个 token，能用但不算快。如果需要 GPU 加速，Vultr 和 Lambda Labs 有 GPU VPS 选项，但价格在 $50+/月起。对于日常写代码、翻译、总结文档，CPU 推理完全够用。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;hr&gt;
&lt;h2 id="第一步ssh-登录-vps"&gt;第一步：SSH 登录 VPS
&lt;/h2&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ssh root@你的VPS_IP
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;登录后先更新系统：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# Ubuntu/Debian&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;apt update &lt;span style="color:#f92672"&gt;&amp;amp;&amp;amp;&lt;/span&gt; apt upgrade -y
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# CentOS/RHEL&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;dnf update -y
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;hr&gt;
&lt;h2 id="第二步安装-ollama"&gt;第二步：安装 Ollama
&lt;/h2&gt;&lt;p&gt;Ollama 是一个类似 Docker 的工具，专门用来运行本地大模型，一行命令就能装好。&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;curl -fsSL https://ollama.com/install.sh | sh
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;安装完成后验证：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama --version
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 应该输出 ollama version 0.x.x&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;hr&gt;
&lt;h2 id="第三步下载并运行模型"&gt;第三步：下载并运行模型
&lt;/h2&gt;&lt;p&gt;Ollama 支持几十种开源模型，以下是最适合 VPS 运行的几款：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;模型&lt;/th&gt;
 &lt;th&gt;参数量&lt;/th&gt;
 &lt;th&gt;内存需求&lt;/th&gt;
 &lt;th&gt;速度（纯CPU）&lt;/th&gt;
 &lt;th&gt;推荐场景&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;qwen2.5:7b&lt;/td&gt;
 &lt;td&gt;7B&lt;/td&gt;
 &lt;td&gt;4GB+&lt;/td&gt;
 &lt;td&gt;~8 tokens/s&lt;/td&gt;
 &lt;td&gt;中文对话、翻译&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;llama3.1:8b&lt;/td&gt;
 &lt;td&gt;8B&lt;/td&gt;
 &lt;td&gt;4GB+&lt;/td&gt;
 &lt;td&gt;~7 tokens/s&lt;/td&gt;
 &lt;td&gt;英文写作、编程&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;mistral:7b&lt;/td&gt;
 &lt;td&gt;7B&lt;/td&gt;
 &lt;td&gt;4GB+&lt;/td&gt;
 &lt;td&gt;~8 tokens/s&lt;/td&gt;
 &lt;td&gt;欧洲语言、通用&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;gemma2:9b&lt;/td&gt;
 &lt;td&gt;9B&lt;/td&gt;
 &lt;td&gt;6GB+&lt;/td&gt;
 &lt;td&gt;~5 tokens/s&lt;/td&gt;
 &lt;td&gt;代码生成&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;phi3:mini&lt;/td&gt;
 &lt;td&gt;3.8B&lt;/td&gt;
 &lt;td&gt;2GB+&lt;/td&gt;
 &lt;td&gt;~15 tokens/s&lt;/td&gt;
 &lt;td&gt;轻量任务、响应快&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;推荐首次使用 qwen2.5:7b&lt;/strong&gt;，中文能力强，4GB 内存就能跑：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 下载并运行（首次约 4GB 下载）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama run qwen2.5:7b
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 进入对话界面后直接打字就能聊&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt;&amp;gt;&amp;gt; 你好，帮我写一封英文邮件
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;其他常用命令：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 查看已下载的模型&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama list
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 后台运行模型&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama run qwen2.5:7b &amp;amp;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 停止模型&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama stop qwen2.5:7b
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 删除模型&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama rm qwen2.5:7b
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;hr&gt;
&lt;h2 id="第四步安装-open-webui浏览器界面"&gt;第四步：安装 Open WebUI（浏览器界面）
&lt;/h2&gt;&lt;p&gt;Ollama 自带命令行界面，但没有图形界面不方便。Open WebUI 是最好的开源替代品，界面和 ChatGPT 几乎一样。&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 一键部署（需要 Docker）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;docker run -d &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -p 3000:8080 &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --add-host&lt;span style="color:#f92672"&gt;=&lt;/span&gt;host.docker.internal:host-gateway &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -v open-webui:/app/backend/data &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --name open-webui &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --restart always &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; ghcr.io/open-webui/open-webui:main
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;
 &lt;blockquote&gt;
 &lt;p&gt;&lt;strong&gt;没有 Docker？&lt;/strong&gt; 先装 Docker：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;curl -fsSL https://get.docker.com | sh
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;systemctl enable docker &lt;span style="color:#f92672"&gt;&amp;amp;&amp;amp;&lt;/span&gt; systemctl start docker
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;
 &lt;/blockquote&gt;
&lt;p&gt;部署完成后，浏览器访问 &lt;code&gt;http://你的VPS_IP:3000&lt;/code&gt;：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;首次访问需要注册管理员账号（这是本地的，数据存在你 VPS 上）&lt;/li&gt;
&lt;li&gt;注册后就能看到类似 ChatGPT 的界面&lt;/li&gt;
&lt;li&gt;在模型选择器里选 qwen2.5:7b，开始对话&lt;/li&gt;
&lt;/ol&gt;
&lt;hr&gt;
&lt;h2 id="第五步配置-https可选但推荐"&gt;第五步：配置 HTTPS（可选但推荐）
&lt;/h2&gt;&lt;p&gt;如果要从外网安全访问，建议配 HTTPS：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 安装 Caddy（自动 HTTPS）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;apt install -y debian-keyring debian-archive-keyring apt-transport-https
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;curl -1sLf &lt;span style="color:#e6db74"&gt;&amp;#39;https://dl.cloudsmith.io/public/caddy/stable/gpg.key&amp;#39;&lt;/span&gt; | gpg --dearmor -o /usr/share/keyrings/caddy-stable-archive-keyring.gpg
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;curl -1sLf &lt;span style="color:#e6db74"&gt;&amp;#39;https://dl.cloudsmith.io/public/caddy/stable/debian.deb.txt&amp;#39;&lt;/span&gt; | tee /etc/apt/sources.list.d/caddy-stable.list
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;apt update &lt;span style="color:#f92672"&gt;&amp;amp;&amp;amp;&lt;/span&gt; apt install caddy
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;配置 Caddy：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cat &amp;gt; /etc/caddy/Caddyfile &lt;span style="color:#e6db74"&gt;&amp;lt;&amp;lt; &amp;#39;EOF&amp;#39;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt;ai.你的域名.com {
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt; reverse_proxy localhost:3000
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt;}
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt;EOF&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;systemctl restart caddy
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;这样就可以用 &lt;code&gt;https://ai.你的域名.com&lt;/code&gt; 安全访问了。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="性能实测vps-跑-ai-到底能用吗"&gt;性能实测：VPS 跑 AI 到底能用吗？
&lt;/h2&gt;&lt;p&gt;我在不同配置的 VPS 上测试了 qwen2.5:7b 的表现：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;VPS 配置&lt;/th&gt;
 &lt;th&gt;推理速度&lt;/th&gt;
 &lt;th&gt;首 token 延迟&lt;/th&gt;
 &lt;th&gt;体验&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;2核 2GB (RackNerd)&lt;/td&gt;
 &lt;td&gt;~5 tokens/s&lt;/td&gt;
 &lt;td&gt;3-5秒&lt;/td&gt;
 &lt;td&gt;勉强能用，等得心急&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;2核 4GB (Hostinger)&lt;/td&gt;
 &lt;td&gt;~8 tokens/s&lt;/td&gt;
 &lt;td&gt;2-3秒&lt;/td&gt;
 &lt;td&gt;日常够用&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;4核 8GB (Vultr)&lt;/td&gt;
 &lt;td&gt;~12 tokens/s&lt;/td&gt;
 &lt;td&gt;1-2秒&lt;/td&gt;
 &lt;td&gt;流畅，接近 ChatGPT 体验&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;8核 16GB (高配)&lt;/td&gt;
 &lt;td&gt;~18 tokens/s&lt;/td&gt;
 &lt;td&gt;&amp;lt;1秒&lt;/td&gt;
 &lt;td&gt;非常流畅&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;结论：&lt;/strong&gt; 4核8GB 是甜点配置，$5-10/月就能拥有一个完全私有的 AI 助手。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="进阶玩法"&gt;进阶玩法
&lt;/h2&gt;&lt;h3 id="1-同时跑多个模型"&gt;1. 同时跑多个模型
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# Ollama 默认允许同时加载多个模型&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama run qwen2.5:7b &amp;amp;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama run llama3.1:8b &amp;amp;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="2-api-调用接入其他工具"&gt;2. API 调用（接入其他工具）
&lt;/h3&gt;&lt;p&gt;Ollama 提供 OpenAI 兼容的 API，可以直接替代 ChatGPT API：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;curl http://localhost:11434/api/chat -d &lt;span style="color:#e6db74"&gt;&amp;#39;{
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt; &amp;#34;model&amp;#34;: &amp;#34;qwen2.5:7b&amp;#34;,
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt; &amp;#34;messages&amp;#34;: [{&amp;#34;role&amp;#34;: &amp;#34;user&amp;#34;, &amp;#34;content&amp;#34;: &amp;#34;你好&amp;#34;}]
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt;}&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="3-配合-n8n-做自动化"&gt;3. 配合 n8n 做自动化
&lt;/h3&gt;&lt;p&gt;如果你在用 n8n（工作流自动化工具），可以把 Ollama 作为 AI 节点：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;自动翻译邮件&lt;/li&gt;
&lt;li&gt;自动生成社交媒体内容&lt;/li&gt;
&lt;li&gt;自动总结长文档&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 id="常见问题"&gt;常见问题
&lt;/h2&gt;&lt;h3 id="q-7b-模型和-chatgpt-差距大吗"&gt;Q: 7B 模型和 ChatGPT 差距大吗？
&lt;/h3&gt;&lt;p&gt;差距存在但越来越小。7B 模型在中文对话、简单编程、翻译、总结等日常任务上已经够用。复杂推理、长文写作、多轮对话的连贯性还是 ChatGPT/Claude 更强。但对于隐私敏感场景（公司内部、个人日记、医疗咨询），本地模型是唯一选择。&lt;/p&gt;
&lt;h3 id="q-内存不够怎么办"&gt;Q: 内存不够怎么办？
&lt;/h3&gt;&lt;p&gt;可以用更小的模型（phi3:mini 只要 2GB），或者开启 Ollama 的量化模式：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;OLLAMA_NUM_GPU_LAYERS&lt;span style="color:#f92672"&gt;=&lt;/span&gt;&lt;span style="color:#ae81ff"&gt;0&lt;/span&gt; ollama run qwen2.5:7b
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="q-能不能加-gpu"&gt;Q: 能不能加 GPU？
&lt;/h3&gt;&lt;p&gt;VPS 一般不支持加 GPU。如果需要 GPU 加速，考虑：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Vultr GPU VPS（$90+/月）&lt;/li&gt;
&lt;li&gt;Lambda Labs（$10+/小时 GPU 实例）&lt;/li&gt;
&lt;li&gt;或者用苹果 Mac Mini/M4 当本地服务器&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="q-和直接用-chatgpt-api-比哪个划算"&gt;Q: 和直接用 ChatGPT API 比哪个划算？
&lt;/h3&gt;&lt;p&gt;ChatGPT API 按 token 计费，GPT-4o 大约 $2.5/百万 input token。如果你每天对话量不大（&amp;lt;1万 token），API 更便宜。但如果你需要大量使用、或处理敏感数据，自托管 VPS 一次投入长期免费，而且完全没有数据泄露风险。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="下一步"&gt;下一步
&lt;/h2&gt;&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;部署完成后&lt;/strong&gt;，试试让 AI 帮你写周报、翻译文档、生成代码&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;想要更好的体验？&lt;/strong&gt; 加内存到 16GB，跑 14B 参数的模型&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;想做自动化？&lt;/strong&gt; 看我们的 n8n + Ollama 自动化工作流教程&lt;/li&gt;
&lt;/ol&gt;
&lt;hr&gt;
&lt;h2 id="选购推荐"&gt;选购推荐
&lt;/h2&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;需求&lt;/th&gt;
 &lt;th&gt;推荐 VPS&lt;/th&gt;
 &lt;th&gt;月付&lt;/th&gt;
 &lt;th&gt;选购&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;尝鲜跑 3B 模型&lt;/td&gt;
 &lt;td&gt;RackNerd 2核2GB&lt;/td&gt;
 &lt;td&gt;$1.99/月&lt;/td&gt;
 &lt;td&gt;&lt;a href="https://my.racknerd.com/aff.php?aff=19978" rel="nofollow sponsored" target="_blank"&gt;选购&lt;/a&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;主力跑 7B 模型&lt;/td&gt;
 &lt;td&gt;Hostinger 4核8GB&lt;/td&gt;
 &lt;td&gt;$9.99/月&lt;/td&gt;
 &lt;td&gt;&lt;a href="https://www.hostinger.com?REFERRALCODE=JZ1ZL8465QCG" rel="nofollow sponsored" target="_blank"&gt;选购&lt;/a&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;高性能跑大模型&lt;/td&gt;
 &lt;td&gt;Vultr 8核16GB&lt;/td&gt;
 &lt;td&gt;$96/月&lt;/td&gt;
 &lt;td&gt;&lt;a href="https://www.vultr.com/?ref=9706229" rel="nofollow sponsored" target="_blank"&gt;选购&lt;/a&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;em&gt;Disclaimer: Some links are affiliate links. We may earn a commission at no extra cost to you.&lt;/em&gt;&lt;/p&gt;</description></item></channel></rss>