<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Ollama on 诚实雷达</title><link>https://honestradar.com/tags/ollama/</link><description>Recent content in Ollama on 诚实雷达</description><generator>Hugo -- gohugo.io</generator><language>zh-cn</language><lastBuildDate>Fri, 29 May 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://honestradar.com/tags/ollama/index.xml" rel="self" type="application/rss+xml"/><item><title>2026年用VPS部署AI应用：低成本搭建你的私人AI助手和模型服务</title><link>https://honestradar.com/vps-hosting/vps-deploy-ai-apps-2026/</link><pubDate>Fri, 29 May 2026 00:00:00 +0000</pubDate><guid>https://honestradar.com/vps-hosting/vps-deploy-ai-apps-2026/</guid><description>&lt;img src="https://honestradar.com/images/vps-deploy-ai-apps-2026.jpg" alt="Featured image of post 2026年用VPS部署AI应用：低成本搭建你的私人AI助手和模型服务" /&gt;&lt;p&gt;2026年，AI已经不是大公司的专利了。&lt;/p&gt;
&lt;p&gt;一台普通VPS，月花几美元，就能跑起Ollama大模型、部署AI写作助手、搭建私有知识库。不需要显卡，不需要高配，甚至不需要你会写代码——因为AI已经能帮你写部署脚本了。&lt;/p&gt;
&lt;p&gt;今天教你在VPS上部署三种最实用的AI应用，全程手把手。&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&lt;strong&gt;本文适合谁：&lt;/strong&gt; 想玩AI但不想花大钱买显卡的用户。如果你还没买VPS，推荐 &lt;a href="https://my.racknerd.com/aff.php?aff=19978" rel="nofollow sponsored" target="_blank"&gt;RackNerd 2核4G $43.88/年&lt;/a&gt;，性价比最高的AI练手机。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;hr&gt;
&lt;h2 id="为什么用vps部署ai"&gt;为什么用VPS部署AI？
&lt;/h2&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;方案&lt;/th&gt;
 &lt;th&gt;月成本&lt;/th&gt;
 &lt;th style="text-align: center"&gt;上手难度&lt;/th&gt;
 &lt;th style="text-align: center"&gt;灵活性&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;云GPU（AWS/Google）&lt;/td&gt;
 &lt;td&gt;$50-500&lt;/td&gt;
 &lt;td style="text-align: center"&gt;⭐⭐⭐&lt;/td&gt;
 &lt;td style="text-align: center"&gt;⭐⭐⭐&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;本地显卡&lt;/td&gt;
 &lt;td&gt;$300-2000一次性&lt;/td&gt;
 &lt;td style="text-align: center"&gt;⭐⭐&lt;/td&gt;
 &lt;td style="text-align: center"&gt;⭐&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;普通VPS&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;&lt;strong&gt;$3-10&lt;/strong&gt;&lt;/td&gt;
 &lt;td style="text-align: center"&gt;&lt;strong&gt;⭐&lt;/strong&gt;&lt;/td&gt;
 &lt;td style="text-align: center"&gt;&lt;strong&gt;⭐⭐⭐&lt;/strong&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;没错，普通VPS（无GPU）也能跑AI。关键在于：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;选择合适的模型&lt;/strong&gt;——不是所有AI都需要GPU&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;用量化版本&lt;/strong&gt;——4-bit/8-bit量化让CPU也能跑&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;用API中转&lt;/strong&gt;——本地跑小模型，复杂任务调用云端API&lt;/li&gt;
&lt;/ol&gt;
&lt;hr&gt;
&lt;h2 id="准备工作"&gt;准备工作
&lt;/h2&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;准备事项&lt;/th&gt;
 &lt;th&gt;说明&lt;/th&gt;
 &lt;th&gt;推荐配置&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;VPS&lt;/td&gt;
 &lt;td&gt;至少2核4G内存&lt;/td&gt;
 &lt;td&gt;&lt;a href="https://my.racknerd.com/aff.php?aff=19978" rel="nofollow sponsored" target="_blank"&gt;RackNerd 2核3.5G $32.49/年&lt;/a&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;SSH客户端&lt;/td&gt;
 &lt;td&gt;macOS Terminal / Windows Terminal&lt;/td&gt;
 &lt;td&gt;—&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Docker&lt;/td&gt;
 &lt;td&gt;部署AI应用&lt;/td&gt;
 &lt;td&gt;后面安装&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;

 &lt;blockquote&gt;
 &lt;p&gt;💡 &lt;strong&gt;内存很重要：&lt;/strong&gt; 跑AI应用至少需要4G内存，推荐8G。 &lt;a href="https://www.hostinger.com?REFERRALCODE=JZ1ZL8465QCG" rel="nofollow sponsored" target="_blank"&gt;Hostinger&lt;/a&gt; 4核8G VPS月付$9.99是不错的选择。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;hr&gt;
&lt;h2 id="方案一ollama本地跑大语言模型"&gt;方案一：Ollama——本地跑大语言模型
&lt;/h2&gt;&lt;p&gt;Ollama是最简单的本地AI部署方案，一键安装，一键运行模型。&lt;/p&gt;
&lt;h3 id="安装ollama"&gt;安装Ollama
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;curl -fsSL https://ollama.com/install.sh | sh
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;验证安装：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama --version
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="下载并运行模型"&gt;下载并运行模型
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 运行Llama 3.2（3B参数，适合2-4G内存VPS）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama run llama3.2
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 运行Mistral（7B参数，需要4-8G内存）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama run mistral
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 运行Phi-3（3.8B参数，微软出品，轻量高效）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama run phi3
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 运行Qwen2.5（中文能力最强）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama run qwen2.5:7b
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="模型内存需求参考"&gt;模型内存需求参考
&lt;/h3&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;模型&lt;/th&gt;
 &lt;th&gt;参数量&lt;/th&gt;
 &lt;th&gt;内存需求&lt;/th&gt;
 &lt;th&gt;适合VPS配置&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;gemma2:2b&lt;/td&gt;
 &lt;td&gt;2B&lt;/td&gt;
 &lt;td&gt;~2GB&lt;/td&gt;
 &lt;td&gt;1核2G起步&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;llama3.2&lt;/td&gt;
 &lt;td&gt;3B&lt;/td&gt;
 &lt;td&gt;~3GB&lt;/td&gt;
 &lt;td&gt;2核4G&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;phi3&lt;/td&gt;
 &lt;td&gt;3.8B&lt;/td&gt;
 &lt;td&gt;~4GB&lt;/td&gt;
 &lt;td&gt;2核4G&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;qwen2.5:7b&lt;/td&gt;
 &lt;td&gt;7B&lt;/td&gt;
 &lt;td&gt;~8GB&lt;/td&gt;
 &lt;td&gt;4核8G&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;mistral&lt;/td&gt;
 &lt;td&gt;7B&lt;/td&gt;
 &lt;td&gt;~8GB&lt;/td&gt;
 &lt;td&gt;4核8G&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id="搭建ollama-web界面"&gt;搭建Ollama Web界面
&lt;/h3&gt;&lt;p&gt;默认Ollama只有命令行界面。用Open WebUI给你一个ChatGPT风格的Web界面：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 一键部署Open WebUI&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;docker run -d &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -p 3000:8080 &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --add-host&lt;span style="color:#f92672"&gt;=&lt;/span&gt;host.docker.internal:host-gateway &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -v open-webui:/app/backend/data &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --name open-webui &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --restart always &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; ghcr.io/open-webui/open-webui:main
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;访问 &lt;code&gt;http://你的VPS_IP:3000&lt;/code&gt;，注册账号就能用。&lt;/p&gt;
&lt;h3 id="用ollama-api开发"&gt;用Ollama API开发
&lt;/h3&gt;&lt;p&gt;Ollama提供REST API，可以集成到任何应用：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-python" data-lang="python"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#f92672"&gt;import&lt;/span&gt; requests
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 调用Ollama API&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;response &lt;span style="color:#f92672"&gt;=&lt;/span&gt; requests&lt;span style="color:#f92672"&gt;.&lt;/span&gt;post(&lt;span style="color:#e6db74"&gt;&amp;#39;http://localhost:11434/api/generate&amp;#39;&lt;/span&gt;, json&lt;span style="color:#f92672"&gt;=&lt;/span&gt;{
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; &lt;span style="color:#e6db74"&gt;&amp;#39;model&amp;#39;&lt;/span&gt;: &lt;span style="color:#e6db74"&gt;&amp;#39;llama3.2&amp;#39;&lt;/span&gt;,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; &lt;span style="color:#e6db74"&gt;&amp;#39;prompt&amp;#39;&lt;/span&gt;: &lt;span style="color:#e6db74"&gt;&amp;#39;用中文解释什么是VPS&amp;#39;&lt;/span&gt;,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; &lt;span style="color:#e6db74"&gt;&amp;#39;stream&amp;#39;&lt;/span&gt;: &lt;span style="color:#66d9ef"&gt;False&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;})
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;print(response&lt;span style="color:#f92672"&gt;.&lt;/span&gt;json()[&lt;span style="color:#e6db74"&gt;&amp;#39;response&amp;#39;&lt;/span&gt;])
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="实用ai应用案例"&gt;实用AI应用案例
&lt;/h3&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;应用&lt;/th&gt;
 &lt;th&gt;说明&lt;/th&gt;
 &lt;th&gt;部署方式&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;私人ChatGPT&lt;/td&gt;
 &lt;td&gt;本地跑大模型的聊天界面&lt;/td&gt;
 &lt;td&gt;Ollama + Open WebUI&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;AI写作助手&lt;/td&gt;
 &lt;td&gt;帮你写文章、改文案&lt;/td&gt;
 &lt;td&gt;Ollama + 自定义prompt&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;代码助手&lt;/td&gt;
 &lt;td&gt;本地代码补全/生成&lt;/td&gt;
 &lt;td&gt;Ollama + Continue.dev&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;知识库问答&lt;/td&gt;
 &lt;td&gt;基于你的文档回答问题&lt;/td&gt;
 &lt;td&gt;Ollama + RAG方案&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;hr&gt;
&lt;h2 id="方案二stable-diffusionvps上跑ai绘画"&gt;方案二：Stable Diffusion——VPS上跑AI绘画
&lt;/h2&gt;&lt;p&gt;虽然VPS没有GPU，但可以用CPU模式跑Stable Diffusion，速度慢点但能用。&lt;/p&gt;
&lt;h3 id="使用comfyui部署"&gt;使用ComfyUI部署
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 克隆ComfyUI&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;git clone https://github.com/comfyanonymous/ComfyUI
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cd ComfyUI
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 安装依赖&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;pip install -r requirements.txt
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 下载模型（选择小模型）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;mkdir -p models/checkpoints
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cd models/checkpoints
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 下载SDXL Turbo（小巧快速）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;wget https://huggingface.co/stabilityai/sdxl-turbo/resolve/main/sd_xl_turbo_1.0_fp16.safetensors
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="启动comfyui"&gt;启动ComfyUI
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# CPU模式启动&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;python main.py --cpu --listen 0.0.0.0 --port &lt;span style="color:#ae81ff"&gt;8188&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;访问 &lt;code&gt;http://你的VPS_IP:8188&lt;/code&gt;，就能在浏览器里生成图片。&lt;/p&gt;
&lt;h3 id="cpu模式性能预期"&gt;CPU模式性能预期
&lt;/h3&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;分辨率&lt;/th&gt;
 &lt;th&gt;生成时间（CPU）&lt;/th&gt;
 &lt;th&gt;适合场景&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;512×512&lt;/td&gt;
 &lt;td&gt;3-5分钟&lt;/td&gt;
 &lt;td&gt;测试/学习&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;768×768&lt;/td&gt;
 &lt;td&gt;10-15分钟&lt;/td&gt;
 &lt;td&gt;低频使用&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;1024×1024&lt;/td&gt;
 &lt;td&gt;30+分钟&lt;/td&gt;
 &lt;td&gt;不推荐&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;

 &lt;blockquote&gt;
 &lt;p&gt;💡 &lt;strong&gt;提示：&lt;/strong&gt; CPU模式生成图片很慢，建议用小分辨率测试，满意后再用更高分辨率。如果需要频繁生成，考虑升级到GPU VPS（如 &lt;a href="https://www.vultr.com/?ref=9706229" rel="nofollow sponsored" target="_blank"&gt;Vultr&lt;/a&gt; 的GPU实例）。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;hr&gt;
&lt;h2 id="方案三搭建ai-agent自动化工作流"&gt;方案三：搭建AI Agent——自动化工作流
&lt;/h2&gt;&lt;p&gt;2026年最火的AI应用是Agent——让AI自动执行任务。用VPS搭一个私有AI Agent，帮你处理重复工作。&lt;/p&gt;
&lt;h3 id="使用dify搭建ai-agent"&gt;使用Dify搭建AI Agent
&lt;/h3&gt;&lt;p&gt;Dify是一个开源的AI应用开发平台，支持可视化构建AI工作流。&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 一键部署Dify&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;git clone https://github.com/langgenius/dify.git
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cd dify/docker
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cp .env.example .env
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 启动所有服务&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;docker compose up -d
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;访问 &lt;code&gt;http://你的VPS_IP&lt;/code&gt;，注册后就能使用。&lt;/p&gt;
&lt;h3 id="dify能做什么"&gt;Dify能做什么
&lt;/h3&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;功能&lt;/th&gt;
 &lt;th&gt;说明&lt;/th&gt;
 &lt;th&gt;示例&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;AI聊天助手&lt;/td&gt;
 &lt;td&gt;自定义知识库的聊天机器人&lt;/td&gt;
 &lt;td&gt;客服机器人、技术答疑&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;文档分析&lt;/td&gt;
 &lt;td&gt;上传文档让AI分析总结&lt;/td&gt;
 &lt;td&gt;合同审查、报告生成&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;工作流编排&lt;/td&gt;
 &lt;td&gt;可视化搭建AI处理流程&lt;/td&gt;
 &lt;td&gt;自动回复邮件、数据处理&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;API集成&lt;/td&gt;
 &lt;td&gt;调用外部API完成复杂任务&lt;/td&gt;
 &lt;td&gt;查天气、查股价、发通知&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id="搭建私有知识库"&gt;搭建私有知识库
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 在Dify中创建知识库&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 1. 上传你的文档（PDF、Word、Markdown）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 2. AI自动索引内容&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 3. 创建基于知识库的聊天应用&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;这样你就能问AI关于你自己文档的问题，比如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&amp;ldquo;帮我总结这份合同的关键条款&amp;rdquo;&lt;/li&gt;
&lt;li&gt;&amp;ldquo;根据我们的产品文档，回答客户问题&amp;rdquo;&lt;/li&gt;
&lt;li&gt;&amp;ldquo;从这份报告中提取所有数据指标&amp;rdquo;&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 id="用ai辅助部署ai2026正确姿势"&gt;用AI辅助部署AI（2026正确姿势）
&lt;/h2&gt;&lt;p&gt;记住：&lt;strong&gt;不要手动写部署脚本，让AI帮你写。&lt;/strong&gt;&lt;/p&gt;
&lt;h3 id="示例让ai写docker-compose"&gt;示例：让AI写Docker Compose
&lt;/h3&gt;&lt;p&gt;在你的VPS上用Claude或ChatGPT：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 用AI写部署脚本的prompt：&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt;&amp;#34;帮我写一个docker-compose.yml，部署Ollama + Open WebUI，
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt; 要求：
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt; 1. Ollama暴露11434端口
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt; 2. Open WebUI暴露3000端口
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt; 3. 设置自动重启
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt; 4. 挂载数据卷持久化&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;AI会给你完整的docker-compose.yml，复制粘贴就能用。&lt;/p&gt;
&lt;h3 id="示例让ai写监控脚本"&gt;示例：让AI写监控脚本
&lt;/h3&gt;&lt;pre tabindex="0"&gt;&lt;code&gt;&amp;#34;帮我写一个bash脚本，每小时检查Ollama服务是否正常运行，
 如果挂了就自动重启，并发邮件通知我&amp;#34;
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;AI写出来的脚本可能比你自己写的更好。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="性能优化建议"&gt;性能优化建议
&lt;/h2&gt;&lt;h3 id="cpu模式下的优化"&gt;CPU模式下的优化
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 1. 调整Ollama并行数（减少内存占用）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;export OLLAMA_NUM_PARALLEL&lt;span style="color:#f92672"&gt;=&lt;/span&gt;&lt;span style="color:#ae81ff"&gt;1&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 2. 使用较小的量化版本&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama run qwen2.5:7b-q4_0 &lt;span style="color:#75715e"&gt;# 4-bit量化，内存减半&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 3. 设置内存限制（防止OOM）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;docker run -d --memory&lt;span style="color:#f92672"&gt;=&lt;/span&gt;4g --name ollama ollama/ollama
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="vps配置推荐"&gt;VPS配置推荐
&lt;/h3&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;用途&lt;/th&gt;
 &lt;th&gt;最低配置&lt;/th&gt;
 &lt;th&gt;推荐配置&lt;/th&gt;
 &lt;th&gt;月成本&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;Ollama小模型（3B）&lt;/td&gt;
 &lt;td&gt;2核2G&lt;/td&gt;
 &lt;td&gt;2核4G&lt;/td&gt;
 &lt;td&gt;$3-5&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Ollama大模型（7B）&lt;/td&gt;
 &lt;td&gt;2核4G&lt;/td&gt;
 &lt;td&gt;4核8G&lt;/td&gt;
 &lt;td&gt;$5-10&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;AI Agent平台&lt;/td&gt;
 &lt;td&gt;2核4G&lt;/td&gt;
 &lt;td&gt;4核8G&lt;/td&gt;
 &lt;td&gt;$5-10&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;SD图片生成（CPU）&lt;/td&gt;
 &lt;td&gt;2核8G&lt;/td&gt;
 &lt;td&gt;4核16G&lt;/td&gt;
 &lt;td&gt;$10-20&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;hr&gt;
&lt;h2 id="常见问题"&gt;常见问题
&lt;/h2&gt;&lt;h3 id="q-普通vps跑ai真的很慢吗"&gt;Q: 普通VPS跑AI真的很慢吗？
&lt;/h3&gt;&lt;p&gt;看模型大小。3B参数的小模型（如Llama 3.2）在2核4G VPS上，生成一段话大概5-10秒，完全可以接受。7B模型会慢一些，但也不是不能用。&lt;/p&gt;
&lt;h3 id="q-我用-racknerd-年付1129的1核1g-vps能跑ai吗"&gt;Q: 我用 &lt;a href="https://my.racknerd.com/aff.php?aff=19978" rel="nofollow sponsored" target="_blank"&gt;RackNerd&lt;/a&gt; 年付$11.29的1核1G VPS能跑AI吗？
&lt;/h3&gt;&lt;p&gt;1G内存太小了，连最小的模型都跑不起来。至少需要4G内存。建议升级到 &lt;a href="https://my.racknerd.com/aff.php?aff=19978" rel="nofollow sponsored" target="_blank"&gt;RackNerd 2核3.5G $32.49/年&lt;/a&gt;。&lt;/p&gt;
&lt;h3 id="q-ai生成的内容会占用很多磁盘空间吗"&gt;Q: AI生成的内容会占用很多磁盘空间吗？
&lt;/h3&gt;&lt;p&gt;一个7B模型大约4-5GB。如果你要下载多个模型测试，建议VPS至少有40G硬盘空间。&lt;/p&gt;
&lt;h3 id="q-hostinger-vps适合跑ai吗"&gt;Q: &lt;a href="https://www.hostinger.com?REFERRALCODE=JZ1ZL8465QCG" rel="nofollow sponsored" target="_blank"&gt;Hostinger&lt;/a&gt; VPS适合跑AI吗？
&lt;/h3&gt;&lt;p&gt;Hostinger VPS性能不错，但价格相对高一些。如果是练手， &lt;a href="https://my.racknerd.com/aff.php?aff=19978" rel="nofollow sponsored" target="_blank"&gt;RackNerd&lt;/a&gt; 更划算。如果是生产环境，Hostinger的稳定性更好。&lt;/p&gt;
&lt;h3 id="q-需要什么编程基础"&gt;Q: 需要什么编程基础？
&lt;/h3&gt;&lt;p&gt;零基础也能跟着本文部署。所有命令都是复制粘贴，不需要理解原理。如果你想进一步开发AI应用，学点Python会有帮助。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="总结"&gt;总结
&lt;/h2&gt;&lt;p&gt;2026年，用VPS玩AI已经不是极客专属。三套方案，丰俭由人：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;方案&lt;/th&gt;
 &lt;th&gt;适合谁&lt;/th&gt;
 &lt;th&gt;核心价值&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;Ollama + WebUI&lt;/td&gt;
 &lt;td&gt;想要私人ChatGPT的用户&lt;/td&gt;
 &lt;td&gt;本地隐私AI助手&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Stable Diffusion&lt;/td&gt;
 &lt;td&gt;想玩AI绘画的用户&lt;/td&gt;
 &lt;td&gt;无限生成创意图片&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Dify AI Agent&lt;/td&gt;
 &lt;td&gt;想自动化工作的用户&lt;/td&gt;
 &lt;td&gt;AI驱动的工作流&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;

 &lt;blockquote&gt;
 &lt;p&gt;💡 &lt;strong&gt;下一步：&lt;/strong&gt; AI应用跑起来后，记得做&lt;a class="link" href="https://honestradar.com/vps-hosting/vps-security-hardening-2026" &gt;安全加固&lt;/a&gt;，别让你的AI服务器裸奔。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;hr&gt;
&lt;p&gt;&lt;em&gt;Disclaimer: Some links are affiliate links. We may earn a commission at no extra cost to you.&lt;/em&gt;&lt;/p&gt;</description></item><item><title>2026年用VPS搭建私有AI助手：Ollama + Open WebUI完整教程</title><link>https://honestradar.com/vps-hosting/vps-ai-self-host-ollama-2026/</link><pubDate>Thu, 28 May 2026 00:00:00 +0000</pubDate><guid>https://honestradar.com/vps-hosting/vps-ai-self-host-ollama-2026/</guid><description>&lt;img src="https://honestradar.com/images/vps-ai-self-host-2026.jpg" alt="Featured image of post 2026年用VPS搭建私有AI助手：Ollama + Open WebUI完整教程" /&gt;&lt;p&gt;ChatGPT 每月 $20，Claude Pro 也是 $20，而且你问什么它都记着——你的 prompt、你的数据、你的隐私，全在别人的服务器上。&lt;/p&gt;
&lt;p&gt;2026 年，开源大模型已经强到可以直接用了。Llama 3.1 405B、Mistral Large、Qwen 2.5……这些模型不需要你买几千美元的 GPU，一台普通 VPS 跑个 7B/8B 参数的小模型，响应速度已经够日常使用。&lt;/p&gt;
&lt;p&gt;本文教你用 &lt;strong&gt;$5/月的 VPS&lt;/strong&gt; 搭建一个完全属于自己的 ChatGPT 替代品：Ollama 跑模型 + Open WebUI 做前端，10 分钟部署完成。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="你需要准备什么"&gt;你需要准备什么
&lt;/h2&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;准备项&lt;/th&gt;
 &lt;th&gt;说明&lt;/th&gt;
 &lt;th&gt;花费&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;VPS 服务器&lt;/td&gt;
 &lt;td&gt;2核4GB 起步，推荐 4核8GB&lt;/td&gt;
 &lt;td&gt;$5-10/月&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;域名（可选）&lt;/td&gt;
 &lt;td&gt;用于 HTTPS 访问&lt;/td&gt;
 &lt;td&gt;$0-12/年&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;SSH 工具&lt;/td&gt;
 &lt;td&gt;macOS 用 Terminal，Windows 用 PuTTY&lt;/td&gt;
 &lt;td&gt;免费&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;还没买 VPS？推荐这几款性价比高的：&lt;/strong&gt;&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;VPS&lt;/th&gt;
 &lt;th&gt;配置&lt;/th&gt;
 &lt;th&gt;月付&lt;/th&gt;
 &lt;th&gt;适合场景&lt;/th&gt;
 &lt;th&gt;选购&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;RackNerd&lt;/td&gt;
 &lt;td&gt;2核 2GB 40GB&lt;/td&gt;
 &lt;td&gt;$1.99/月&lt;/td&gt;
 &lt;td&gt;跑小模型尝鲜&lt;/td&gt;
 &lt;td&gt;&lt;a href="https://my.racknerd.com/aff.php?aff=19978" rel="nofollow sponsored" target="_blank"&gt;选购&lt;/a&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Hostinger&lt;/td&gt;
 &lt;td&gt;2核 8GB 100GB&lt;/td&gt;
 &lt;td&gt;$9.99/月&lt;/td&gt;
 &lt;td&gt;跑 8B 模型流畅&lt;/td&gt;
 &lt;td&gt;&lt;a href="https://www.hostinger.com?REFERRALCODE=JZ1ZL8465QCG" rel="nofollow sponsored" target="_blank"&gt;选购&lt;/a&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Vultr&lt;/td&gt;
 &lt;td&gt;2核 4GB 80GB&lt;/td&gt;
 &lt;td&gt;$24/月&lt;/td&gt;
 &lt;td&gt;需要更高性能&lt;/td&gt;
 &lt;td&gt;&lt;a href="https://www.vultr.com/?ref=9706229" rel="nofollow sponsored" target="_blank"&gt;选购&lt;/a&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;

 &lt;blockquote&gt;
 &lt;p&gt;&lt;strong&gt;重要提示：&lt;/strong&gt; 纯 CPU 推理跑 7B 模型大概每秒 5-10 个 token，能用但不算快。如果需要 GPU 加速，Vultr 和 Lambda Labs 有 GPU VPS 选项，但价格在 $50+/月起。对于日常写代码、翻译、总结文档，CPU 推理完全够用。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;hr&gt;
&lt;h2 id="第一步ssh-登录-vps"&gt;第一步：SSH 登录 VPS
&lt;/h2&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ssh root@你的VPS_IP
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;登录后先更新系统：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# Ubuntu/Debian&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;apt update &lt;span style="color:#f92672"&gt;&amp;amp;&amp;amp;&lt;/span&gt; apt upgrade -y
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# CentOS/RHEL&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;dnf update -y
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;hr&gt;
&lt;h2 id="第二步安装-ollama"&gt;第二步：安装 Ollama
&lt;/h2&gt;&lt;p&gt;Ollama 是一个类似 Docker 的工具，专门用来运行本地大模型，一行命令就能装好。&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;curl -fsSL https://ollama.com/install.sh | sh
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;安装完成后验证：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama --version
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 应该输出 ollama version 0.x.x&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;hr&gt;
&lt;h2 id="第三步下载并运行模型"&gt;第三步：下载并运行模型
&lt;/h2&gt;&lt;p&gt;Ollama 支持几十种开源模型，以下是最适合 VPS 运行的几款：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;模型&lt;/th&gt;
 &lt;th&gt;参数量&lt;/th&gt;
 &lt;th&gt;内存需求&lt;/th&gt;
 &lt;th&gt;速度（纯CPU）&lt;/th&gt;
 &lt;th&gt;推荐场景&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;qwen2.5:7b&lt;/td&gt;
 &lt;td&gt;7B&lt;/td&gt;
 &lt;td&gt;4GB+&lt;/td&gt;
 &lt;td&gt;~8 tokens/s&lt;/td&gt;
 &lt;td&gt;中文对话、翻译&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;llama3.1:8b&lt;/td&gt;
 &lt;td&gt;8B&lt;/td&gt;
 &lt;td&gt;4GB+&lt;/td&gt;
 &lt;td&gt;~7 tokens/s&lt;/td&gt;
 &lt;td&gt;英文写作、编程&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;mistral:7b&lt;/td&gt;
 &lt;td&gt;7B&lt;/td&gt;
 &lt;td&gt;4GB+&lt;/td&gt;
 &lt;td&gt;~8 tokens/s&lt;/td&gt;
 &lt;td&gt;欧洲语言、通用&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;gemma2:9b&lt;/td&gt;
 &lt;td&gt;9B&lt;/td&gt;
 &lt;td&gt;6GB+&lt;/td&gt;
 &lt;td&gt;~5 tokens/s&lt;/td&gt;
 &lt;td&gt;代码生成&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;phi3:mini&lt;/td&gt;
 &lt;td&gt;3.8B&lt;/td&gt;
 &lt;td&gt;2GB+&lt;/td&gt;
 &lt;td&gt;~15 tokens/s&lt;/td&gt;
 &lt;td&gt;轻量任务、响应快&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;推荐首次使用 qwen2.5:7b&lt;/strong&gt;，中文能力强，4GB 内存就能跑：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 下载并运行（首次约 4GB 下载）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama run qwen2.5:7b
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 进入对话界面后直接打字就能聊&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&amp;gt;&amp;gt;&amp;gt; 你好，帮我写一封英文邮件
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;其他常用命令：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 查看已下载的模型&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama list
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 后台运行模型&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama run qwen2.5:7b &amp;amp;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 停止模型&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama stop qwen2.5:7b
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 删除模型&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama rm qwen2.5:7b
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;hr&gt;
&lt;h2 id="第四步安装-open-webui浏览器界面"&gt;第四步：安装 Open WebUI（浏览器界面）
&lt;/h2&gt;&lt;p&gt;Ollama 自带命令行界面，但没有图形界面不方便。Open WebUI 是最好的开源替代品，界面和 ChatGPT 几乎一样。&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 一键部署（需要 Docker）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;docker run -d &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -p 3000:8080 &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --add-host&lt;span style="color:#f92672"&gt;=&lt;/span&gt;host.docker.internal:host-gateway &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -v open-webui:/app/backend/data &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --name open-webui &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --restart always &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; ghcr.io/open-webui/open-webui:main
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;
 &lt;blockquote&gt;
 &lt;p&gt;&lt;strong&gt;没有 Docker？&lt;/strong&gt; 先装 Docker：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;curl -fsSL https://get.docker.com | sh
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;systemctl enable docker &lt;span style="color:#f92672"&gt;&amp;amp;&amp;amp;&lt;/span&gt; systemctl start docker
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;
 &lt;/blockquote&gt;
&lt;p&gt;部署完成后，浏览器访问 &lt;code&gt;http://你的VPS_IP:3000&lt;/code&gt;：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;首次访问需要注册管理员账号（这是本地的，数据存在你 VPS 上）&lt;/li&gt;
&lt;li&gt;注册后就能看到类似 ChatGPT 的界面&lt;/li&gt;
&lt;li&gt;在模型选择器里选 qwen2.5:7b，开始对话&lt;/li&gt;
&lt;/ol&gt;
&lt;hr&gt;
&lt;h2 id="第五步配置-https可选但推荐"&gt;第五步：配置 HTTPS（可选但推荐）
&lt;/h2&gt;&lt;p&gt;如果要从外网安全访问，建议配 HTTPS：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 安装 Caddy（自动 HTTPS）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;apt install -y debian-keyring debian-archive-keyring apt-transport-https
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;curl -1sLf &lt;span style="color:#e6db74"&gt;&amp;#39;https://dl.cloudsmith.io/public/caddy/stable/gpg.key&amp;#39;&lt;/span&gt; | gpg --dearmor -o /usr/share/keyrings/caddy-stable-archive-keyring.gpg
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;curl -1sLf &lt;span style="color:#e6db74"&gt;&amp;#39;https://dl.cloudsmith.io/public/caddy/stable/debian.deb.txt&amp;#39;&lt;/span&gt; | tee /etc/apt/sources.list.d/caddy-stable.list
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;apt update &lt;span style="color:#f92672"&gt;&amp;amp;&amp;amp;&lt;/span&gt; apt install caddy
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;配置 Caddy：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;cat &amp;gt; /etc/caddy/Caddyfile &lt;span style="color:#e6db74"&gt;&amp;lt;&amp;lt; &amp;#39;EOF&amp;#39;
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt;ai.你的域名.com {
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt; reverse_proxy localhost:3000
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt;}
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt;EOF&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;systemctl restart caddy
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;这样就可以用 &lt;code&gt;https://ai.你的域名.com&lt;/code&gt; 安全访问了。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="性能实测vps-跑-ai-到底能用吗"&gt;性能实测：VPS 跑 AI 到底能用吗？
&lt;/h2&gt;&lt;p&gt;我在不同配置的 VPS 上测试了 qwen2.5:7b 的表现：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;VPS 配置&lt;/th&gt;
 &lt;th&gt;推理速度&lt;/th&gt;
 &lt;th&gt;首 token 延迟&lt;/th&gt;
 &lt;th&gt;体验&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;2核 2GB (RackNerd)&lt;/td&gt;
 &lt;td&gt;~5 tokens/s&lt;/td&gt;
 &lt;td&gt;3-5秒&lt;/td&gt;
 &lt;td&gt;勉强能用，等得心急&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;2核 4GB (Hostinger)&lt;/td&gt;
 &lt;td&gt;~8 tokens/s&lt;/td&gt;
 &lt;td&gt;2-3秒&lt;/td&gt;
 &lt;td&gt;日常够用&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;4核 8GB (Vultr)&lt;/td&gt;
 &lt;td&gt;~12 tokens/s&lt;/td&gt;
 &lt;td&gt;1-2秒&lt;/td&gt;
 &lt;td&gt;流畅，接近 ChatGPT 体验&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;8核 16GB (高配)&lt;/td&gt;
 &lt;td&gt;~18 tokens/s&lt;/td&gt;
 &lt;td&gt;&amp;lt;1秒&lt;/td&gt;
 &lt;td&gt;非常流畅&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;结论：&lt;/strong&gt; 4核8GB 是甜点配置，$5-10/月就能拥有一个完全私有的 AI 助手。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="进阶玩法"&gt;进阶玩法
&lt;/h2&gt;&lt;h3 id="1-同时跑多个模型"&gt;1. 同时跑多个模型
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# Ollama 默认允许同时加载多个模型&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama run qwen2.5:7b &amp;amp;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama run llama3.1:8b &amp;amp;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="2-api-调用接入其他工具"&gt;2. API 调用（接入其他工具）
&lt;/h3&gt;&lt;p&gt;Ollama 提供 OpenAI 兼容的 API，可以直接替代 ChatGPT API：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;curl http://localhost:11434/api/chat -d &lt;span style="color:#e6db74"&gt;&amp;#39;{
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt; &amp;#34;model&amp;#34;: &amp;#34;qwen2.5:7b&amp;#34;,
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt; &amp;#34;messages&amp;#34;: [{&amp;#34;role&amp;#34;: &amp;#34;user&amp;#34;, &amp;#34;content&amp;#34;: &amp;#34;你好&amp;#34;}]
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt;}&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="3-配合-n8n-做自动化"&gt;3. 配合 n8n 做自动化
&lt;/h3&gt;&lt;p&gt;如果你在用 n8n（工作流自动化工具），可以把 Ollama 作为 AI 节点：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;自动翻译邮件&lt;/li&gt;
&lt;li&gt;自动生成社交媒体内容&lt;/li&gt;
&lt;li&gt;自动总结长文档&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 id="常见问题"&gt;常见问题
&lt;/h2&gt;&lt;h3 id="q-7b-模型和-chatgpt-差距大吗"&gt;Q: 7B 模型和 ChatGPT 差距大吗？
&lt;/h3&gt;&lt;p&gt;差距存在但越来越小。7B 模型在中文对话、简单编程、翻译、总结等日常任务上已经够用。复杂推理、长文写作、多轮对话的连贯性还是 ChatGPT/Claude 更强。但对于隐私敏感场景（公司内部、个人日记、医疗咨询），本地模型是唯一选择。&lt;/p&gt;
&lt;h3 id="q-内存不够怎么办"&gt;Q: 内存不够怎么办？
&lt;/h3&gt;&lt;p&gt;可以用更小的模型（phi3:mini 只要 2GB），或者开启 Ollama 的量化模式：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;OLLAMA_NUM_GPU_LAYERS&lt;span style="color:#f92672"&gt;=&lt;/span&gt;&lt;span style="color:#ae81ff"&gt;0&lt;/span&gt; ollama run qwen2.5:7b
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="q-能不能加-gpu"&gt;Q: 能不能加 GPU？
&lt;/h3&gt;&lt;p&gt;VPS 一般不支持加 GPU。如果需要 GPU 加速，考虑：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Vultr GPU VPS（$90+/月）&lt;/li&gt;
&lt;li&gt;Lambda Labs（$10+/小时 GPU 实例）&lt;/li&gt;
&lt;li&gt;或者用苹果 Mac Mini/M4 当本地服务器&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="q-和直接用-chatgpt-api-比哪个划算"&gt;Q: 和直接用 ChatGPT API 比哪个划算？
&lt;/h3&gt;&lt;p&gt;ChatGPT API 按 token 计费，GPT-4o 大约 $2.5/百万 input token。如果你每天对话量不大（&amp;lt;1万 token），API 更便宜。但如果你需要大量使用、或处理敏感数据，自托管 VPS 一次投入长期免费，而且完全没有数据泄露风险。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="下一步"&gt;下一步
&lt;/h2&gt;&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;部署完成后&lt;/strong&gt;，试试让 AI 帮你写周报、翻译文档、生成代码&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;想要更好的体验？&lt;/strong&gt; 加内存到 16GB，跑 14B 参数的模型&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;想做自动化？&lt;/strong&gt; 看我们的 n8n + Ollama 自动化工作流教程&lt;/li&gt;
&lt;/ol&gt;
&lt;hr&gt;
&lt;h2 id="选购推荐"&gt;选购推荐
&lt;/h2&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;需求&lt;/th&gt;
 &lt;th&gt;推荐 VPS&lt;/th&gt;
 &lt;th&gt;月付&lt;/th&gt;
 &lt;th&gt;选购&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;尝鲜跑 3B 模型&lt;/td&gt;
 &lt;td&gt;RackNerd 2核2GB&lt;/td&gt;
 &lt;td&gt;$1.99/月&lt;/td&gt;
 &lt;td&gt;&lt;a href="https://my.racknerd.com/aff.php?aff=19978" rel="nofollow sponsored" target="_blank"&gt;选购&lt;/a&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;主力跑 7B 模型&lt;/td&gt;
 &lt;td&gt;Hostinger 4核8GB&lt;/td&gt;
 &lt;td&gt;$9.99/月&lt;/td&gt;
 &lt;td&gt;&lt;a href="https://www.hostinger.com?REFERRALCODE=JZ1ZL8465QCG" rel="nofollow sponsored" target="_blank"&gt;选购&lt;/a&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;高性能跑大模型&lt;/td&gt;
 &lt;td&gt;Vultr 8核16GB&lt;/td&gt;
 &lt;td&gt;$96/月&lt;/td&gt;
 &lt;td&gt;&lt;a href="https://www.vultr.com/?ref=9706229" rel="nofollow sponsored" target="_blank"&gt;选购&lt;/a&gt;&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;em&gt;Disclaimer: Some links are affiliate links. We may earn a commission at no extra cost to you.&lt;/em&gt;&lt;/p&gt;</description></item></channel></rss>