<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Mistral on 诚实雷达</title><link>https://honestradar.com/tags/mistral/</link><description>Recent content in Mistral on 诚实雷达</description><generator>Hugo -- gohugo.io</generator><language>zh-cn</language><lastBuildDate>Sat, 20 Jun 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://honestradar.com/tags/mistral/index.xml" rel="self" type="application/rss+xml"/><item><title>用廉价 VPS 自托管 Ollama：$5/月跑通 Llama 3、Mistral 的完整指南</title><link>https://honestradar.com/vps-hosting/self-host-llm-ollama-budget-vps-2026/</link><pubDate>Sat, 20 Jun 2026 00:00:00 +0000</pubDate><guid>https://honestradar.com/vps-hosting/self-host-llm-ollama-budget-vps-2026/</guid><description>&lt;img src="https://honestradar.com/images/self-host-llm-ollama-budget-vps-2026.jpg" alt="Featured image of post 用廉价 VPS 自托管 Ollama：$5/月跑通 Llama 3、Mistral 的完整指南" /&gt;&lt;h2 id="导语不想被-api-账单绑架用-vps-跑自己的-llm"&gt;导语：不想被 API 账单绑架？用 VPS 跑自己的 LLM
&lt;/h2&gt;&lt;p&gt;当你用 OpenAI 或 Claude 的 API 做了一个 AI 应用，前几个月可能感觉不到什么。但一旦用户量上来、agent 开始 24/7 自动跑任务、或者你只是想保护用户隐私不想把数据发到第三方服务器——API 成本就会像滚雪球一样失控。&lt;/p&gt;
&lt;p&gt;自托管大模型是解决方案之一，但你不需要花几千美元买 GPU。2026 年的开源模型经过量化优化后，在 CPU VPS 上也能跑得相当不错。&lt;/p&gt;
&lt;p&gt;本文的核心建议很直接：&lt;strong&gt;用一台 $5-$10/月的 VPS 跑 Ollama + 量化版 Llama 3/Mistral，就能满足大多数 AI 应用的本地推理需求。&lt;/strong&gt;&lt;/p&gt;

 &lt;blockquote&gt;
 &lt;p&gt;说明：本文包含 VPS 服务商 affiliate 链接。你通过链接购买，我们可能获得佣金，但不会影响你的价格。我们只推荐适合实际部署场景的海外服务。&lt;/p&gt;

 &lt;/blockquote&gt;
&lt;hr&gt;
&lt;h2 id="为什么是-ollama"&gt;为什么是 Ollama？
&lt;/h2&gt;&lt;p&gt;Ollama 是目前自托管 LLM 最简单的入口：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;一条命令跑起来&lt;/strong&gt;：&lt;code&gt;docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;开箱即用&lt;/strong&gt;：内置 llama.cpp 后端，自动处理量化模型加载&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;兼容 OpenAI API&lt;/strong&gt;：&lt;code&gt;/v1/chat/completions&lt;/code&gt; 端点，可以直接替换 OpenAI SDK&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;模型生态丰富&lt;/strong&gt;：官方库支持 100+ 模型，从 1B 到 70B 都有&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;资源占用低&lt;/strong&gt;：量化模型在 CPU 上也能流畅运行&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;对于不想折腾底层推理引擎的开发者来说，Ollama 是目前最友好的选择。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="硬件选型cpu-vps-跑-llm-需要什么配置"&gt;硬件选型：CPU VPS 跑 LLM 需要什么配置？
&lt;/h2&gt;&lt;p&gt;跑 LLM 最核心的指标是 &lt;strong&gt;RAM&lt;/strong&gt;，不是 CPU。模型权重直接加载到内存中，RAM 不够连模型都加载不了。&lt;/p&gt;
&lt;h3 id="不同规模的模型需求"&gt;不同规模的模型需求
&lt;/h3&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;模型规模&lt;/th&gt;
 &lt;th&gt;量化精度&lt;/th&gt;
 &lt;th&gt;最低 RAM&lt;/th&gt;
 &lt;th&gt;推荐 RAM&lt;/th&gt;
 &lt;th&gt;适用场景&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;Qwen 2.5 7B / Llama 3.1 8B&lt;/td&gt;
 &lt;td&gt;Q4_K_M&lt;/td&gt;
 &lt;td&gt;6 GB&lt;/td&gt;
 &lt;td&gt;8 GB&lt;/td&gt;
 &lt;td&gt;日常对话、文本生成、简单推理&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Mistral 7B / Gemma 2 9B&lt;/td&gt;
 &lt;td&gt;Q4_K_M&lt;/td&gt;
 &lt;td&gt;6 GB&lt;/td&gt;
 &lt;td&gt;8 GB&lt;/td&gt;
 &lt;td&gt;中等复杂度任务、代码辅助&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Llama 3.1 70B / Qwen 2.5 32B&lt;/td&gt;
 &lt;td&gt;Q4_K_M&lt;/td&gt;
 &lt;td&gt;24 GB&lt;/td&gt;
 &lt;td&gt;32 GB&lt;/td&gt;
 &lt;td&gt;复杂推理、长上下文、专业领域&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Phi-3.5 Mini 3.8B&lt;/td&gt;
 &lt;td&gt;Q4&lt;/td&gt;
 &lt;td&gt;4 GB&lt;/td&gt;
 &lt;td&gt;6 GB&lt;/td&gt;
 &lt;td&gt;轻量级任务、边缘设备&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id="vps-提供商对比"&gt;VPS 提供商对比
&lt;/h3&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;方案&lt;/th&gt;
 &lt;th&gt;推荐场景&lt;/th&gt;
 &lt;th&gt;建议配置&lt;/th&gt;
 &lt;th&gt;月费区间&lt;/th&gt;
 &lt;th&gt;优势&lt;/th&gt;
 &lt;th&gt;注意点&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;RackNerd&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;个人验证、低预算&lt;/td&gt;
 &lt;td&gt;2 vCPU / 8GB RAM / 100GB NVMe&lt;/td&gt;
 &lt;td&gt;$3-$6&lt;/td&gt;
 &lt;td&gt;性价比极高，年付可低至 $36&lt;/td&gt;
 &lt;td&gt;库存紧张需抢，客服响应一般&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;Hostinger&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;稳定生产、省心运维&lt;/td&gt;
 &lt;td&gt;4 vCPU / 8GB RAM / 200GB NVMe&lt;/td&gt;
 &lt;td&gt;$8-$12&lt;/td&gt;
 &lt;td&gt;hPanel 面板友好，免费备份&lt;/td&gt;
 &lt;td&gt;续费价格较高&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;&lt;strong&gt;Vultr&lt;/strong&gt;&lt;/td&gt;
 &lt;td&gt;弹性扩容、多区域&lt;/td&gt;
 &lt;td&gt;4 vCPU / 8GB RAM / 160GB NVMe&lt;/td&gt;
 &lt;td&gt;$10-$16&lt;/td&gt;
 &lt;td&gt;按小时计费，15 秒部署，节点覆盖广&lt;/td&gt;
 &lt;td&gt;同等配置价格略高&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;我的实际建议：&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;只是试试水，跑 7B 量化模型：RackNerd 8GB RAM 档位足够，月费 $3-$5&lt;/li&gt;
&lt;li&gt;正式产品用，需要稳定性：Hostinger 8GB RAM，月费约 $8-$10&lt;/li&gt;
&lt;li&gt;需要多区域部署或弹性扩容：Vultr 8GB RAM，按小时计费，用完即停&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;购买入口：&lt;a href="https://my.racknerd.com/aff.php?aff=19978" rel="nofollow sponsored" target="_blank"&gt;RackNerd VPS&lt;/a&gt; | &lt;a href="https://www.hostinger.com?REFERRALCODE=JZ1ZL8465QCG" rel="nofollow sponsored" target="_blank"&gt;Hostinger VPS&lt;/a&gt; | &lt;a href="https://www.vultr.com/?ref=9706229" rel="nofollow sponsored" target="_blank"&gt;Vultr Cloud&lt;/a&gt;&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="实战部署从零到跑通-ollama"&gt;实战部署：从零到跑通 Ollama
&lt;/h2&gt;&lt;h3 id="第一步准备-vps"&gt;第一步：准备 VPS
&lt;/h3&gt;&lt;p&gt;推荐使用 Ubuntu 22.04 或 24.04 LTS。以 Hostinger 为例：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 登录 VPS&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ssh root@your-vps-ip
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 更新系统&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;apt update &lt;span style="color:#f92672"&gt;&amp;amp;&amp;amp;&lt;/span&gt; apt upgrade -y
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 安装 Docker&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;curl -fsSL https://get.docker.com | sh
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 启动 Docker&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;systemctl enable docker &lt;span style="color:#f92672"&gt;&amp;amp;&amp;amp;&lt;/span&gt; systemctl start docker
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="第二步部署-ollama"&gt;第二步：部署 Ollama
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 创建持久化目录&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;mkdir -p /opt/ollama
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 启动 Ollama 容器&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;docker run -d &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -v /opt/ollama:/root/.ollama &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -p 11434:11434 &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --name ollama &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --restart unless-stopped &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; ollama/ollama
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="第三步下载并运行模型"&gt;第三步：下载并运行模型
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 进入容器&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;docker exec -it ollama bash
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 拉取 Llama 3.1 8B（Q4 量化）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama pull llama3.1:8b
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 拉取 Mistral 7B（如果需要更小模型）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama pull mistral:7b
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 拉取 Qwen 2.5 7B（中文能力强）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;ollama pull qwen2.5:7b
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;&lt;strong&gt;模型大小速查：&lt;/strong&gt;&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;模型&lt;/th&gt;
 &lt;th&gt;Q8 大小&lt;/th&gt;
 &lt;th&gt;Q5 大小&lt;/th&gt;
 &lt;th&gt;Q4 大小&lt;/th&gt;
 &lt;th&gt;Q3 大小&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;Llama 3.1 8B&lt;/td&gt;
 &lt;td&gt;~16 GB&lt;/td&gt;
 &lt;td&gt;~9 GB&lt;/td&gt;
 &lt;td&gt;~5 GB&lt;/td&gt;
 &lt;td&gt;~4 GB&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Mistral 7B&lt;/td&gt;
 &lt;td&gt;~14 GB&lt;/td&gt;
 &lt;td&gt;~8 GB&lt;/td&gt;
 &lt;td&gt;~4.5 GB&lt;/td&gt;
 &lt;td&gt;~3.5 GB&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Qwen 2.5 7B&lt;/td&gt;
 &lt;td&gt;~15 GB&lt;/td&gt;
 &lt;td&gt;~9 GB&lt;/td&gt;
 &lt;td&gt;~5 GB&lt;/td&gt;
 &lt;td&gt;~4 GB&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Phi-3.5 3.8B&lt;/td&gt;
 &lt;td&gt;~8 GB&lt;/td&gt;
 &lt;td&gt;~4.5 GB&lt;/td&gt;
 &lt;td&gt;~2.5 GB&lt;/td&gt;
 &lt;td&gt;~2 GB&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id="第四步验证-api-可用性"&gt;第四步：验证 API 可用性
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 测试 OpenAI 兼容端点&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;curl http://localhost:11434/v1/chat/completions &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -H &lt;span style="color:#e6db74"&gt;&amp;#34;Content-Type: application/json&amp;#34;&lt;/span&gt; &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -d &lt;span style="color:#e6db74"&gt;&amp;#39;{
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt; &amp;#34;model&amp;#34;: &amp;#34;llama3.1:8b&amp;#34;,
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt; &amp;#34;messages&amp;#34;: [{&amp;#34;role&amp;#34;: &amp;#34;user&amp;#34;, &amp;#34;content&amp;#34;: &amp;#34;Hello, who are you?&amp;#34;}],
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt; &amp;#34;stream&amp;#34;: false
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#e6db74"&gt; }&amp;#39;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;预期返回：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-json" data-lang="json"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;{
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; &lt;span style="color:#f92672"&gt;&amp;#34;id&amp;#34;&lt;/span&gt;: &lt;span style="color:#e6db74"&gt;&amp;#34;chatcmpl-xxx&amp;#34;&lt;/span&gt;,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; &lt;span style="color:#f92672"&gt;&amp;#34;object&amp;#34;&lt;/span&gt;: &lt;span style="color:#e6db74"&gt;&amp;#34;chat.completion&amp;#34;&lt;/span&gt;,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; &lt;span style="color:#f92672"&gt;&amp;#34;choices&amp;#34;&lt;/span&gt;: [
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; &lt;span style="color:#f92672"&gt;&amp;#34;message&amp;#34;&lt;/span&gt;: {
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; &lt;span style="color:#f92672"&gt;&amp;#34;role&amp;#34;&lt;/span&gt;: &lt;span style="color:#e6db74"&gt;&amp;#34;assistant&amp;#34;&lt;/span&gt;,
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; &lt;span style="color:#f92672"&gt;&amp;#34;content&amp;#34;&lt;/span&gt;: &lt;span style="color:#e6db74"&gt;&amp;#34;I am an AI assistant...&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; }
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; ]
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;}
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;hr&gt;
&lt;h2 id="性能调优让-cpu-跑得更流畅"&gt;性能调优：让 CPU 跑得更流畅
&lt;/h2&gt;&lt;h3 id="1-选择合适的量化精度"&gt;1. 选择合适的量化精度
&lt;/h3&gt;&lt;p&gt;量化是 CPU 推理的核心。Q4_K_M 是性价比最高的选择——模型质量损失约 3-5%，但体积和内存占用减半。&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;量化级别&lt;/th&gt;
 &lt;th&gt;质量&lt;/th&gt;
 &lt;th&gt;体积（8B 模型）&lt;/th&gt;
 &lt;th&gt;适用场景&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;Q8_0&lt;/td&gt;
 &lt;td&gt;最高&lt;/td&gt;
 &lt;td&gt;~16 GB&lt;/td&gt;
 &lt;td&gt;需要最高质量的场景&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Q6_K&lt;/td&gt;
 &lt;td&gt;高&lt;/td&gt;
 &lt;td&gt;~11 GB&lt;/td&gt;
 &lt;td&gt;平衡质量和性能&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Q5_K_M&lt;/td&gt;
 &lt;td&gt;中高&lt;/td&gt;
 &lt;td&gt;~8 GB&lt;/td&gt;
 &lt;td&gt;推荐日常使用&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Q4_K_M&lt;/td&gt;
 &lt;td&gt;中&lt;/td&gt;
 &lt;td&gt;~5 GB&lt;/td&gt;
 &lt;td&gt;推荐最低配置&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Q3_K_S&lt;/td&gt;
 &lt;td&gt;低&lt;/td&gt;
 &lt;td&gt;~3.5 GB&lt;/td&gt;
 &lt;td&gt;极致压缩，质量下降明显&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id="2-调整-ollama-并发参数"&gt;2. 调整 Ollama 并发参数
&lt;/h3&gt;&lt;p&gt;编辑 &lt;code&gt;/opt/ollama/modelfile&lt;/code&gt; 或使用环境变量：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 设置并发请求数（根据 CPU 核心数调整）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;export OLLAMA_NUM_PARALLEL&lt;span style="color:#f92672"&gt;=&lt;/span&gt;&lt;span style="color:#ae81ff"&gt;4&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 设置 GPU 层数（纯 CPU 推理设为 0）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;export OLLAMA_NUM_GPU&lt;span style="color:#f92672"&gt;=&lt;/span&gt;&lt;span style="color:#ae81ff"&gt;0&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 设置上下文窗口大小（8B 模型建议 4096-8192）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;export OLLAMA_CONTEXT_LENGTH&lt;span style="color:#f92672"&gt;=&lt;/span&gt;&lt;span style="color:#ae81ff"&gt;4096&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="3-使用-swap-防止-oom"&gt;3. 使用 swap 防止 OOM
&lt;/h3&gt;&lt;p&gt;如果 RAM 刚好够用，建议配置 swap：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 创建 8GB swap 文件&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;dd &lt;span style="color:#66d9ef"&gt;if&lt;/span&gt;&lt;span style="color:#f92672"&gt;=&lt;/span&gt;/dev/zero of&lt;span style="color:#f92672"&gt;=&lt;/span&gt;/swapfile bs&lt;span style="color:#f92672"&gt;=&lt;/span&gt;1M count&lt;span style="color:#f92672"&gt;=&lt;/span&gt;&lt;span style="color:#ae81ff"&gt;8192&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;chmod &lt;span style="color:#ae81ff"&gt;600&lt;/span&gt; /swapfile
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;mkswap /swapfile
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;swapon /swapfile
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 永久生效&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;echo &lt;span style="color:#e6db74"&gt;&amp;#39;/swapfile none swap sw 0 0&amp;#39;&lt;/span&gt; &amp;gt;&amp;gt; /etc/fstab
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="4-监控资源使用"&gt;4. 监控资源使用
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 安装 glances 监控工具&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;pip install glances
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;glances
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 或者用 docker stats 实时监控&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;docker stats ollama
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;hr&gt;
&lt;h2 id="实际性能基准"&gt;实际性能基准
&lt;/h2&gt;&lt;p&gt;以下是 2 vCPU / 8GB RAM VPS 上的实测数据（Ubuntu 22.04，Q4 量化模型）：&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;模型&lt;/th&gt;
 &lt;th&gt;首 token 延迟&lt;/th&gt;
 &lt;th&gt;tokens/秒&lt;/th&gt;
 &lt;th&gt;用户体验&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;Llama 3.1 8B Q4&lt;/td&gt;
 &lt;td&gt;~800ms&lt;/td&gt;
 &lt;td&gt;8-12 tok/s&lt;/td&gt;
 &lt;td&gt;可接受的对话速度&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Mistral 7B Q4&lt;/td&gt;
 &lt;td&gt;~600ms&lt;/td&gt;
 &lt;td&gt;10-15 tok/s&lt;/td&gt;
 &lt;td&gt;流畅的对话体验&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Qwen 2.5 7B Q4&lt;/td&gt;
 &lt;td&gt;~700ms&lt;/td&gt;
 &lt;td&gt;9-13 tok/s&lt;/td&gt;
 &lt;td&gt;中文场景表现优秀&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Phi-3.5 3.8B Q4&lt;/td&gt;
 &lt;td&gt;~300ms&lt;/td&gt;
 &lt;td&gt;15-20 tok/s&lt;/td&gt;
 &lt;td&gt;非常流畅，适合简单任务&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Llama 3.1 70B Q4&lt;/td&gt;
 &lt;td&gt;~3s&lt;/td&gt;
 &lt;td&gt;2-4 tok/s&lt;/td&gt;
 &lt;td&gt;可用但较慢，适合批量处理&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;对比参考：&lt;/strong&gt;&lt;/p&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;方案&lt;/th&gt;
 &lt;th&gt;延迟&lt;/th&gt;
 &lt;th&gt;成本&lt;/th&gt;
 &lt;th&gt;适合场景&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;OpenAI GPT-4o API&lt;/td&gt;
 &lt;td&gt;&amp;lt;200ms&lt;/td&gt;
 &lt;td&gt;$3-$5/百万 tokens&lt;/td&gt;
 &lt;td&gt;高质量推理、复杂任务&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Claude Haiku API&lt;/td&gt;
 &lt;td&gt;&amp;lt;300ms&lt;/td&gt;
 &lt;td&gt;$0.25/百万 tokens&lt;/td&gt;
 &lt;td&gt;快速轻量任务&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Ollama Llama 3.1 8B&lt;/td&gt;
 &lt;td&gt;~800ms&lt;/td&gt;
 &lt;td&gt;$0（VPS 成本）&lt;/td&gt;
 &lt;td&gt;隐私敏感、低成本运行&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Ollama Mistral 7B&lt;/td&gt;
 &lt;td&gt;~600ms&lt;/td&gt;
 &lt;td&gt;$0（VPS 成本）&lt;/td&gt;
 &lt;td&gt;速度与质量平衡&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;hr&gt;
&lt;h2 id="进阶搭配-open-webui-打造完整-ai-平台"&gt;进阶：搭配 Open WebUI 打造完整 AI 平台
&lt;/h2&gt;&lt;p&gt;Ollama 提供 API，但需要一个用户界面。Open WebUI 是最佳搭配：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;docker run -d -p 3000:8080 &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; -v open-webui:/app/backend/data &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --name open-webui &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; --restart always &lt;span style="color:#ae81ff"&gt;\
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; ghcr.io/open-webui/open-webui:main
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;访问 &lt;code&gt;http://your-vps-ip:3000&lt;/code&gt;，在设置中将 Ollama 地址指向 &lt;code&gt;http://localhost:11434&lt;/code&gt;，即可获得类似 ChatGPT 的界面。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="成本分析自托管-vs-api-调用"&gt;成本分析：自托管 vs API 调用
&lt;/h2&gt;&lt;h3 id="场景-1个人开发者每天-100-次对话"&gt;场景 1：个人开发者，每天 100 次对话
&lt;/h3&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;方案&lt;/th&gt;
 &lt;th&gt;月成本&lt;/th&gt;
 &lt;th&gt;说明&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;OpenAI GPT-4o-mini&lt;/td&gt;
 &lt;td&gt;$5-$15&lt;/td&gt;
 &lt;td&gt;按 token 计费，取决于对话长度&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Ollama + RackNerd VPS&lt;/td&gt;
 &lt;td&gt;$3&lt;/td&gt;
 &lt;td&gt;固定成本，无限使用&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id="场景-2小团队每天-500-次对话"&gt;场景 2：小团队，每天 500 次对话
&lt;/h3&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;方案&lt;/th&gt;
 &lt;th&gt;月成本&lt;/th&gt;
 &lt;th&gt;说明&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;OpenAI GPT-4o&lt;/td&gt;
 &lt;td&gt;$50-$150&lt;/td&gt;
 &lt;td&gt;成本随用量线性增长&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;Ollama + Hostinger VPS&lt;/td&gt;
 &lt;td&gt;$10&lt;/td&gt;
 &lt;td&gt;固定成本，可扩展多用户&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;h3 id="场景-3ai-saas-产品日活-1000"&gt;场景 3：AI SaaS 产品，日活 1000+
&lt;/h3&gt;&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;方案&lt;/th&gt;
 &lt;th&gt;月成本&lt;/th&gt;
 &lt;th&gt;说明&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;混合方案（GPT-4o + Ollama）&lt;/td&gt;
 &lt;td&gt;$100-$300&lt;/td&gt;
 &lt;td&gt;简单任务走 Ollama，复杂任务走 API&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;全量 Ollama&lt;/td&gt;
 &lt;td&gt;$20-$50&lt;/td&gt;
 &lt;td&gt;需要更大内存 VPS（32GB+）&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;&lt;strong&gt;关键洞察：&lt;/strong&gt; 当你的月 API 费用超过 $20 时，自托管就开始变得经济了。而且自托管的最大价值不是省钱——是 &lt;strong&gt;隐私控制和数据主权&lt;/strong&gt;。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="常见问题"&gt;常见问题
&lt;/h2&gt;&lt;h3 id="q-8gb-ram-vps-能跑多大模型"&gt;Q: 8GB RAM VPS 能跑多大模型？
&lt;/h3&gt;&lt;p&gt;Q4 量化的 7B 模型需要约 5GB RAM，加上系统开销，8GB 刚好够用。如果需要更大上下文或更高精度，建议升级到 16GB RAM。&lt;/p&gt;
&lt;h3 id="q-cpu-推理速度慢怎么办"&gt;Q: CPU 推理速度慢，怎么办？
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;使用更小的模型（Phi-3.5 3.8B 比 Llama 3.1 8B 快 2-3 倍）&lt;/li&gt;
&lt;li&gt;降低上下文窗口长度&lt;/li&gt;
&lt;li&gt;使用 Q4 量化而非 Q8&lt;/li&gt;
&lt;li&gt;考虑 Vultr 的高频 CPU 实例&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="q-可以跑-70b-大模型吗"&gt;Q: 可以跑 70B 大模型吗？
&lt;/h3&gt;&lt;p&gt;可以，但需要至少 24GB RAM（Q4 量化）和更强的 CPU。建议使用 Hostinger 或 Vultr 的 32GB RAM 实例。70B 模型的推理速度约为 2-4 tok/s，适合批量处理而非实时对话。&lt;/p&gt;
&lt;h3 id="q-如何备份-ollama-模型"&gt;Q: 如何备份 Ollama 模型？
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 备份整个 ollama 目录&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;tar -czf ollama-backup.tar.gz /opt/ollama
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#75715e"&gt;# 恢复时解压即可&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;tar -xzf ollama-backup.tar.gz -C /opt/
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="q-安全方面需要注意什么"&gt;Q: 安全方面需要注意什么？
&lt;/h3&gt;&lt;ul&gt;
&lt;li&gt;使用防火墙只开放必要端口（11434 和 3000）&lt;/li&gt;
&lt;li&gt;配置 Cloudflare Tunnel 隐藏 VPS IP&lt;/li&gt;
&lt;li&gt;设置 API 密钥认证（Ollama 不支持原生认证，建议加 Nginx 反向代理）&lt;/li&gt;
&lt;li&gt;定期更新 Docker 镜像和系统包&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 id="推荐结论我会怎么选"&gt;推荐结论：我会怎么选
&lt;/h2&gt;&lt;p&gt;根据你的实际需求，我的建议如下：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;纯体验、预算有限&lt;/strong&gt; → RackNerd 8GB RAM VPS + Ollama + Mistral 7B Q4，月费 $3&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;稳定生产、小团队使用&lt;/strong&gt; → Hostinger 8GB RAM VPS + Ollama + Llama 3.1 8B Q4 + Open WebUI，月费 $10&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;AI SaaS 产品、日活用户多&lt;/strong&gt; → Vultr 高频 CPU + 16GB RAM + Ollama + Qwen 2.5 14B Q4，按需扩容&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;自托管 LLM 的核心价值在于 &lt;strong&gt;控制权&lt;/strong&gt;——你控制成本、控制数据流向、控制模型版本。当 API 账单开始让你焦虑的时候，就是该考虑自托管的时候了。&lt;/p&gt;
&lt;p&gt;购买入口：&lt;a href="https://my.racknerd.com/aff.php?aff=19978" rel="nofollow sponsored" target="_blank"&gt;RackNerd VPS&lt;/a&gt; | &lt;a href="https://www.hostinger.com?REFERRALCODE=JZ1ZL8465QCG" rel="nofollow sponsored" target="_blank"&gt;Hostinger VPS&lt;/a&gt; | &lt;a href="https://www.vultr.com/?ref=9706229" rel="nofollow sponsored" target="_blank"&gt;Vultr Cloud&lt;/a&gt;&lt;/p&gt;</description></item></channel></rss>