如何自托管 Vane(前身为 Perplexica):完整指南
在你自己的硬件上运行 Perplexity 风格的 AI 回答引擎——集成 SearXNG,自选 LLM,无日志记录。
Vane(原名 Perplexica)是最流行的开源自托管 Perplexity 替代方案——一个 AI 回答引擎,它接收你的问题,通过私有的 SearXNG 实例搜索网络,阅读结果,然后生成带有引用的答案。本指南将带你端到端地完成自托管:使用捆绑镜像进行 Docker 部署,通过 Ollama 连接本地模型或使用云端 LLM,重要的配置,以及如何保持整个闭环的私密性。如果你还在不同 AI 回答引擎之间犹豫,可以先查看我们更全面的 开源 Perplexity 替代方案 汇总,确定选择 Vane 后再回来阅读。
官方仓库是 github.com/ItzCrazyKns/Vane。旧的 ItzCrazyKns/Perplexica 路径现在重定向到那里——同一项目,同一血统。
Vane 是什么(以及不是什么)
Vane 是一个 AI 回答引擎,不是聊天机器人,也不是文档知识库。它是最接近 Perplexity 本身的开源体验:你用自然语言输入一个问题,Vane 执行真实的网络搜索,对顶级结果进行排序和阅读,然后返回一个综合答案,并附有可点击的内联来源引用。
架构上,它将三个组件打包成一个可部署的堆栈:
- Next.js 前端——你实际使用的聊天式 Web UI。
- API 后端——处理搜索、检索和 LLM 调用的编排层(仓库中大约 99% 是 TypeScript)。
- 私有的集成 SearXNG 元搜索引擎——隐私保护的搜索层,将你的查询分发给多个搜索后端,而不进行追踪。
这种打包方式正是 Vane 如此易于自托管的原因:你不需要单独配置 SearXNG。整个项目以一个单一的 Docker 镜像 itzcrazykns1337/vane:latest 提供,只需 docker compose up 即可启动。
| Vane | |
|---|---|
| 是什么 | 自托管 AI 回答引擎(Perplexity 风格) |
| 曾用名 | Perplexica(2026 年 3 月左右更名) |
| 官方仓库 | github.com/ItzCrazyKns/Vane |
| 许可证 | MIT |
| GitHub 星标 | ~35.4k(截至 2026 年 6 月) |
| 技术栈 | Next.js 前端 + API 后端 + 集成 SearXNG |
| Docker 镜像 | itzcrazykns1337/vane:latest |
| 本地 LLM | 支持——通过 Ollama |
| 云端 LLM | OpenAI、Anthropic Claude、Google Gemini、Groq 等 |
MIT 许可证值得一提:它是宽松许可证,因此你可以运行、修改甚至将 Vane 嵌入商业作品中,而无需承担 copyleft 义务。如果你打算在此基础上进行开发,这与 Khoj 等采用 AGPL 许可证的工具相比,是一个有意义的区别。
命名提示。 你仍然会在 GitHub fork、Medium 文章和 YouTube 教程中找到在更名前写的 “Perplexica”。Vane 和 Perplexica 是同一个项目——在搜索设置帮助时,请同时搜索两个名称。
为什么自托管 Vane 而不是使用 Perplexity
托管的 Perplexity 打磨精良且流畅。但它会记录你的每一次查询,用不透明的逻辑决定信任哪些来源,无法离线运行或在你防火墙后运行,并且为好的模型收取订阅费。自托管 Vane 则完全改变了这些情况:
- 架构即隐私。 使用本地模型时,你的查询、网络搜索、检索到的页面以及生成的答案永远不会离开你的网络。第三方不会记录任何内容,也不会训练其他人的模型。
- 模型选择自由。 通过 Ollama 运行本地 LLM 实现完全隔离的答案,或者在你需要最高推理质量时接入前沿云端模型——每个任务由你决定。
- 没有把关人。 你控制哪些搜索引擎提供答案,没有广告或排名激励对你不利。
- 无需订阅。 除去 VPS(或你已经拥有的机器)的成本,如果使用本地模型,运行它实际上免费。
诚实的权衡:你运行它,你打补丁,你让它保持运行。本地 7–8B 模型的推理能力无法与前沿云端模型相媲美,而基于 SearXNG 的搜索也无法拥有商业爬虫的新鲜度。对于注重隐私的开发者来说,拥有整个技术栈正是关键。对于普通用户来说,托管产品更省事。本指南假设你已经决定控制权比便利性更重要。
开始之前:前提条件
你需要三样东西:
- 一台安装了 Docker 和 Docker Compose 的主机。 VPS、家庭实验室机器或你自己的笔记本电脑都可以。对于仅 CPU 推理,一台 2–4 vCPU / 8 GB RAM 的机器是合理的最低配置;要流畅运行本地 LLM 生成,你需要 GPU(消费级 12–24 GB VRAM 类别的显卡会有很大不同)。
- 一个模型后端。 要么是一个正在运行的 Ollama 实例(用于本地私有推理),要么是云端提供商的 API 密钥(OpenAI、Anthropic、Gemini、Groq)。
- 基本熟悉终端。 以下所有操作都是
git clone、编辑配置文件、docker compose up。
关于硬件的一点说明:SearXNG 和 Vane 应用本身很轻量。资源消耗几乎完全在于 LLM。如果你将 Vane 指向云端模型,即使是一台小型 VPS 也能很好地运行该堆栈,因为繁重的计算发生在提供商那里。
分步指南:使用 Docker 自托管 Vane
这些步骤描述了 Vane 部署的总体框架。始终遵循项目自己的 README 以获取准确的最新命令——配置键、compose 文件和镜像标签在不同版本之间会有所变化,尤其是在更名之后。
1. 安装 Docker 并克隆仓库
在你的主机上安装 Docker 和 Docker Compose,然后克隆官方仓库:
git clone https://github.com/ItzCrazyKns/Vane.git
cd Vane
仓库中包含一个 docker-compose.yaml,定义了完整的堆栈——前端、后端和集成的 SearXNG。如果你不想从源码构建,预构建的镜像 itzcrazykns1337/vane:latest 已被 compose 文件引用,因此大多数用户无需编译任何东西。
2. 创建你的配置
Vane 从配置文件中读取设置(过去是一个 TOML 文件,你从 .sample 复制而来)。在这里你告诉它使用哪个模型后端。两种路径:
- 本地(Ollama): 将 Vane 指向你的 Ollama 服务器地址(当 Ollama 运行在主机上而 Vane 运行在 Docker 中时,通常为
http://host.docker.internal:11434)。你可以从已拉取的模型中选择一个聊天模型和一个嵌入模型。 - 云端: 粘贴 OpenAI、Anthropic Claude、Google Gemini 或 Groq 的 API 密钥。可以将本地字段留空,或者两者都填上,然后在 UI 中按查询选择。
你不必只选一个——Vane 允许你注册多个提供商,并在查询时从 Web UI 中切换模型。
3. (对于本地模型)先拉取你的 Ollama 模型
如果你选择本地模型,确保在启动 Vane 之前 Ollama 已经拥有这些模型:
ollama pull llama3.1 # 聊天/推理模型
ollama pull nomic-embed-text # 用于检索的嵌入模型
一个能力适中的 7–8B 指令模型是本地 AI 搜索的通常起点;如果你的硬件允许,可以扩大规模。有关选择嵌入模型的更多信息,请参阅我们的指南 最佳本地嵌入模型。
4. 启动堆栈
在项目目录中:
docker compose up -d
这会同时启动 Next.js 前端、API 后端和集成的 SearXNG 实例。首次运行时,给它一点时间拉取镜像并初始化。
5. 打开 UI 并提问
默认情况下,Web UI 在本地端口(通常为 127.0.0.1:3000——请检查 compose 文件)上提供。在浏览器中打开,输入一个问题,Vane 将:
- 将你的查询发送到其私有的 SearXNG 实例。
- 检索并排名顶级网页结果。
- 将它们作为上下文输入到你选择的 LLM。
- 返回一个综合的、带引用的答案。
如果你选择了本地模型,整个循环都在你的硬件上运行,没有任何数据离开你的网络。
连接 Ollama 与云端 LLM 的对比
这是你将做出的最重要的选择,因为它是在隐私与质量之间进行权衡。
| Ollama(本地) | 云端 LLM | |
|---|---|---|
| 提示词去向 | 留在你的硬件上 | 发送给提供商 |
| 隐私 | 可以完全物理隔离 | 提供商会看到提示词和检索到的上下文 |
| 答案质量 | 良好,受限于你的硬件 | 前沿级别的推理能力 |
| 成本 | 仅硬件成本(无按查询费用) | 按 token 的 API 计费 |
| 是否需要 GPU | 强烈推荐 | 不需要 |
| 最适合 | 隐私关键、离线或成本敏感的使用场景 | 高难度问题上的最大质量 |
许多人采用的一种实用模式:保持搜索和检索本地化(SearXNG 无论如何都运行在你的机器上),并且只在你想获得前沿质量时,才使用云端 LLM 进行最终生成步骤。你对搜索层的查询保持私密;只有提示词和检索到的片段会发送给模型提供商——这是一个你现在有意识而非默认做出的权衡。如果隐私是你选择这里的主要原因,那么请完全使用本地 Ollama。
真正重要的配置
一旦 Vane 运行起来,有几个设置值得调整:
搜索模式(快速 / 平衡 / 质量)
Vane 提供了在延迟和全面性之间权衡的搜索模式。快速执行较轻量的搜索并快速回答;质量在回答前检索和阅读更多内容。从平衡开始,根据你更在意等待时间还是深度进行调整。
哪个模型处理哪个任务
你通常可以将一个模型分配给聊天/生成,将另一个(更小、更便宜或本地)模型分配给嵌入。一种常见的节省成本方式:使用本地嵌入进行检索,仅对最终答案使用云端模型。
集成的 SearXNG
由于 Vane 自带自己的 SearXNG,因此你继承了 SearXNG 的所有可调参数——启用了哪些上游引擎、默认区域和语言、安全搜索。如果某个引擎产生速率限制或返回垃圾信息,在 SearXNG 配置中禁用它可以提高 Vane 的回答质量。要了解你可以调整的全部内容,请参阅我们的自托管 SearXNG 指南——同一个引擎,只是独立运行。
保持内部使用
最私密的做法是根本不将 Vane 暴露在公共互联网上——在 localhost、私有 IP 或 VPN 后面运行它,这样该实例只能从你的网络内部访问。如果你确实要(为团队)暴露它,请将其放在带有 TLS 和身份验证的反向代理后面;永远不要将带有云 API 密钥的 AI 回答引擎开放给外界。
Vane 与其他替代方案的快速对比
当你想要“Perplexity,但属于我自己的”时,Vane 是最佳选择——一个网络回答引擎。它不像某些替代方案那样是一个文档知识库:
- 想要在多个客户端上与自己的文档(PDF、笔记、Markdown)聊天? Khoj 是更强的选择——它是一个围绕你的文件构建的 AI“第二大脑”,底层使用 pgvector。
- 只想要自己点击的私密网络搜索,不需要 AI 层? 单独运行 SearXNG。
- 在自己的语料库上构建问答,而不是基于实时网络? 那是检索增强生成,一种不同的架构,基于嵌入和向量数据库。
许多人运行多个工具——Vane 用于网络,RAG 栈用于他们自己的数据。
隐私与数据所有权
这是自托管的全部原因。当 Vane 指向本地 Ollama 模型并使用其集成的 SearXNG 时,整个循环——你的查询、搜索、检索到的页面、生成的答案——都保留在你的网络内部。没有第三方记录它,没有提供商在其上训练,你甚至可以离线运行它。
一旦你接入云端 LLM,你就重新引入了一个依赖:提示词和检索到的上下文会发送给该提供商以进行生成步骤。这可以是为了答案质量而做出的完全合理、深思熟虑的权衡——只需有意识地这样做,并且如果隐私是你的驱动因素,则保持搜索和任何文档摄取在本地。同样的原则贯穿本网站的所有指南,从 SearXNG 到我们的自托管 RAG 指南。
常见问题
Vane 和 Perplexica 是同一个项目吗?
是的。原名 Perplexica 的项目在 2026 年 3 月左右更名为 Vane。GitHub 仓库迁移到 github.com/ItzCrazyKns/Vane,旧的 Perplexica 路径现在重定向到那里。较旧的教程仍写着 “Perplexica”——同一款软件。
我可以完全离线运行 Vane 吗? 可以。通过 Ollama 将 Vane 指向本地 LLM 并使用其集成的 SearXNG,整个管道——搜索、检索和答案生成——都在你自己的硬件上运行,没有任何数据离开你的网络。请注意,网络搜索仍然需要互联网访问才能到达上游搜索引擎;这里的“离线”是指没有第三方 AI 服务,而不是没有网络。
自托管 Vane 需要 GPU 吗? 仅用于本地 LLM 推理,即使在这种情况下,也只是强烈建议而非硬性要求——本地模型可以在 CPU 上运行但速度较慢。如果你将 Vane 指向云端 LLM(OpenAI、Claude、Gemini、Groq),繁重的计算发生在提供商那里,一台小型纯 CPU VPS 就能轻松运行该堆栈。
Vane 是免费使用的吗? 是的。Vane 在宽松的 MIT 许可证下开源,因此没有软件成本。你唯一的成本是运行它的硬件或 VPS,再加上如果你选择云端 LLM 而非本地 LLM 时的按 token API 费用。
Vane vs. Khoj——我应该自托管哪一个? 如果你想要一个从实时网络回答问题的 Perplexity 风格引擎,选择 Vane。如果你的目标是在浏览器、Obsidian、桌面和手机上搜索并与你自己的文档聊天,选择 Khoj。它们解决的是重叠但不同的问题,并且很多人同时运行两者。
Vane 是端到端拥有一个 Perplexity 风格回答引擎的最直接方式。从这里开始,学习它依赖的私密搜索层,与 Khoj 和其他替代方案进行比较,或者继续阅读与你自己文档聊天。Aquila 是你拥有的 AI 搜索的独立家园。掌控你自己的搜索。