开源 Perplexity 替代品：自托管 AI 搜索 (2026)

2026 年最好的开源、自托管 Perplexity 替代品是 Vane（更名后的 Perplexica）、Khoj 和 SurfSense（用于完整的 AI 答案引擎），以及 SearXNG（作为多个工具所依赖的私有元搜索层）。每个方案都允许你在自己的硬件上运行 AI 搜索体验，通过 Ollama 指向本地 LLM 或使用云模型，并将你的查询保留在自己服务器之外。本文对它们进行坦诚对比，包括首选方案的设置说明和清晰的优缺点表格。

如果“AI 搜索引擎”和“RAG”在你看来是一回事，它们是近亲——文档问答方面的内容请参阅自托管 RAG 完整指南。

为什么要自托管 AI 搜索引擎

Perplexity 出色且方便。但它会记录你每一次查询，按自己的逻辑对来源排序，而且你无法离线或在防火墙后运行它。自托管开源替代品能带来：

隐私。 你的搜索和连接的文档永远不会离开你的基础设施。
模型选择。 通过 Ollama 运行本地模型实现完全隔离的隐私，或接入云端 LLM（OpenAI、Claude、Groq）以获得更强性能。
无守门人。 你控制哪些搜索后端和来源提供答案，没有广告或排名机制对你不利。

当然，代价是：你运行它，你维护它。对于普通用户，托管产品更省事；对于注重隐私的开发者或团队，拥有整个堆栈才是关键。

候选方案

Vane（原名 Perplexica）

它是什么： 最直接的开源 Perplexity 克隆——一个 AI 回答引擎。大约在 2026 年 3 月，原名 Perplexica 的项目更名为 Vane。它整合了 Next.js 前端、API 后端和一个私有的 SearXNG 元搜索引擎，通常一起打包，你可以用 Docker 快速启动。它可通过 Ollama 使用本地 LLM，也支持云供应商（OpenAI、Claude、Groq）。

为什么选它： 它提供了最接近 Perplexity 本身的体验——输入问题，它通过 SearXNG 搜索网络，读取结果，然后返回带引用的答案。它是该领域 GitHub 星数最多的项目（截至 2026 年 6 月约 3.54 万星，MIT 许可），意味着活跃的开发和大量的社区部署指南。官方仓库是 github.com/ItzCrazyKns/Vane（旧的 Perplexica 路径现在会重定向到那里）。

名称说明：你仍会在改名之前的 GitHub 分支、教程和 Medium 文章中看到“Perplexica”。Vane 和 Perplexica 指同一技术谱系——搜索时两者都试试。

Khoj

它是什么： 一个开源、可自托管的“AI 第二大脑”（AGPL-3.0，Y Combinator 支持，截至 2026 年 6 月约 3.52 万 GitHub 星）。它从网络以及你自己的文档（PDF、Markdown、org-mode、Word、Notion、图片等）中回答问题，支持任何本地或在线 LLM（llama、qwen、mistral、gpt、claude、gemini）。底层使用 pgvector 进行语义搜索，可通过浏览器、Obsidian、Emacs、桌面、手机甚至 WhatsApp 访问。

为什么选它： Khoj 更偏向“个人知识助手”而非“网络搜索引擎”。如果你的目标是在多个客户端上搜索和查询自己的文档（并可选访问网络），它是这里功能最齐全的选择。它还支持自定义代理、自动化和定期研究。

SurfSense

它是什么： 一个开源 AI 研究助手（Apache-2.0，截至 2026 年 6 月约 1.5 万 GitHub 星），定位为 NotebookLM、Perplexity 和 Glean 的替代品。它将 LLM 与你自己的知识来源以及 27 个以上外部集成（Slack、Notion、Google Drive、GitHub、YouTube，以及 Tavily/Linkup 等搜索 API）连接，运行在你的基础设施上，并完全支持使用 Ollama（和 vLLM）运行本地 LLM。它采用两层 RAG 架构（带倒数排名融合（Reciprocal Rank Fusion）的混合搜索+重排序器），支持 50 多种文件格式，并增加了团队协作功能（共享聊天、基于角色的访问）。

为什么选它： 它是这组工具中最“团队知识平台”的。如果你想要一个自托管的研究工作空间，从多个企业源聚合数据并支持协作，SurfSense 比那些更接近搜索框的工具更合适。

SearXNG

它是什么： 它本身不是一个 AI 引擎——它是一个免费、可自托管的元搜索引擎（AGPL-3.0，截至 2026 年 6 月约 3.23 万 GitHub 星），同时查询数百个搜索后端（Google、Bing 等——根据其文档多达约 269 个服务）并聚合结果，不跟踪你、不存储查询、不提供广告。它是原始 Searx 的社区维护分支。

为什么它在这个列表里： SearXNG 是 AI 答案引擎所接入的隐私保护搜索层。Vane 打包了它。你也可以自己将 SearXNG 与 Ollama 配对，构建一个最简的“搜索后总结”流水线。把它想象成检索管道，而非答案引擎——但它很基础，所以理应在这里。

对比表

工具	最佳用途	本地LLM (Ollama)	搜索网络	与文档聊天	许可证
Vane（前Perplexica）	最接近Perplexity风格的答案引擎	是	是（通过SearXNG）	有限	MIT
Khoj	个人AI第二大脑，用于文档	是	是	是（pgvector）	AGPL-3.0
SurfSense	团队研究空间 + 集成	是	是（通过搜索API）	是（混合RAG）	Apache-2.0
SearXNG	私有元搜索层	不适用	是（200+引擎）	否	AGPL-3.0

星数和具体功能集变化很快——请在使用前查看各项目的 GitHub。

坦诚的优缺点

Vane

优点：最接近真实 Perplexity 体验；自带 SearXNG；社区庞大活跃；Docker 优先。
缺点：偏向网络搜索回答——相比 Khoj/SurfSense，文档知识库能力较弱；更名导致有两个名称的文档分散且偶尔过时。

Khoj

优点：最适合与自己的文档聊天；客户端集成丰富；项目成熟且有资金支持。
缺点：AGPL-3.0 如果嵌入产品会有 copyleft 影响；更像是“助手”而非“搜索引擎”，可能超出你的需求。

SurfSense

优点：丰富的源集成；协作功能；先进的 RAG（混合搜索+重排序器）。
缺点：部署较重；面向团队，对于个人私有搜索框来说过于臃肿。

SearXNG

优点：稳定可靠的私有元搜索；其他工具的隐私基础；Docker 部署简单。
缺点：本身没有 AI 层——你需要自己提供 LLM 和摘要生成。

你应该选哪个？

你想要“Perplexity，但属于我”： 从 Vane 开始。它是最忠实的克隆，而且自带搜索层。
你想跨设备搜索和对话自己的文件： Khoj。
你是一个团队，需要自托管的、连接到 Slack/Notion/Drive 的研究中心： SurfSense。
你只需要私有网络搜索来构建上层应用： SearXNG，然后加上 LLM。

搭建首选方案（Vane）——概览

由于 Vane 是 Docker 优先，大致步骤为：

安装 Docker 并克隆项目仓库：github.com/ItzCrazyKns/Vane（官方仓库；旧的 Perplexica 路径会重定向到这里）。如果你不想从源码构建，Vane 也提供了预构建的 Docker 镜像（itzcrazykns1337/vane:latest）。
配置模型后端。 将其指向本地 Ollama 实例以获得完全隐私（先 ollama pull 一个对话模型和一个嵌入模型），或者添加云供应商的 API 密钥。
用 docker compose up 启动整个堆栈。 这将同时启动 Next.js 前端、API 和打包的 SearXNG 实例。
打开 Web UI 并提问。它会通过 SearXNG 搜索，读取结果，并返回带引用的答案——如果你选择本地模型，则完全运行在你的硬件上。

请务必遵循项目最新的 README 获取准确、即时的命令——配置键和 compose 文件在不同版本间可能有变化。

这些方案与托管版 Perplexity 的对比

需要坦诚说明你放弃了什么。托管版 Perplexity 拥有精美的 UI、背后庞大的爬取/索引、无需你配置就能快速响应，以及每周都推出新功能的团队。指向 SearXNG 的自托管引擎不会有商业爬虫那样广泛的实时网络覆盖，而本地 7-8B 模型也无法像前沿云模型那样推理。

你得到的是：你的查询不会被记录或货币化，你连接的文档保持私密，你可以离线运行，你选择模型，而且无需订阅。对于许多开发者和注重隐私的团队来说，这种权衡显然值得——尤其是当你仅在生成时使用强大的云 LLM，而将搜索和文档摄入保留在本地。根据便利性和控制权哪个是你不能妥协的来选择。

隐私与数据所有权

这正是做这一切的原因。使用自托管的答案引擎和本地 LLM，完整的循环——你的查询、搜索、检索到的页面、生成的答案——都停留在你的网络内。没有第三方记录任何东西，没有东西训练别人的模型，你可以完全隔离运行。一旦你接入云端 LLM，你就重新引入了依赖：你的提示（以及检索到的上下文）会发送给那个供应商。如果是为了质量，这可以是一个有意识的合理权衡——但要明确知道这一点，并将嵌入和文档摄入保留在本地（如果隐私是你的主要目标）。同样的原则贯穿我们的自托管 RAG 指南。

常见问题

2026 年最好的开源 Perplexity 替代品是什么？ Vane（更名后的 Perplexica）是最接近 Perplexity 网络回答体验的方案，也是 GitHub 星数最高的。对于搜索自己的文档，Khoj 或 SurfSense 更强大。

Perplexica 和 Vane 是同一个吗？ 是的。原名 Perplexica 的项目在 2026 年 3 月左右更名为 Vane。旧教程和分支仍使用 Perplexica 名称，所以搜索时两者都试试。

能否完全离线运行 AI 搜索？ 可以。将自托管引擎（Vane、Khoj 或 SurfSense）与通过 Ollama 运行的本地 LLM 以及自托管的 SearXNG 实例配对，整个流水线就在你的硬件上运行，没有任何东西离开你的网络。

这些需要 GPU 吗？ 不是必须的。它们可以在 CPU 上运行，但本地 LLM 生成在 GPU 上要快得多。常见的折中是使用本地嵌入/搜索，加上云 LLM 生成最终答案。

SearXNG 和其他工具有什么区别？ SearXNG 是一个私有元搜索引擎——它查找并聚合结果，但没有 AI 层。其他工具（Vane、Khoj、SurfSense）在其上添加了 LLM，以读取结果并写出带引用的答案。

Aquila 是提供私有、自托管 AI 搜索的独立指南——那种你拥有而非租用的搜索。深入了解完整 RAG 指南，从什么是语义搜索获取基础知识，或浏览所有指南并订阅新闻通讯。掌控你自己的搜索。