开源 Perplexity 替代品:自托管 AI 搜索 (2026)
你自行运行的 AI 答案引擎——无查询日志、无租赁索引、无守门人。
2026 年最好的开源、自托管 Perplexity 替代品是 Vane(更名后的 Perplexica)、Khoj 和 SurfSense(用于完整的 AI 答案引擎),以及 SearXNG(作为多个工具所依赖的私有元搜索层)。每个方案都允许你在自己的硬件上运行 AI 搜索体验,通过 Ollama 指向本地 LLM 或使用云模型,并将你的查询保留在自己服务器之外。本文对它们进行坦诚对比,包括首选方案的设置说明和清晰的优缺点表格。
如果“AI 搜索引擎”和“RAG”在你看来是一回事,它们是近亲——文档问答方面的内容请参阅自托管 RAG 完整指南。
为什么要自托管 AI 搜索引擎
Perplexity 出色且方便。但它会记录你每一次查询,按自己的逻辑对来源排序,而且你无法离线或在防火墙后运行它。自托管开源替代品能带来:
- 隐私。 你的搜索和连接的文档永远不会离开你的基础设施。
- 模型选择。 通过 Ollama 运行本地模型实现完全隔离的隐私,或接入云端 LLM(OpenAI、Claude、Groq)以获得更强性能。
- 无守门人。 你控制哪些搜索后端和来源提供答案,没有广告或排名机制对你不利。
当然,代价是:你运行它,你维护它。对于普通用户,托管产品更省事;对于注重隐私的开发者或团队,拥有整个堆栈才是关键。
候选方案
Vane(原名 Perplexica)
它是什么: 最直接的开源 Perplexity 克隆——一个 AI 回答引擎。大约在 2026 年 3 月,原名 Perplexica 的项目更名为 Vane。它整合了 Next.js 前端、API 后端和一个私有的 SearXNG 元搜索引擎,通常一起打包,你可以用 Docker 快速启动。它可通过 Ollama 使用本地 LLM,也支持云供应商(OpenAI、Claude、Groq)。
为什么选它: 它提供了最接近 Perplexity 本身的体验——输入问题,它通过 SearXNG 搜索网络,读取结果,然后返回带引用的答案。它是该领域 GitHub 星数最多的项目(截至 2026 年 6 月约 3.54 万星,MIT 许可),意味着活跃的开发和大量的社区部署指南。官方仓库是 github.com/ItzCrazyKns/Vane(旧的 Perplexica 路径现在会重定向到那里)。
名称说明:你仍会在改名之前的 GitHub 分支、教程和 Medium 文章中看到“Perplexica”。Vane 和 Perplexica 指同一技术谱系——搜索时两者都试试。
Khoj
它是什么: 一个开源、可自托管的“AI 第二大脑”(AGPL-3.0,Y Combinator 支持,截至 2026 年 6 月约 3.52 万 GitHub 星)。它从网络以及你自己的文档(PDF、Markdown、org-mode、Word、Notion、图片等)中回答问题,支持任何本地或在线 LLM(llama、qwen、mistral、gpt、claude、gemini)。底层使用 pgvector 进行语义搜索,可通过浏览器、Obsidian、Emacs、桌面、手机甚至 WhatsApp 访问。
为什么选它: Khoj 更偏向“个人知识助手”而非“网络搜索引擎”。如果你的目标是在多个客户端上搜索和查询自己的文档(并可选访问网络),它是这里功能最齐全的选择。它还支持自定义代理、自动化和定期研究。
SurfSense
它是什么: 一个开源 AI 研究助手(Apache-2.0,截至 2026 年 6 月约 1.5 万 GitHub 星),定位为 NotebookLM、Perplexity 和 Glean 的替代品。它将 LLM 与你自己的知识来源以及 27 个以上外部集成(Slack、Notion、Google Drive、GitHub、YouTube,以及 Tavily/Linkup 等搜索 API)连接,运行在你的基础设施上,并完全支持使用 Ollama(和 vLLM)运行本地 LLM。它采用两层 RAG 架构(带倒数排名融合(Reciprocal Rank Fusion)的混合搜索+重排序器),支持 50 多种文件格式,并增加了团队协作功能(共享聊天、基于角色的访问)。
为什么选它: 它是这组工具中最“团队知识平台”的。如果你想要一个自托管的研究工作空间,从多个企业源聚合数据并支持协作,SurfSense 比那些更接近搜索框的工具更合适。
SearXNG
它是什么: 它本身不是一个 AI 引擎——它是一个免费、可自托管的元搜索引擎(AGPL-3.0,截至 2026 年 6 月约 3.23 万 GitHub 星),同时查询数百个搜索后端(Google、Bing 等——根据其文档多达约 269 个服务)并聚合结果,不跟踪你、不存储查询、不提供广告。它是原始 Searx 的社区维护分支。
为什么它在这个列表里: SearXNG 是 AI 答案引擎所接入的隐私保护搜索层。Vane 打包了它。你也可以自己将 SearXNG 与 Ollama 配对,构建一个最简的“搜索后总结”流水线。把它想象成检索管道,而非答案引擎——但它很基础,所以理应在这里。
对比表
| 工具 | 最佳用途 | 本地LLM (Ollama) | 搜索网络 | 与文档聊天 | 许可证 |
|---|---|---|---|---|---|
| Vane(前Perplexica) | 最接近Perplexity风格的答案引擎 | 是 | 是(通过SearXNG) | 有限 | MIT |
| Khoj | 个人AI第二大脑,用于文档 | 是 | 是 | 是(pgvector) | AGPL-3.0 |
| SurfSense | 团队研究空间 + 集成 | 是 | 是(通过搜索API) | 是(混合RAG) | Apache-2.0 |
| SearXNG | 私有元搜索层 | 不适用 | 是(200+引擎) | 否 | AGPL-3.0 |
星数和具体功能集变化很快——请在使用前查看各项目的 GitHub。
坦诚的优缺点
Vane
- 优点:最接近真实 Perplexity 体验;自带 SearXNG;社区庞大活跃;Docker 优先。
- 缺点:偏向网络搜索回答——相比 Khoj/SurfSense,文档知识库能力较弱;更名导致有两个名称的文档分散且偶尔过时。
Khoj
- 优点:最适合与自己的文档聊天;客户端集成丰富;项目成熟且有资金支持。
- 缺点:AGPL-3.0 如果嵌入产品会有 copyleft 影响;更像是“助手”而非“搜索引擎”,可能超出你的需求。
SurfSense
- 优点:丰富的源集成;协作功能;先进的 RAG(混合搜索+重排序器)。
- 缺点:部署较重;面向团队,对于个人私有搜索框来说过于臃肿。
SearXNG
- 优点:稳定可靠的私有元搜索;其他工具的隐私基础;Docker 部署简单。
- 缺点:本身没有 AI 层——你需要自己提供 LLM 和摘要生成。
你应该选哪个?
- 你想要“Perplexity,但属于我”: 从 Vane 开始。它是最忠实的克隆,而且自带搜索层。
- 你想跨设备搜索和对话自己的文件: Khoj。
- 你是一个团队,需要自托管的、连接到 Slack/Notion/Drive 的研究中心: SurfSense。
- 你只需要私有网络搜索来构建上层应用: SearXNG,然后加上 LLM。
搭建首选方案(Vane)——概览
由于 Vane 是 Docker 优先,大致步骤为:
- 安装 Docker 并克隆项目仓库:github.com/ItzCrazyKns/Vane(官方仓库;旧的
Perplexica路径会重定向到这里)。如果你不想从源码构建,Vane 也提供了预构建的 Docker 镜像(itzcrazykns1337/vane:latest)。 - 配置模型后端。 将其指向本地 Ollama 实例以获得完全隐私(先
ollama pull一个对话模型和一个嵌入模型),或者添加云供应商的 API 密钥。 - 用
docker compose up启动整个堆栈。 这将同时启动 Next.js 前端、API 和打包的 SearXNG 实例。 - 打开 Web UI 并提问。它会通过 SearXNG 搜索,读取结果,并返回带引用的答案——如果你选择本地模型,则完全运行在你的硬件上。
请务必遵循项目最新的 README 获取准确、即时的命令——配置键和 compose 文件在不同版本间可能有变化。
这些方案与托管版 Perplexity 的对比
需要坦诚说明你放弃了什么。托管版 Perplexity 拥有精美的 UI、背后庞大的爬取/索引、无需你配置就能快速响应,以及每周都推出新功能的团队。指向 SearXNG 的自托管引擎不会有商业爬虫那样广泛的实时网络覆盖,而本地 7-8B 模型也无法像前沿云模型那样推理。
你得到的是:你的查询不会被记录或货币化,你连接的文档保持私密,你可以离线运行,你选择模型,而且无需订阅。对于许多开发者和注重隐私的团队来说,这种权衡显然值得——尤其是当你仅在生成时使用强大的云 LLM,而将搜索和文档摄入保留在本地。根据便利性和控制权哪个是你不能妥协的来选择。
隐私与数据所有权
这正是做这一切的原因。使用自托管的答案引擎和本地 LLM,完整的循环——你的查询、搜索、检索到的页面、生成的答案——都停留在你的网络内。没有第三方记录任何东西,没有东西训练别人的模型,你可以完全隔离运行。一旦你接入云端 LLM,你就重新引入了依赖:你的提示(以及检索到的上下文)会发送给那个供应商。如果是为了质量,这可以是一个有意识的合理权衡——但要明确知道这一点,并将嵌入和文档摄入保留在本地(如果隐私是你的主要目标)。同样的原则贯穿我们的自托管 RAG 指南。
常见问题
2026 年最好的开源 Perplexity 替代品是什么? Vane(更名后的 Perplexica)是最接近 Perplexity 网络回答体验的方案,也是 GitHub 星数最高的。对于搜索自己的文档,Khoj 或 SurfSense 更强大。
Perplexica 和 Vane 是同一个吗? 是的。原名 Perplexica 的项目在 2026 年 3 月左右更名为 Vane。旧教程和分支仍使用 Perplexica 名称,所以搜索时两者都试试。
能否完全离线运行 AI 搜索? 可以。将自托管引擎(Vane、Khoj 或 SurfSense)与通过 Ollama 运行的本地 LLM 以及自托管的 SearXNG 实例配对,整个流水线就在你的硬件上运行,没有任何东西离开你的网络。
这些需要 GPU 吗? 不是必须的。它们可以在 CPU 上运行,但本地 LLM 生成在 GPU 上要快得多。常见的折中是使用本地嵌入/搜索,加上云 LLM 生成最终答案。
SearXNG 和其他工具有什么区别? SearXNG 是一个私有元搜索引擎——它查找并聚合结果,但没有 AI 层。其他工具(Vane、Khoj、SurfSense)在其上添加了 LLM,以读取结果并写出带引用的答案。
Aquila 是提供私有、自托管 AI 搜索的独立指南——那种你拥有而非租用的搜索。深入了解完整 RAG 指南,从什么是语义搜索获取基础知识,或浏览所有指南并订阅新闻通讯。掌控你自己的搜索。