开源 Perplexity 替代品:自托管 AI 搜索 (2026)

你自行运行的 AI 答案引擎——无查询日志、无租赁索引、无守门人。

Aquila 团队 更新于 2026年6月19日

2026 年最好的开源、自托管 Perplexity 替代品是 Vane(更名后的 Perplexica)、KhojSurfSense(用于完整的 AI 答案引擎),以及 SearXNG(作为多个工具所依赖的私有元搜索层)。每个方案都允许你在自己的硬件上运行 AI 搜索体验,通过 Ollama 指向本地 LLM 或使用云模型,并将你的查询保留在自己服务器之外。本文对它们进行坦诚对比,包括首选方案的设置说明和清晰的优缺点表格。

如果“AI 搜索引擎”和“RAG”在你看来是一回事,它们是近亲——文档问答方面的内容请参阅自托管 RAG 完整指南

为什么要自托管 AI 搜索引擎

Perplexity 出色且方便。但它会记录你每一次查询,按自己的逻辑对来源排序,而且你无法离线或在防火墙后运行它。自托管开源替代品能带来:

  • 隐私。 你的搜索和连接的文档永远不会离开你的基础设施。
  • 模型选择。 通过 Ollama 运行本地模型实现完全隔离的隐私,或接入云端 LLM(OpenAI、Claude、Groq)以获得更强性能。
  • 无守门人。 你控制哪些搜索后端和来源提供答案,没有广告或排名机制对你不利。

当然,代价是:你运行它,你维护它。对于普通用户,托管产品更省事;对于注重隐私的开发者或团队,拥有整个堆栈才是关键。

候选方案

Vane(原名 Perplexica)

它是什么: 最直接的开源 Perplexity 克隆——一个 AI 回答引擎。大约在 2026 年 3 月,原名 Perplexica 的项目更名为 Vane。它整合了 Next.js 前端、API 后端和一个私有的 SearXNG 元搜索引擎,通常一起打包,你可以用 Docker 快速启动。它可通过 Ollama 使用本地 LLM,也支持云供应商(OpenAI、Claude、Groq)。

为什么选它: 它提供了最接近 Perplexity 本身的体验——输入问题,它通过 SearXNG 搜索网络,读取结果,然后返回带引用的答案。它是该领域 GitHub 星数最多的项目(截至 2026 年 6 月约 3.54 万星,MIT 许可),意味着活跃的开发和大量的社区部署指南。官方仓库是 github.com/ItzCrazyKns/Vane(旧的 Perplexica 路径现在会重定向到那里)。

名称说明:你仍会在改名之前的 GitHub 分支、教程和 Medium 文章中看到“Perplexica”。Vane 和 Perplexica 指同一技术谱系——搜索时两者都试试。

Khoj

它是什么: 一个开源、可自托管的“AI 第二大脑”(AGPL-3.0,Y Combinator 支持,截至 2026 年 6 月约 3.52 万 GitHub 星)。它从网络以及你自己的文档(PDF、Markdown、org-mode、Word、Notion、图片等)中回答问题,支持任何本地或在线 LLM(llama、qwen、mistral、gpt、claude、gemini)。底层使用 pgvector 进行语义搜索,可通过浏览器、Obsidian、Emacs、桌面、手机甚至 WhatsApp 访问。

为什么选它: Khoj 更偏向“个人知识助手”而非“网络搜索引擎”。如果你的目标是在多个客户端上搜索和查询自己的文档(并可选访问网络),它是这里功能最齐全的选择。它还支持自定义代理、自动化和定期研究。

SurfSense

它是什么: 一个开源 AI 研究助手(Apache-2.0,截至 2026 年 6 月约 1.5 万 GitHub 星),定位为 NotebookLM、Perplexity 和 Glean 的替代品。它将 LLM 与你自己的知识来源以及 27 个以上外部集成(Slack、Notion、Google Drive、GitHub、YouTube,以及 Tavily/Linkup 等搜索 API)连接,运行在你的基础设施上,并完全支持使用 Ollama(和 vLLM)运行本地 LLM。它采用两层 RAG 架构(带倒数排名融合(Reciprocal Rank Fusion)的混合搜索+重排序器),支持 50 多种文件格式,并增加了团队协作功能(共享聊天、基于角色的访问)。

为什么选它: 它是这组工具中最“团队知识平台”的。如果你想要一个自托管的研究工作空间,从多个企业源聚合数据并支持协作,SurfSense 比那些更接近搜索框的工具更合适。

SearXNG

它是什么: 它本身不是一个 AI 引擎——它是一个免费、可自托管的元搜索引擎(AGPL-3.0,截至 2026 年 6 月约 3.23 万 GitHub 星),同时查询数百个搜索后端(Google、Bing 等——根据其文档多达约 269 个服务)并聚合结果,不跟踪你、不存储查询、不提供广告。它是原始 Searx 的社区维护分支。

为什么它在这个列表里: SearXNG 是 AI 答案引擎所接入的隐私保护搜索层。Vane 打包了它。你也可以自己将 SearXNG 与 Ollama 配对,构建一个最简的“搜索后总结”流水线。把它想象成检索管道,而非答案引擎——但它很基础,所以理应在这里。

对比表

工具最佳用途本地LLM (Ollama)搜索网络与文档聊天许可证
Vane(前Perplexica)最接近Perplexity风格的答案引擎是(通过SearXNG)有限MIT
Khoj个人AI第二大脑,用于文档是(pgvector)AGPL-3.0
SurfSense团队研究空间 + 集成是(通过搜索API)是(混合RAG)Apache-2.0
SearXNG私有元搜索层不适用是(200+引擎)AGPL-3.0

星数和具体功能集变化很快——请在使用前查看各项目的 GitHub。

坦诚的优缺点

Vane

  • 优点:最接近真实 Perplexity 体验;自带 SearXNG;社区庞大活跃;Docker 优先。
  • 缺点:偏向网络搜索回答——相比 Khoj/SurfSense,文档知识库能力较弱;更名导致有两个名称的文档分散且偶尔过时。

Khoj

  • 优点:最适合与自己的文档聊天;客户端集成丰富;项目成熟且有资金支持。
  • 缺点:AGPL-3.0 如果嵌入产品会有 copyleft 影响;更像是“助手”而非“搜索引擎”,可能超出你的需求。

SurfSense

  • 优点:丰富的源集成;协作功能;先进的 RAG(混合搜索+重排序器)。
  • 缺点:部署较重;面向团队,对于个人私有搜索框来说过于臃肿。

SearXNG

  • 优点:稳定可靠的私有元搜索;其他工具的隐私基础;Docker 部署简单。
  • 缺点:本身没有 AI 层——你需要自己提供 LLM 和摘要生成。

你应该选哪个?

  • 你想要“Perplexity,但属于我”:Vane 开始。它是最忠实的克隆,而且自带搜索层。
  • 你想跨设备搜索和对话自己的文件: Khoj
  • 你是一个团队,需要自托管的、连接到 Slack/Notion/Drive 的研究中心: SurfSense
  • 你只需要私有网络搜索来构建上层应用: SearXNG,然后加上 LLM。

搭建首选方案(Vane)——概览

由于 Vane 是 Docker 优先,大致步骤为:

  1. 安装 Docker 并克隆项目仓库:github.com/ItzCrazyKns/Vane(官方仓库;旧的 Perplexica 路径会重定向到这里)。如果你不想从源码构建,Vane 也提供了预构建的 Docker 镜像(itzcrazykns1337/vane:latest)。
  2. 配置模型后端。 将其指向本地 Ollama 实例以获得完全隐私(先 ollama pull 一个对话模型和一个嵌入模型),或者添加云供应商的 API 密钥。
  3. docker compose up 启动整个堆栈。 这将同时启动 Next.js 前端、API 和打包的 SearXNG 实例。
  4. 打开 Web UI 并提问。它会通过 SearXNG 搜索,读取结果,并返回带引用的答案——如果你选择本地模型,则完全运行在你的硬件上。

请务必遵循项目最新的 README 获取准确、即时的命令——配置键和 compose 文件在不同版本间可能有变化。

这些方案与托管版 Perplexity 的对比

需要坦诚说明你放弃了什么。托管版 Perplexity 拥有精美的 UI、背后庞大的爬取/索引、无需你配置就能快速响应,以及每周都推出新功能的团队。指向 SearXNG 的自托管引擎不会有商业爬虫那样广泛的实时网络覆盖,而本地 7-8B 模型也无法像前沿云模型那样推理。

你得到的是:你的查询不会被记录或货币化,你连接的文档保持私密,你可以离线运行,你选择模型,而且无需订阅。对于许多开发者和注重隐私的团队来说,这种权衡显然值得——尤其是当你在生成时使用强大的云 LLM,而将搜索和文档摄入保留在本地。根据便利性和控制权哪个是你不能妥协的来选择。

隐私与数据所有权

这正是做这一切的原因。使用自托管的答案引擎和本地 LLM,完整的循环——你的查询、搜索、检索到的页面、生成的答案——都停留在你的网络内。没有第三方记录任何东西,没有东西训练别人的模型,你可以完全隔离运行。一旦你接入云端 LLM,你就重新引入了依赖:你的提示(以及检索到的上下文)会发送给那个供应商。如果是为了质量,这可以是一个有意识的合理权衡——但要明确知道这一点,并将嵌入和文档摄入保留在本地(如果隐私是你的主要目标)。同样的原则贯穿我们的自托管 RAG 指南

常见问题

2026 年最好的开源 Perplexity 替代品是什么? Vane(更名后的 Perplexica)是最接近 Perplexity 网络回答体验的方案,也是 GitHub 星数最高的。对于搜索自己的文档,Khoj 或 SurfSense 更强大。

Perplexica 和 Vane 是同一个吗? 是的。原名 Perplexica 的项目在 2026 年 3 月左右更名为 Vane。旧教程和分支仍使用 Perplexica 名称,所以搜索时两者都试试。

能否完全离线运行 AI 搜索? 可以。将自托管引擎(Vane、Khoj 或 SurfSense)与通过 Ollama 运行的本地 LLM 以及自托管的 SearXNG 实例配对,整个流水线就在你的硬件上运行,没有任何东西离开你的网络。

这些需要 GPU 吗? 不是必须的。它们可以在 CPU 上运行,但本地 LLM 生成在 GPU 上要快得多。常见的折中是使用本地嵌入/搜索,加上云 LLM 生成最终答案。

SearXNG 和其他工具有什么区别? SearXNG 是一个私有元搜索引擎——它查找并聚合结果,但没有 AI 层。其他工具(Vane、Khoj、SurfSense)在其上添加了 LLM,以读取结果并写出带引用的答案。


Aquila 是提供私有、自托管 AI 搜索的独立指南——那种你拥有而非租用的搜索。深入了解完整 RAG 指南,从什么是语义搜索获取基础知识,或浏览所有指南并订阅新闻通讯。掌控你自己的搜索。

继续学习

更多关于自托管 AI 搜索、RAG 和向量数据库的指南。