指南

构建归你所有的搜索。

实用、自托管优先的 RAG、AI 搜索和向量数据库指南。没有废话,没有厂商推销——只讲如何自己运行。

自托管 RAG

私有 AI 知识库——你自己运行的检索增强生成。

自托管 RAG

在 VPS 上搭建私有 RAG 系统:分步教程

一份实践教程,教你如何在 VPS 上构建一个私有、自托管的 RAG 系统:配置服务器、运行 Ollama、搭建向量存储、构建管道,并交付一个 FastAPI 服务。

阅读指南
自托管 RAG

RAG 本地最佳嵌入模型 (2026)

对适用于 RAG 的本地、可自托管嵌入模型的实用对比——nomic-embed-text、mxbai-embed-large、bge、e5、gte,涵盖维度、许可及选择方法。

阅读指南
自托管 RAG

自托管RAG:私有AI知识库完全指南

构建一个你完全拥有的私有、自托管RAG系统。包括参考栈、嵌入和向量存储选择、VPS规格、陷阱以及何时不应自托管。

阅读指南
自托管 RAG

自托管 RAG 与 OpenAI + Pinecone:真实的成本对比

自托管 RAG 与 OpenAI 嵌入加 Pinecone 的真实、逐项成本对比——涵盖计算、嵌入、存储、隐性成本,以及托管方案何时胜出。

阅读指南
自托管 RAG

自托管文档聊天:构建私有PDF问答助手

构建一个自托管的私有『与PDF和文档聊天』助手:摄入、嵌入、存储、检索和回答,使用本地LLM和UI。真实命令。

阅读指南
自托管 RAG

如何评估 RAG 系统:指标、黄金数据集与回归测试

正确评估 RAG:检索指标(recall@k、MRR、nDCG)、生成指标(忠实度、相关性)、黄金数据集、RAGAS 与 LLM-as-judge、自托管。

阅读指南
自托管 RAG

生产级 RAG:将自托管检索从演示打造成可靠服务

将自托管 RAG 投入生产:缓存、可观测性、延迟和成本控制、访问控制、数据新鲜度、CI 中的评估以及扩展向量存储。

阅读指南
自托管 RAG

RAG分块策略:如何拆分文档以获得更好的检索

关于RAG分块策略的实用指南:固定大小、递归、语义和结构感知拆分、重叠、父文档检索和大小确定。

阅读指南
自托管 RAG

RAG 重排序:两阶段检索-重排序流程如何击败原始 Top-K

为你的 RAG 管道添加重排序器:为什么检索后重排序优于原始向量 top-k、交叉编码器与双编码器的对比、可自托管的模型、延迟权衡。

阅读指南
自托管 RAG

RAG vs 微调:你真正需要哪一个?(2026)

关于 RAG 与微调的清晰决策指南——各自的作用、成本、延迟和维护权衡、幻觉问题以及何时结合使用两者。

阅读指南
自托管 RAG

RAG 与长上下文:2026 年你还需要检索吗?

2026 年关于 RAG 与长上下文 LLM 的诚实剖析:成本、延迟、准确率、“lost in the middle”、上下文填充何时胜出、检索何时胜出,以及混合方案。

阅读指南

自托管的 Perplexity 替代方案与神经回答引擎。

向量数据库

向量搜索的工作原理,以及哪些引擎适合自托管。

基础概念

语义搜索、嵌入,以及现代搜索背后的核心概念。