Rag

3 articles
2025

RAG:知识库分段

在构建知识库时,分段(Chunking)是一个至关重要的步骤,尤其是在与大型语言模型(LLM)结合使用,例如在检索增强生成(RAG)系统中。分段的目的是将长文本分割成较小的、可管理的块,以便: 适应LLM的上下文窗口限制: LLM有输入Token数量的限制,过长的文本需要被切分。 …
Read more

使用 LlamaIndex 和 Milvus 检索增强生成 (RAG)

这里将要介绍使用本地部署的LLM,如何使用LlamaIndex构建RAG系统。 主要流程: RAG 是一种基于检索增强生成(Retrieval-Augmented Generation)的技术,它通过检索相关文档来增强生成模型的输出。RAG可以用于各种任务,包括问答、摘要、翻译 …
Read more

RAG vs 模型微调

RAG RAG (Retrieval-Augmented Generation),中文可以理解为检索增强生成,是一种通过从外部知识库检索信息来增强大型语言模型(LLM)能力的AI框架。 简单来说,传统的 LLM 是基于其训练数据来生成文本的,而 RAG 则在此基础上增加了一个步 …
Read more