LLM

2025

使用 LlamaIndex 和 Milvus 检索增强生成 (RAG)

这里将要介绍使用本地部署的LLM,如何使用LlamaIndex构建RAG系统。 主要流程: RAG 是一种基于检索增强生成(Retrieval-Augmented Generation)的技术,它通过检索相关文档来增强生成模型的输出。RAG可以用于各种任务,包括问答、摘要、翻译 …
Read more

向量归一化和相似度

1、向量归一化 在机器学习和深度学习中,对嵌入向量进行归一化(Normalization)至关重要,它能带来多方面的益处,尤其是在涉及到相似度计算、模型训练和数据表示时。归一化通常指的是将向量的长度(或范数)缩放为单位长度(通常为 L2 范数等于 1)。以下是归一化的主要必要性: …
Read more

RAG vs 模型微调

RAG RAG (Retrieval-Augmented Generation),中文可以理解为检索增强生成,是一种通过从外部知识库检索信息来增强大型语言模型(LLM)能力的AI框架。 简单来说,传统的 LLM 是基于其训练数据来生成文本的,而 RAG 则在此基础上增加了一个步 …
Read more

GGUF格式和LLM量化类型

GGUF 格式 LLM GGUF 格式是一种用于存储大型语言模型(LLM)的文件格式,特别是那些与 Llama.cpp 库一起使用的模型。GGUF 是 “GG Ultra Fast” 的缩写,它旨在提供一种高效且可移植的方式来存储和加载 LLM。 GGUF 格式的关键特性包括: …
Read more

Llama.cpp vs Ollama

Llama.cpp 和 Ollama 都是在本地运行大型语言模型(LLMs)的工具,但它们的设计目标和使用方式有所不同。以下是它们之间的主要区别: 设计目标: Llama.cpp: Llama.cpp 是一个用 C++ 编写的库,专注于在消费级硬件(尤其是 CPU) …
Read more

GraphRAG vs AnythingLLM

GraphRAG 核心理念: GraphRAG 是一种检索增强生成(RAG)技术,它利用知识图谱来增强大型语言模型(LLM)的性能。 工作原理: 它从知识图谱中检索相关信息,并将其作为上下文提供给 LLM。这有助于 LLM 更准确、更全面地回答问题,尤其是在需要复杂推理或涉及实体 …
Read more

简单对比GraphRAG和LlamaIndex

比较LlamaIndex和GraphRAG的成熟度,需要考虑它们各自的目标、功能以及实际应用情况。以下是一些关键点的比较: LlamaIndex 成熟度: LlamaIndex是一个为了简化LLM(大型语言模型)应用中的数据增强检索(RAG)流程的工具。 它专注于提供各种数据连接 …
Read more

Embedding

Embedding 模型是什么? 简单来说,Embedding 模型是一种将高维度、离散或复杂的输入数据(例如文字、图片、用户ID、商品ID等)转换为低维度、连续的向量(Vector)表示的技术或模型。这个生成的向量被称为“嵌入”(Embedding)。 想象一下,我们有很多词 …
Read more