分类

LLM Engineering

已发布 8 篇文章

01 Embedding与向量数据库

本笔记深入探讨了Embedding和向量数据库的核心概念与应用。Embedding是将文本、图片等非结构化数据转化为高维向量，捕捉其语义信息。向量数据库则高效存储和检索这些向量，为LLM提供长期记忆和语义搜索能力，并详细介绍了Word2Vec、TF-IDF等Embedding技术以及FAISS等向量数据库的实际应用。

02 RAG技术与应用

本笔记深入探讨RAG技术，从核心原理、优势及应用开发模式出发，详细介绍了Embedding模型选择、基于DeepSeek+Faiss构建本地知识库检索的实战案例。此外，还涵盖了Query改写和Query联网搜索等高级优化策略，旨在提升大模型问答系统的准确性和时效性。

2026年5月21日

Read article

LLM Engineering

03 RAG多模态数据处理

本资料详细介绍了RAG多模态数据处理，包括Gemini的多模态处理能力及API使用。通过迪士尼RAG助手案例，深入探讨了Multimodal-Embedding、Faiss索引构建、多模态统一向量空间和查询处理流程。最后，对比分析了多种知识切片策略及其适用场景。

2026年5月21日

Read article

LLM Engineering

04 RAG高级技术与调优

本笔记深入探讨了RAG（检索增强生成）系统的高级技术与调优策略，涵盖知识库处理（问题生成、对话沉淀、健康度检查、版本管理）、高效召回（多查询、混合检索、重排序、双向改写、Small-to-Big策略）以及GraphRAG的原理与应用，旨在帮助构建更鲁棒、精准的RAG系统。

2026年5月21日

Read article

LLM Engineering

05 项目实战：企业知识库

本资料深入探讨了企业知识库RAG系统的项目实战，以RAG挑战赛冠军方案为例，详细介绍了从数据解析、内容提取、检索、重排序到最终答案生成的全流程优化技术，包括多路由、动态知识库、LLM重排序、结构化输出及指令细化。最后，提供了搭建自定义RAG系统的实践指导。

2026年5月21日

LLMRAGHandsOnChunkingRerankingWeights

Read article

LLM Engineering

06 Function Calling&MCP

本资料深入探讨了Function Calling和Model Context Protocol (MCP) 两大技术。Function Calling是LLM与外部系统交互的“桥梁”，扩展模型能力，而MCP作为开放协议标准，旨在统一LLM与多数据源、工具及服务之间的交互，被誉为“AI领域的USB-C接口”。笔记将详细阐述它们的概念、区别、应用场景及代码实践。

2026年5月21日

FunctionCallingMCPSQLAutomation

Read article

LLM Engineering

07 Agent的自主规划与工具开发

本学习笔记深入探讨了AI Agent的自主规划与工具开发，详细介绍了反应式、深思熟虑和混合式三种智能体架构。通过具体的案例（如私募基金问答、智能投研、投顾AI助手），阐述了Agent在复杂任务中的应用，并讲解了LangGraph等框架的核心使用方法及Agent构建的最佳实践。

2026年5月21日

AgentPlanningCoTMCPStreamlitUI

Read article

LLM Engineering

08 Agent的能力优化与效果评估

本笔记详细介绍了Agent能力优化与效果评估，涵盖了投顾AI助手的混合智能体架构、LangSmith在追踪调试与自动化测试中的应用、OpenEvals内置与自定义评估器的使用，以及DeepEval、Qwen Agent和LangFuse等工具的对比与实践。

2026年5月21日

AgentEvalErrorAnalysisAgentOptIntentRoutingMemoryTuning

Read article