⌘K

分类

LLM Engineering

已发布 8 篇文章

LLM Engineering

01 Embedding与向量数据库

本笔记深入探讨了Embedding和向量数据库的核心概念与应用。Embedding是将文本、图片等非结构化数据转化为高维向量,捕捉其语义信息。向量数据库则高效存储和检索这些向量,为LLM提供长期记忆和语义搜索能力,并详细介绍了Word2Vec、TF-IDF等Embedding技术以及FAISS等向量数据库的实际应用。

2026年5月20日
RAGLLMPython
Read article
LLM Engineering

02 RAG技术与应用

本笔记深入探讨RAG技术,从核心原理、优势及应用开发模式出发,详细介绍了Embedding模型选择、基于DeepSeek+Faiss构建本地知识库检索的实战案例。此外,还涵盖了Query改写和Query联网搜索等高级优化策略,旨在提升大模型问答系统的准确性和时效性。

2026年5月21日
Read article
LLM Engineering

03 RAG多模态数据处理

本资料详细介绍了RAG多模态数据处理,包括Gemini的多模态处理能力及API使用。通过迪士尼RAG助手案例,深入探讨了Multimodal-Embedding、Faiss索引构建、多模态统一向量空间和查询处理流程。最后,对比分析了多种知识切片策略及其适用场景。

2026年5月21日
Read article
LLM Engineering

04 RAG高级技术与调优

本笔记深入探讨了RAG(检索增强生成)系统的高级技术与调优策略,涵盖知识库处理(问题生成、对话沉淀、健康度检查、版本管理)、高效召回(多查询、混合检索、重排序、双向改写、Small-to-Big策略)以及GraphRAG的原理与应用,旨在帮助构建更鲁棒、精准的RAG系统。

2026年5月21日
Read article
LLM Engineering

05 项目实战:企业知识库

本资料深入探讨了企业知识库RAG系统的项目实战,以RAG挑战赛冠军方案为例,详细介绍了从数据解析、内容提取、检索、重排序到最终答案生成的全流程优化技术,包括多路由、动态知识库、LLM重排序、结构化输出及指令细化。最后,提供了搭建自定义RAG系统的实践指导。

2026年5月21日
LLMRAGHandsOnChunkingRerankingWeights
Read article
LLM Engineering

06 Function Calling&MCP

本资料深入探讨了Function Calling和Model Context Protocol (MCP) 两大技术。Function Calling是LLM与外部系统交互的“桥梁”,扩展模型能力,而MCP作为开放协议标准,旨在统一LLM与多数据源、工具及服务之间的交互,被誉为“AI领域的USB-C接口”。笔记将详细阐述它们的概念、区别、应用场景及代码实践。

2026年5月21日
FunctionCallingMCPSQLAutomation
Read article
LLM Engineering

07 Agent的自主规划与工具开发

本学习笔记深入探讨了AI Agent的自主规划与工具开发,详细介绍了反应式、深思熟虑和混合式三种智能体架构。通过具体的案例(如私募基金问答、智能投研、投顾AI助手),阐述了Agent在复杂任务中的应用,并讲解了LangGraph等框架的核心使用方法及Agent构建的最佳实践。

2026年5月21日
AgentPlanningCoTMCPStreamlitUI
Read article
LLM Engineering

08 Agent的能力优化与效果评估

本笔记详细介绍了Agent能力优化与效果评估,涵盖了投顾AI助手的混合智能体架构、LangSmith在追踪调试与自动化测试中的应用、OpenEvals内置与自定义评估器的使用,以及DeepEval、Qwen Agent和LangFuse等工具的对比与实践。

2026年5月21日
AgentEvalErrorAnalysisAgentOptIntentRoutingMemoryTuning
Read article