209
Total Articles
A chronological view of all my articles.
Exploring, learning, and sharing along the way.
2 articles
阐述 Chat Engine 作为查询引擎的有状态扩展形态,解决多轮连续对话场景。介绍 BaseChatEngine 统一接口及 AgentChatResponse 返回值结构。详解四种核心对话模式:① simple (纯聊天无检索);② condense_question (先改写问题再查询);③ context (直接检索再聊天);④ condense_plus_context (改写+检索+回答的组合模式)。重点分析 Memory 机制的 token 限额管理与自动裁剪策略。
定义 Query Engine 为 RAG 编排器,负责串联"Query → Retriever → Nodes → Synthesizer → Response"全流程。详解 RetrieverQueryEngine 的 4 步执行过程(接收问题→调用检索器→调用响应生成器→返回 Response),三种构造方式(index.as_query_engine / 指定参数 / 手动组装),以及四大扩展点(替换 Retriever/Synthesizer/增加 Postprocessor/改写 Query)。强调其作为"RAG 执行中枢"的核心价值。