但问智能Agentic RAG系统

实战项目

最先进的智能检索系统,搭载代理式检索增强生成(RAG)与REST API

系统概述

但问智能体是集成了AI检索增强生成(RAG)的全功能解决方案,具备生产级特性,包括多模态内容摄取、混合搜索功能、可配置的GraphRAG以及用户/文档管理。

系统同时包含深度研究API,这是一个多步骤推理系统,能从您的知识库和/或互联网获取相关数据,为复杂查询提供更丰富、更具上下文感知的答案。

但问智能体RAG + Agent多模态处理文本/图像/音频知识图谱实体关系提取混合搜索语义+关键词MCP集成模型上下文协议

核心功能

  • 多模态内容摄取与处理
  • 混合搜索技术与相关性排序
  • 自动构建知识图谱
  • Agentic检索增强生成

技术优势

  • MCP集成支持
  • 模块化服务架构
  • 可扩展性与灵活性
  • 易于部署与配置

系统架构

用户界面层Web应用移动应用REST API 集群认证/授权负载均衡核心服务层身份认证用户管理权限控制检索服务混合搜索语义匹配内容摄取文档解析多模态处理图谱构建实体提取关系映射消息队列 & 任务编排存储层Postgres + pgvector向量存储图数据库

但问智能体系统基于模块化、面向服务的架构设计,确保可扩展性和灵活性:

API层

REST API集群处理传入请求,将其路由到适当的服务

核心服务

专用服务用于身份验证、检索、摄取、图构建和应用管理

编排系统

使用消息队列系统管理复杂工作流和长时运行任务

核心功能详解

多模态摄取

支持IMAGE、PDF, Word, Excel, Markdown、HTML、PPT等大部分主流文件格式嵌入。

混合搜索

结合语义搜索和关键词搜索,通过倒数排序融合实现增强相关性,提供更准确的搜索结果。

知识图谱

自动提取实体和关系,构建知识图谱,捕捉信息之间的复杂联系,支持图形化查询和推理。

代理式RAG

强大的深度研究代理与RAG集成,智能调度检索策略,基于知识库提供精准、连贯的信息。

MCP支持

集成Model Context Protocol,增强大型语言模型检索和搜索能力,实现更智能的交互和信息获取。

自托管支持

提供Docker部署方案,便于本地环境搭建完整但问智能体系统,支持直观的配置文件定制。

MCP功能特性

大语言模型 (Claude/GPT)MCP 服务层向量搜索语义相似度匹配Embedding检索图搜索知识图谱遍历关系推理混合检索多源数据融合实时更新企业知识库 / 互联网数据 / 文档库

什么是MCP?

但问智能体系统集成了Model Context Protocol (MCP),这是一个使Claude等大型语言模型具备检索和搜索能力的服务器。通过MCP,模型可以搜索您的知识库,执行向量搜索、图搜索、网络搜索和文档搜索,让信息检索更加高效精准。

可用工具

搜索工具

执行检索操作并返回格式化结果,支持跨向量、图形、网络和文档来源的搜索

RAG工具

执行检索增强生成,检索相关上下文并生成答案,基于知识库提供连贯响应

集成优势

  • 赋予模型实时检索能力
  • 支持多种搜索方式整合
  • 简化与Claude等LLM的集成
  • 本地部署与云端部署双选项
  • API调用简单直观

适用场景

企业知识库

整合企业内部文档、流程和知识,打造智能检索系统,提升信息获取效率

智能客服

构建基于知识库的智能客服系统,提供准确一致的自动化回复和服务支持

研究助手

支持科研人员高效检索和分析大量文献资料,辅助研究过程和决策

内容创作

为内容创作者提供资料检索、事实核查和创意支持,提升创作质量和效率

课程详细内容

课程目标

从0到1完整构建一个能够理解并回答企业内部知识库相关问题的智能问答系统。

核心能力深化

多模态内容摄取

处理PDF、Word、Markdown、HTML等多种格式文档,提取文本与元数据。

高级RAG策略

混合搜索、重排序、基于元数据的过滤、Parent Document Retriever等进阶技巧。

知识图谱入门

了解知识图谱基本概念,探索如何利用LLM辅助构建简单知识图谱,并与RAG结合。

Agentic RAG

引入Agent思想,让Agent自主分析问题、选择检索策略、甚至反思检索结果,提升问答质量。

技术实现细节

文档处理流水线

自研文档分块算法实现高效的文档加载、分割(RecursiveCharacterTextSplitter, Semantic Chunker等)、清洗。

向量数据库选型与优化

深入对比Pinecone, Weaviate, Milvus, ChromaDB, pgvector等,学习索引策略、数据分区、性能调优。

混合检索实现

结合全文检索与Vector DB实现混合查询。

与大模型集成

设计高效的Prompt模板将检索到的上下文注入LLM,生成精准答案。

引用与溯源

实现答案能够追溯到原文出处,增强可信度。

系统架构设计

服务拆分

设计文档处理服务、向量化服务、检索服务、问答API服务。

异步处理

使用消息队列(如RabbitMQ/Kafka/Celery)处理耗时的文档入库任务。

可扩展性

考虑分布式向量检索引擎的部署与扩展。

监控与日志

集成基础的日志收集与监控,追踪系统性能与问题。

实战项目贯穿

需求分析

定义知识库范围、用户场景、性能指标。

技术选型

根据需求选择合适的技术栈。

编码实现

分模块完成数据处理、索引构建、检索逻辑、API接口开发。

前端交互

自研高颜值前端界面进行问答交互。

部署与测试

使用Docker进行容器化部署,进行功能与性能测试。

联系我们

如果您对但问智能体系统有任何疑问或需要定制解决方案,请随时与我们联系