Back to Work2025.12 - 至今

ai-agent

风控审核大模型 AI Agent

Risk Control AI Agent Review System

腾讯 · 技术负责人

独立设计 V1→V4 架构演进,准确率从 70% 提升至 90%+,节省 2+ 人力/天

Impact: 准确率 70%→90%+,节省 2+ 人力/天

项目概述

风控审核大模型 AI Agent 是腾讯企业微信的核心智能审核系统,通过 V1→V4 的架构演进,将审核准确率从 70% 提升至 90%+,每日自动结单 300+ 单,节省 2+ 人力/天。

架构演进

V1: 朴素 RAG (2025.12)

Loading diagram...

问题: 召回率低,复杂场景无法处理


V2: CBR 案例推理 (2026.01)

Loading diagram...

改进: 引入历史案例,提升复杂场景处理能力


V3: Prompt Chaining (2026.01)

Loading diagram...

改进: 多阶段推理,提升准确率


V4: Multi-Query + 策略短路 (2026.02)

Loading diagram...

核心创新:

  • 策略短路: 高置信场景直接匹配策略,跳过复杂推理
  • Multi-Query: 并行检索策略和案例,提升召回率 20%

技术亮点

策略短路机制

针对高频场景(如人脸解封),设计规则引擎直接匹配:

场景短路前识别率短路后识别率
人脸解封5-10%94.89%
账号申诉30%85%+

Multi-Query 并行检索

# 伪代码示意
async def multi_query_retrieve(query):
    tasks = [
        retrieve_policies(query),      # 策略检索
        retrieve_cases(query),         # 案例检索
        retrieve_similar_tickets(query) # 相似工单
    ]
    results = await asyncio.gather(*tasks)
    return merge_and_rank(results)

可观测性工具链

  • Langfuse: 全链路追踪,延迟/成本/准确率实时监控
  • RAGAS: 自动化评估框架,持续优化 Prompt
  • Badcase 定位: 失败案例自动归因,指导迭代

关键成果

指标V1V4提升
准确率70%90%++20%
日均自动结单50300+6x
人力节省-2+/天-
并发支持1002000+20x

技术栈

  • 推理框架: Prompt Chaining + CBR
  • 检索系统: Multi-Query RAG
  • 向量数据库: Qdrant
  • 监控: Langfuse + RAGAS
  • 后端: Go + 分布式异步