←Back to Work2025.12 - 至今
ai-agent
风控审核大模型 AI Agent
Risk Control AI Agent Review System
腾讯 · 技术负责人
独立设计 V1→V4 架构演进,准确率从 70% 提升至 90%+,节省 2+ 人力/天
Impact: 准确率 70%→90%+,节省 2+ 人力/天
项目概述
风控审核大模型 AI Agent 是腾讯企业微信的核心智能审核系统,通过 V1→V4 的架构演进,将审核准确率从 70% 提升至 90%+,每日自动结单 300+ 单,节省 2+ 人力/天。
架构演进
V1: 朴素 RAG (2025.12)
Loading diagram...
问题: 召回率低,复杂场景无法处理
V2: CBR 案例推理 (2026.01)
Loading diagram...
改进: 引入历史案例,提升复杂场景处理能力
V3: Prompt Chaining (2026.01)
Loading diagram...
改进: 多阶段推理,提升准确率
V4: Multi-Query + 策略短路 (2026.02)
Loading diagram...
核心创新:
- 策略短路: 高置信场景直接匹配策略,跳过复杂推理
- Multi-Query: 并行检索策略和案例,提升召回率 20%
技术亮点
策略短路机制
针对高频场景(如人脸解封),设计规则引擎直接匹配:
| 场景 | 短路前识别率 | 短路后识别率 |
|---|---|---|
| 人脸解封 | 5-10% | 94.89% |
| 账号申诉 | 30% | 85%+ |
Multi-Query 并行检索
# 伪代码示意
async def multi_query_retrieve(query):
tasks = [
retrieve_policies(query), # 策略检索
retrieve_cases(query), # 案例检索
retrieve_similar_tickets(query) # 相似工单
]
results = await asyncio.gather(*tasks)
return merge_and_rank(results)
可观测性工具链
- Langfuse: 全链路追踪,延迟/成本/准确率实时监控
- RAGAS: 自动化评估框架,持续优化 Prompt
- Badcase 定位: 失败案例自动归因,指导迭代
关键成果
| 指标 | V1 | V4 | 提升 |
|---|---|---|---|
| 准确率 | 70% | 90%+ | +20% |
| 日均自动结单 | 50 | 300+ | 6x |
| 人力节省 | - | 2+/天 | - |
| 并发支持 | 100 | 2000+ | 20x |
技术栈
- 推理框架: Prompt Chaining + CBR
- 检索系统: Multi-Query RAG
- 向量数据库: Qdrant
- 监控: Langfuse + RAGAS
- 后端: Go + 分布式异步