# Design: 智能外呼自动触发与状态监控 ## Context 当前"云小调"系统已实现首页案件数据加载和右下角智能外呼气泡组件,但外呼流程需要手动触发,缺少自动化能力。根据产品需求,调解流程应在案件数据加载完成后自动启动 AI 智能外呼,提升调解效率。 **核心挑战**: 1. 何时触发外呼?如何避免重复触发? 2. 如何处理多人外呼场景(申请人、被申请人)? 3. 如何管理 jobId 状态和生命周期? 4. 如何设计轮询策略平衡实时性与服务器压力? 5. 如何处理页面刷新、组件卸载等边界场景? **技术栈约束**: - React + Ant Design 4.24.12 - Context API 管理全局状态 - localStorage 持久化存储 - 前端 Mock 数据(当前阶段) ## Goals / Non-Goals ### Goals 1. **自动触发**:案件数据加载完成后自动发起外呼,无需手动操作 2. **状态监控**:实时展示外呼状态(拨号中、通话中、已完成等) 3. **多任务支持**:同时展示多人通话状态 4. **幂等性保证**:页面刷新时不重复发起外呼,继续监听现有任务 5. **自动清理**:通话结束后自动移除气泡和存储数据 6. **错误容错**:API 失败时提供友好提示,不阻塞主流程 7. **失败任务可视化**:失败任务在气泡中清晰展示,带红色状态指示灯 8. **重复防护**:相同联系人失败任务自动去重,避免信息冗余 9. **自动过期清理**:失败任务超过24小时自动清除 ### Non-Goals - 不涉及后端外呼接口实现 - 不涉及通话录音播放功能 - 不涉及外呼任务的手动取消或重试操作 - 不涉及复杂的权限控制(当前仅前端功能) - 不涉及失败任务的自动重试机制 ## Decisions ### Decision 1: 触发时机选择 - 在 `loadCaseData` 后触发 **方案对比**: | 方案 | 优点 | 缺点 | 决策 | |------|------|------|------| | A. 在 `CaseDataContext` 中触发 | 集中管理数据流,逻辑清晰 | 增加 Context 耦合度 | ✅ 采用 | | B. 在 `OutboundCallWidget` 组件内触发 | 解耦数据和外呼逻辑 | 依赖组件挂载时机,可能触发延迟 | ❌ 不采用 | | C. 在 App.js 路由层触发 | 全局控制 | 难以获取案件数据,需要额外传递 | ❌ 不采用 | **选择 A 的理由**: - `loadCaseData` 是唯一的数据入口,在此处触发可确保数据就绪 - 避免组件挂载时机不确定导致的触发延迟 - 便于实现幂等性检查(基于 localStorage 判断是否已有活跃任务) ### Decision 2: jobId 状态管理 - localStorage + 活跃状态过滤 **数据结构设计**: **成功任务存储**: ```javascript // localStorage key: 'outbound_call_jobs' [ { jobId: "1770602736933-4794-83bb-e2cec968ebfc", callStatus: "Scheduling", // 或 Executing, Paused, Drafted, Succeeded, Failed, Cancelled personId: "2303191513081131", mediationId: 20, caseId: "CASE_001", // 用于轮询查询的 caseRef 参数 perClassName: "申请人", // 人员类型名称 trueName: "张三", // 真实姓名 startTime: 1738228800000, // 触发时间戳 retryCount: 0, // 重试次数 pollStartTime: 1738228800000 // 轮询开始时间(用于2小时超时检测) } ] ``` **失败任务存储**: ```javascript // localStorage key: 'outbound_call_jobs_failed' [ { personId: "2303191513081131", message: "今日呼叫次数已达上限(3次)", perClassName: "申请人", // 人员类型名称 trueName: "张三", // 真实姓名 errorCode: 1001, // 错误码 startTime: 1738228800000 // 失败时间戳(用于24小时过期清理) } ] ``` **状态分类**: - **活跃状态**(需轮询):`Scheduling`, `Executing`, `Paused`, `Drafted` - **终态**(需清除):`Succeeded`, `Failed`, `Cancelled` **方案对比**: | 方案 | 优点 | 缺点 | 决策 | |------|------|------|------| | A. localStorage 持久化 | 页面刷新后状态不丢失,支持断点续传 | 需要手动清理终态数据 | ✅ 采用 | | B. Context 内存存储 | 简单,自动清理 | 页面刷新后丢失,无法继续监听 | ❌ 不采用 | | C. IndexedDB 存储 | 支持复杂查询 | 过度设计,增加复杂度 | ❌ 不采用 | **选择 A 的理由**: - 用户刷新页面后可继续监听外呼状态,提升体验 - 终态清理逻辑简单,可在轮询中实现 ### Decision 3: 轮询策略 - 10秒间隔 + 2小时超时 + 10次重试 **参数配置**: ```javascript const POLL_INTERVAL = 10000; // 10秒 const MAX_POLL_DURATION = 7200000; // 2小时(毫秒) const MAX_RETRY_COUNT = 10; // 最大重试次数 ``` **方案对比**: | 方案 | 轮询间隔 | 服务器压力 | 实时性 | 决策 | |------|----------|-----------|--------|------| | A. 5秒间隔 | 5s | 较高 | 高 | ❌ 压力过大 | | B. 10秒间隔 | 10s | 中等 | 较高 | ✅ 采用 | | C. 30秒间隔 | 30s | 低 | 低 | ❌ 延迟过高 | **选择 B 的理由**: - 10秒间隔在实时性和服务器压力之间取得平衡 - 对于电话外呼场景,10秒延迟可接受(通话时长通常数分钟) **超时设计**: - 2小时后自动停止轮询,避免无限轮询 - 超时后从 localStorage 移除 jobId,防止脏数据累积 **重试机制**: - 单次查询失败累加 `retryCount`,不立即清除 jobId - 连续失败 10 次后展示错误提示并清除该 jobId - 避免因偶发网络抖动导致任务丢失 ### Decision 4: 多任务展示 - 纵向堆叠气泡 **UI 设计**: ``` ┌─────────────────────────┐ │ 智能体工作中 │ │ 正在与申请人(张三)通话... │ │ 已持续: 02:35 │ └─────────────────────────┘ ┌─────────────────────────┐ │ 智能体工作中 │ │ 正在与被申请人(李四)通话...│ │ 已持续: 01:20 │ └─────────────────────────┘ ``` **方案对比**: | 方案 | 优点 | 缺点 | 决策 | |------|------|------|------| | A. 纵向堆叠多个气泡 | 清晰展示每个任务,易扩展 | 占用屏幕空间 | ✅ 采用 | | B. 单个气泡轮播展示 | 节省空间 | 用户难以同时了解所有任务 | ❌ 不采用 | | C. 折叠列表 | 灵活 | 增加交互复杂度 | ❌ 不采用 | **选择 A 的理由**: - 外呼任务数量有限(通常 1-2 个),堆叠不会占用过多空间 - 直观展示每个任务状态,符合用户心智模型 ### Decision 5: 幂等性设计 - 基于活跃 jobId 判断 **触发条件**: ```javascript // 伪代码 const activeJobs = getActiveJobsFromStorage(); // 从 localStorage 获取活跃任务 if (activeJobs.length > 0) { console.log('已有活跃外呼任务,跳过发起新外呼'); return; } // 否则,发起新外呼 await OutboundBotAPIService.makeCallV2(...); ``` **边界场景处理**: 1. **首次进入页面**:无活跃 jobId,发起新外呼 2. **刷新页面**:检测到活跃 jobId,继续监听,不发起新外呼 3. **通话结束后再次刷新**:jobId 已清除,可发起新外呼 4. **多标签页同时打开**:共享 localStorage,避免重复触发 ## Risks / Trade-offs ### Risk 1: 轮询频率与服务器压力 **风险描述**:多个用户同时轮询可能增加服务器负载。 **缓解措施**: - 采用 10 秒轮询间隔(非 5 秒或更短) - 设置 2 小时最大轮询时长,避免无限轮询 - 终态任务立即停止轮询,减少无效请求 **Trade-off**:牺牲部分实时性(10秒延迟)换取服务器稳定性。 ### Risk 2: localStorage 容量限制 **风险描述**:jobId 数据累积可能超出 localStorage 容量(5MB)。 **缓解措施**: - 终态任务立即清除 - 定期清理超过 24 小时的历史数据(后续扩展) - 单个 jobId 对象约 200 字节,可存储数千条记录 **Trade-off**:当前风险较低,暂不引入复杂的存储淘汰策略。 ### Risk 3: 页面刷新时的竞态条件 **风险描述**:用户快速刷新页面可能触发多次 `makeCallV2` 调用。 **缓解措施**: - 在 `CaseDataContext` 中使用 `hasLoaded` 标志防止重复加载 - `makeCallV2` 调用前检查活跃 jobId,确保幂等性 - 后端接口应支持幂等性设计(基于 caseId + mediationId 去重) **Trade-off**:前后端协同保障,前端尽最大努力避免重复调用。 ### Risk 4: 组件卸载时的内存泄漏 **风险描述**:定时器未清理可能导致内存泄漏或组件卸载后仍执行回调。 **缓解措施**: - 在 `useEffect` 返回清理函数:`return () => clearInterval(intervalId)` - 使用 `useRef` 保存 `isMounted` 状态,回调中检查组件是否已卸载 - 考虑使用 `AbortController` 取消未完成的 API 请求 **Trade-off**:增加代码复杂度,但避免生产环境内存泄漏和控制台报错。 ## Migration Plan ### Phase 1: 实现基础功能(当前提案) 1. 在 `CaseDataContext` 中添加外呼触发逻辑 2. 改造 `OutboundCallWidget` 轮询逻辑 3. 实现 localStorage 状态管理 4. 完成错误处理和重试机制 ### Phase 2: 用户体验优化(当前完成) 1. 失败任务独立存储和展示 2. 失败任务去重机制(按 personId 去重) 3. 失败任务自动清理(24小时过期) 4. 视觉优化:成功任务绿色指示灯,失败任务红色指示灯 5. 重复气泡防护,避免信息冗余 ### Phase 3: 优化与扩展(后续迭代) 1. 支持手动取消外呼任务 2. 外呼结果通知(成功/失败弹窗) 3. 外呼历史记录查询 4. 集成通话录音播放功能 ### Rollback Plan 如发现严重问题,可通过以下步骤回滚: 1. 注释 `CaseDataContext` 中外呼触发代码 2. 恢复 `OutboundCallWidget` 原有轮询逻辑 3. 清除 localStorage 中 `outbound_call_jobs` 数据 ## Open Questions 1. **多标签页同步问题**:如何在多个标签页之间同步 jobId 状态? - **初步方案**:使用 `window.addEventListener('storage', ...)` 监听 localStorage 变化 2. **外呼失败后是否自动重试**:当前设计为不自动重试,是否需要调整? - **决策点**:需产品确认,当前保持简单设计 3. **通话时长计算逻辑**:API 返回的 `startTime` 字段格式是否统一? - **待确认**:API 文档中未明确说明,需要与后端对齐 4. **外呼任务优先级**:如果同时有多个案件,如何决定外呼顺序? - **当前方案**:按 API 响应顺序依次展示,不涉及优先级排序