回滚本地LLM运行分析并对齐远端回滚状态

This commit is contained in:
liuwei
2026-05-06 08:43:18 +08:00
parent 969a731019
commit 8957799b76
4 changed files with 92 additions and 1001 deletions

View File

@@ -524,12 +524,6 @@
- 让 AI 能力更可控、更可衡量
当前进展:
- 第一阶段已完成:后台 `LLM目录配置` 页面已补充“AI运行分析”区块可查看最近窗口内统一 LLM 调用的成功率、平均耗时、失败次数与最近错误
- 第一阶段已完成:已支持按 `scene / backend / provider / model` 四个维度聚合最近窗口调用数据,便于快速识别慢场景、异常后端与高失败模型
- 当前仍以“最近窗口运行分析”为主,暂未引入持久化 token 成本结算;后续可在确认治理需求后继续扩展预算、告警与降级策略
建议内容:
- 统计各插件 token 消耗