下放 ai_auto_response 参与判断到 LLM

变更项:
1. 新增 decision 配置并重写 ResponsePlanner,将是否送模型的本地粗筛收缩为轻量入口判断,允许在主动参与开启时更多普通文本进入模型。
2. 将 cooldown 从模型前挡板后移到 LLM 判定 should_reply 之后,改为发送闸门,减少本地提前拦截。
3. 调整上下文与 prompt 控制信息,明确 reply_mode 只是本地 hint,并把 acceptance_state、solver 等信号直接下放给模型统一判断是否参与和如何回复。
This commit is contained in:
liuwei
2026-04-28 17:41:02 +08:00
parent 6359b11951
commit e7d68a89c2
6 changed files with 157 additions and 104 deletions

View File

@@ -55,6 +55,18 @@ long_absent_member_days = 30
memory_lookback_days = 180
active_context_hours = 8
[decision]
# 决策层改成“LLM 优先裁决”:
# 1. 本地尽量只做硬过滤和极轻的入口判断;
# 2. 是否参与聊天、是否回复、最终 reply_mode 尽量交给模型自己输出 should_reply 来决定;
# 3. 这样会增加一定模型调用量,但能明显减少本地规则把语境复杂消息提前拦掉的问题。
model_decides_participation = true
# 当 allow_proactive_reply=true 时,这里允许普通群聊文本也送模型:
# 1. 本地不再要求必须先命中 question/topic/followup 等信号才进模型;
# 2. 最终由模型结合最近消息、群接受度、是否已有真人在答等信号统一判断 should_reply
# 3. 如果后续觉得成本又偏高,可以只把这个开关关掉,而不必回退整套旧规则。
allow_all_text_when_proactive = true
[reply]
# 回复长度改成“下限放开、上限约束”的思路:
# 1. 允许模型只回几个字,避免每句都被逼着凑满;