下放 ai_auto_response 参与判断到 LLM

变更项： 1. 新增 decision 配置并重写 ResponsePlanner，将是否送模型的本地粗筛收缩为轻量入口判断，允许在主动参与开启时更多普通文本进入模型。 2. 将 cooldown 从模型前挡板后移到 LLM 判定 should_reply 之后，改为发送闸门，减少本地提前拦截。 3. 调整上下文与 prompt 控制信息，明确 reply_mode 只是本地 hint，并把 acceptance_state、solver 等信号直接下放给模型统一判断是否参与和如何回复。
2026-04-28 17:41:02 +08:00
parent 6359b11951
commit e7d68a89c2
6 changed files with 157 additions and 104 deletions
--- a/plugins/ai_auto_response/config.toml
+++ b/plugins/ai_auto_response/config.toml
@@ -55,6 +55,18 @@ long_absent_member_days = 30
 memory_lookback_days = 180
 active_context_hours = 8

+[decision]
+# 决策层改成“LLM 优先裁决”：
+# 1. 本地尽量只做硬过滤和极轻的入口判断；
+# 2. 是否参与聊天、是否回复、最终 reply_mode 尽量交给模型自己输出 should_reply 来决定；
+# 3. 这样会增加一定模型调用量，但能明显减少本地规则把语境复杂消息提前拦掉的问题。
+model_decides_participation = true
+# 当 allow_proactive_reply=true 时，这里允许普通群聊文本也送模型：
+# 1. 本地不再要求必须先命中 question/topic/followup 等信号才进模型；
+# 2. 最终由模型结合最近消息、群接受度、是否已有真人在答等信号统一判断 should_reply；
+# 3. 如果后续觉得成本又偏高，可以只把这个开关关掉，而不必回退整套旧规则。
+allow_all_text_when_proactive = true
+
 [reply]
 # 回复长度改成“下限放开、上限约束”的思路：
 # 1. 允许模型只回几个字，避免每句都被逼着凑满；