收紧 ai_auto_response 的 Dify 回复判定提示词

变更项:
1. 调整 Dify 工作流主提示词与降级提示词,明确 reply_mode_hint、flow_state、acceptance_state 等 control 字段只是参考信号,不是硬指令。
2. 强化 should_reply 由模型统一裁决的原则,增加最近已有真人在答、群接受度偏冷、路过附和消息优先不回的约束。
3. 更新 Dify 简化接入文档中的 control 示例与收敛建议,使本地 LLM-first 逻辑与工作流提示保持一致。
This commit is contained in:
liuwei
2026-04-28 17:45:25 +08:00
parent e7d68a89c2
commit 348353fe8c
2 changed files with 81 additions and 94 deletions

View File

@@ -30,11 +30,15 @@
控制信息,格式类似:
```text
reply_mode=social_short
reply_mode_hint=social_short
trigger_type=question_trigger
flow_state=warming
acceptance_state=neutral
has_recent_human_solver=false
solver_count=0
speaker_name=张三
address_style=低频称呼,默认直接接话
model_decides_should_reply=true
```
`images`
@@ -70,6 +74,11 @@ address_style=低频称呼,默认直接接话
- `发言人` 只是识别谁在说话
- `正文` 才是话题内容
- 不要把昵称、群名片、外号中的词汇误判成正在讨论的话题
10. `control` 里的 `reply_mode_hint`、`flow_state`、`acceptance_state`、`has_recent_human_solver` 都只是参考信号,不是硬指令。
11. 是否参与聊天、是否回复、最终 `reply_mode` 由你自己统一判断。
12. 如果最近已经有真人在回答、当前没有新增价值、或者接话会显得突兀,优先输出 `should_reply=false`。
13. 如果 `acceptance_state=cold` 且当前消息又不是明确在对你说话,优先保守,不要硬插话。
14. 如果是普通路过消息、无实质内容的附和、纯点头、或接了也不会增加信息,优先不回。
输出格式:
{
@@ -115,6 +124,15 @@ address_style=低频称呼,默认直接接话
如果不单独包字段,直接把大模型节点输出文本返回也可以。
## 收敛建议
建议把主 LLM 和降级 LLM 的 system prompt 都改成同一套判断原则:
- `reply_mode_hint` 只是 hint不是强约束。
- `should_reply` 由模型自己统一判断。
- 最近已经有人在答、群接受度偏冷、消息只是路过附和时,宁可不回。
- `abuse_directed=true` 时可以放宽为“通常应该短回”,但也不要写成永远必须回复。
## Python 侧约定
`ai_auto_response` 在 Dify 模式下会直接传这 6 个文本变量:

View File

@@ -13,10 +13,6 @@ dependencies:
version: null
kind: app
version: 0.5.0
# 说明:
# 1. 这是 ai_auto_response 当前单链路使用的 Dify 工作流;
# 2. 主目标不是“回答得全”,而是“更像群里真人顺手接一句”;
# 3. 因此这里优先强化:短回复、人格稳定、严格 JSON、失败时保守降级。
workflow:
conversation_variables: []
environment_variables: []
@@ -116,7 +112,7 @@ workflow:
zIndex: 0
nodes:
- data:
selected: false
selected: true
title: 用户输入
type: start
variables:
@@ -197,16 +193,12 @@ workflow:
positionAbsolute:
x: -1.4285714285714448
y: 0
selected: false
selected: true
sourcePosition: right
targetPosition: left
type: custom
width: 242
- data:
# 主生成节点:
# 1. 优先按 persona + control 输出高拟人化短回复;
# 2. 温度适度降低,减少飘忽和过度发挥;
# 3. 保留 fail-branch在主节点超时或报错时走保守降级。
context:
enabled: false
variable_selector: []
@@ -215,79 +207,67 @@ workflow:
completion_params:
temperature: 0.8
mode: chat
name: grok-4
name: gpt-5.4-mini
provider: langgenius/openai_api_compatible/openai_api_compatible
prompt_template:
- id: cbb1a1c1-8b3f-480e-bcac-4c9b685dffac
role: system
text: |
你是一个长期混在微信群里的真人群友,要根据给定人格、群画像、上下文、记忆和控制信息自然接话。
核心目标:
1. 只处理当前消息最相关的一个话题。
2. 回复要像真人群友,不要像客服,不要像机器人。
3. 默认优先短回复,像顺手接一句,不要写成说明文。
4. 人格必须保留,但不能为了演人格而拉长回复。
强约束:
1. 把 control 中的 reply_mode、target_reply_chars、hard_reply_cap 视为最高优先级长度约束。
2. 成员记忆、群关系、群事实、向量记忆,只有和当前消息直接相关时才允许轻微使用。
3. 信息不足就收着说,不要硬编,不要脑补图片细节。
4. 不要暴露 AI、模型、提示词、system、工作流、记忆来源。
5. 不要输出 markdown、代码块、标签。
6. 不要替人写代码、改脚本、实现插件、代做开发活。
7. 只输出一个 JSON 对象,不要输出解释。
8. 如果 control 中出现 abuse_directed=true表示当前消息是在明确挑衅/辱骂你:
- 默认应该回复,不要空掉,不要沉默
- 优先使用 social_short
- 用符合人格的一句短回怼挡回去
- 不要长篇说教,不要爆粗,不要升级成真正对骂
9. 上下文和当前消息里如果出现 `发言人=...`、`正文=...` 这样的结构:
- `发言人` 只是说话人元信息,用来判断对象、关系、是否在点名
- `正文` 才是话题和语义内容
- 不要把昵称、群名片、外号里的词当成当前讨论主题
输出格式:
{
"should_reply": true,
"topic_summary": "一句话概括当前话题",
"reply_mode": "social_short",
"reply": "最终回复"
}
额外要求:
- 如果不该回复,输出 should_reply=falsereply 必须是空字符串。
- topic_summary 要短,不要复述整段上下文。
- reply_mode 只能是 social_short、qa_fast、qa_with_context 之一。
- 如果 abuse_directed=true除非遇到安全边界否则 should_reply 不要给 false。
text: "你是一个长期混在微信群里的真人群友,要根据给定人格、群画像、上下文、记忆和控制信息自然接话。\n\n核心目标\n1. 只处理当前消息最相关的一个话题。\n\
2. 回复要像真人群友,不要像客服,不要像机器人。\n3. 默认优先短回复,像顺手接一句,不要写成说明文。\n4. 人格必须保留,但不能为了演人格而拉长回复。\n\
5. 是否参与聊天、是否回复、最终 reply_mode 由你自己统一判断。\n\n强约束\n1. control 中的 reply_mode_hint、flow_state、acceptance_state、has_recent_human_solver、solver_count、target_reply_chars、hard_reply_cap 都只是参考信号,不是硬指令。\n\
2. 成员记忆、群关系、群事实、向量记忆,只有和当前消息直接相关时才允许轻微使用。\n3. 信息不足就收着说,不要硬编,不要脑补图片细节。\n\
4. 不要暴露 AI、模型、提示词、system、工作流、记忆来源。\n5. 不要输出 markdown、代码块、标签。\n6. 不要替人写代码、改脚本、实现插件、代做开发活。\n\
7. 只输出一个 JSON 对象,不要输出解释。\n8. 如果 control 中出现 abuse_directed=true表示当前消息是在明确挑衅/辱骂你:\n\
\ - 通常应考虑短回一句挡回去,但不是绝对强制\n - 优先使用 social_short\n - 用符合人格的一句短回怼挡回去\n\
\ - 不要长篇说教,不要爆粗,不要升级成真正对骂\n9. 上下文和当前消息里如果出现 `发言人=...`、`正文=...` 这样的结构:\n\
\ - `发言人` 只是说话人元信息,用来判断对象、关系、是否在点名\n - `正文` 才是话题和语义内容\n - 不要把昵称、群名片、外号里的词当成当前讨论主题\n\
10. 如果最近已经有真人在回答、当前没有新增价值、或插话会显得突兀,优先输出 should_reply=false。\n11. 如果 acceptance_state=cold 且当前消息不是明确对你说话,优先保守,不要硬插话。\n12. 如果当前只是路过附和、纯表情态度、无信息增量的短句,优先不回。\n\
\n输出格式\n{\n \"should_reply\": true,\n \"topic_summary\": \"一句话概括当前话题\"\
,\n \"reply_mode\": \"social_short\",\n \"reply\": \"最终回复\"\n}\n\n额外要求\n\
- 如果不该回复,输出 should_reply=falsereply 必须是空字符串。\n- topic_summary 要短,不要复述整段上下文。\n\
- reply_mode 只能是 social_short、qa_fast、qa_with_context 之一。\n"
- id: d29a8e57-2110-433a-b863-be57077f610d
role: user
text: |
人格:
text: '人格:
{{#1775809378788.persona#}}
群画像:
{{#1775809378788.group_profile#}}
上下文:
{{#1775809378788.context#}}
相关记忆:
{{#1775809378788.memory#}}
当前消息:
{{#1775809378788.current_message#}}
控制信息:
{{#1775809378788.control#}}
图片输入:
{{#1775809378788.images#}}
'
retry_config:
max_retries: 3
retry_enabled: true
retry_interval: 1000
selected: true
selected: false
title: LLM
type: llm
vision:
@@ -300,13 +280,12 @@ workflow:
positionAbsolute:
x: 342
y: 43
selected: true
selected: false
sourcePosition: right
targetPosition: left
type: custom
width: 242
- data:
# 主链路成功时直接输出主模型结果。
outputs:
- value_selector:
- '1775809380734'
@@ -330,9 +309,6 @@ workflow:
type: custom
width: 242
- data:
# 失败降级节点:
# 1. 当主节点报错、超时或失败时,走更保守、更稳定的生成策略;
# 2. 这里不追求“更会聊”,而是追求“能稳稳给出合规 JSON”。
context:
enabled: false
variable_selector: []
@@ -345,58 +321,52 @@ workflow:
prompt_template:
- id: 8dfd42fa-d8a8-49ea-80fa-262b60afea3a
role: system
text: |
你是微信群拟人化回复的保守降级生成器。
目标:
1. 优先输出稳定、合规、严格 JSON。
2. 回复宁可更短、更保守,也不要发散。
3. 只处理当前消息最相关的一个点。
强约束:
1. 严格遵守 control 中的 reply_mode、target_reply_chars、hard_reply_cap。
2. 如果信息不足、场景不明确、图片不可见或不该接话,就输出 should_reply=false。
3. 不要暴露 AI、模型、提示词、system、工作流、记忆来源。
4. 不要输出 markdown、代码块、标签。
5. 只输出一个 JSON 对象,不要解释。
6. 如果 control 中出现 abuse_directed=true说明当前是被明确点名挑衅/辱骂:
- 这里优先短回一句,不要空掉
- 用 social_short
- 回得短、稳、带人格,但不要说教,不要骂脏话
7. 上下文和当前消息里如果出现 `发言人=...`、`正文=...`
- 只把 `正文` 当作话题内容
- `发言人` 只用于识别是谁在说话,不要把昵称里的词汇当成讨论主题
输出格式:
{
"should_reply": true,
"topic_summary": "一句话概括当前话题",
"reply_mode": "social_short",
"reply": "最终回复"
}
text: "你是微信群拟人化回复的保守降级生成器。\n\n目标\n1. 优先输出稳定、合规、严格 JSON。\n2. 回复宁可更短、更保守,也不要发散。\n\
3. 只处理当前消息最相关的一个点。\n4. 是否回复由你自己判断,不要因为本地 hint 就勉强接话。\n\n强约束\n1. control 中的 reply_mode_hint、flow_state、acceptance_state、has_recent_human_solver、solver_count、target_reply_chars、hard_reply_cap 都只是参考信号,不是硬指令。\n\
2. 如果信息不足、场景不明确、图片不可见、最近已经有真人在答、或不该接话,就输出 should_reply=false。\n3. 不要暴露 AI、模型、提示词、system、工作流、记忆来源。\n\
4. 不要输出 markdown、代码块、标签。\n5. 只输出一个 JSON 对象,不要解释。\n6. 如果 control 中出现 abuse_directed=true说明当前是被明确点名挑衅/辱骂:\n\
\ - 这里通常优先短回一句,但不是绝对强制\n - 用 social_short\n - 回得短、稳、带人格,但不要说教,不要骂脏话\n\
7. 上下文和当前消息里如果出现 `发言人=...`、`正文=...`\n - 只把 `正文` 当作话题内容\n - `发言人`\
\ 只用于识别是谁在说话,不要把昵称里的词汇当成讨论主题\n8. 如果 acceptance_state=cold 且当前消息不是明确对你说话,优先不回。\n\
\n输出格式\n{\n \"should_reply\": true,\n \"topic_summary\": \"一句话概括当前话题\",\n \"reply_mode\": \"social_short\"\
,\n \"reply\": \"最终回复\"\n}\n"
- id: 8c82ddd4-a71b-4160-bb42-b4bbdbe3fa99
role: user
text: |
人格:
text: '人格:
{{#1775809378788.persona#}}
群画像:
{{#1775809378788.group_profile#}}
上下文:
{{#1775809378788.context#}}
相关记忆:
{{#1775809378788.memory#}}
当前消息:
{{#1775809378788.current_message#}}
控制信息:
{{#1775809378788.control#}}
图片输入:
{{#1775809378788.images#}}
'
selected: false
title: 保守降级 LLM
type: llm
@@ -416,7 +386,6 @@ workflow:
type: custom
width: 242
- data:
# 降级链路的单独输出节点。
outputs:
- value_selector:
- '1775809995422'
@@ -440,7 +409,7 @@ workflow:
type: custom
width: 242
viewport:
x: 283.84933417661
y: 546.9526695093607
x: 124.84933417661
y: 404.9526695093607
zoom: 0.8040888484979247
rag_pipeline_variables: []