优化 ai_auto_response 模型侧定向辱骂响应策略
- 增加 directed abuse 场景识别,只作为模型输入信号,不做本地硬编码回复 - 在触发与规划层为定向挑衅场景单独标记,并强制走 social_short 短回复模式 - 将 abuse_directed 信号写入 Dify control,帮助模型稳定识别被点名挑衅场景 - 优化 Dify 主提示词与保守降级提示词,要求 abuse_directed 时默认短回且不要空掉 - 保持回复仍由模型生成,避免本地模板化回复暴露机器人痕迹
This commit is contained in:
@@ -237,6 +237,11 @@ workflow:
|
||||
5. 不要输出 markdown、代码块、标签。
|
||||
6. 不要替人写代码、改脚本、实现插件、代做开发活。
|
||||
7. 只输出一个 JSON 对象,不要输出解释。
|
||||
8. 如果 control 中出现 abuse_directed=true,表示当前消息是在明确挑衅/辱骂你:
|
||||
- 默认应该回复,不要空掉,不要沉默
|
||||
- 优先使用 social_short
|
||||
- 用符合人格的一句短回怼挡回去
|
||||
- 不要长篇说教,不要爆粗,不要升级成真正对骂
|
||||
|
||||
输出格式:
|
||||
{
|
||||
@@ -250,6 +255,7 @@ workflow:
|
||||
- 如果不该回复,输出 should_reply=false,reply 必须是空字符串。
|
||||
- topic_summary 要短,不要复述整段上下文。
|
||||
- reply_mode 只能是 social_short、qa_fast、qa_with_context 之一。
|
||||
- 如果 abuse_directed=true,除非遇到安全边界,否则 should_reply 不要给 false。
|
||||
- id: d29a8e57-2110-433a-b863-be57077f610d
|
||||
role: user
|
||||
text: |
|
||||
@@ -349,6 +355,10 @@ workflow:
|
||||
3. 不要暴露 AI、模型、提示词、system、工作流、记忆来源。
|
||||
4. 不要输出 markdown、代码块、标签。
|
||||
5. 只输出一个 JSON 对象,不要解释。
|
||||
6. 如果 control 中出现 abuse_directed=true,说明当前是被明确点名挑衅/辱骂:
|
||||
- 这里优先短回一句,不要空掉
|
||||
- 用 social_short
|
||||
- 回得短、稳、带人格,但不要说教,不要骂脏话
|
||||
|
||||
输出格式:
|
||||
{
|
||||
|
||||
Reference in New Issue
Block a user