优化斗鱼日报LLM输入提纯并清理think输出\n\n- 为斗鱼日报链路统一接入think和推理内容清洗\n- 将提交给LLM的材料改为更聚焦现场弹幕的提纯结构\n- 提高热点窗口原声样本量，避免窗口样本长期不足\n- 刷新日报缓存版本，确保新提示词和新材料立即生效

2026-04-27 13:20:30 +08:00
parent 0253e705e5
commit a830089b10
3 changed files with 220 additions and 12 deletions
--- a/plugins/douyu/danmu_summary.py
+++ b/plugins/douyu/danmu_summary.py
@@ -759,6 +759,22 @@ class DouyuDanmuSummaryHelper:
            seen.add(content)
            if len(selected) >= limit:
                break
+        # 固定位置采样只能快速抓到“窗口骨架”，但在弹幕量大时通常不足以凑满 limit。
+        # 这里继续顺序补样本，把同一热点窗口里更多真实原声带给 LLM，
+        # 减少模型只看到 4-5 条孤立短句、难以还原现场氛围的问题。
+        if len(selected) < limit:
+            for item in items:
+                content = str(item.get("content") or "").strip()
+                if not content or content in seen:
+                    continue
+                selected.append({
+                    "time": str(item.get("timestamp_text") or ""),
+                    "nickname": str(item.get("nickname") or ""),
+                    "content": content[:80],
+                })
+                seen.add(content)
+                if len(selected) >= limit:
+                    break
        return selected

    @classmethod