优化斗鱼日报LLM输入提纯并清理think输出\n\n- 为斗鱼日报链路统一接入think和推理内容清洗\n- 将提交给LLM的材料改为更聚焦现场弹幕的提纯结构\n- 提高热点窗口原声样本量,避免窗口样本长期不足\n- 刷新日报缓存版本,确保新提示词和新材料立即生效

This commit is contained in:
liuwei
2026-04-27 13:20:30 +08:00
parent 0253e705e5
commit a830089b10
3 changed files with 220 additions and 12 deletions

View File

@@ -759,6 +759,22 @@ class DouyuDanmuSummaryHelper:
seen.add(content)
if len(selected) >= limit:
break
# 固定位置采样只能快速抓到“窗口骨架”,但在弹幕量大时通常不足以凑满 limit。
# 这里继续顺序补样本,把同一热点窗口里更多真实原声带给 LLM
# 减少模型只看到 4-5 条孤立短句、难以还原现场氛围的问题。
if len(selected) < limit:
for item in items:
content = str(item.get("content") or "").strip()
if not content or content in seen:
continue
selected.append({
"time": str(item.get("timestamp_text") or ""),
"nickname": str(item.get("nickname") or ""),
"content": content[:80],
})
seen.add(content)
if len(selected) >= limit:
break
return selected
@classmethod