优化斗鱼日报LLM输入提纯并清理think输出\n\n- 为斗鱼日报链路统一接入think和推理内容清洗\n- 将提交给LLM的材料改为更聚焦现场弹幕的提纯结构\n- 提高热点窗口原声样本量,避免窗口样本长期不足\n- 刷新日报缓存版本,确保新提示词和新材料立即生效
This commit is contained in:
@@ -759,6 +759,22 @@ class DouyuDanmuSummaryHelper:
|
||||
seen.add(content)
|
||||
if len(selected) >= limit:
|
||||
break
|
||||
# 固定位置采样只能快速抓到“窗口骨架”,但在弹幕量大时通常不足以凑满 limit。
|
||||
# 这里继续顺序补样本,把同一热点窗口里更多真实原声带给 LLM,
|
||||
# 减少模型只看到 4-5 条孤立短句、难以还原现场氛围的问题。
|
||||
if len(selected) < limit:
|
||||
for item in items:
|
||||
content = str(item.get("content") or "").strip()
|
||||
if not content or content in seen:
|
||||
continue
|
||||
selected.append({
|
||||
"time": str(item.get("timestamp_text") or ""),
|
||||
"nickname": str(item.get("nickname") or ""),
|
||||
"content": content[:80],
|
||||
})
|
||||
seen.add(content)
|
||||
if len(selected) >= limit:
|
||||
break
|
||||
return selected
|
||||
|
||||
@classmethod
|
||||
|
||||
Reference in New Issue
Block a user