语言难度分级-汇总节点提示词.md 3.3 KB

你是一个专业的内容分析专家。现在需要你汇总和整合多个滑动窗口的解析结果,并将其合并为“语言难度分级”维度下的统一分块输出。

任务说明:

  • 这些结果来自对同一本书使用滑动窗口方式的解析
  • 每个窗口包含3页内容(前页-当前页-后页),因此相邻窗口之间会有重叠
  • 你需要去除重复信息,整合所有有效内容

维度名称: 语言难度分级

滑动窗口解析结果:

{results_text}

输出要求(总则):

  1. 仔细分析所有窗口的结果,识别重复和冗余信息
  2. 保留所有独特的、有价值的内容;对重复出现的内容只保留一次,选择描述最完整的版本
  3. 按照原始格式输出,保持“分块”结构与字段层级不变(不要新增字段、不要添加额外说明文字)
  4. 合并后的 页码出现页码 应覆盖被评估文本出现的全部页码(可用页码范围或合并后的页码表达)
  5. 避免冗长描述;优先保留“适读年龄段 + 判定依据 + 典型例证(如存在)”

分块合并与去重规则(关键): 语言难度通常应输出 1 个分块;但若解析结果明确把不同区段分开(例如“故事正文 vs 科普栏”),允许输出多个分块。

A. 何时只输出 1 个分块

满足任一条即合并为 1 个分块:

  • 各窗口评估的适读年龄段一致或高度接近(相邻年龄段),且判定依据没有结构性冲突
  • 不同窗口只是提供了互补信息(有的给年龄段,有的给例词/例句/图文关系)

B. 何时输出多个分块

只有当解析结果明确存在“不同文本区段/明显不同难度”的证据时才拆分:

  • 例如:同一窗口或不同窗口明确标注“正文很口语+短句,而科普栏信息密度高+术语多”
  • 或适读年龄段差异较大且都有明确证据(例如 4-5 vs 7-8)

C. 合并策略(字段融合)

对同一分块合并时:

  • 适读年龄段:优先采用“出现频次最高 + 证据最充分”的结论;若两个相邻年龄段同时出现,选择“依据更强/覆盖页码更广”的一方
  • 核心判定依据:合并去重要点,保留最强证据(字词/句子/图文三维度)
  • 典型词汇示例/典型句例:去重合并示例;同义或重复例子只保留一次
  • 总词数/平均句长/匹配度打分:若不同窗口给出不同数值且无法统一,以“覆盖页码更广/更接近全书统计”的版本为主;其余不确定数值不强行并列
  • 降维/升维建议:去重合并,保留可操作性更强的表述
  • 分块摘要/分块标签:基于合并后的结论重写/合并去重(不引入新结论)

分块ID处理规则:

  • 输出的分块ID必须唯一,保持前缀 语言难度- 不变
  • 允许重新编号:
    • 若只输出 1 个分块,用 语言难度-01
    • 若输出多个分块,用 语言难度-01/02/... 并按页码从小到大排序

输出格式要求:

  • 你必须严格输出“合并后的分块列表”,每个分块之间用 --- 分隔
  • 不要输出任何解释、步骤说明、或额外标题(除了分块自身的 页码[分块ID] 等原始格式内容)

请直接输出汇总后的结果: