你是一个专业的内容分析专家。现在需要你汇总和整合多个滑动窗口的解析结果,并将其合并为“图书基础信息”维度下的统一分块输出。
任务说明:
- 这些结果来自对同一本书使用滑动窗口方式的解析
- 每个窗口包含3页内容(前页-当前页-后页),因此相邻窗口之间会有重叠
- 你需要去除重复信息,整合所有有效内容
维度名称: 图书基础信息
滑动窗口解析结果:
{results_text}
输出要求(总则):
- 仔细分析所有窗口的结果,识别重复和冗余信息
- 保留所有独特的、有价值的内容;对重复出现的内容只保留一次,选择描述最完整的版本
- 按照原始格式输出,保持“分块”结构与字段层级不变(不要新增字段、不要添加额外说明文字)
- 合并后的
页码 与 出现页码 应覆盖该信息出现的全部页码(可用页码范围或合并后的页码表达)
- 避免冗长描述;优先保留“可核对的原文信息”(ISBN、出版社、年份、页数、开本等)
分块合并与去重规则(关键):
你必须先对分块按“拆解项”归类,再在类内合并去重。常见拆解项包括:
书号、适读年龄、作品综述(书籍简介)、出版机构、出版时间、版权归属、创作团队、装帧类型、页数、字数、开本。
A. 同一拆解项判定(需要合并)
满足任一条即合并:
- 分块内容中的
{匹配到的拆解项名称} 相同
- 内容明显描述同一信息点(例如“ISBN/书号”表述差异但实为同一字段)
B. 合并策略
- 内容:
- 若同一拆解项在不同窗口重复出现:只保留一次,选择信息更完整的一版(例如包含更多数字/限定词)
- 若同一拆解项在不同窗口提供互补信息:合并为一条更完整的“内容”(不得丢失关键字段)
- 对列表型信息(创作团队多人、多个合作机构)去重合并:同名同机构只保留一次
- 分析:
- 保留最完整的一版;若有互补信息可合并为一段(仍在原字段位置)
- 分块摘要:基于合并后的内容重写一句话概括(不引入新事实)
- 分块标签:保持原标签结构,合并去重关键词
C. 冲突处理
若出现冲突(如出版时间不同、页数不同):
- 优先保留“更像版权页/扉页信息、并且更具体”的版本
- 若无法判断哪一个正确,则并列保留两条差异(不要加你自己的判断)
分块ID处理规则:
- 输出的分块ID必须唯一,保持前缀
基础信息- 不变
- 允许重新编号(如
基础信息-01、基础信息-02…),建议按“书号/适读年龄/简介/机构/时间/版权/团队/装帧/页数/字数/开本”的常规顺序排序编号
输出格式要求:
- 你必须严格输出“合并后的分块列表”,每个分块之间用
--- 分隔
- 不要输出任何解释、步骤说明、或额外标题(除了分块自身的
页码、[分块ID] 等原始格式内容)
请直接输出汇总后的结果: