Преглед изворни кода

feat(docs): 大幅重构维度分析文档并新增汇总提示词文件

分析结果显示本次提交为非常复杂的功能开发(FEATURE_DEVELOPMENT),主要包含两方面重大变更:

1. 对8个维度分析文档(如创作背景.md、叙事流维度.md等)进行深度重构:
   - 统一规范输出格式
   - 新增滑动窗口扫描说明
   - 优化动态判定逻辑部分
   - 平均每个文件修改14.6行

2. 新增8个汇总节点提示词文件(如创作背景-汇总节点提示词.md):
   - 为各维度创建专门汇总文件
   - 包含57-67行详细提示词模板
   - 完善文档体系架构

同时添加.gitignore文件规范Python项目配置。本次变更共影响17个文档文件和1个配置文件,总计737行代码变更,是核心功能的重要演进。
yingge пре 3 месеци
родитељ
комит
a9ae8832fc

+ 165 - 0
.gitignore

@@ -0,0 +1,165 @@
+### Python template
+# Byte-compiled / optimized / DLL files
+__pycache__/
+*.py[cod]
+*$py.class
+
+# C extensions
+*.so
+
+# Distribution / packaging
+.Python
+build/
+develop-eggs/
+dist/
+downloads/
+eggs/
+.eggs/
+lib/
+lib64/
+parts/
+sdist/
+var/
+wheels/
+share/python-wheels/
+*.egg-info/
+.installed.cfg
+*.egg
+MANIFEST
+
+# PyInstaller
+#  Usually these files are written by a python script from a template
+#  before PyInstaller builds the exe, so as to inject date/other infos into it.
+*.manifest
+*.spec
+
+# Installer logs
+pip-log.txt
+pip-delete-this-directory.txt
+
+# Unit test / coverage reports
+htmlcov/
+.tox/
+.nox/
+.coverage
+.coverage.*
+.cache
+nosetests.xml
+coverage.xml
+*.cover
+*.py,cover
+.hypothesis/
+.pytest_cache/
+cover/
+
+# Translations
+*.mo
+*.pot
+
+# Django stuff:
+*.log
+local_settings.py
+db.sqlite3
+db.sqlite3-journal
+
+# Flask stuff:
+instance/
+.webassets-cache
+
+# Scrapy stuff:
+.scrapy
+
+# Sphinx documentation
+docs/_build/
+
+# PyBuilder
+.pybuilder/
+target/
+
+# Jupyter Notebook
+.ipynb_checkpoints
+
+# IPython
+profile_default/
+ipython_config.py
+
+# pyenv
+#   For a library or package, you might want to ignore these files since the code is
+#   intended to run in multiple environments; otherwise, check them in:
+# .python-version
+
+# pipenv
+#   According to pypa/pipenv#598, it is recommended to include Pipfile.lock in version control.
+#   However, in case of collaboration, if having platform-specific dependencies or dependencies
+#   having no cross-platform support, pipenv may install dependencies that don't work, or not
+#   install all needed dependencies.
+#Pipfile.lock
+
+# poetry
+#   Similar to Pipfile.lock, it is generally recommended to include poetry.lock in version control.
+#   This is especially recommended for binary packages to ensure reproducibility, and is more
+#   commonly ignored for libraries.
+#   https://python-poetry.org/docs/basic-usage/#commit-your-poetrylock-file-to-version-control
+#poetry.lock
+
+# pdm
+#   Similar to Pipfile.lock, it is generally recommended to include pdm.lock in version control.
+#pdm.lock
+#   pdm stores project-wide configurations in .pdm.toml, but it is recommended to not include it
+#   in version control.
+#   https://pdm.fming.dev/latest/usage/project/#working-with-version-control
+.pdm.toml
+.pdm-python
+.pdm-build/
+
+# PEP 582; used by e.g. github.com/David-OConnor/pyflow and github.com/pdm-project/pdm
+__pypackages__/
+
+# Celery stuff
+celerybeat-schedule
+celerybeat.pid
+
+# SageMath parsed files
+*.sage.py
+
+# Environments
+.env
+.venv
+env/
+venv/
+ENV/
+env.bak/
+venv.bak/
+
+# Spyder project settings
+.spyderproject
+.spyproject
+
+# Rope project settings
+.ropeproject
+
+# mkdocs documentation
+/site
+
+# mypy
+.mypy_cache/
+.dmypy.json
+dmypy.json
+
+# Pyre type checker
+.pyre/
+
+# pytype static type analyzer
+.pytype/
+
+# Cython debug symbols
+cython_debug/
+
+# PyCharm
+#  JetBrains specific template is maintained in a separate JetBrains.gitignore that can
+#  be found at https://github.com/github/gitignore/blob/main/Global/JetBrains.gitignore
+#  and can be added to the global gitignore or merged into this file.  For a more nuclear
+#  option (not recommended) you can uncomment the following to ignore the entire idea folder.
+#.idea/
+.idea/
+

+ 28 - 59
dimension/创作背景.md

@@ -10,62 +10,32 @@
 {content}
 
 ## 输出格式要求
-请按照以下 **Markdown** 结构输出你的分析结果
-分块分隔:每个独立分块使用 ---(水平分割线)进行视觉分隔。
-标题层级:
-- ### 标记页码/逻辑大块
-- #### 标记分块 ID
-
-### 页码:{page_number}
-#### 分块ID:创作背景-01
-- **分块信息**:
-  - **分块ID**:创作背景-01
-  - **分块类型**:作者绘者背景
-  - **分块标题**:作者/绘者背景
-  - **分块摘要**:一句话概括作者与绘者背景
-  - **分块标签**:["创作背景", "作者绘者背景"]
-- **作者绘者背景**:
-  - **内容**:描述图片中关于“作者/绘者背景”的内容
-  - **分析**:解释它是如何符合以下标准的:...
-
----
-### 页码:{page_number}
-#### 分块ID:创作背景-02
-- **分块信息**:
-  - **分块ID**:创作背景-02
-  - **分块类型**:获奖信息
-  - **分块标题**:获奖信息
-  - **分块摘要**:一句话概括获奖信息
-  - **分块标签**:["创作背景", "获奖信息"]
-- **获奖信息**:
-  - **内容**:描述图片中关于“获奖信息”的内容
-  - **分析**:解释它是如何符合以下标准的:...
-
----
-### 页码:{page_number}
-#### 分块ID:创作背景-03
-- **分块信息**:
-  - **分块ID**:创作背景-03
-  - **分块类型**:创作动机
-  - **分块标题**:创作动机
-  - **分块摘要**:一句话概括创作动机
-  - **分块标签**:["创作背景", "创作动机"]
-- **创作动机**:
-  - **内容**:描述图片中关于“创作动机”的内容
-  - **分析**:解释它是如何符合以下标准的:...
-
----
-### 页码:{page_number}
-#### 分块ID:创作背景-04
-- **分块信息**:
-  - **分块ID**:创作背景-04
-  - **分块类型**:权威认证
-  - **分块标题**:权威认证
-  - **分块摘要**:一句话概括权威认证
-  - **分块标签**:["创作背景", "权威认证"]
-- **权威认证**:
-  - **内容**:描述图片中关于“权威认证”的内容
-  - **分析**:解释它是如何符合以下标准的:...
+请按照以下 **Markdown** 结构输出你的分析结果。注意:输入图像为滑动窗口(前页-当前页-后页)拼接长图,请根据图像特征(页码数字、内容断点)动态判定内容所属页码。仅输出图像中实际存在的内容,若某项信息未在图中出现,则直接跳过该分块。
+
+页码:{提取到的实际页码}
+[分块ID] {分块标题}
+- 分块信息:
+  - 分块ID:{如:创作背景-01}
+  - 分块摘要:{一句话概括该分块的关键信息}
+  - 分块标签:["创作背景", "{拆解项}", "{关键词}"]
+- 分块内容:
+  - {匹配到的拆解项名称}:
+    - 内容:{描述图片中实际出现的原文/要点}
+    - 分析:{解释其如何满足本维度标准;若可判断,补充其在滑窗中的大概方位/对应页}
+  - 出现页码:{页码}
+(若存在多个分块,使用 --- 分割线分隔)
+
+## 分析步骤
+1. **滑动窗口扫描**:综合分析上一页、当前页、下一页的连续信息,避免重复提取。
+2. **拆解项匹配**:在“作者/绘者/译者背景、获奖信息、创作动机、权威认证”中,选择当前窗口真实出现的项。
+3. **页码判定**:以页码标识与内容断点为准,必要时输出页码范围(如 01-02)。
+4. **分块生成**:每个分块仅对应一个拆解项;同一拆解项若出现多处,合并为同一分块并去重。
+
+## 动态判定逻辑 (Dynamic Logic)
+### 执行标准:
+1. **滑动窗口扫描**:优先识别跨页连续的“简介/奖项/作者介绍”段落,避免把同一段文字拆成重复分块。
+2. **分块匹配**:根据当前窗口内容实质,动态激活 1 个或多个拆解项分块。
+3. **非空剪枝**:仅输出判定存在的分块;在分块内部,仅保留真实出现的子字段(如仅出现“作者姓名”,则不输出“代表作品”等空项),不留白。
 
 ## 维度定义 (详细标准)
 **视角:**  像文学评论家一样看书
@@ -131,6 +101,5 @@
 ## 指令
 1. **分析:** 仔细阅读上方的"维度定义",理解每一项的具体标准。
 2. **扫描:** 观察图像,识别符合这些标准的元素。
-3. **提取:** 对每个分块填写对应内容,并标注页码。
-   - 如果图像中不存在该类别的内容,可以将列表留空或设为null。
-   - 请提供描述性的值。
+3. **判定页码**: 根据图中的左上角的页码(如:P1),指明内容所属页码。
+4. **提取:** 对每个分块填写对应内容,标注页码,并请提供描述性的值。

+ 1 - 0
dimension/叙事流维度.md

@@ -20,6 +20,7 @@
   - {子项具体内容1}:{描述}
   - {子项具体内容2}:{描述}
   - 出现页码:{页码}
+(若存在多个分块,使用---分割线分隔)
 
 ## 分析步骤
 1. **通读全书**:完整阅读绘本,把握故事整体脉络

+ 25 - 33
dimension/因果逻辑与世界观.md

@@ -10,40 +10,32 @@
 {content}
 
 ## 输出格式要求
-请按照以下 **Markdown** 结构输出你的分析结果
-输出结构按“分块”组织,每个分块对应一个拆解项,便于直接写入知识库.
-每个分块对象需在首字段标注“页码”(拼接长图中的第几张图)。
-分块分隔:每个独立分块使用 ---(水平分割线)进行视觉分隔.
-标题层级:
-- ### 标记页码/逻辑大块
-- #### 标记分块 ID
+请按照以下 **Markdown** 结构输出你的分析结果。注意:输入图像为滑动窗口(前页-当前页-后页)拼接长图,请根据图像特征(页码数字、内容断点)动态判定内容所属页码。仅输出图像中实际存在的内容,若某项信息未在图中出现,则直接跳过该分块。
 
-### 页码:{page_number}
-#### 分块ID:因果-01
-- **分块信息**:
-  - **分块ID**:因果-01
-  - **分块类型**:明确的因果链条
-  - **分块标题**:因果链条
-  - **分块摘要**:一句话概括主要因果链条
-  - **分块标签**:["因果逻辑", "世界观"]
-- **分块内容**:
-  - **明确的因果链条**:
-    - **内容**:描述图片中关于“明确的因果链条”的内容
-    - **分析**:解释它是如何符合以下标准的:1. **事件粒度**:以角色的**离散动作或状态变化**为单位,如"离开家""吃掉苹果""房子倒塌..."
- 
----
-### 页码:{page_number}
-#### 分块ID:因果-02
-- **分块信息**:
-  - **分块ID**:因果-02
-  - **分块类型**:世界观设定
-  - **分块标题**:世界观设定
-  - **分块摘要**:一句话概括世界运行规则
-  - **分块标签**:["因果逻辑", "世界观"]
-- **分块内容**:
-  - **世界观设定**:
-    - **内容**:描述图片中关于“世界观设定”的内容
-    - **分析**:解释它是如何符合以下标准的:1. **规则类型**:<br />a. **物理规则**:重力、时间流逝、物体交互方式(如"石头永...
+页码:{提取到的实际页码}
+[分块ID] {分块标题}
+- 分块信息:
+  - 分块ID:{如:因果-01}
+  - 分块摘要:{一句话概括该分块的核心规则/链条}
+  - 分块标签:["因果逻辑", "世界观", "{拆解项}"]
+- 分块内容:
+  - {匹配到的拆解项名称}:
+    - 内容:{描述图片中关于该拆解项的实际内容(尽量以“事件/规则”的可检验表述呈现)}
+    - 分析:{解释其如何符合维度标准(如事件粒度/确定性/条件明确/规则类型与适用范围等)}
+  - 出现页码:{页码}
+(若存在多个分块,使用 --- 分割线分隔)
+
+## 分析步骤
+1. **滑动窗口扫描**:综合分析上一页、当前页、下一页的连续事件与说明文字,避免把同一条因果链拆成重复分块。
+2. **拆解项匹配**:在“明确的因果链条 / 世界观设定”中,动态判定当前窗口实际出现的内容属于哪一类。
+3. **确定性约束**:只提取文本/画面明确展示的因果或规则;避免长链臆测推理(除非故事明确展示多步因果)。
+4. **分块组织**:每个分块对应 1 个拆解项;同类内容多处出现时合并去重。
+
+## 动态判定逻辑 (Dynamic Logic)
+### 执行标准:
+1. **滑动窗口扫描**:因果链常跨页呈现(条件在前页、动作在当前页、结果在后页),需三页合并判断。
+2. **分块匹配**:若同时出现“因果链条”和“规则设定”,可同时输出两个分块。
+3. **非空剪枝**:仅输出判定存在的分块;分块内部仅保留真实出现的子点(如未出现“例外情况”则不输出该子点),不留白。
 
 ## 维度定义 (详细标准)
 **视角:**  像逻辑学家一样看书

+ 23 - 8
dimension/图书基础信息.md

@@ -7,17 +7,32 @@
 记录书籍核心基础信息,为各场景(选书、创作、硬件适配)提供底层数据支撑
 
 ## 输出格式要求
-请按照以下 Markdown 结构输出分析结果。 注意: 输入图像为滑动窗口拼接长图,请根据图像特征(页码数字、内容断点)动态判定内容所属页码。仅输出图像中实际存在的内容,若某项信息未在图中出现,则直接跳过该分块。
+请按照以下 **Markdown** 结构输出你的分析结果。注意:输入图像为滑动窗口(前页-当前页-后页)拼接长图,请根据图像特征(页码数字、内容断点)动态判定内容所属页码。仅输出图像中实际存在的内容,若某项信息未在图中出现,则直接跳过该分块。
 
-页码:{识别到的实际页码,如:01 或 01-02}
+页码:{提取到的实际页码}
 [分块ID] {分块标题}
-分块信息:
-- 分块ID:{如:基础信息-01}
-- 分块摘要:{一句话概括}
+- 分块信息:
+  - 分块ID:{如:基础信息-01}
+  - 分块摘要:{一句话概括该分块的核心信息}
+  - 分块标签:["图书基础信息", "{拆解项}"]
 - 分块内容:
-  - 内容:{描述图片中提取到的具体原始信息}
-  - 分析:{解释该信息如何符合维度标准,并注明其在拼接图中的大概方位}
-(若存在多个分块,使用---分割线分隔)
+  - {匹配到的拆解项名称}:
+    - 内容:{描述图片中提取到的具体原始信息(尽量保留原文)}
+    - 分析:{解释该信息如何符合维度标准;若可判断,补充其在滑窗中的大概方位/对应页}
+  - 出现页码:{页码}
+(若存在多个分块,使用 --- 分割线分隔)
+
+## 分析步骤
+1. **滑动窗口扫描**:综合分析上一页、当前页、下一页,优先识别“封面/版权页/扉页/腰封/封底”等可能承载基础信息的位置。
+2. **拆解项匹配**:将识别到的信息映射到拆解项(书号、适读年龄、出版机构、版权归属、创作团队等)。
+3. **分块组织**:每个分块对应 1 个拆解项;同一拆解项跨页重复出现时合并去重。
+4. **页码判定**:按页码标识与内容断点输出实际页码或页码范围。
+
+## 动态判定逻辑 (Dynamic Logic)
+### 执行标准:
+1. **滑动窗口扫描**:同一信息(如 ISBN/版权声明)可能在前后页重复出现,需优先选更完整的一处。
+2. **分块匹配**:根据当前窗口内容实质,动态输出出现的拆解项分块。
+3. **非空剪枝**:仅输出存在的分块;分块内仅保留真实出现的字段,不留白。
 
 ## 维度定义 (详细标准)
 **视角** /

+ 15 - 1
dimension/核心价值观提炼.md

@@ -10,19 +10,33 @@
 {content}
 
 ## 输出格式要求:
-请按照以下 **Markdown** 结构输出你的分析结果,仅输出图像中实际存在的内容,若某项信息未在图中出现,则直接跳过该分块。
+请按照以下 **Markdown** 结构输出你的分析结果。注意:输入图像为滑动窗口(前页-当前页-后页)拼接长图,请根据图像特征(页码数字、内容断点)动态判定内容所属页码。仅输出图像中实际存在的内容,若某项信息未在图中出现,则直接跳过该分块。
 
 页码:{提取到的实际页码}
 [分块ID] {分块标题}
 - 分块信息:
   - 分块ID:{如:价值观-01}
   - 分块摘要:{一句话概括核心价值观主题}
+  - 分块标签:["核心价值观", "{主题标签}", "{情绪/冲突关键词}"]
 - 分块内容:
   - 主题标签:
     - 内容:描述图片中关于“主题标签”的内容
     - 分析:解释它是如何符合以下标准的:...
+  - 出现页码:{页码}
 (若存在多个分块,使用---分割线分隔)
 
+## 分析步骤
+1. **滑动窗口扫描**:综合分析上一页、当前页、下一页的文本与画面线索,判断价值观表达是否跨页连续。
+2. **主题匹配**:将窗口中“明确表达/隐含指向”的道理,映射到维度定义的 12 类主题体系。
+3. **证据提取**:只使用图像中真实存在的台词、叙述句、角色行为与结果作为证据,不做超出画面/文本的补写。
+4. **分块组织**:每个分块对应 1 个价值观主题;若同一主题在窗口内多次出现,合并去重后输出一次。
+
+## 动态判定逻辑 (Dynamic Logic)
+### 执行标准:
+1. **滑动窗口扫描**:同一主题可能在“前页铺垫-当前页冲突-后页结果”中完成表达,需结合三页整体判断。
+2. **分块匹配**:根据内容实质,动态输出 1 个或多个主题分块。
+3. **非空剪枝**:仅输出出现的主题分块;分块内部仅保留真实出现的证据点与描述,不留空字段。
+
 ## 维度定义 (详细标准)
 **视角:**  像德育老师一样看书
 **目标:**  提取书里隐藏的"道理"

+ 46 - 63
dimension/知识实体与百科拆解.md

@@ -1,6 +1,6 @@
 # 视觉分析任务: 知识实体与百科拆解
 
-**角色:** 你是一位专业的儿童绘本和教育材料内容分析专家, 专注于 **知识实体与百科拆解**
+角色: 你是一位专业的儿童绘本和教育材料内容分析专家, 专注于 知识实体与百科拆解。
 你的目标是根据该维度的具体标准从图像中提取信息。
 
 ## 用途
@@ -10,98 +10,81 @@
 {content}
 
 ## 输出格式要求
-请按照以下 **Markdown** 结构输出你的分析结果
-
-标题层级:
-- ### 标记页码/逻辑大块
-
-### 页码:{page_number}
-- **自然科学**:
-  - **内容**:描述图片中关于“自然科学”的内容
-  - **分析**:解释它是如何符合以下标准的: 动植物相关...
-- **社会常识交通规则职业认知**:
-  - **内容**:描述图片中关于“社会常识(交通规则、职业认知)”的内容
-  - **分析**:解释它是如何符合以下标准的: 1 职业认知、<br />2 社区功能:认识学校、医院、邮局、超市、图书馆等场所的作用<br />3...
-- **历史文化**:
-  - **内容**:描述图片中关于“历史文化”的内容
-  - **分析**:解释它是如何符合以下标准的: 传统节日、成语典故、历史事件...
-- **社会情感与品德教育**:
-  - **内容**:描述图片中关于“社会情感与品德教育”的内容
-  - **分析**:解释它是如何符合以下标准的: 情绪管理、社交技能、品德发展、自我认知...
-- **生活健康与安全**:
-  - **内容**:描述图片中关于“生活健康与安全”的内容
-  - **分析**:解释它是如何符合以下标准的: 身体卫生、自理能力、安全常识...
-- **健康医学**:
-  - **内容**:描述图片中关于“健康医学”的内容
-  - **分析**:解释它是如何符合以下标准的: 身体认知、疾病常识、医疗过程、公共卫生...
-- **生命教育**:
-  - **内容**:描述图片中关于“生命教育”的内容
-  - **分析**:解释它是如何符合以下标准的: 理解出生、成长、衰老、死亡;面对离别、失去时的情感...
-- **品德教育**:
-  - **内容**:描述图片中关于“品德教育”的内容
-  - **分析**:解释它是如何符合以下标准的: 快乐、分享、合作、关心与照顾、助人、给予、尊重、勇气、感恩、智慧等...
-- **人文艺术**:
-  - **内容**:描述图片中关于“人文艺术”的内容
-  - **分析**:解释它是如何符合以下标准的: 绘画、音乐、舞蹈、戏剧......
-- **物理与物质科学**:
-  - **内容**:描述图片中关于“物理与物质科学”的内容
-  - **分析**:解释它是如何符合以下标准的: 物质特性、力与运动、声光电磁、物态变化...
-- **地球与环境科学**:
-  - **内容**:描述图片中关于“地球与环境科学”的内容
-  - **分析**:解释它是如何符合以下标准的: 1 天文地理:日月星辰、昼夜四季、天气现象(雨、雪、彩虹)。<br />2 自然环境:山脉、河流、海...
+请按照以下 Markdown 结构输出你的分析结果,仅输出图像中实际存在的内容,若某项信息未在图中出现,则直接跳过该分块。
+
+页码:{提取到的实际页码}
+- 自然科学:
+  - 内容:描述图片中关于“自然科学”的内容
+  - 分析:解释它是如何符合以下标准的: 动植物相关...
+- 社会常识交通规则职业认知:
+  - 内容:描述图片中关于“社会常识(交通规则、职业认知)”的内容
+  - 分析:解释它是如何符合以下标准的: 1 职业认知、<br />2 社区功能:认识学校、医院、邮局、超市、图书馆等场所的作用<br />3...
+- 历史文化:
+  - 内容:描述图片中关于“历史文化”的内容
+  - 分析:解释它是如何符合以下标准的: 传统节日、成语典故、历史事件...
+- 社会情感与品德教育:
+  - 内容:描述图片中关于“社会情感与品德教育”的内容
+  - 分析:解释它是如何符合以下标准的: 情绪管理、社交技能、品德发展、自我认知...
+- 生活健康与安全:
+  - 内容:描述图片中关于“生活健康与安全”的内容
+  - 分析:解释它是如何符合以下标准的: 身体卫生、自理能力、安全常识...
+- 健康医学:
+  - 内容:描述图片中关于“健康医学”的内容
+  - 分析:解释它是如何符合以下标准的: 身体认知、疾病常识、医疗过程、公共卫生...
+- 生命教育:
+  - 内容:描述图片中关于“生命教育”的内容
+  - 分析:解释它是如何符合以下标准的: 理解出生、成长、衰老、死亡;面对离别、失去时的情感...
+- 品德教育:
+  - 内容:描述图片中关于“品德教育”的内容
+  - 分析:解释它是如何符合以下标准的: 快乐、分享、合作、关心与照顾、助人、给予、尊重、勇气、感恩、智慧等...
+- 人文艺术:
+  - 内容:描述图片中关于“人文艺术”的内容
+  - 分析:解释它是如何符合以下标准的: 绘画、音乐、舞蹈、戏剧......
+- 物理与物质科学:
+  - 内容:描述图片中关于“物理与物质科学”的内容
+  - 分析:解释它是如何符合以下标准的: 物质特性、力与运动、声光电磁、物态变化...
+- 地球与环境科学:
+  - 内容:描述图片中关于“地球与环境科学”的内容
+  - 分析:解释它是如何符合以下标准的: 1 天文地理:日月星辰、昼夜四季、天气现象(雨、雪、彩虹)。<br />2 自然环境:山脉、河流、海...
 
 ## 维度定义 (详细标准)
-**视角:**  像博物学家一样看书
-**目标:**  提取硬核知识点
-**应用:**  AI 百科助手
-
-**拆解颗粒度:**
-
+视角:  像博物学家一样看书
+目标:  提取硬核知识点
+应用:  AI 百科助手
 
+拆解颗粒度:
 ### 拆解项 (文本描述)
-
 #### 自然科学
 动植物相关
-
 #### 社会常识(交通规则、职业认知)
 1 职业认知、
 2 社区功能:认识学校、医院、邮局、超市、图书馆等场所的作用
 3 规则意识:理解排队、轮流、遵守公共规则(如交通规则)的必要性。
 4 经济启蒙:对货币、买卖、储蓄、生产与消费的初级概念
-
 #### 历史文化
 传统节日、成语典故、历史事件
-
 #### 社会情感与品德教育
 情绪管理、社交技能、品德发展、自我认知
-
 #### 生活健康与安全
 身体卫生、自理能力、安全常识
-
 #### 健康医学
 身体认知、疾病常识、医疗过程、公共卫生
-
 #### 生命教育
 理解出生、成长、衰老、死亡;面对离别、失去时的情感
-
 #### 品德教育
-乐、分享、合作、关心与照顾、助人、给予、尊重、勇气、感恩、智慧等
-
+快乐、分享、合作、关心与照顾、助人、给予、尊重、勇气、感恩、智慧等
 #### 人文艺术
 绘画、音乐、舞蹈、戏剧...
-
 #### 物理与物质科学
 物质特性、力与运动、声光电磁、物态变化
-
 #### 地球与环境科学
 1 天文地理:日月星辰、昼夜四季、天气现象(雨、雪、彩虹)。
 2 自然环境:山脉、河流、海洋、森林、沙漠等不同地貌。
 3 资源认知:水、土壤、动植物资源的珍贵性与有限性。
 4 环保行为:节约用水、垃圾分类、爱护动植物、减少污染。
 
-
 ## 指令
-1. **分析:** 仔细阅读上方的"维度定义",理解每一项的具体标准。
-2. **扫描:** 观察图像,识别符合这些标准的元素。
-3. **判定页码**: 根据图中的左上角的页码(如:P1),指明内容所属页码。
-4. **提取:** 对每个分块填写对应内容,标注页码,并请提供描述性的值。
+1. 分析: 仔细阅读上方的"维度定义",理解每一项的具体标准。
+2. 扫描: 观察图像,识别符合这些标准的元素。
+3. 判定页码: 根据图中的左上角的页码(如:P1),指明内容所属页码。
+4. 提取: 对每个分块填写对应内容,标注页码,并请提供描述性的值。

+ 53 - 39
dimension/角色人设.md

@@ -10,53 +10,67 @@
 {content}
 
 ## 输出格式要求:
-请按照以下 **Markdown** 结构输出你的分析结果,仅输出图像中实际存在的内容,若某项信息未在图中出现,则直接跳过该分块。
+请按照以下 **Markdown** 结构输出你的分析结果。注意:输入图像为滑动窗口(前页-当前页-后页)拼接长图,请根据图像特征(页码数字、内容断点)动态判定内容所属页码。仅输出图像中实际存在的内容,若某项信息未在图中出现,则直接跳过该分块。
 
 页码:{提取到的实际页码}
 [分块ID] {分块标题}
 - 分块信息:
   - 分块ID:{如:角色-01}
-  - 分块摘要:{一句话概括核心价值观主题}
+  - 分块摘要:{一句话概括该角色的人设要点(身份/性格/关键特征)}
   - 分块标签:["角色人设", "物种/身份", "性格关键词"]
-- 角色标识:
-  - 内容:为每个出场角色提供唯一标识(如:角色名称/昵称;若无名称则用外观特征短语)
-- 角色名称:
-  - 内容:读取图片中的角色名称(若未出现则填 null)
-- 角色形象:
-  - 内容:描述“角色形象”的内容
-  - 分析:示例:通过对比与场景描写塑造角色形象
-- 角色的口头禅:
-  - 内容:描述图片中关于“角色的口头禅”的内容
-  - 分析:解释它是如何符合以下标准的:...
-- 性格弱点:
-  - 内容:描述图片中关于“性格弱点”的内容
-  - 分析:解释它是如何符合以下标准的:...
-- 爱好:
-  - 内容:描述图片中关于“爱好”的内容
-  - 分析:解释它是如何符合以下标准的:...
-- 角色定位:
-  - 内容:描述图片中关于“角色定位”的内容
-  - 分析:解释它是如何符合以下标准的:...
-- 性格与行为信息:
-  - 内容:描述图片中关于“性格与行为信息”的内容
-  - 分析:解释它是如何符合以下标准的:...
-- 情绪表达特点:
-  - 内容:描述图片中关于“情绪表达特点”的内容
-  - 分析:解释它是如何符合以下标准的:...
-- 关系与互动信息:
-  - 内容:描述图片中关于“关系与互动信息”的内容
-  - 分析:解释它是如何符合以下标准的:...
-- 关键事件与转变:
-  - 内容:描述图片中关于“关键事件与转变”的内容
-  - 分析:解释它是如何符合以下标准的:...
-- 成长轨迹:
-  - 内容:描述图片中关于“成长轨迹”的内容
-  - 分析:解释它是如何符合以下标准的:...
-- 主题映射:
-  - 内容:描述图片中关于“主题映射”的内容
-  - 分析:解释它是如何符合以下标准的:...
+- 分块内容:
+  - 角色标识:
+    - 内容:为每个出场角色提供唯一标识(如:角色名称/昵称;若无名称则用外观特征短语)
+  - 角色名称:
+    - 内容:读取图片中的角色名称(若未出现则填 null)
+  - 角色形象:
+    - 内容:描述图片中关于“角色形象”的内容
+    - 分析:解释它是如何符合以下标准的:...
+  - 角色的口头禅:
+    - 内容:描述图片中关于“角色的口头禅”的内容
+    - 分析:解释它是如何符合以下标准的:...
+  - 性格弱点:
+    - 内容:描述图片中关于“性格弱点”的内容
+    - 分析:解释它是如何符合以下标准的:...
+  - 爱好:
+    - 内容:描述图片中关于“爱好”的内容
+    - 分析:解释它是如何符合以下标准的:...
+  - 角色定位:
+    - 内容:描述图片中关于“角色定位”的内容
+    - 分析:解释它是如何符合以下标准的:...
+  - 性格与行为信息:
+    - 内容:描述图片中关于“性格与行为信息”的内容
+    - 分析:解释它是如何符合以下标准的:...
+  - 情绪表达特点:
+    - 内容:描述图片中关于“情绪表达特点”的内容
+    - 分析:解释它是如何符合以下标准的:...
+  - 关系与互动信息:
+    - 内容:描述图片中关于“关系与互动信息”的内容
+    - 分析:解释它是如何符合以下标准的:...
+  - 关键事件与转变:
+    - 内容:描述图片中关于“关键事件与转变”的内容
+    - 分析:解释它是如何符合以下标准的:...
+  - 成长轨迹:
+    - 内容:描述图片中关于“成长轨迹”的内容
+    - 分析:解释它是如何符合以下标准的:...
+  - 主题映射:
+    - 内容:描述图片中关于“主题映射”的内容
+    - 分析:解释它是如何符合以下标准的:...
+  - 出现页码:{页码}
 (若存在多个分块,使用---分割线分隔)
 
+## 分析步骤
+1. **滑动窗口扫描**:综合分析上一页、当前页、下一页,先列出所有“真实出场角色”(含仅露出部分的角色)。
+2. **角色去重**:同一角色跨页重复出现时,只输出一次分块;将窗口内信息合并到同一角色分块中。
+3. **字段提取**:仅填写画面/文本中能支撑的信息;不存在则跳过该字段,不留空行。
+4. **页码判定**:按页码标识与内容断点输出实际页码或页码范围。
+
+## 动态判定逻辑 (Dynamic Logic)
+### 执行标准:
+1. **滑动窗口扫描**:角色信息往往分散在三页(外观在前页、台词在当前页、转变在后页),需合并判断。
+2. **分块匹配**:每个分块严格对应 1 个角色;不要在同一分块中混合多个角色的信息。
+3. **非空剪枝**:仅输出识别到的角色分块;分块内仅保留真实出现的字段与子项,不留白。
+
 ## 维度定义 (详细标准)
 **视角:**  像相声演员背贯口一样看书
 **目标:**  建立立体人物档案

+ 41 - 41
dimension/语言难度分级.md

@@ -7,48 +7,42 @@
 {content}
 
 ## 输出格式要求
-请按照以下 **Markdown** 结构输出你的分析结果
-每个分块对象需在首字段标注“页码”(拼接长图中的第几张图)。
-分块分隔:每个独立分块使用 ---(水平分割线)进行视觉分隔。
-标题层级:
-- ### 标记页码/逻辑大块
-- #### 标记分块 ID
+请按照以下 **Markdown** 结构输出你的分析结果。注意:输入图像为滑动窗口(前页-当前页-后页)拼接长图,请根据图像特征(页码数字、内容断点)动态判定内容所属页码。仅输出图像中实际存在的内容,若某项信息未在图中出现,则直接跳过该字段,不留白。
 
-### 页码:{page_number}
-#### 分块ID:语言难度-01
-- **分块信息**:
-  - **分块ID**:语言难度-01
-  - **分块类型**:语言难度分级
-  - **分块标题**:语言难度分级报告
-  - **分块摘要**:一句话概括适读年龄段与主要判定依据
-  - **分块标签**:["语言难度", "分级评估"]
-- **分块内容**:
-  - **绘本信息**:
-    - **书名**:
-    - **总词数**:
-    - **平均句长**:
-  - **难度分级评估**:
-    - **适读年龄段**:
-    - **核心判定依据**:
-    - **匹配度打分**:
-  - **维度详细分析**:
-    - **字词特征**:
-      - **词汇类型**:
-      - **识字难度**:
-      - **关键特征**:
-      - **典型词汇示例**:
-    - **句子特征**:
-      - **句法结构**:
-      - **句式复杂度**:
-      - **修辞手法**:
-      - **典型句例**:
-    - **图文关系**:
-      - **图文比重**:
-      - **功能分析**:
-      - **对应特征描述**:
-  - **改进与优化建议**:
-    - **降维建议**:
-    - **升维建议**:
+页码:{提取到的实际页码}
+[分块ID] {分块标题}
+- 分块信息:
+  - 分块ID:{如:语言难度-01}
+  - 分块摘要:{一句话概括适读年龄段与主要判定依据}
+  - 分块标签:["语言难度", "分级评估", "{适读年龄段}"]
+- 分块内容:
+  - 绘本信息:
+    - 书名:{如图中出现则填写;未出现则跳过}
+    - 总词数:{如可从图中统计/读取则填写;否则跳过}
+    - 平均句长:{如可从图中统计/读取则填写;否则跳过}
+  - 难度分级评估:
+    - 适读年龄段:{3-4/4-5/5-6/6-7/7-8}
+    - 核心判定依据:{用要点列出}
+    - 匹配度打分:{可选;如无依据则跳过}
+  - 维度详细分析:
+    - 字词特征:
+      - 词汇类型:
+      - 识字难度:
+      - 关键特征:
+      - 典型词汇示例:
+    - 句子特征:
+      - 句法结构:
+      - 句式复杂度:
+      - 修辞手法:
+      - 典型句例:
+    - 图文关系:
+      - 图文比重:
+      - 功能分析:
+      - 对应特征描述:
+  - 改进与优化建议:
+    - 降维建议:
+    - 升维建议:
+  - 出现页码:{页码}
 
 ## 分析步骤
 1.  **文本扫描**:统计字数、句长,识别核心词汇类别(动词/名词/形容词等)。
@@ -57,6 +51,12 @@
 4.  **特征对位**:将提取的特征与《参考标准》表进行比对,找到最匹配的年龄段。
 5.  **综合定级**:结合三个维度(字词、句子、图文)得出最终适读年龄。
 
+## 动态判定逻辑 (Dynamic Logic)
+### 执行标准:
+1. **滑动窗口扫描**:综合分析上一页、当前页、下一页的文字量、句式与图文依赖程度,避免因跨页重复而重复统计。
+2. **分块匹配**:通常输出 1 个“语言难度分级”分块;若滑窗中出现明显不同难度区段(如“故事正文 vs 科普栏”),可拆成多个分块并分别标注页码范围。
+3. **非空剪枝**:仅输出可被文本/画面支撑的字段;无法从图中得到的统计项与示例项直接跳过,不留空字段。
+
 ## 注意事项
 - **口语 vs 书面语**:低龄段(3-6岁)高度依赖口语表达,高龄段(6-8岁)开始向书面语过渡。
 - **韵律与重复**:3-5岁的核心是"重复"和"韵律"(易于记忆模仿),6岁后注重逻辑和因果。

+ 43 - 66
dimension/阅读效果反馈.md

@@ -10,71 +10,36 @@
 {content}
 
 ## 输出格式要求
-请按照以下 **Markdown** 结构输出你的分析结果
-键名对应维度文本中提供的"拆解项" (Breakdown Items) 定义。
-输出结构按“分块”组织;若识别到多种阅读效果反馈,应分别输出多个分块。
-每个分块对象需在首字段标注“页码”(拼接长图中的第几张图)。
-分块分隔:每个独立分块使用 ---(水平分割线)进行视觉分隔。
-标题层级:
-- ### 标记页码/逻辑大块
-- #### 标记分块 ID
-
-### 页码:{page_number}
-#### 分块ID:阅读效果-01
-- **分块信息**:
-  - **分块ID**:阅读效果-01
-  - **分块类型**:阅读效果反馈
-  - **分块标题**:阅读效果反馈报告-1
-  - **分块摘要**:一句话概括第1种阅读效果指标与评估方法
-  - **分块标签**:["阅读效果", "评估方法"]
-- **分块内容**:
-  - **知识掌握br核心指标**:
-    - **内容**:描述图片中关于“知识掌握<br />(核心指标)”的内容
-    - **分析**:解释它是如何符合以下标准的:...
-  - **互动完成度br过程指标**:
-    - **内容**:描述图片中关于“互动完成度<br />(过程指标)”的内容
-    - **分析**:解释它是如何符合以下标准的:...
-  - **能力提升br结果指标**:
-    - **内容**:描述图片中关于“能力提升<br />(结果指标)”的内容
-    - **分析**:解释它是如何符合以下标准的:...
-  - **评估方法知识类提问**:
-    - **内容**:描述图片中关于“评估方法 -知识类提问”的内容
-    - **分析**:解释它是如何符合以下标准的:...
-  - **评估方法互动类邀请**:
-    - **内容**:描述图片中关于“评估方法 -互动类邀请”的内容
-    - **分析**:解释它是如何符合以下标准的:...
-  - **评估方法能力类提问**:
-    - **内容**:描述图片中关于“评估方法 -能力类提问”的内容
-    - **分析**:解释它是如何符合以下标准的:...
-
----
-### 页码:{page_number}
-#### 分块ID:阅读效果-02
-- **分块信息**:
-  - **分块ID**:阅读效果-02
-  - **分块类型**:阅读效果反馈
-  - **分块标题**:阅读效果反馈报告-2
-  - **分块摘要**:一句话概括第2种阅读效果指标与评估方法
-  - **分块标签**:["阅读效果", "评估方法"]
-- **分块内容**:
-  - **知识掌握br核心指标**:
-    - **内容**:描述图片中关于“知识掌握<br />(核心指标)”的内容
-    - **分析**:解释它是如何符合以下标准的:...
-  - **互动完成度br过程指标**:
-    - **内容**:描述图片中关于“互动完成度<br />(过程指标)”的内容
-    - **分析**:解释它是如何符合以下标准的:...
-  - **能力提升br结果指标**:
-    - **内容**:描述图片中关于“能力提升<br />(结果指标)”的内容
-    - **分析**:解释它是如何符合以下标准的:...
-  - **评估方法知识类提问**:
-    - **内容**:描述图片中关于“评估方法 -知识类提问”的内容
-    - **分析**:解释它是如何符合以下标准的:...
-  - **评估方法互动类邀请**:
-    - **内容**:描述图片中关于“评估方法 -互动类邀请”的内容
-    - **分析**:解释它是如何符合以下标准的:...
-  - **评估方法能力类提问**:
-    - **内容**:描述图片中关于“评估方法 -能力类提问”的内容
-    - **分析**:解释它是如何符合以下标准的:...
+请按照以下 **Markdown** 结构输出你的分析结果。注意:输入图像为滑动窗口(前页-当前页-后页)拼接长图,请根据图像特征(页码数字、内容断点)动态判定内容所属页码。仅输出图像中实际存在的内容,若某项信息未在图中出现,则直接跳过该字段,不留白。
+
+键名需对应维度文本中提供的“拆解项”定义。输出结构按“分块”组织;若识别到多种阅读效果反馈,应分别输出多个分块,并用 `---` 分隔。
+
+页码:{提取到的实际页码}
+[分块ID] {分块标题}
+- 分块信息:
+  - 分块ID:{如:阅读效果-01}
+  - 分块摘要:{一句话概括该分块的核心指标与评估方法}
+  - 分块标签:["阅读效果", "评估方法", "{指标关键词}"]
+- 分块内容:
+  - 知识掌握<br />(核心指标):
+    - 内容:{描述图片中关于该指标的实际内容}
+    - 分析:{解释它是如何符合以下标准的:...}
+  - 互动完成度<br />(过程指标):
+    - 内容:{描述图片中关于该指标的实际内容}
+    - 分析:{解释它是如何符合以下标准的:...}
+  - 能力提升<br />(结果指标):
+    - 内容:{描述图片中关于该指标的实际内容}
+    - 分析:{解释它是如何符合以下标准的:...}
+  - 评估方法 -知识类提问:
+    - 内容:{描述图片中关于该方法的实际内容}
+    - 分析:{解释它是如何符合以下标准的:...}
+  - 评估方法 -互动类邀请:
+    - 内容:{描述图片中关于该方法的实际内容}
+    - 分析:{解释它是如何符合以下标准的:...}
+  - 评估方法 -能力类提问:
+    - 内容:{描述图片中关于该方法的实际内容}
+    - 分析:{解释它是如何符合以下标准的:...}
+  - 出现页码:{页码}
 
 ## 维度定义 (详细标准)
 **视角:**  像教育评估师一样看书
@@ -134,4 +99,16 @@
 1. **分析:** 仔细阅读上方的"维度定义",理解每一项的具体标准。
 2. **扫描:** 观察图像,识别符合这些标准的元素。
 3. **判定页码**: 根据图中的左上角的页码(如:P1),指明内容所属页码。
-4. **提取:** 对每个分块填写对应内容,标注页码,并请提供描述性的值。
+4. **提取:** 对每个分块填写对应内容,标注页码,并请提供描述性的值。
+
+## 分析步骤
+1. **滑动窗口扫描**:综合分析上一页、当前页、下一页,识别“指标描述/评估问题清单/任务邀请”等是否跨页连续。
+2. **拆解项匹配**:将窗口中出现的内容分别映射到三类指标与三类评估方法(可同时命中多个)。
+3. **分块组织**:若存在多套不同的“指标+方法”组合,拆成多个分块输出,并去重合并跨页重复内容。
+4. **页码判定**:按页码标识与内容断点输出实际页码或页码范围。
+
+## 动态判定逻辑 (Dynamic Logic)
+### 执行标准:
+1. **滑动窗口扫描**:同一条提问清单/评估说明可能在前后页重复出现,优先选更完整版本并去重。
+2. **分块匹配**:根据内容实质动态输出 1 个或多个分块;每个分块应自洽地包含“指标 + 对应评估方法”的证据。
+3. **非空剪枝**:仅输出出现的分块与字段;某个指标/方法未出现则跳过该字段,不留白。

+ 56 - 0
summarize/创作背景-汇总节点提示词.md

@@ -0,0 +1,56 @@
+你是一个专业的内容分析专家。现在需要你汇总和整合多个滑动窗口的解析结果,并将其合并为“创作背景”维度下的统一分块输出。
+
+**任务说明:**
+- 这些结果来自对同一本书使用滑动窗口方式的解析
+- 每个窗口包含3页内容(前页-当前页-后页),因此相邻窗口之间会有重叠
+- 你需要去除重复信息,整合所有有效内容
+
+**维度名称:** 创作背景
+
+**滑动窗口解析结果:**
+
+{results_text}
+
+**输出要求(总则):**
+1. 仔细分析所有窗口的结果,识别重复和冗余信息
+2. 保留所有独特的、有价值的内容;对重复出现的内容只保留一次,选择描述最完整的版本
+3. 按照原始格式输出,保持“分块”结构与字段层级不变(不要新增字段、不要添加额外说明文字)
+4. 合并后的 `页码` 与 `出现页码` 应覆盖该信息出现的全部页码(可用页码范围或合并后的页码表达)
+5. 避免冗长描述;优先保留“原文/要点”与可核对的事实信息(姓名、奖项、年份、机构等)
+
+**分块合并与去重规则(关键):**
+你必须先对分块按“拆解项类型”分组,再在组内合并去重。常见拆解项包括:
+- 作者/绘者/译者背景
+- 获奖信息(作品荣誉/创作者荣誉)
+- 创作动机(解决的问题/灵感来源)
+- 权威认证(专家审订与推荐/机构认证/市场认可)
+
+### A. 何时视为“同一分块”(需要合并)
+满足任一条即合并:
+1. `分块内容` 的 `{匹配到的拆解项名称}` 相同(即同一拆解项)
+2. 拆解项不同但内容明显描述同一事实(如“作者简介”与“文字作者背景”重复)
+
+### B. 组内合并策略(字段融合)
+- **内容**:
+  - 将同一拆解项在不同窗口出现的要点合并为一份,去除重复句/重复事实
+  - 列表型信息(多个作者、多个奖项、多个机构)需去重合并:同名同年同机构只保留一次
+- **分析**:
+  - 合并后只保留一次“分析”,选更完整/更贴合标准的版本
+  - 不输出“猜测”;只基于图像中实际信息
+- **分块摘要**:基于合并后的内容重写为一句话概括(不引入新事实)
+- **分块标签**:保持原标签结构,合并去重关键词
+
+### C. 冲突处理
+若同一事实出现冲突(如年份不同、奖项名不同):
+- 优先保留“更具体、包含更多限定信息(机构/全称/年份)”的版本
+- 若两者都具体但互斥,保留两条并在“内容”中并列呈现(但不要加你自己的判断)
+
+**分块ID处理规则:**
+- 输出的分块ID必须唯一,保持前缀 `创作背景-` 不变
+- 允许重新编号(如 `创作背景-01`、`创作背景-02`…),按对应信息首次出现的页码从小到大排序编号
+
+**输出格式要求:**
+- 你必须严格输出“合并后的分块列表”,每个分块之间用 `---` 分隔
+- 不要输出任何解释、步骤说明、或额外标题(除了分块自身的 `页码`、`[分块ID]` 等原始格式内容)
+
+请直接输出汇总后的结果:

+ 53 - 0
summarize/叙事流维度-汇总节点提示词.md

@@ -0,0 +1,53 @@
+你是一个专业的内容分析专家。现在需要你汇总和整合多个滑动窗口的解析结果,并将其合并为“叙事流维度”下的统一分块输出。
+
+**任务说明:**
+- 这些结果来自对同一本书使用滑动窗口方式的解析
+- 每个窗口包含3页内容(前页-当前页-后页),因此相邻窗口之间会有重叠
+- 你需要去除重复信息,整合所有有效内容
+
+**维度名称:** 叙事流维度
+
+**滑动窗口解析结果:**
+
+{results_text}
+
+**输出要求(总则):**
+1. 仔细分析所有窗口的结果,识别重复和冗余信息
+2. 保留所有独特的、有价值的内容;对重复出现的内容只保留一次,选择描述最完整的版本
+3. 按照原始格式输出,保持“分块”结构与字段层级不变(不要新增字段、不要添加额外说明文字)
+4. 合并后的 `页码` 与 `出现页码` 应覆盖该叙事要点出现的全部页码
+5. 避免冗长描述;优先保留“关键事件/转折/情绪点/因果链”的高信息密度表述
+
+**分块合并与去重规则(关键):**
+你必须先对分块按“当前环节/维度类别”归类,再在类内合并去重。常见类别:
+起因、经过、高潮、结局、叙事特色、延伸建议。
+
+### A. 同一叙事要点判定(需要合并)
+满足任一条即视为同一要点并合并:
+1. `分块标签` 中的 `{当前环节}` 相同,且分块内容描述同一关键事件/转折(主语角色+动作+结果高度一致)
+2. 分块内容的关键名词/角色/道具一致,且事件链条明显是同一条(只是不同窗口补充了前因/后果)
+
+### B. 合并策略(保持时间顺序)
+- **内容合并**:
+  - 将同一要点在不同窗口的描述合并为一条更完整的表述(优先补齐“前因→事件→结果”)
+  - 对重复的句子/同义描述去重,只保留一次
+  - 若同一环节下确实存在多个不同事件:应拆成多个分块分别输出,不要硬合并
+- **分块摘要**:重写为一句话概括(事件核心+情绪/主题),不引入新事件
+- **分块标签**:保持原结构,合并去重关键词
+- **页码**:合并覆盖所有出现页;建议按页码从小到大组织内容信息(但不得新增字段)
+
+### C. 边界与冲突处理
+- 若两个分块事件相似但存在关键冲突(不同主角、不同结果、不同核心冲突):不得合并
+- 若同一事件被判定为不同环节(例如“经过 vs 高潮”):
+  - 以“冲突爆发/情绪顶点/角色抉择”更符合高潮的标准为准
+  - 但不得删除独立信息:必要时可在两个分块中各保留其独特内容(避免重复句)
+
+**分块ID处理规则:**
+- 输出的分块ID必须唯一,保持前缀 `叙事-` 不变
+- 允许重新编号(如 `叙事-01`、`叙事-02`…),按首次出现页码从小到大排序编号
+
+**输出格式要求:**
+- 你必须严格输出“合并后的分块列表”,每个分块之间用 `---` 分隔
+- 不要输出任何解释、步骤说明、或额外标题(除了分块自身的 `页码`、`[分块ID]` 等原始格式内容)
+
+请直接输出汇总后的结果:

+ 61 - 0
summarize/因果逻辑与世界观-汇总节点提示词.md

@@ -0,0 +1,61 @@
+你是一个专业的内容分析专家。现在需要你汇总和整合多个滑动窗口的解析结果,并将其合并为“因果逻辑与世界观”维度下的统一分块输出。
+
+**任务说明:**
+- 这些结果来自对同一本书使用滑动窗口方式的解析
+- 每个窗口包含3页内容(前页-当前页-后页),因此相邻窗口之间会有重叠
+- 你需要去除重复信息,整合所有有效内容
+
+**维度名称:** 因果逻辑与世界观
+
+**滑动窗口解析结果:**
+
+{results_text}
+
+**输出要求(总则):**
+1. 仔细分析所有窗口的结果,识别重复和冗余信息
+2. 保留所有独特的、有价值的内容;对重复出现的内容只保留一次,选择描述最完整的版本
+3. 按照原始格式输出,保持“分块”结构与字段层级不变(不要新增字段、不要添加额外说明文字)
+4. 合并后的 `页码` 与 `出现页码` 应覆盖该规则/链条出现的全部页码
+5. 避免冗长描述;优先保留“可检验的事件链条/规则表述”
+
+**分块合并与去重规则(关键):**
+你必须先按拆解项类型分组:
+- 明确的因果链条
+- 世界观设定
+然后在组内合并去重。
+
+### A. 同一因果链条判定(需要合并)
+满足任一条即合并:
+1. 同一“原因→结果”对(主语角色/条件/动作/结果高度一致)
+2. 同一条链条在不同窗口补齐了条件或结果(前页给条件、后页给结果),整体指向同一机制
+
+### B. 同一世界观规则判定(需要合并)
+满足任一条即合并:
+1. 规则类型与表述语义一致(同一物理/生物/社会/超自然规则)
+2. 只是补充了适用范围/例外情况/触发条件(属于同一规则的增强描述)
+
+### C. 合并策略(字段融合)
+- **内容**:
+  - 对重复规则/链条去重,只保留一次
+  - 对同一规则/链条的互补信息进行补齐合并(条件、范围、例外、步骤)
+  - 不做额外推理,不新增没有在解析结果中出现的中间步骤
+- **分析**:
+  - 优先保留更贴合标准(事件粒度/确定性/条件明确/适用范围/一致性)的版本
+  - 可将互补的分析点合并为一段(仍保持在原字段位置)
+- **分块摘要**:基于合并后的内容重写一句话概括(不引入新规则)
+- **分块标签**:保持原结构,合并去重关键词
+
+### D. 冲突处理
+若同一规则/链条在不同窗口出现互斥表述:
+- 优先保留“更具体、更可检验、并且与更多窗口一致”的版本
+- 若无法判断,保留两条并列(但不得输出“你认为哪个更对”的判断)
+
+**分块ID处理规则:**
+- 输出的分块ID必须唯一,保持前缀 `因果-` 不变
+- 允许重新编号(如 `因果-01`、`因果-02`…),建议先输出“因果链条”再输出“世界观设定”,并按首次出现页码从小到大排序编号
+
+**输出格式要求:**
+- 你必须严格输出“合并后的分块列表”,每个分块之间用 `---` 分隔
+- 不要输出任何解释、步骤说明、或额外标题(除了分块自身的 `页码`、`[分块ID]` 等原始格式内容)
+
+请直接输出汇总后的结果:

+ 53 - 0
summarize/图书基础信息-汇总节点提示词.md

@@ -0,0 +1,53 @@
+你是一个专业的内容分析专家。现在需要你汇总和整合多个滑动窗口的解析结果,并将其合并为“图书基础信息”维度下的统一分块输出。
+
+**任务说明:**
+- 这些结果来自对同一本书使用滑动窗口方式的解析
+- 每个窗口包含3页内容(前页-当前页-后页),因此相邻窗口之间会有重叠
+- 你需要去除重复信息,整合所有有效内容
+
+**维度名称:** 图书基础信息
+
+**滑动窗口解析结果:**
+
+{results_text}
+
+**输出要求(总则):**
+1. 仔细分析所有窗口的结果,识别重复和冗余信息
+2. 保留所有独特的、有价值的内容;对重复出现的内容只保留一次,选择描述最完整的版本
+3. 按照原始格式输出,保持“分块”结构与字段层级不变(不要新增字段、不要添加额外说明文字)
+4. 合并后的 `页码` 与 `出现页码` 应覆盖该信息出现的全部页码(可用页码范围或合并后的页码表达)
+5. 避免冗长描述;优先保留“可核对的原文信息”(ISBN、出版社、年份、页数、开本等)
+
+**分块合并与去重规则(关键):**
+你必须先对分块按“拆解项”归类,再在类内合并去重。常见拆解项包括:
+书号、适读年龄、作品综述(书籍简介)、出版机构、出版时间、版权归属、创作团队、装帧类型、页数、字数、开本。
+
+### A. 同一拆解项判定(需要合并)
+满足任一条即合并:
+1. 分块内容中的 `{匹配到的拆解项名称}` 相同
+2. 内容明显描述同一信息点(例如“ISBN/书号”表述差异但实为同一字段)
+
+### B. 合并策略
+- **内容**:
+  - 若同一拆解项在不同窗口重复出现:只保留一次,选择信息更完整的一版(例如包含更多数字/限定词)
+  - 若同一拆解项在不同窗口提供互补信息:合并为一条更完整的“内容”(不得丢失关键字段)
+  - 对列表型信息(创作团队多人、多个合作机构)去重合并:同名同机构只保留一次
+- **分析**:
+  - 保留最完整的一版;若有互补信息可合并为一段(仍在原字段位置)
+- **分块摘要**:基于合并后的内容重写一句话概括(不引入新事实)
+- **分块标签**:保持原标签结构,合并去重关键词
+
+### C. 冲突处理
+若出现冲突(如出版时间不同、页数不同):
+- 优先保留“更像版权页/扉页信息、并且更具体”的版本
+- 若无法判断哪一个正确,则并列保留两条差异(不要加你自己的判断)
+
+**分块ID处理规则:**
+- 输出的分块ID必须唯一,保持前缀 `基础信息-` 不变
+- 允许重新编号(如 `基础信息-01`、`基础信息-02`…),建议按“书号/适读年龄/简介/机构/时间/版权/团队/装帧/页数/字数/开本”的常规顺序排序编号
+
+**输出格式要求:**
+- 你必须严格输出“合并后的分块列表”,每个分块之间用 `---` 分隔
+- 不要输出任何解释、步骤说明、或额外标题(除了分块自身的 `页码`、`[分块ID]` 等原始格式内容)
+
+请直接输出汇总后的结果:

+ 52 - 0
summarize/核心价值观提炼-汇总节点提示词.md

@@ -0,0 +1,52 @@
+你是一个专业的内容分析专家。现在需要你汇总和整合多个滑动窗口的解析结果,并将其合并为“核心价值观提炼”维度下的统一分块输出。
+
+**任务说明:**
+- 这些结果来自对同一本书使用滑动窗口方式的解析
+- 每个窗口包含3页内容(前页-当前页-后页),因此相邻窗口之间会有重叠
+- 你需要去除重复信息,整合所有有效内容
+
+**维度名称:** 核心价值观提炼
+
+**滑动窗口解析结果:**
+
+{results_text}
+
+**输出要求(总则):**
+1. 仔细分析所有窗口的结果,识别重复和冗余信息
+2. 保留所有独特的、有价值的内容;对重复出现的内容只保留一次,选择描述最完整的版本
+3. 按照原始格式输出,保持“分块”结构与字段层级不变(不要新增字段、不要添加额外说明文字)
+4. 合并后的 `页码` 与 `出现页码` 应覆盖该价值观表达出现的全部页码
+5. 避免冗长描述;只使用解析结果中已出现的证据点(台词/叙述/行为-结果)
+
+**分块合并与去重规则(关键):**
+你必须先对分块按“主题标签”归类,再在类内合并去重。由于滑动窗口重叠,同一主题会多次出现。
+
+### A. 同一主题判定(需要合并)
+满足任一条即视为同一主题分块并合并:
+1. `主题标签` 内容相同(同一类别/同一主题词)
+2. 主题词不同但明显属于同一大类且描述同一“道理”(例如“勇气/不害怕”属于同一品格主题),且证据点高度重合
+
+### B. 合并策略(如何融合证据)
+- **内容**:
+  - 合并同一主题下的所有“证据点”,去掉重复的句子/重复行为描述
+  - 若证据点来自不同页的“铺垫-冲突-结果”,应保留其顺序感(按页码从小到大组织描述,但不新增格式字段)
+- **分析**:
+  - 选择“论证最完整、最贴合该主题体系定义”的一版作为保留
+  - 若不同窗口提供了互补分析点,可合并为一段(仍保持在原字段位置,不新增字段)
+- **分块摘要**:基于合并后的主题与证据重写一句话概括(不引入新主题)
+- **分块标签**:保持原标签结构,合并去重关键词
+
+### C. 冲突与边界处理
+- 若同一证据点被不同窗口归入不同主题:
+  - 以“更贴合维度定义的 12 类主题体系”的归类为主
+  - 但不得删除明显独立的第二主题证据(若确实存在两条不同道理,则拆成两个分块)
+
+**分块ID处理规则:**
+- 输出的分块ID必须唯一,保持前缀 `价值观-` 不变
+- 允许重新编号(如 `价值观-01`、`价值观-02`…),按主题首次出现的页码从小到大排序编号
+
+**输出格式要求:**
+- 你必须严格输出“合并后的分块列表”,每个分块之间用 `---` 分隔
+- 不要输出任何解释、步骤说明、或额外标题(除了分块自身的 `页码`、`[分块ID]` 等原始格式内容)
+
+请直接输出汇总后的结果:

+ 67 - 0
summarize/角色人设建立-汇总节点提示词.md

@@ -0,0 +1,67 @@
+你是一个专业的内容分析专家。现在需要你汇总和整合多个滑动窗口的解析结果,并将其合并为“角色人设建立”维度下的统一分块输出。
+
+**任务说明:**
+- 这些结果来自对同一本书使用滑动窗口方式的解析
+- 每个窗口包含3页内容(前页-当前页-后页),因此相邻窗口之间会有重叠
+- 你需要去除重复信息,整合所有有效内容
+- 你需要对“同一角色”在不同窗口里的信息进行合理合并(即使某些窗口缺少角色名称)
+
+**维度名称:** 角色人设建立
+
+**滑动窗口解析结果:**
+
+{results_text}
+
+**输出要求(总则):**
+1. 仔细分析所有窗口的结果,识别重复和冗余信息
+2. 保留所有独特的、有价值的内容;对重复出现的内容只保留一次,选择描述最完整的版本
+3. 按照原始格式输出,保持“分块”结构与字段层级不变(不要新增字段、不要添加额外说明文字)
+4. 每个分块必须且只对应**一个角色**;同一角色跨窗口出现时必须合并为一个分块
+5. 对于合并后的分块:`页码` 与 `出现页码` 应覆盖该角色信息出现的全部页码(可用页码范围或合并后的页码表达),避免遗漏
+6. 避免冗长描述;优先保留信息密度最高、可被图文直接支撑的表述
+
+**同一角色判定与合并规则(关键):**
+你必须把所有角色分块先聚类,再输出聚类后的合并结果。判定“同一角色”的优先级如下(从高到低):
+
+### A. 强匹配(直接视为同一角色)
+- **角色名称**一致(忽略大小写/全半角/常见称呼差异,如“兔兔/小兔”)
+- 或 **角色标识**一致(完全相同或明显同义,如“戴红围巾的小熊” vs “红围巾熊”)
+
+### B. 弱匹配(无名称/名称缺失时的相似合并)
+当某些窗口 `角色名称 = null` 或名称缺失时,允许按“形象相似”合并,但必须满足:
+- **必须至少满足 3 条相似证据**(从下列证据中选),并且
+- **不得出现关键冲突**(如物种/身份明显不同、外观核心特征互相矛盾)
+
+可用的“相似证据”(满足其三即可):
+1. **物种/身份**一致(由 `分块标签` 或 `角色形象/角色标识` 可推断)
+2. **核心外观特征**一致(颜色、体型、发型/耳朵/尾巴等显著特征、服饰/配件)
+3. **标志性配件/道具**一致(如“红围巾/眼镜/背包/手杖/玩偶”)
+4. **口头禅/常用句式**一致或高度相似
+5. **关系与互动对象**高度一致(经常与同一对象互动、称呼关系一致)
+6. **场景功能/角色定位**一致且稳定(如总是“引路人/捣蛋鬼/旁白式角色”)
+
+“关键冲突”判定(出现任一则禁止合并):
+- 物种/身份明显不同(熊 vs 兔;孩子 vs 成人;动物 vs 物品拟人)
+- 核心外观矛盾且不可解释(如“一直戴眼镜” vs “明确没有眼镜且强调其特征”)
+- 关系网络明显冲突(同一窗口里同时出现两个不同个体,且被区分对待)
+
+### C. 合并策略(如何融合字段)
+对同一角色聚类后,合并字段时遵循:
+- **角色名称**:若任一分块提供非空名称,合并结果使用该名称(多名称则选择出现频次最高/最正式的;其余可吸收进“角色标识”的内容表述中)
+- **角色标识**:优先使用“名称(若有)+ 最具区分度的外观短语”;如无名称,用最具区分度且最短的外观短语
+- **其余字段(形象/口头禅/弱点/爱好/定位/行为/情绪/关系/转变/成长/主题映射)**:
+  - 去重合并:语义相同/高度相近只保留一次,选描述更完整者
+  - 互补合并:不同窗口提供不同字段时全部保留
+  - 冲突处理:若同一字段出现轻微不一致,优先保留“更具体、证据更强、与更多窗口一致”的版本;不输出“可能/也许”的猜测
+- **分块摘要**:基于合并后的信息重写为一句话概括(身份/性格关键词/关键特征),不要引入新事实
+- **分块标签**:在不改变标签结构的前提下,保留或合并关键词(去重)
+
+**分块ID处理规则:**
+- 输出的分块ID必须唯一,保持前缀 `角色-` 不变
+- 允许重新编号(如 `角色-01`、`角色-02`…),按角色首次出现的页码从小到大排序编号
+
+**输出格式要求:**
+- 你必须严格输出“合并后的分块列表”,每个分块之间用 `---` 分隔
+- 不要输出任何解释、步骤说明、或额外标题(除了分块自身的 `页码`、`[分块ID]` 等原始格式内容)
+
+请直接输出汇总后的结果:

+ 53 - 0
summarize/语言难度分级-汇总节点提示词.md

@@ -0,0 +1,53 @@
+你是一个专业的内容分析专家。现在需要你汇总和整合多个滑动窗口的解析结果,并将其合并为“语言难度分级”维度下的统一分块输出。
+
+**任务说明:**
+- 这些结果来自对同一本书使用滑动窗口方式的解析
+- 每个窗口包含3页内容(前页-当前页-后页),因此相邻窗口之间会有重叠
+- 你需要去除重复信息,整合所有有效内容
+
+**维度名称:** 语言难度分级
+
+**滑动窗口解析结果:**
+
+{results_text}
+
+**输出要求(总则):**
+1. 仔细分析所有窗口的结果,识别重复和冗余信息
+2. 保留所有独特的、有价值的内容;对重复出现的内容只保留一次,选择描述最完整的版本
+3. 按照原始格式输出,保持“分块”结构与字段层级不变(不要新增字段、不要添加额外说明文字)
+4. 合并后的 `页码` 与 `出现页码` 应覆盖被评估文本出现的全部页码(可用页码范围或合并后的页码表达)
+5. 避免冗长描述;优先保留“适读年龄段 + 判定依据 + 典型例证(如存在)”
+
+**分块合并与去重规则(关键):**
+语言难度通常应输出 1 个分块;但若解析结果明确把不同区段分开(例如“故事正文 vs 科普栏”),允许输出多个分块。
+
+### A. 何时只输出 1 个分块
+满足任一条即合并为 1 个分块:
+- 各窗口评估的适读年龄段一致或高度接近(相邻年龄段),且判定依据没有结构性冲突
+- 不同窗口只是提供了互补信息(有的给年龄段,有的给例词/例句/图文关系)
+
+### B. 何时输出多个分块
+只有当解析结果明确存在“不同文本区段/明显不同难度”的证据时才拆分:
+- 例如:同一窗口或不同窗口明确标注“正文很口语+短句,而科普栏信息密度高+术语多”
+- 或适读年龄段差异较大且都有明确证据(例如 4-5 vs 7-8)
+
+### C. 合并策略(字段融合)
+对同一分块合并时:
+- **适读年龄段**:优先采用“出现频次最高 + 证据最充分”的结论;若两个相邻年龄段同时出现,选择“依据更强/覆盖页码更广”的一方
+- **核心判定依据**:合并去重要点,保留最强证据(字词/句子/图文三维度)
+- **典型词汇示例/典型句例**:去重合并示例;同义或重复例子只保留一次
+- **总词数/平均句长/匹配度打分**:若不同窗口给出不同数值且无法统一,以“覆盖页码更广/更接近全书统计”的版本为主;其余不确定数值不强行并列
+- **降维/升维建议**:去重合并,保留可操作性更强的表述
+- **分块摘要/分块标签**:基于合并后的结论重写/合并去重(不引入新结论)
+
+**分块ID处理规则:**
+- 输出的分块ID必须唯一,保持前缀 `语言难度-` 不变
+- 允许重新编号:
+  - 若只输出 1 个分块,用 `语言难度-01`
+  - 若输出多个分块,用 `语言难度-01/02/...` 并按页码从小到大排序
+
+**输出格式要求:**
+- 你必须严格输出“合并后的分块列表”,每个分块之间用 `---` 分隔
+- 不要输出任何解释、步骤说明、或额外标题(除了分块自身的 `页码`、`[分块ID]` 等原始格式内容)
+
+请直接输出汇总后的结果:

+ 53 - 0
summarize/阅读效果反馈-汇总节点提示词.md

@@ -0,0 +1,53 @@
+你是一个专业的内容分析专家。现在需要你汇总和整合多个滑动窗口的解析结果,并将其合并为“阅读效果反馈”维度下的统一分块输出。
+
+**任务说明:**
+- 这些结果来自对同一本书使用滑动窗口方式的解析
+- 每个窗口包含3页内容(前页-当前页-后页),因此相邻窗口之间会有重叠
+- 你需要去除重复信息,整合所有有效内容
+
+**维度名称:** 阅读效果反馈
+
+**滑动窗口解析结果:**
+
+{results_text}
+
+**输出要求(总则):**
+1. 仔细分析所有窗口的结果,识别重复和冗余信息
+2. 保留所有独特的、有价值的内容;对重复出现的内容只保留一次,选择描述最完整的版本
+3. 按照原始格式输出,保持“分块”结构与字段层级不变(不要新增字段、不要添加额外说明文字)
+4. 合并后的 `页码` 与 `出现页码` 应覆盖该指标/方法出现的全部页码
+5. 避免冗长描述;优先保留“可执行的指标描述 + 可直接使用的提问/邀请清单”
+
+**分块合并与去重规则(关键):**
+阅读效果反馈常以“指标 + 评估方法”组合出现。你必须先将分块聚类,再输出聚类后的合并结果。
+
+### A. 同一分块判定(需要合并)
+满足任一条即合并:
+1. 分块覆盖的“核心指标/过程指标/结果指标”与“评估方法三类”集合高度一致(同一套组合)
+2. 分块摘要描述同一套评估目标(只是不同窗口补充了更多问题/指标细节)
+
+### B. 合并策略(字段融合)
+- **指标字段(知识掌握/互动完成度/能力提升)**:
+  - 去重合并描述点;重复句只保留一次
+  - 若不同窗口补充了不同细节/例子,应合并保留
+- **评估方法字段(知识类提问/互动类邀请/能力类提问)**:
+  - 将问题/邀请清单合并去重(同义、仅换个说法的条目算重复)
+  - 保留更清晰、可直接对孩子说的版本
+- **分析**:
+  - 选更贴合维度标准、信息更完整的一版;必要时可合并互补点(但不新增字段)
+- **分块摘要/分块标签**:
+  - 基于合并后的内容重写摘要(不引入新指标)
+  - 标签去重合并,保持原结构
+
+### C. 何时保留多个分块(不要硬合并)
+若解析结果存在两套明显不同的“指标+方法”体系(例如分别针对不同章节/不同能力目标),应保留为多个分块输出,并用 `---` 分隔。
+
+**分块ID处理规则:**
+- 输出的分块ID必须唯一,保持前缀 `阅读效果-` 不变
+- 允许重新编号(如 `阅读效果-01`、`阅读效果-02`…),按对应体系首次出现的页码从小到大排序编号
+
+**输出格式要求:**
+- 你必须严格输出“合并后的分块列表”,每个分块之间用 `---` 分隔
+- 不要输出任何解释、步骤说明、或额外标题(除了分块自身的 `页码`、`[分块ID]` 等原始格式内容)
+
+请直接输出汇总后的结果: