修复PDF解析工作流中的f-string格式错误.md 1.0 KB

问题分析

pdf_parser_workflow.py 文件中,_parse_single_page 方法使用了 f-string 来构建提示词,但提示词中包含了用于定义 JSON 格式的字面量大括号 {}。在 f-string 中,大括号被用于插入变量,因此 Python 解释器会尝试将这些字面量大括号解析为格式说明符,导致 Invalid format specifier 错误。

修复方案

将提示词中所有用于定义 JSON 格式的字面量大括号 {} 替换为转义形式 {{}},这样 Python 解释器就会将它们视为普通字符而不是格式说明符。

具体修改位置

  • 文件:/Users/alair/project/ai/graph_rag_server/src/parser/pdf_parser/pdf_parser_workflow.py
  • 方法:_parse_single_page
  • 行号:282-314

修复内容

将提示词中的 JSON 示例部分的所有大括号替换为双大括号,例如:

  • { 替换为 {{
  • } 替换为 }}

这样修改后,f-string 就会正确解析变量 {page["page_number"]},同时将 JSON 格式中的大括号视为普通字符输出。