Files
root 691b8cdd0c feat: 初始化黄小瓜AI助手记忆仓库
- 核心配置: IDENTITY, USER, SOUL, AGENTS, TOOLS, HEARTBEAT, MEMORY
- memory/: 每日总结和临时记录
- skills/: 所有已安装技能
- notes/: 语音配置笔记
2026-04-04 02:42:48 +08:00

2.8 KiB
Raw Permalink Blame History

文本格式化模块

纯文本 → 结构化 XML → 样式美化的工程化流程。


文件结构

doc_format/
├── prompt/
│   ├── scenario_recognition_prompt.txt    # 场景识别 Prompt
│   ├── pure_text_system_prompt.txt        # 文本转 XML Prompt
│   └── style_customization_prompt.txt     # 样式解析 Prompt
└── templates/
    ├── general.json                        # 通用场景模板
    ├── paper.json                          # 学术论文模板
    ├── contract.json                       # 合同模板
    ├── essay.json                          # 作文模板
    ├── government.json                     # 公文模板

工作流程

你需要按照以下步骤完成文本美化任务:

步骤 1: 场景识别与标题生成

分析用户提供的文本内容,识别所属场景并生成文档标题。

参考规则: prompt/scenario_recognition_prompt.txt

你必须输出给用户:

{
  "scenario": "场景标识",
  "title": "生成的标题2-25字符"
}

步骤 2: 样式自定义(可选)

仅当用户明确提出样式要求时执行此步骤,例如:

  • "标题用初号黑体"
  • "正文改成小四"
  • "标题居中显示"

允许样式: 参考 templates/{scenario}.json 中的 schema.children[].structure 字段,必须为叶节点的样式。 参考规则: prompt/style_customization_prompt.txt

你必须输出给用户JSON 数组格式):

[
  {
    "structureName": "Title",
    "fontSize": 42,
    "fontFamily": "黑体",
    "fontColor": "AE2E19",
    "alignment": 2,
    "lineSpacing": 1.5
  }
]

如果用户没有样式要求,此步骤不输出。


步骤 3: 文本转 XML 结构化

根据识别的场景,加载对应模板,将纯文本转换为结构化 XML。

模板位置: templates/{scenario}.json

参考规则: prompt/pure_text_system_prompt.txt

你必须输出给用户:

{
  "xml": "<root>...</root>"
}

步骤 4: 调用套用 MCP 工具

使用 tencent-docs MCP Server 对应的 MCP 工具 doc.ai_format_pure_text 调用套用 API传入前面步骤的结果生成在线腾讯文档链接。

MCP 工具参数:

  • title: 文档标题(步骤 1 的输出)
  • xml: 格式套用后的文档 XML 结构(步骤 3 的输出)
  • scenario: 模板场景(步骤 1 的输出)
  • customStyles: 对文档的自定义样式(步骤 2 的输出,可选,需序列化为 JSON 字符串)

最终输出文档链接给用户。

注意事项

JSON 序列化

文本中的引号必须正确转义:

错误:

{"text": "合同(以下简称"本合同""}

正确:

{"text": "合同(以下简称\"本合同\""}