长文本不是“字数越多越好”,而是当结构复杂、语义跨段、需要持续一致性时才有价值。典型需求:
叙事类创作
商业与研究写作
企业知识与规范化输出
教学与培训内容
多轮交互驱动的生成
汇编/整合类输出
结论:当你需要跨段逻辑、跨章一致性、跨轮决策传导时,就是“真正需要长文本”的时刻。

**上下文窗口 ≠ 可靠记忆 ≠ 可控流程。**实际落地会遇到这些硬问题:
注意力稀释与“中段遗忘”
错误累积不可逆
成本与延迟不可控
工具与事实约束无法插入
可观测性与可维护性差
团队协作与版本控制
因此,大上下文适合“参考更多材料”,但不解决“过程控制与长期一致性”。这正是工作流存在的意义。
目标:多卷本叙事、人物成长线、伏笔呼应。
痛点:设定丢失、人物性格跑偏、时间线错位、反复重写成本高。
为什么工作流:可把“世界观卡”“角色卡”“时间线卡”作为会话变量;逐章生成→每章摘要→用摘要喂下一章;每章出厂前经过“逻辑校验/风格统一”子流程。
流程骨架:
目标:结构化论证、数据支撑、统一术语、可追溯引用。
痛点:数据口径不一致、图表与文字不匹配、结论与证据脱节。
为什么工作流:RAG 检索事实、HTTP 调数据、代码节点做单位/口径标准化;章节级校验“论据-论点一致性”,统一术语表。
流程骨架:
目标:可执行、可审计、版本化维护。
痛点:不同作者口径不一致、改动处难以追踪、法条引用易出错。
为什么工作流:条款/步骤作为结构化变量;校验节点检查“禁止词”“高风险语句”;对版本差异做自动比对与变更日志。
流程骨架:
目标:分层进阶、案例驱动、作业/答疑联动。
痛点:章节跨度大、同一案例在不同难度层面复用、风格易飘。
为什么工作流:先固化教学目标与难度分层卡;每章产出后摘要关键知识点,再统一风格卡;可插“问答生成”子流程形成练习题。
流程骨架:
目标:从多渠道抓信息,统一口径形成长文。
痛点:来源不一致、重复/冲突信息多、人工筛选成本高。
为什么工作流:HTTP 拉取多源 → 代码去重与冲突合并 → 模型聚合抽象 → 统一风格输出;错误点能回到对应节点修正。
流程骨架:
分层结构化记忆
迭代与校验闭环
工具与数据接入
成本与时延管理
可观测与可回放
协作与验收
此时直接一个 LLM 节点(或 Chatflow 单轮)够用。
凡是跨段一致、跨轮传导、可审计与可维护的需求,就该上工作流。
开始节点(输入)
global_style, world_rules, character_bible, glossary, acc_outline, acc_chapters.大纲节点(LLM)
acc_outline;生成术语初稿写入 glossary。迭代节点(按章节列表)
acc_chapters。整书汇编节点(代码/LLM)
发布/回写(HTTP)


目前使用的是优云智算的分时租赁方式 https://www.compshare.cn/
可以选择自行下载指定版本的dify
git clone --depth 1 --branch v1.9.1 https://github.com/langgenius/dify.git
也可以直到github中下载安装压缩包上传后进行解压安装
sudo apt install unzip
sudo apt install lrzsz

使用docker进行安装
cd dify
cd docker
cp .env.example .env
docker compose up -d

sudo usermod -aG docker $USER
启动新窗口

原有docker 配置文件 如果网络顺畅不需要进行额外的修改
/etc/docker/daemon.json :
{
"registry-mirrors": [
"https://dockerproxy.com",
"https://docker.m.daocloud.io",
"https://cr.console.aliyun.com",
"https://ccr.ccs.tencentyun.com",
"https://hub-mirror.c.163.com",
"https://mirror.baidubce.com",
"https://docker.nju.edu.cn",
"https://docker.mirrors.sjtug.sjtu.edu.cn",
"https://github.com/ustclug/mirrorrequest",
"https://registry.docker-cn.com"
]
}

网络不好更改默认镜像
sudo rm -f /usr/bin/docker/daemon.json
sudo mkdir -p /etc/docker
sudo tee /etc/docker/daemon.json <<EOF
{
"registry-mirrors": [
"https://docker.m.daocloud.io",
"https://hub.uuuadc.top",
"https://mirror.baidubce.com",
"https://ccr.ccs.tencentyun.com"
]
}
EOF
sudo systemctl daemon-reload
sudo systemctl restart docker
docker info | grep -A 3 "Registry Mirrors"

docker compose ps

链接服务器IP访问初始化界面


配置模型供应商

原生自带供应商安装





dify市场安装指定软件




使用本地插件形式安装(推荐)



在复杂长文本流程中,常常要做到下面几点:
因此,在 Dify 构建长文本系统时,把“核心子流程”封装成工具 / 接口是工程级的好实践。
启用发布 / 接口选项
在 Workflow 或 Chatflow 的设置中,有 “暴露为 API / 工具” 的选项(或“Deploy / Publish”按钮)。这一步会让该流程具备 HTTP 接口、工具插件(Tool)能力。
定义输入 / 输出 Schema
theme, chapter_id, history, style_card 等)注册为工具 / 插件
生成 API 文档 / SDK
这种方式适合你已经把流程“封装成 API”的场景。
接口稳定性与版本管理
v1.0、v1.1)权限与认证
超时与降级策略
上下文与变量同步问题
错误传播与审计
资源隔离与负载控制



主题拆解 Agent(Planner)
输入:{{zhuti}}、目标文种、受众、{{zishu}}。
输出:结构化 outline(数组),含每节目的、关键要点、所需证据/素材、预估字数。
审判者(Regulator / Reviewer)
对 outline 或分节草稿进行:体裁合规、逻辑一致、事实/引用与格式检查。输出打分 + 必改清单。
迭代扩写(Writer per item)
按 {{item}} 扩写,严格遵循体裁模板与“必须修改”清单;生成正文与本节摘要、关键事实。
风格/术语统一(Style Harmonizer)
按 {{writing_style}} 与术语表 {{glossary}} 做最小幅度改写;输出定稿。
可选:引用与附录生成(Citations/Appendix)
将 {{refs}} 格式化为参考文献或法规条款附录。
系统指令
你是资深行业研究员。目标是把“{{zhuti}}”拆解为可执行的行业报告大纲。
约束:
- 体裁:行业研究报告(摘要、背景、市场规模与增速、供需格局、竞争格局、产业链、政策与风险、趋势与建议)
- 受众:业务/管理层
- 输出必须是 JSON,字段见 schema。
- 每一节给出:写作目的、关键结论要点(bullet)、需要的证据类型(数据/报告/法规)、建议图表类型、预估字数(整数)。
调用指令(用户提示)
请基于主题“{{zhuti}}”,目标字数上限 {{zishu}},给出全报告大纲。
若历史上下文存在,需保证与 {{history}} 一致。
写作风格参考:{{writing_style}}。
期望输出(JSON Schema)
{
"core_goal": "string",
"sections": [
{
"title": "string",
"purpose": "string",
"bullets": ["string"],
"evidence_needed": ["宏观数据","公开年报","第三方测算","政策原文或权威解读"],
"chart_suggestion": ["柱状图","折线图","堆叠面积","桑基图"],
"estimated_words": 800
}
],
"global_constraints": {
"terminology": ["统一术语1","统一术语2"],
"forbidden": ["夸大性词汇","不确定却肯定的断言"]
}
}
系统指令(大纲评审)
你是报告总编,依据以下 Rubric 为大纲打分并给出“必须修改项”:
维度:
- 结构完备(0-5):是否覆盖摘要、市场规模、供需、竞争格局、产业链、政策风险、趋势建议
- 逻辑递进(0-5):从现状→问题→分析→建议是否清晰
- 可证据性(0-5):每节是否给出可验证的证据类型
- 与历史一致(0-5):是否与 {{history}} 关键假设一致
仅输出 JSON:
{
"scores": {"structure":0,"logic":0,"evidence":0,"consistency":0},
"must_fix": ["..."],
"suggestions": ["..."],
"verdict": "pass | revise"
}
系统指令(分节草稿评审)
你是事实与体裁审稿官。检查【本节草稿】:
- 是否匹配本节 purpose 与 bullets
- 是否给出可证据化陈述(用“可验证标记”标注,如 [需要数据-人口渗透率])
- 禁用词与夸张表达是否出现
- 字数在 estimated_words±15%
仅输出 JSON(同上),并给出 “must_fix”。
系统指令
你是行业报告撰写人。请在不虚构具体数据的前提下,先写结构,再留证据位。
要求:
- 段首给出“本节结论一句话”
- 正文结构:现状→驱动/阻力→对比→结论→建议
- 用占位符标注证据位,如【证据-市场规模近三年CAGR】、【证据-TOP5份额】
- 字数目标:{{item.estimated_words}}±15%
- 仅输出 Markdown,禁止无关说明。
调用指令
本节标题:{{item.title}}
写作目的:{{item.purpose}}
关键要点:{{item.bullets}}
风格:{{writing_style}}
术语表:{{glossary}}
历史对齐:{{history}}
系统指令
根据“风格卡”和“术语表”对文本做最小幅改写:
- 不改变事实与结构
- 统一口吻、句长、标点
- 术语替换为首选项
输出 Markdown 正文。
{{refs}} 合并成参考文献区系统指令
你是机关文字秘书。把“{{zhuti}}”拆解为符合《党政机关公文处理工作条例》与通用公文体例的大纲。
体裁:请指定(如“请示/报告/通知/方案/通报”等),若未指定由你根据意图推断并给出理由。
每节包含:功能定位、核心信息点、依据信息(法规/上级精神/会议纪要)、需落款/时间/附件清单、预估字数。
输出 JSON,见 schema。
调用指令
请为主题“{{zhuti}}”生成公文大纲,目标字数 {{zishu}},风格“{{writing_style}}”。
若有历史上下文 {{history}},需保持政策口径一致。
期望输出(JSON)
{
"doc_type": "请示 | 报告 | 通知 | 方案 | 通报",
"sections": [
{
"title": "string",
"function": "背景/目的/依据/措施/落实/结语",
"bullets": ["string"],
"policy_basis_needed": ["条例/意见/会议精神"],
"estimated_words": 500
}
],
"footer": {"issuer":"单位","date":"自动生成","attachment_list":["..."]}
}
系统指令
你是政务公文审稿官,请根据体裁规则检查结构与表述是否合规:
- 体例检查:标题、主送、正文结构、成文日期、印发范围、落款
- 用语检查:不得出现口语化、情绪化、商业化词汇;引用法规需注明全称与文号占位
- 政策一致:与 {{history}} 的上级精神/既有口径不冲突
- 字数符合约束
输出 JSON:scores、must_fix、verdict。
系统指令
你是机关公文写作者。按体裁与功能定位写作:
- 每节先给“一句话要点”
- 用“依法依规”“经研究,拟提出如下意见”等规范表述
- 对法规引用用占位符【法规-名称-文号-条款】
- 严禁夸张形容词与不确定承诺
- 字数 {{item.estimated_words}}±10%
输出为公文体 Markdown。
与上类似,但词表需加入“政务用语规范表”。
系统指令
你是数据分析项目负责人。围绕“{{zhuti}}”,给出数据报告大纲。
每节需明确:
- 指标集合与口径定义(分子/分母/时间窗/维度/排除项)
- 需要的图表类型与最重要的切片维度
- 业务假设与验证方法(AB/对照/回归/分层)
- 风险与数据质量关注点
输出 JSON。
调用指令
请在 {{zishu}} 字数上限内,生成可执行的数据报告大纲。风格 {{writing_style}},历史一致性 {{history}}。
期望输出
{
"sections": [
{
"title": "核心指标与口径",
"metrics": [
{"name":"DAU","formula":"UV 日活","window":"D","dimension":["渠道","地区"],"exclusion":["内测账号"] }
],
"charts": ["时序折线","分渠道柱状"],
"analysis_plan": ["分层对比","显著性检验"],
"estimated_words": 600
}
]
}
系统指令
你是分析规范审稿官,检查本节草稿:
- 指标口径是否与定义一致(分子/分母/时间窗/去重规则)
- 结论是否仅基于可观察相关,而未误导为因果(如无实验设计)
- 图表描述是否与指标匹配(如累计 vs 日、均值 vs 中位数)
- 数据质量声明是否充分(缺失/异常/截尾说明)
输出 JSON:scores、must_fix、verdict。
系统指令
你是数据分析师。生成本节正文:
- 先给“结论摘要(要点列表)”
- 逐条解释图表应展示的故事与预期验证方式
- 严禁虚构数据;用占位符【数据-指标-时间窗-维度】标注数据位
- 若可能存在“选择偏差/混杂”,需显式注明“风险与限制”
- 字数 {{item.estimated_words}}±15%
输出 Markdown。
系统指令(共用)
你是审稿官。请针对【候选文本】与【任务约束】进行评审,输出 JSON:
维度与分值:
- 结构匹配(0-5)
- 目的达成(0-5)
- 证据可验证性/口径一致(0-5)
- 风格与术语一致(0-5)
- 历史一致(0-5)
阈值:任意一项 <3 或平均 <4 则 verdict=“revise”
输出:
{
"scores": {...},
"must_fix": ["逐条、可操作的修改点"],
"suggestions": ["可选优化"],
"verdict": "pass | revise"
}
仅输出 JSON。
https://pan.baidu.com/s/10FFRqK16UxRNn8d2Y1mgyg?pwd=dkq2 提取码: dkq2