Gemini 1M 上下文 = 写长篇？马良写作告诉你为什么"塞全文"不是答案

马良写作编辑部 · Edited by 马良 · MALIANG · 更新于 2026-04-21

Gemini 2.5 Pro 可以接入 100 万 token 上下文，看起来"一次塞进全书"很美好。但注意力稀释、成本失控、动态设定更新缺失使得"塞全文"不等于长篇工作流。马良用 RAG + 图谱 + Agent 解决这三点。

❦ · Verdict · ❦

TL;DR · 一句话结论

如果你只有 30 seconds

Gemini 2.5 Pro 的 1M 上下文是工程奇迹，但"长上下文"只能解决"读"，解决不了"写"。长篇写作需要"读→写→校验→迭代"，必须靠工作流。马良在 Gemini 之上加了 RAG、图谱、Agent 使其变得可用。

Pick Maliang · 选马良写长篇小说 + 追求一致性的中文作者。

Pick Gemini · 选竞品做文档问答、代码分析、多模态（图 / 视频 / 音频）场景。

Scenario · 场景切入

作者 B 把写了 80 万字的小说全部塞进 Gemini 2.5 Pro 的 1M 窗口。第一次生成的章节出奇好——但每次调用花费 $1-2。写到 100 章时发现个新问题：前几章改了设定，要再把全文更新 + 重塞，循环 300 次后月费破万美元。长 context 不是免费的。

❦ · Matrix · ❦

Matrix · 核心对比表

对比维度	马良写作	Gemini
最大上下文	✅ 取决于所选模型（Gemini 1M 可用）	✅ 1,048,576 tokens
长篇工作流	✅ 7 Agent + 三级大纲	❌ 无
知识图谱	✅ 自动	❌ 无
节奏分析	✅ 有	❌ 无
多模型	✅ 15+	⚠️ Gemini 一系
多模态	⚠️ 文本为主	✅ 文本 / 图像 / 视频 / 音频
中文文笔	✅ 多模型覆盖	✅ Gemini 2.5 Pro 中文在持续优化
成本（长篇）	✅ 多模型混合	⚠️ 1M token 写作成本高
中国大陆访问	✅ 直连	❌ 需代理
动态设定更新	✅ 图谱实时更新	⚠️ 每次重塞全文
检索精度	✅ RAG（精准 top-k）	⚠️ 整窗口 attention
API 稳定性	✅ 多路冗余	✅ 官方 SLA

✅ 明显领先 ⚠️ 持平或部分差距 ❌ 明显短板 · 数据基于公开官方文档 / 公共知识库样本 / 主流评测。

Maliang · 上马

№01 马良写作 · 上马

马良用 RAG 从图谱抽取"当前章节相关的前情"，比塞整本书更精准、更便宜、更快。

用 Gemini Flash 做一致性校验，用 DeepSeek V3 做生成，用 Claude 做设定，一次调用只需 10-30k token。成本是裸 Gemini 1M 的 1/30。

图谱自增量 vs 整包重塞。每次章节完成后图谱更新，无需重刷长 context。

Fair Play · 不打口水仗

Gemini 2.5 Pro 的 1M 上下文在"一次读完整本小说"类问答分析场景极有用（适合写编辑报告 / 文本审校）。多模态能力独步业界。作为"辅助分析工具"非常好；作为"写作主工作流"则不足。

我们不否定任何一款产品，只按"中文长篇写作"这一场景做选型建议。

❦ · Evidence · ❦

Evidence · 数据与证据

注意力稀释研究：Google 官方 Long Context 论文里"needle-in-haystack"实验明确显示长 context 的 recall 衰减曲线。（参考 · 核验于 2026-04-21）
马良 RAG 示意：/features/knowledge-graph 中的三层检索流程（RAG + 图谱 + 一致性）。（站内数据 · maliangwriter.com · 核验于 2026-04-21）查看 →

Decision Tree · 决策树