Duplicate Detector · 段落查重

重复内容检测:30万字以后,别让自己反复写同一段

长篇写到中后段,作者很容易反复写同一种动作、同一句心理、同一段环境描写。重复内容检测先用 bigram / LCS 做召回,再结合语义复核判断相似段落,直接标出位置和相似度。

召回算法 Bigram + LCS 相似度
语义复核 LLM 判断是否真重复
定位方式 段落 句子位置和相似度
风险分级 3 轻微 / 明显 / 高重复
小说段落查重重复句检测相似段落定位重复率检测语义重复判断

交互工具就在本页

首包 HTML 已经写入标题、正文、FAQ 和相关工具,方便 Google 直接理解这个页面。浏览器加载脚本后,会自动进入可操作的 重复内容检测 输入框和结果区。

How it works · 三步搞定

从粘贴到处理,三步完成

01 · 粘贴章节或片段

适合检查单章、连续多章或你怀疑写重复的片段。

02 · 自动拆句比对

先按段落和句子拆分,交叉比对相似表达,召回可疑重复内容。

03 · 按位置处理

结果会标出两段内容的位置、相似度和重复类型,方便直接回正文修改。

Features · 能力亮点

不是摆设,是按作者工作流做的工具

字面重复召回

识别完全重复、局部复制、换少量词但结构高度相似的句子。

LCS 相似度

长句和段落用最长公共子序列辅助判断,减少漏掉改写式重复。

语义复核

对高相似候选再判断语义是否真重复,降低“同名角色出现多次”的误报。

段落定位

直接输出重复内容所在段落和句子序号,不需要作者自己全文搜索。

重复率概览

汇总全篇重复率、最高相似度和高风险对数,先处理最严重的地方。

长篇友好

适合章节发布前做局部去重,避免读者感觉作者在水字数。

FAQ · 常见问题

使用前最该问清楚的事

重复内容检测和论文查重一样吗?

不一样。它面向小说正文,重点是找作者自己在章节里反复使用的句式、动作和描写,不是对全网数据库查重。

为什么要同时用 bigram、LCS 和语义判断?

bigram 和 LCS 召回快,适合找字面相似;语义复核能判断“换了词但意思重复”的段落,也能降低人名设定造成的误报。

能检测多长的文本?

适合单章或几章合并检查。非常长的小说建议按卷或按 3-5 章分批检测,定位更清楚。

相似度多少算需要修改?

一般 0.75 以上建议看一眼,0.85 以上优先处理。动作描写、心理描写和环境描写最容易重复。

检测结果会保存吗?

不会长期保存。工具只返回本次重复定位结果。

从免费工具进入完整写作流

这些工具负责解决发布前的具体问题:错别字、AI 味、取名、排版和重复内容。需要整章生成、知识图谱、三级大纲和多模型协作时,可以注册马良写作,把工具结果继续接进完整创作台。