这是我们内容新鲜度系列的第二部分。第 1 部分介绍了新鲜度的重要性及其实际意义。本篇将继续讨论:为什么仅有保质期是不够的,以及什么是持续监控。
假设你做了一件负责任的事情。假设你做了一件负责任的事,你维基中的每份文档都有一个审核日期。创建后六个月,对于稳定的参考资料,也许是十二个月。日期一到,所有者就会收到通知:审查此文档,否则就会被标记。
这比大多数公司做的都要好。大多数公司什么都不做。文档放在那里,慢慢腐烂,没人注意到,直到有人按照指示去做,结果出了问题。
但这里有一个让人不舒服的事实:**有效期是必要的,但也是完全不够的。**一份文件可能在最后一次审核后几天就变得陈旧不堪,而审核日期并不能发现这一点。
有效期实际上能解决什么问题
有效期解决了责任问题。它们回答了一个问题:_"谁负责确认这是否仍然准确,何时确认?
这是真正有价值的。如果没有它,文档就会进入我们所说的 "所有权空白"--在这种状态下,每个人都认为是别人在维护文档,所以没有人去维护。设定审核日期,就是在特定日期为一个人分配一项义务。简单。清晰。有效。
以下是有效日期的实际应用:
- 创建一份文件,审查日期为 90 天后
- 到期前 14 天,所有者收到通知
- 在到期日,文档被标记为 "需要审核"。
- 所有者审查,确认仍然准确,并延长日期
- 或者更新,或者重新分配,或者存档
这是一个可靠的系统。它能捕捉到缓慢衰减的文档,即一年内都没人考虑过的文档。它创造了定期审查的节奏。它让所有权清晰可见。
**但它有一个盲点,面积相当于一个大陆。
失效日期会错过什么
在审查日期之间,文件就像一个黑盒子。你在 1 月 15 日审查了它。下一次审核是 4 月 15 日。在 2 月 3 日,这些事情都有可能发生:
###链接突然中断
您引用的外部 URL 返回 404。内部链接指向已存档的文档。代码库被重命名,文档中的所有 GitHub 链接都已失效。您的文档看起来仍然正常。有效期还有两个月。没人知道链接已损坏。
相关内容变更
您编写了一份部署指南,其中引用了您的架构文档。二月份,有人完全重写了架构文档--新的模式、新的基础架构、新的约定。您的部署指南仍然引用旧架构。从技术上讲,它还没有错,但已经偏离了方向。到了审核日期,差距可能会很大。
读者数量降至零
你的文档曾经每月有 40 人阅读。后来流程改变了,没有人再需要它了,但也没有人把它存档。它被放在搜索结果中,占用了空间,偶尔还会让不知道它无关紧要的新员工感到困惑。过期日期并不在乎读者数量。无论如何,它都会如期向所有者发送信息。
翻译落后
英文源于 2 月 10 日更新。法语、德语和日语翻译现在已经过时。但这些翻译版本的有效期要到 5 月份。三个月来,非英语团队阅读着过时的内容却浑然不知。
###读者标记问题
一位读者留言"第 3 步不再起作用了,CLI 标志已被弃用"。这条评论被搁置在那里。有效期还有几个星期。下一个阅读文档的人可能不会看到这条评论。下一个人肯定不会看到。
**有效期是一个预定的检查点。这些是计划外事件。这两者之间的差距是陈旧文档造成最大损害的地方。
新鲜度:持续监控
新鲜度评分填补了有效期留下的空白。新鲜度不是每隔 90 天检查一次文档的健康状况,而是每天在后台持续跟踪,无需任何人做任何事情。
以下是它在 Rasepi 中的工作原理:
每个文档都会得到一个实时新鲜度分数,分数从 0 到 100,由多个信号计算得出:
| 信号 | 检测到的内容 | 重要原因 |
|---|---|---|
| 链接健康状况 | 断开、重定向或无法访问的 URL | 断开的链接会降低信任度并浪费时间 |
| 审阅状态** | 文档是否已按计划审阅 | 基线责任检查 |
| 阅读量趋势** | 是否有人在阅读该文档 | 低阅读量表明文档可能无关紧要 |
| 文档最后修改的时间与相关内容的对比 | 检测相对于周围知识库的漂移 | 翻译对齐度 |
| 翻译一致性** | 是否所有语言版本都是最新的 | 过时的翻译意味着其他市场的团队是根据旧信息工作的 |
| 读者标记** | 读者是否报告了问题 | 众包陈旧性检测 |
| ** 交叉引用** | 此文档链接到的文档本身是否陈旧 | 陈旧会传染 |
每个信号都对总分有贡献。一篇文档今天可能会因为一个断开的链接而失去新鲜度得分,即使它的审核日期还要等上几周。这就是关键所在。
二者如何协同工作
有效期和新鲜度并不是相互竞争的。它们是相辅相成的:
有效期是治理层。它们创建了一个定期的人工审核周期。必须有人按计划查看该文档,并确认其仍然准确无误。这就抓住了自动化无法做到的事情--内容是否仍然正确,建议是否仍然合理,所描述的流程是否仍然反映现实。
新鲜度评分是监控层。它可以捕捉到审核日期之间的所有情况--断开的链接、翻译偏移、废弃的文档、当世界在变化而文档没有变化时发生的上下文衰减。
它们共同创建了一个系统,在这个系统中:
1.每份文档都由专人定期审核(过期作废) 2.在两次审查之间,自动信号会及时发现问题(新鲜度) 3.这两个系统都会提供一个大家都能看到的信任分数 4.该分数会影响文档在搜索中的排名,以及人工智能工具是否将其用作信息来源
评分的影响
这就是实用的地方。在 Rasepi 中,文档的新鲜度得分会直接影响其可见度:
- 80-100分:** 完全可见。正常出现在搜索结果中。有资格成为人工智能答案的来源。无标记。
- 得分 50-79:** 可见度降低。出现在搜索结果中,带有陈旧性指示器。人工智能工具可能会降低其作为来源的优先级。所有者会收到通知。
- 分数低于 50:** 标记。在搜索结果中的排名大幅下降。完全排除在人工智能答案之外。所有者收到紧急通知。
这就形成了一个反馈回路。当文档得分下降时,文档所有者就会被催促修复它--不是因为某个任意的日期到了,而是因为确实发生了什么变化。断开的链接、陈旧的翻译、下降的阅读量--这些都是需要现在就关注的真实信号,而不是六周后。
实例
让我们来看一个场景:
3 月 1 日: 您的 "事件响应手册 "得分为 92 分。两周前对其进行了审核,所有链接都有效,阅读率很高,所有四种语言版本都是最新的。
3月8日: 有人调整了工程状态页面。游戏手册中的三个 URL 现在可以重定向。新鲜度得分降至 78。所有者收到通知"检测到 3 个断开的链接。
3 月 10 日: 所有者修复了链接。得分回升到 89 分。
3月15日: 英文版更新了新的升级路径。法文和德文翻译已过时(内容哈希值不匹配)。得分降至 74。
3月17日: 翻译已更新。得分恢复到 91 分。
3月20日: 读者数据显示,日文版已有30天未被访问。得分降至 86 分。这是一个微妙的信号,但有迹可循。
**4月1日:**预定审核日期到来。由于读者信号仍然存在,得分保持在 86 分。
团队并没有等到审核日期才发现问题。新鲜度系统在几天内就能发现问题。审核日期提供了管理检查点。两个层面都在尽职尽责。
为什么 "只设定审核日期 "已经不够了?
五年前,有效期可能已经足够。文档是由人来阅读的,人们可以做出判断。如果文件看起来有点问题,他们会四处打听。
如今,文档是基础设施。它为人工智能工具、入职自动化、合规系统以及提供无上下文结果的搜索引擎提供支持。这些系统不做判断。它们按原样消费内容,并进行大规模再分发。
一份有断开链接和陈旧翻译的文档,如果距离审核日期还有三周时间,就会在这三周内造成巨大损失,尤其是当人工智能助手自信满满地根据文档提供答案时。
**有效期是文档治理的最低可行方法。当文档被无法独立思考的系统消耗时,新鲜度评分才是你所需要的。
开始
如果你已经在文档上标注了有效期(对你来说是件好事--说真的,大多数团队甚至都没有这么做),下面是如何对新鲜度进行分层的方法:
1.** 开始跟踪链接。** 对排名前 50 位的文档进行断链检查。这个数字可能会让你大吃一惊。 2.**如果您有多语言文档,请比较源文档和译文的最后编辑日期。有多少文件落后一个月以上? 3.**哪些文档的流量为零?是否还需要它们,还是应该将它们归档? 4.**如果你有一个内部人工智能助手,询问它从哪些文件中获取资源。然后检查这些文件的新鲜度。
你很可能会发现,技术上没有过期的文档存在很多问题,而过期日期是永远无法发现的。
有效期告诉你最近是否有人检查过文档。新鲜度告诉你文档现在是否健康。一个是日历事件。另一个是活的信号。
两者都需要。但如果你只有有效期,你就会在检查点之间盲目飞行。
文件不会在审核日期过期。文件过期是指文件内容发生变化,但没有人注意到。新鲜度评分会引起注意。
Rasepi 将强制到期日期与持续的新鲜度监测相结合。每份文档都能实时获得或失去信任分数。审查时无需等待,没有盲点,没有意外。
*本文是两部分系列文章中的第二部分。如果您还没有阅读,请从[第 1 部分:您的团队没有跟踪的指标](/en/blog/why-freshness-matters-more than ever/)开始。