抖音昨日公布谣言治理成绩单：引入大模型技术一年后，谣言被处置时的平均浏览量下降62%。"AI求真"功能通过识别、溯源、生成辟谣内容，在谣言扩散早期就介入干预。

抖音用大模型拦谣言,浏览量降62%

抖音昨天(5月25日)晚间公布了一份谣言治理成绩单:引入大模型技术一年后,谣言被处置时的平均浏览量下降62%。这个数字背后,是AI在内容审核领域的一次实战验证——不是事后删帖,而是在谣言扩散早期就介入干预。

62%意味着什么

平均浏览量下降62%,换个说法就是:同样一条谣言,在被平台处置时,看过的人只有以前的三分之一多一点。这个指标比"删除了多少条谣言"更有说服力,因为它直接反映了谣言的实际传播范围。

传统的人工审核模式下,一条谣言从发布到被举报、审核、处置,往往需要几个小时甚至更久。而在短视频平台上,几个小时足够让一条内容获得几十万甚至上百万的播放量。等人工介入时,谣言已经完成了第一波扩散,后续的辟谣成本会高得多。

大模型的优势在于速度和规模。它可以在内容发布后的几分钟内完成初步判断,标记出疑似谣言内容,然后触发进一步的核查流程。这种"早发现、早处置"的机制,直接压缩了谣言的传播窗口期。

"AI求真"怎么工作

抖音去年9月上线的"AI求真"功能,是这套谣言治理体系的前端入口。用户在浏览内容时,如果遇到容易产生误解的信息,或者主动搜索某个热点事件,系统会通过"求真卡"的形式,展示事件的完整信息和辟谣内容。

这个功能的技术链条大概是这样的:

内容识别:大模型扫描视频、文案、评论,识别出可能包含虚假信息的内容。这一步不仅看关键词,还要理解上下文语义,判断内容是否存在误导性表述。
事实核查:系统会去匹配权威信源的数据库,包括官方通报、新闻报道、科学文献等。如果发现内容与已知事实不符,就会触发预警。
辟谣内容生成:大模型根据权威信源,自动生成辟谣文案,总结事件的真实情况。这一步的关键是既要准确,又要通俗易懂,让普通用户能快速理解。
主动推送:对于已经在传播的谣言,系统会主动在相关内容下方展示"求真卡",或者在用户搜索相关关键词时置顶辟谣信息。

这套流程的核心是"主动干预"。传统模式下,用户需要自己去搜索、去辨别;现在是平台主动把辟谣信息推到用户面前,降低了信息不对称的程度。

大模型在内容审核的优势和局限

抖音这次公布的数据,其实验证了大模型在内容审核领域的几个核心能力:

语义理解能力。谣言往往不是简单的关键词堆砌,而是通过暗示、类比、断章取义等方式误导用户。比如"某地发现不明飞行物"这种表述,字面上没有任何违规词汇,但可能暗示外星人入侵。大模型可以理解这种隐含的误导性,而传统的关键词过滤做不到。

跨模态识别能力。短视频平台的内容是视频、音频、文字的组合。一条谣言可能视频画面是真实的,但配音或文案是虚假的;或者反过来,画面是拼接的,但文案看起来很正常。大模型可以综合分析多模态信息,发现这种不一致性。

规模化处理能力。抖音每天新增的内容量是天文数字,人工审核根本覆盖不过来。大模型可以在秒级完成海量内容的初筛,把可疑内容标记出来,再交给人工复核。这种"机器初筛+人工复核"的模式,既保证了效率,又保证了准确性。

但大模型也不是万能的。它的局限主要在两个方面:

对新型谣言的反应速度。大模型的判断依赖于训练数据和知识库。如果出现一个全新的谣言类型,或者涉及最新发生的事件,模型可能无法立即做出准确判断。这时候还是需要人工介入,更新知识库,重新训练模型。

对边界案例的处理。有些内容介于事实和谣言之间,比如未经证实的传闻、存在争议的观点、夸张但不完全虚假的表述。这种情况下,模型很难给出明确的判断,容易出现误判或漏判。

抖音这次公布的"十大辟谣案例",都是经过AI识别或处置的典型谣言。从案例来看,大模型在处理常见谣言类型(如灾害谣言、健康谣言、社会事件谣言)时,已经有了比较成熟的能力。但对于那些更隐蔽、更复杂的虚假信息,可能还需要持续优化。

行业趋势:从删帖到预防

抖音的这套做法,代表了内容平台谣言治理的一个新方向:从事后删帖,转向事前预防和事中干预。

过去几年,各大平台在内容审核上投入了大量人力,但效果一直不理想。原因很简单:谣言的传播速度远远快于审核速度。等平台发现并删除一条谣言时,它可能已经被转发了几万次,衍生出无数个变种。这时候再去辟谣,成本高、效果差。

大模型的引入,让平台有了"提前介入"的能力。它可以在谣言刚开始传播时就识别出来,通过降低推荐权重、添加辟谣标签、限制转发等方式,把谣言控制在小范围内。这种做法比事后删帖要温和,也更有效。

从技术路线上看,各家平台的做法大同小异。微信的"微信辟谣助手"、微博的"社区公告"、知乎的"辟谣功能",本质上都是在做类似的事情:用AI识别可疑内容,匹配权威信源,生成辟谣信息,主动推送给用户。

但抖音的特殊性在于,它是一个算法驱动的推荐平台。用户看到什么内容,完全由推荐算法决定。这意味着,平台不仅可以在内容层面做辟谣,还可以在分发层面做干预——直接降低谣言内容的曝光率,提高辟谣内容的曝光率。这种"算法+内容"的双重干预,可能是抖音能做到62%降幅的关键原因。

挑战:准确性和言论边界

大模型治理谣言,听起来很美好,但实际操作中有两个绕不开的问题。

第一个是准确性。AI判断一条内容是否为谣言,依据的是已有的知识库和训练数据。但现实世界是动态变化的,今天的"谣言"可能明天就被证实是真的;今天的"事实"可能明天就被推翻。如果模型过于激进,可能会误伤正常内容;如果过于保守,又可能漏掉真正的谣言。

抖音在这方面的做法是"人机结合"。AI负责初筛和标记,但最终的处置决策还是由人工做出。这种模式可以降低误判率,但也意味着无法完全自动化,人力成本依然存在。

第二个是言论边界。什么算谣言,什么算正常的观点表达,这个边界本身就很模糊。比如,对某个政策的批评性评论,算不算"不实信息"?对某个科学问题的非主流观点,算不算"伪科学"?如果平台的标准过于宽泛,可能会被质疑限制言论自由;如果标准过于狭窄,又可能无法有效遏制谣言传播。

这个问题没有标准答案。不同的平台、不同的文化背景、不同的法律环境,对言论边界的理解都不一样。抖音目前的做法是,优先处理那些明确违反法律法规、可能造成严重社会危害的谣言(如灾害谣言、健康谣言),对于争议性较大的内容,则采取"添加背景信息"而非直接删除的方式。

对开发者的启示

抖音的案例,对其他需要做内容审核的平台和开发者,有几点参考价值:

多模态理解是刚需。如果你的产品涉及用户生成内容(UGC),尤其是视频、图片等富媒体内容,单纯的文本审核已经不够用了。需要引入能够理解图像、音频、视频的模型,做跨模态的内容分析。

实时性很重要。谣言的传播是指数级的,晚一个小时介入,影响可能就扩大十倍。如果你的审核流程需要几个小时甚至一天,那基本上就是在做事后补救。需要优化审核流程,尽可能做到实时或准实时。

辟谣比删帖更有效。直接删除内容,可能会引发用户的反感,甚至被解读为"此地无银三百两"。更好的做法是保留内容,但添加辟谣信息,让用户自己判断。这种方式既尊重了用户的知情权,又达到了辟谣的目的。

人机结合是现阶段的最优解。完全依赖AI,准确性不够;完全依赖人工,成本太高。"AI初筛+人工复核"的模式,可以在效率和准确性之间找到平衡点。

从技术选型上看,如果你需要构建类似的内容审核系统,可以考虑以下几个方向:

多模态大模型:如GPT-4V、Claude 3、Gemini等,可以同时理解文本、图像、视频。
知识图谱:构建一个包含权威信源、历史辟谣案例的知识库,用于事实核查。
实时推理引擎:保证模型推理的延迟在秒级,满足实时审核的需求。
人工审核平台:为审核人员提供高效的工具,快速处理AI标记的可疑内容。

写在最后

抖音这次公布的数据,是大模型在内容治理领域的一次成功应用。62%的降幅,证明了AI在谣言识别和早期干预上的有效性。但这只是开始,不是终点。

谣言的形态在不断演化,AI的能力也需要持续迭代。未来可能会出现更隐蔽的虚假信息,比如深度伪造的视频、AI生成的虚假新闻、精心设计的信息操纵。这些新型威胁,需要更强大的AI能力来应对。

另一方面,如何在打击谣言和保护言论自由之间找到平衡,如何避免AI审核系统被滥用,如何让审核标准更加透明和可问责,这些问题同样重要。技术可以提高效率,但不能替代价值判断。

对于整个行业来说,抖音的案例提供了一个可参考的样本。但每个平台的情况不同,需要根据自己的用户特点、内容类型、法律环境,设计适合自己的治理方案。大模型是工具,不是万能药。怎么用好这个工具,考验的是平台的治理智慧。

参考来源

抖音:过去一年在谣言治理工作中引入大模型技术,谣言被处置时平均浏览量下降 62% - IT之家官方报道,包含抖音黑板报原文和"AI求真"功能介绍

抖音用大模型拦谣言，浏览量降62%