更新我们在人工智能和仇恨语音检测方面的进展

作者:首席技术官迈克•斯科罗普夫

每天都变得更好。这是阻止仇恨演讲的意思。

Facebook今天发布的数据我们最新的社区标准执行报告都证明了技术正在以多种方式实现我们这个世界所需要的进步。2020年最后三个月,我们做了比以前更好的主动探测仇恨言论和欺凌和骚扰的内容- 97%仇恨言论被我们的自动化系统从Facebook被发现在任何人类标记之前,高于前一季度的94%和80.5%在2019年底。

更重要的是,这一比例比2017年末的24%有所上升,在如此大规模的技术部署中,我们很少看到这样的进步速度。从治疗疾病到生产更安全的汽车,新技术帮助解决了我们世界面临的最困难的问题,回顾这些时代,你会发现,随着技术的改进和改进,几十年来的进步是渐进的。

当我与建立AI系统的工程师交谈时,我听到了同样的稳定,持续改进的故事,这是可以防止仇恨言论和其他不需要的内容在互联网上传播的工程师。

如此令人鼓舞的是,AI的整个领域正在每月推进,导致每年都有戏剧性的收益。

在那些鼓励的顶级数字下面是稳步进展的故事,由AI技术推动,即使由于挑战的性质而发展,人们努力逃避我们的系统逃避检测。

其中一个示例是我们的系统现在检测到帖子评论中违反内容的方式。这在历史上是AI的挑战,因为确定评论是否违反了我们的政策通常取决于它回复的帖子的上下文。“这是一个很棒的消息”在帖子宣布孩子的诞生和爱人的死亡中,它可能意味着完全不同的东西。

在整个2020年,我们的工程师努力改进人工智能系统分析评论的方式,同时考虑评论本身和评论本身上下文。这需要更好,更深入地了解语言,以及结合帖子中包含的图像,文本和其他细节的分析能力。

如此重要的技术进步,这项工作并不革命而是进化。我们的团队汇集了更好的培训数据,更好的功能和更好的AI模型,以生产一个更好的系统,这些系统更好地分析了评论并从新数据中持续学习。这些努力的结果在今天发布的数字中显而易见 - 在2020年的前三个月,我们的系统发现了我们在任何人报告之前采取行动的欺凌和骚扰内容的16%。到年底,该数量增加到近49%,这意味着数百万额外的内容被检测到并删除了违反我们的政策之前。我们预计随着这一领域的技术领域继续前进,我们预计会发生更多的改进。

Facebook AI统计图表

另一个进度领域一直是我们的系统现在以多种语言操作的方式。在很大程度上在很大程度上介绍了我们的AI工具可以以西班牙语和阿拉伯语等广泛的语言检测违反内容的改进,所以讨论的仇恨讲话量达到2690万,比上一季度的2210万。

这些外语的进步是因为在过去的一年里,一整套人工智能技术取得了飞跃。我们之前写过林former,一个新的架构这使我们能够在更长更复杂的文本片段上训练人工智能模型,以及关于里约热内卢的新系统,它允许我们的内容审核工具不断学习和提高基于每天在Facebook上发布的新内容。

What makes me particularly proud is not just that these cutting-edge technologies are making our platforms better and safer — it’s that we’ve published the research behind them and released the code, enabling academic researchers and engineers across the industry to work with what we’ve built.

尽管有这些鼓励改进,但仍有很大努力。一个特定的焦点领域正在越好地在跨语言,文化和地理位置中观看内容。同样的单词通常可以被解释为良性或仇恨,具体取决于他们发表的位置,谁正在阅读他们,以及捕获这种细微差别的培训机器尤其具有挑战性。

但就像许多其他挑战一样,我们看到了持续的进步,人工智能能力的稳步增强没有放缓的迹象。虽然2020年是我们系统性能持续改善的一年,但在这一年里,我们的研究科学家也取得了根本性的突破,他们将以前所未有的速度从实验室进入我们的核心系统。我非常有信心,在未来的一年里,全新的技术将会被揭示出来,它们将与那些在2020年推动了如此多进步的技术结合起来。



为了帮助个性化内容,量身定制和测量广告,并提供更安全的体验,我们使用cookie。通过单击或导航网站,您同意通过Cookie允许您和关闭Facebook的信息集合。了解更多信息,包括可用控件:饼干政策