
可信任算法正在茧房消解上发挥重要作用,作为一个日均更新为亿数量级的视频平台,抖音进化算法的动力更加迫切
短视频平台已经是人们生活中不可或缺的一部分,平台用户量超过10亿,但流量与算法之间的关系一直是一个神秘黑箱。今年1月,国内短视频平台抖音宣布,将推出10项措施,推动平台工作透明化,和算法向上向善。3月30日,抖音安全与信任中心网站(95152.douyin.com)上线试运行,网站面向社会公开抖音算法原理、社区规范、治理体系和用户服务机制。这个网站的特别之处在于,它是行业里首次公开推荐算法原理的平台,介绍其推荐算法如何预估用户行为概率,并通过多目标建模等方式来实现更优质、丰富的内容推荐。而算法需由平台治理体系对其进行约束和规范。网站也披露了抖音平台治理的审核流程,阐述平台如何应对谣言、网暴等违规内容带来的挑战。关于算法的讨论中,“信息茧房”是对算法机制最直接的攻击。“信息茧房”最早出现在凯斯·桑斯坦的《信息乌托邦》书中,是对博客时代“友情链接”功能带来观点单一的担心。在当下环境中,“信息茧房”已成为网络常用语,但含义已经发生变化,更多是用于描述信息同质化等现象。一些人认为,内容平台在推荐算法加持下,只给用户推送他们喜欢看的内容和观点,因而导致个体用户会处于“信息茧房”中。但这并非事实,“信息茧房”对于平台、用户和创作者来说都会带来伤害。用户抗拒信息茧房;一些创作者希望自己的内容能够被更多人看到,而不是永远停留在固定的用户圈层里;平台同样不喜欢,抖音实践发现,尽管多样性的推荐内容可能会在短期减少用户活跃度,但长期随着时间积累,算法会帮用户探索出更多兴趣,带来更多用户长期价值,因此抖音也想打破“信息茧房”。从技术视角看,这是推荐的精准性和多样性平衡的命题,需要在保证内容推荐效率的同时,不断调整推荐方向和节奏。因此,算法优化并非一蹴而就,需要长期持续优化调整,而算法公开是关键一步。抖音不断调整优化价值模型,希望实现内容、用户、作者以及平台的多方价值共赢。
爆款与算法
移动互联网时代,算法必不可少。在电商平台上,算法不仅为用户推荐商品,在商品配送和供应链环节都发挥作用。在外卖平台上,算法要结合天气、高峰时间段和交通等多重因素,优化业务链条。抖音平台上有大量用户和内容,更需要推荐算法。抖音算法工程师刘畅近期在与我们交流时介绍,抖音每一天的内容投稿量为亿数量级,但一个用户一天能观看的内容大约平均几百条,因此抖音需要很强的分发效率,才能够让用户找到自己感兴趣的内容,同时也能把内容分发给合适的用户,让用户和创作者都能在平台上有不错的体验。从外界视角来看,抖音上会出现郭有才等素人快速走红的“大爆款”内容。一些人认为,这是“平台造神”的结果,即平台为了保持流量热度不断推出新网红。从实际操作的视角看,平台没有动力和意愿去“造神”,也没有能力随便捧红一个人。此外,社交媒体平台普遍具备“去中心化”特征,用户不仅是信息接受者,也会用观看、点赞、评论等行为表达自己的偏好。这些内容偏好被算法捕捉后,才会被推荐给更多人。这种“去中心化”的推荐机制,实现了“用户对用户的推荐”,平台无法将全部流量集中到某个创作者,无法随意地将其打造成“神”。中国人民大学新闻学院发布报告称,媒体报道、热搜是网红“出圈”关键。报告对抖音网红涨粉数进行回归分析发现,是否上热搜能够显著影响网红的30天内涨粉情况,即上热搜能够助推涨粉并实现破圈传播。与此同时,一些抖音单月涨粉超过500万的创作者,如生活剧情博主“大圆哥”、母婴育儿博主“朱两只吖”,由于没上过热搜,缺乏主流媒体报道,则未能触及更广泛的圈层、为大众所熟知。短时间内走红的网红,或是新闻事件当事人,或有特殊的内容禀赋,具有不可预测性。艺人经济公司很难靠砸资源捧出真正的大明星,网红也没有明确的“造星”路径。一家头部MCN机构创始人认为,“头部网红自身有很强的特质,这是他的核心竞争力,一家机构再厉害,也复制不了李佳琦这样的网红。”此外,如果算法想捧谁就捧谁,平台可能会因此受到“反噬”,与某些网红的深度绑定,也容易为平台带来内容风险。
推荐算法原理
推荐算法的工作流程,一般包含召回、过滤、排序等环节,重点是学习用户行为。用户每次刷新,推荐算法启动的第一步是召回,即从候选内容池中快速捞取可能感兴趣的内容。然后,深度学习算法基于用户的历史行为,给每个用户形成一套专属的价值模型,模型会预测用户对候选视频的行为,结合用户行为和视频本身的价值权重,推算出视频推荐的价值分数,并将综合得出的价值最高的视频推送给用户。这个估算价值的模型,随着算法的进步,已近乎即时调整,用户每次动作,算法都会根据用户实际动作调整自己的参数,对各类价值重新加权,以更好满足用户需求。算法是工具,是为解决用户需求,打分的最终目标是用户长期价值。在那场交流中,刘畅提到,长期价值是抖音算法的“北极星指标”,而不是短期数据,“如果我们比较关注短期数据,那就会强化像点赞、完播这些短期好收集的信号,但如果我们关注用户的长期价值,我们就会看他对某些作者长期的一些互动,比如会不会经常去收藏某些内容,这些内容才是用户对平台长期认可的方式。”算法基于用户行为推荐,对可能发生的用户行为预测打分。图源:抖音安全与信任中心官网
比如,抖音平台上有一条长达450分钟的红楼梦解析视频,播放量超过3亿。在短视频平台,这条视频实在是太长了,长视频有一个特点,完播率大幅低于短视频。但从播放量看,这条视频的播放量是很好的。过去,不少人认为,完播率是算法推荐的核心权重,如果很少用户能够看完这条视频,算法可能会判定为低质量内容,不会推荐。这是片面的观点,这条450分钟的长视频的分享量、评论量和收藏量都很高,在多维度的打分标准下,得到了平台算法推荐。短视频分享平台有优化算法的迫切动力——推荐内容越丰富,越多元,用户长期留存率越大。“信息茧房”很多时候是要求算法足够精准,只推荐用户明确感兴趣的内容,这样能够在短期内获得高流量,但长期来看,用户也会因为内容单调而流失。抖音需要平衡算法的精准度和多样性。一方面,在一个日均更新为亿数量级的超级视频平台上,如果完全采用用户探索模式,获取信息的效率会非常低,需要算法主动做出推荐。另一方面,也需要基于用户的基本兴趣做多样性处理。为了更好地推荐内容,抖音还加大了对小众内容的扶持,对内容做“打散”,如果用户连续刷到类似的内容,算法会介入,控制相似内容出现的频次。不管推荐算法如何复杂,其工作的核心都是学习用户产生的行为反馈数据,并通过概率计算,将模型中推荐价值最高的视频推送给用户。但如果单纯依靠算法预判行为而不加约束,可能会带来不当内容泛滥等新问题。因此,还需要人工为其构筑多层“护栏”,避免算法对内容价值的“认知盲区”引发的问题。抖音平台通过五项举措来为算法设置“护栏”。第一,组建专门团队,负责对治理标准进行准入及准出的管理工作。第二,该团队设置了多项条款,并根据不同类型的内容制定对应标准。第三,不断迭代和评估相关标准。第四,持续对标准落地质量追踪和纠偏。第五,对用户和作者开展治理标准普及工作。去年,抖音建立了热点当事人核实机制和事件核实机制。平台会对热度较高,但有可能是摆拍演绎内容,和作者建立联系,沟通并确认真实情况到底是什么样的。

算法需要公开
算法是工具,需要根据应用场景不断优化调整,算法公开是优化算法的第一步。从2024年开始,抖音算法团队就不断讨论算法公开的可行性和具体方式,且已经将平台治理和算法透明度列为重点工作。抖音生态运营经理陈丹丹在近期的一次交流中提到,随着抖音平台越来越大,大家在业务实践过程中发现了很多问题,一方面,抖音需要弥补自己的短板;另一方面,也需要和外界做更多、更深入的沟通。通过提高透明度来营造一个可被信任的平台环境。信息爆炸时代,在海量信息中寻找自己所需的内容很多时候无异于大海捞针。据国际数据公司IDC发布的《数据时代2025》报告显示,全球每年产生的数据将从2018年的33 ZB(1 ZB等于10万亿亿个字节)增长到175 ZB,以25Mb/秒的下载速度计算,一个人下载全人类2025年产生的数据需要18亿年。具体到个人,面对的新增信息量,也从报纸时代的每天几十个版面、数百条新闻,增加到一个平台每天就有上亿条新内容,远超个人所能处理的极限。人们需要算法来做内容推荐,但如果算法是个“黑箱”,不可避免会带来包括茧房、信息诱导等担忧。算法公开可以帮助打破信息茧房,利于用户高效率获取信息;也能让公众更好理解算法,并参与到算法治理中,提出实际有效的建议。推荐算法本质上是一套信息分发系统,让信息匹配更高效。当代社会,信息流动效率越高的经济体,越具有竞争力和创新活力。推荐算法带来许多行业的新机遇,比如直播带货的主播,已经成为国家认证的新职业。这份工作背后已经有一套成熟的运作机制,而不是简单粗暴的靠算法发“彩票”。公开算法,让更多了解算法的运作机制,能够让内容、社交生态都进入一个更良性的循环。在提升信息获取效率之外,算法在很多时候也能带来社会价值。过去两年,有不少相对小众的旅游城市被大众熟知,包括山东淄博、甘肃天水等,很多本地人都没能看见的信息,被算法看到了。2023年9月,一条“探访三花剧团开放式化妆间”的短视频在抖音上火了,成都三花剧团当时经营困难,一度濒临倒闭,但这条视频让三花剧团在之后的三个月里,卖出了2.5万张票,比过去两年卖的票还多,也直接让这家剧团“起死回生”。2023年2月,甲骨文专业研究生李右溪发布了一条“挑战全网最冷门专业”的视频,当晚播放量过百万,而这也让她调整了职业发展方向,变成了一个知识博主,在抖音上科普甲骨文知识,目前粉丝数量超过90多万人,让这个曾经极度冷门的专业变得受欢迎。类似这样小众内容被看见的案例还有很多,比如乡村老师张建涛在抖音上学习物理实验,教孩子们成功发射了“水火箭”,他的视频又被更多人看到,一度带动了乡村学校研究“水火箭”实验热潮。重庆大学化学化工学院教授勾茜在抖音上科普星际化学知识,她希望通过这种方式把深奥的理科概念讲得通俗易懂,这样才会有更多人对冷门专业感兴趣,加入研究队伍。今天,在抖音上,我们能很容易找到水稻种植、菌菇培育的相关内容。中国中小农用户分布广,种植养殖种类众多,需要的技术门类繁杂,过去科研机构和农业企业推广、科普的过程中普遍面临成本高、人手不足的问题。短视频和直播的平台再加上算法的助力,能够让专业人士和农业同行们更好的交流。在抖音,目前有超过30万个果树嫁接的视频,播放量超过7.5亿。算法是技术工具,而非“幕后黑手”。了解算法,调整算法,优化算法,才能让算法持续向善。