承泽观察 | 张俊妮:主动提升算法透明度有利于平台企业可持续发展

承泽观察 | 张俊妮:主动提升算法透明度有利于平台企业可持续发展
2022年08月22日 19:22 北京大学国家发展研究院

题记:2021年上半年,北京大学国家发展研究院建立了一个包括近20位教授的《平台经济创新与治理》课题组,对平台经济问题做了全面分析,课题报告《有序繁荣:平台经济的创新与治理》即将由中信出版社出版。为更好地分享对于平台经济的见解,特别是对一些最新发展的看法,课题组决定与中新经纬合作,推出系列评论文章《承泽观察·平台经济40评》。本文为北大国发院长聘副教授张俊妮的文章。

2021年3月召开的中央财经委员会第九次会议指出,近年来我国平台经济快速发展,在经济社会发展全局中的地位和作用日益突显。要着眼长远、兼顾当前,补齐短板、强化弱项,营造创新环境,解决突出矛盾和问题,推动平台经济规范健康持续发展。

时代呼吁平台企业更积极地履行社会责任。平台企业使用算法连接众多的利益相关者(如外卖平台上的消费者、餐饮企业、骑手),其履行社会责任的核心在于使用负责任的算法平衡和兼顾各利益相关者的利益。只有使用负责任的算法,平台企业才能获得利益相关者的认同和支持,从而获得可持续发展的动力。

提升算法透明度是实现负责任算法的第一步和关键一步。多个国家进行了相关的制度探索。例如,2021年5月,美国议会提出《算法正义与互联网平台透明度法案》(正在立法过程中),规定互联网平台需披露算法处理信息的方式方法以及信息的来源,发布透明度报告,使用户能够了解平台如何对内容进行审核以及如何使用算法推荐内容。2021年11月,英国内阁办公厅中央数字和数据办公室发布算法透明度标准。第一层信息要求提供算法工具的简短非技术性描述,概述该工具是什么以及使用该工具的原因;第二层信息要求提供更详细的技术信息,例如有关工具工作方式和工具使用数据的具体细节;2022年3月我国《互联网信息服务算法推荐管理规定》正式生效,要求算法推荐服务者对算法进行备案,以适当方式公示算法推荐服务的基本原理、目的意图和主要运行机制等。

目前我国关于算法透明度的法律法规尚不存在统一的执行标准,算法公示内容的详略程度主要由平台企业自行决定。然而,遵守法律法规仅仅是企业履行社会责任的最基本要求,有长远发展考量的平台企业不应坐等媒体披露或政府监管算法存在的问题,宜主动在更高水平上实现算法透明。

算法透明的一种思路是将算法代码透明化,但这种做法往往无法付诸实际。第一,这涉及平台企业的核心商业机密;第二,当前常用的算法基于深度学习等复杂模型,即使全部看了代码也无法了解算法的实际效果;第三,算法的实际效果在很大程度上依赖于用来训练算法的数据,但数据没有体现在代码中。

另一种思路着眼于算法输入和输出的透明,是更加实际的做法。首先需要阐明的就是算法的优化目标,它是平台企业如何权衡自己与各利益相关者利益的关键所在。这一点非常重要,我们将通过关于YouTube的实际案例进行详细说明。

2005至2011年,YouTube的算法向用户推荐视频时的优化目标是浏览量或点击量。这导致点击诱饵(如误导性标题)的激增,用户体验直线下降。2012年,YouTube将推荐系统调整为优化观看每段视频的时间和花费在平台上的总时间,以增加广告收入。然而,花费的时间不一定等于花费的高质量时间。2016年,YouTube开始优先考虑通过调查衡量的用户满意度,以及用户点击分享、喜欢和不喜欢等按钮这样的直接回应指标。2017年YouTube对推荐系统实施了更多更改,以阻止宣传包含煽动性宗教或种族优越论内容的视频。

然而,YouTube前计算机程序员纪尧姆·查斯洛(Guillaume Chaslot)认为,这些改变大多是表面上的,并没有从根本上改变算法中形成的一些令人不安的偏见。他编写了一个计算机程序进行调查。该程序模拟了一些没有任何观看历史记录的用户的行为,每位用户首先通过文字搜索找到一些视频,从中选择一个“种子”视频,然后按照推荐的视频链跟踪沿途的数据。查斯洛利用该程序探索了在美国、法国、英国和德国选举、全球变暖和大规模枪击事件期间YouTube推荐内容中的偏见。研究表明,YouTube系统地放大了分裂、耸人听闻和阴谋论的视频。2018年初,媒体报道了查斯洛的调查结果。作为回应,YouTube宣布将为视频标注新的信息标签,以努力打击阴谋论和鼓吹宣传。

2019年初,YouTube推出了30多项更改,旨在积极减少推荐边缘内容以及可能以有害方式误导用户的内容,例如宣传治疗一种严重疾病的虚假奇迹、声称地球是平的、或者对9·11之类的历史事件公然做出虚假声明的视频。这种变化依赖于机器学习和真人的结合。YouTube与人类评估人员和专家合作,帮助培训生成推荐内容的机器学习系统。这些评估人员接受使用公共指南的培训,并提供有关视频质量的关键输入。2019年底,YouTube宣布在美国,通过未订阅的推荐观看边缘或误导内容的平均时间减少了70%。2021年,YouTube将推荐中的边缘或误导内容的消费量大大降低到1%以下。YouTube通过官方博客持续公布对推荐系统的更改及其背后的逻辑。

在构建更负责任算法期间,YouTube在2018至2021年四年间广告收入年增长超过30%,在2021年获得了288亿美元广告收入,比2020年增长46%。YouTube付费订阅服务(YouTube Music和YouTube Premium)的用户在2020年达到3千万,在2021年达到5千万。

在YouTube的案例中,用户的核心诉求并不是依据瞬间的本能反应或自我沉溺去观看耸人听闻的视频,而是获取真实可靠有内涵的内容。当YouTube不着眼于通过让用户沉溺来获取更多收入,反而收入大幅上升。由此可见,平台企业仔细选择并主动公示与利益相关者核心诉求相关的优化目标,以及采取与其相适应的措施,不仅能大幅度改善算法的社会效益,也有助于平台的经济效益和可持续发展。例如,在一个外卖平台上,消费者的核心诉求可能是获得健康安全、美味营养的食物,骑手的核心诉求可能是在安全到达的前提下获得应有收入,餐饮企业的核心诉求可能是通过提升菜品味道和质量获得更多收入(而不是为争取排名靠前而疲于做满减、折扣等活动),平台算法的优化目标应该兼顾这些核心诉求,而不是着眼于平台自身的分成。一旦确定了合适的优化目标,查斯洛使用的模拟方法以及其他评估方法可用于平台企业自查或第三方独立评估,以及时发现与目标不符合的算法问题。

在提升算法透明度方面,平台企业还可以对算法训练、评估及选择中用到的数据、算法使用的技术、算法的运行效果等等进行说明。值得一提的是,2018年《哈佛商业评论》上的一篇文章指出,相对于低透明度而言,中等透明度显著增加了信任,过高透明度反而完全侵蚀了信任。用户不会信任黑箱算法,但他们不需要极高的透明度,不需要过度了解黑箱算法的细节。这意味着,平台企业无需着力于披露源代码或帮助用户阅读海量数据集,而应该努力提供关于驱动算法决策因素的基本洞察。

总而言之,通过主动提升算法透明度并进行持续改进,平台企业能获取其连接的众多利益相关者的满意和信任,在提升社会效益的同时实现自身的经济效益和可持续发展。

张俊妮,哈佛大学统计学博士,北大国发院统计学副教授(长聘)张俊妮老师的研究领域为贝叶斯人口统计学、因果推断、数据与文本挖掘

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部