企业能使用的政府数据仅有7% |迈向公共数据开放利用的民主主义

企业能使用的政府数据仅有7% |迈向公共数据开放利用的民主主义
2024年09月25日 10:46 法大科技成果转化基地

公共数据开放利用制度的民主观及法理阐释

作者:高秦伟,中山大学法学院教授,博士生导师。杨振,中山大学法学院2020级博士研究生。来源:《甘肃社会科学》2024年第4期。

提  要

数字时代,公共数据开放利用制度的构建与完善成为深化数据要素市场化配置改革的关键举措。一直以来,公共数据以开放为重要方式,实践着民主法治的透明化和公平化的目标,提升了行政的合法性与效能。利用层面则是在数字时代之下充分发挥公共数据能够加强公民福祉,提升治理水平与促进产业发展的功效。在释放数据要素价值的当下,公共数据开放利用的民主观与法理在于既要坚持数据开放的固有内涵,以民主理念促进访问、共享,建构各种数据共享空间,为公众便利访问提供基础设施与条件;亦要强调数据再利用,以多样化的方式为社会提供公共数据,并实现与其他主体开展双向公平授权形成共享数据。公共数据的公平利用有益于形成有效和竞争性的市场,能够真正成为激活所有数据价值的引领性机制。树立公共数据开放利用制度的民主观有利于克服当前制度探索中的偏差,能够明确公共数据流通的法理本质,并切实发挥公共数据应有的作用。此种公共数据的民主观需要落实于公共数据的访问、共享与利用的整个过程,使数据真正具有可访问性、可用性与再利用的价值。

关 键 词:公共数据;民主观;公平访问;公平共享;公平利用;授权运营

健全数据基础制度,切实推动数据开放利用业已成为促进社会发展的关键性要素,也系2024年国务院政府工作报告的最新表述。国家发改委提请第十四届全国人大二次会议审查的《关于2023年国民经济和社会发展计划执行情况与2024年国民经济和社会发展计划草案的报告》,对近年来开展的公共数据开放利用的内涵再次重申。对此,学者分析认为公共数据开放利用系指对公共机构依法履职或提供公共服务过程中产生的数据进行加工处理再利用的过程,包括政务数据共享、公共数据开放、公共数据授权运营。这一阐释是对近年公共数据开放利用立法与实践的整合,颇具现实性。最近,作为国内首个省级“数据要素×”三年行动实施方案的《甘肃省“数据要素×”三年行动实施方案(2024—2026年)》公布,提出力争到2026年底,打造面向西部的区域性数据交易中心,建立较为完善的数据要素市场化配置制度体系等目标,强调加强公共数据资源供给政策激励,研究制定《甘肃省数据条例》《甘肃省公共数据授权运营管理办法》等政策措施,探索公共数据授权运营,向社会提供更多的数据产品和服务。作为数据要素的核心组成部分,公共数据体量极为巨大、类目繁多、价值较高,对于提升治理水平和促进产业发展均具有重大的推动作用,对公共数据进行开放利用、并以公共数据引领撬动各方数据的融合应用构成了数字时代的应有之义。然而实践中,中国的公共数据开放利用程度仍然较低,据估计企业使用的政府开放数据占比仅为7%;一些公共数据被少数企业获得且由此具有排他地位,难以惠及各方主体,与社会期待形成较大的差距。在理论层面上,虽然有关政府数据、公共数据研究的文献卷帙浩繁,但是对于公共数据价值释放的机制有哪些,共享、开放、利用的内涵及其关系是什么,可用于什么目的,相关的法理是什么?如何能够有效化解公共机关“开放意愿不强、担忧安全管理风险、技术能力不足”等困境,公共数据开放利用中如何回应其与公众的关系?如何化解公众对于公共数据授权运营的担忧?诸如此类的追问则缺乏较为系统的剖析,故而其均构成了本文的问题意识,在反思的基础之上提出公共数据开放利用的法理所在,希冀相关的探讨能够为公共数据开放利用提供一定的智识。

一、公共数据开放利用制度的流变与反思

“公共数据”的提法为近年来相关政策与立法所广泛使用,此前存在着政府信息、政务信息、政府数据、政务数据、公共信息等诸多表述。之所以如此,与学理上对信息、数据的关联与区隔有关,亦与制度演进、理论重述相联。更为重要的是在数据要素价值发挥的背景下,公共数据应如何作为,政策、立法上表述有所不同,如《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》《数字中国建设整体布局规划》等聚焦于公共数据的开放利用,而《全国一体化政务大数据体系建设指南》则侧重政务数据共享。虽然学理上对于公共数据的概念、内涵界定探讨文献较多,但多是从法律规范或者政策文件中推导而来,并未将之与公共数据如何有效释放价值的目标相关联,颇有由果导因之势;亦未深入反思目前力推的授权运营机制能否为公众提供公平利用机会的问题,难免结成无因之果。为厘清公共数据开放利用制度的法理,有必要对其演进加以系统梳理并反思。制度演进层面大致归纳为三个阶段,即政府信息公开、政府数据开放与公共数据开放利用阶段。值得注意的是三个阶段并非呈现出线性发展的趋势,彼此的互动至今赓续存在。

(一)政府信息公开阶段

此阶段本身历经多种形态,如从传统公共和重要记录的发布、官方统计的公开,以及在电子政务和开放政府计划下的政府信息公开。当然,这些形态并非完全相互替代。传统的公共和重要记录发布是国家或其地方政府将一些数据存储备查,例如出生、死亡证明、选举登记记录、犯罪记录,个人与企业许可、财产证明等。这些内容基本上系政府信息,通常会主动公开。传统的信息发布与政府数据开放的差异在于,前者一般是经过加工的、不完整的、非机读的形式,与后者开放的条件并不匹配。人类社会真正迈入政府信息公开阶段是自知情权确立而得以滥觞。知情权运动使得各国纷纷颁行信息公开法,以确保公众获取信息的权利并实现对政府的有效监督。公众依据信息公开法申请公开政府信息,目前已经成为世界各国的通行做法,中国亦不例外。此时的关切点在于政府如何平衡公众知情权和个人隐私、商业秘密、国家秘密之间的抵牾。因各国发展状态迥然相异,政府信息公开阶段遇到的挑战也不尽相同。以美国为例,大部分依据信息公开法要求政府信息公开的申请,均是基于商业原因而由企业所提出,从而构成了政府信息商业化利用的雏形。而就中国而言,多数情况下是由公民个人提起,目的在于保障自身权益不被侵害或者行使民主监督的权利。此阶段最为重要的特点是信息一旦公开,可以自由使用和再次传播,并无任何措施对公开后因信息使用而产生的影响隐私情形加以处理。此外,官方统计是政府制作和公布官方统计数据的行为,如人口普查记录、劳动力统计数据等,用以支持产业决定、公开透明和科学研究。

在电子政务与开放政府计划下,政府信息公开与政府数据开放形成了诸多重叠之处,两者均在于提升政府的透明度,使社会所有成员皆能够享受由公共资金产生与收集的信息所具有的经济和社会价值。政府信息公开主要以文档的形式存储,而政府数据开放则关注政府数据库中的数据,关注与获取相关的技术和法律问题,从而利用或再利用这些数据集。从政府数据库转向数据网络的广泛运用,这是所有国家在20世纪末开始面临的重要挑战。此前,行政机关通常将数据存储于孤立的系统之中,形成数据库及网络的应用则导致数据得以整合。1996年,欧盟颁布《数据库指令》用以保护相关的权利,但此种制度并未对产业形成有效激励,反而使欧盟数据库产业流向美国。多数观念认为政府数据开放应侧重于开放性和再利用的问题,故而最终导致“政府数据”成为一个相对开放的议题,渐次向公共数据的提法转向。总体而言,信息公开法主要在于促进政府透明运作并接受公众监督,不可避免的是,政府信息公开制度受到了网络信息技术的挑战,从而使之与政府数据开放利用建立了某种关联。如2004年,中共中央办公厅、国务院办公厅联合发布《关于加强信息资源开发利用工作的若干意见》提出要求通过健全政府信息公开制度加强开发利用政府数据。

(二)政府数据开放阶段

政府数据开放以开放政府、开放数据理念的兴起为肇端,开放意味着任何人均可基于任何目的自由地访问、使用以及分享信息和数据。包括依法公开、可批量下载、可机器阅读等。开放政府大致包括三个层面的内容:开放访问、开放数据、开放参与。三者之间存在一定的重叠,但开放访问建基于知情权,强调公众要求政府透明和问责的基本权利。随着技术发展以及开放政府的深入发展,开放数据政策受到重视并得以应用,导致政府必须以主动的态度来审视信息公开中的相关问题,比如先前是逐案式评估个人隐私保护的问题,如今则转变为事先、批量评估的方式,同时更加关注创新和经济发展的议题。2006年3月英国开启了全球政府开放数据的大幕。2009年5月,美国联邦政府开放数据平台上线运行,并拓展至世界多国。2012年6月,上海建立政府数据开放平台,中国由此确立政府数据开放制度。总体而言,政府数据开放制度是通过向所有人提供政府数据且不限制其复用,从而促进透明度、问责制和价值创造。通过鼓励数据集的使用、再利用和免费提供,政府促进了商业创新和以公民为中心的公共服务供给。政府数据开放平台是以默认开放、政府作为平台方式提供开放、民主、多样化的空间,以便实现数字社区参与。如今,行政机关越来越多地将其开放的政府数据门户作为沟通和反馈工具。由于政府缺乏相应的动力,实践中政府开放平台多被视为静态的网站、数据目标或由数据供应驱动的自上而下的平台而已,并非系能够促进创新、协作和知识共享实践的平台,而恰恰正是后一认知方可便于公众访问和数据共享。故而,开放的核心理念应在于要确立数据的可访问性,真正促进政府内部、政府与更为广泛的社会之间展开更高的协作,既实现透明、开放与问责,又向共享、合作与更高的公众参与演进。对于这一认知,亦可回应理论上关于政府信息公开与政府数据开放关系的探讨。目前学界持关联说或区别说两种观点,关联说强调两种制度之间的赓续,而区别说则说明政府数据开放为面向数字时代的新发展。本文倾向于承袭旧有制度基础,使民主与公平访问理念得以在新制度中延续,同时亦希望能够革新旧有制度,如关注政府对数据管理制度的革新,特别是应对政府信息公开中“主动公开”制度予以完善。

政府数据开放的过程中,政府数据共享问题也受到重视,致使实践中总是将开放共享同时提及。在技术发展、依法行政深化等背景下,中国政府数据共享确实取得了较大的成就。对于开放与共享的关系,有学者认为共享是与公共数据开放相对应的概念,特指行政机关之间共享数据的行为,而公共数据开放则是向其他社会主体开放数据的行为。事实上,两者关联度极高,没有政府数据共享并形成人口信息、法人单位信息、自然资源和空间地理信息、电子证照信息等基础数据库或者数据空间,便无法实现有效的公共数据开放。进一步分析,一些“主题领域”建设仅局限于政府部门之间数据共享而不关注社会主体需求的话,显然有悖于政府数据共享的目的。于是,政府数据共享进一步拓展的议题涉及到政府与企业数据共享的层面,如欧盟2020年发布《面向公众利益的企业对政府数据共享欧洲战略》,体现了欧洲对各类数据作为公共基础设施的关切。中国学界对政府从企业调取数据的方式进行了深入讨论,但对于政府履行公共服务职能,需要企业提供公共健康、生态环境、民生保障、道路交通等数据探讨较少。偶有研究指出为更好地保护企业权益,需要采用经济激励等有偿形式的混合性政策工具,在共享规则中设置具体的企业数据权益,才能切实推进政企数据共享。从域外的情形来看,共享不仅构成开放的前提,更是开放的核心本质所在。共享在形态上亦是数据发挥要素价值的重要方式,对于共享的方式,欧洲实践包括数据慈善模式(如为帮助政府更好地制定就业促进政策,领英主动向伦敦就业管理部门共享劳动力市场数据)、奖励模式(鼓励企业广泛参与相关数据共享并予以奖励)、中间人磋商模式(由可信的第三方汇集行业数据再向政府共享)、数据合伙模式等。与之对应的,美国有付费型数据共享、强制型数据共享、自愿型数据共享、合作型数据共享、协议型数据共享等模式。中国的问题在于模式单一,多为政府强制企业报送数据的规定,对于如何共享缺少多元化模式建构以及激励机制的讨论。

(三)公共数据开放利用阶段

《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》将数据分为公共数据、企业数据、个人数据三类,要求针对公共数据建立确权授权机制、全流程合规与规制体系以及价值收益分享方式。于是,公共数据授权运营以及深化对公共数据开发利用的工作便在国内渐次推进,一些政策文件直接采用“公共数据开发利用”的表述,足见这一阶段“利用”成为重点。此一阶段,既体现为一些地方先后将公共数据授权运营写入地方立法之中,形成了各具特色的政企合作运营模式;也体现为国务院部门开展了以行业为单位的公共数据授权运营探索,形成了如人力资源和社会保障部将社保数据授权金保信社保卡科技有限公司运营、中国气象局将气象数据授权北京天译科技有限公司运营等公共数据产品及相关服务,为公共数据价值释放提供了另类思路。2022年1月,《“十四五”数字经济发展规划》要求统筹公共数据开发利用,构建统一的国家公共数据开放平台和开发利用端口,并且针对公共数据提出“通过数据开放、特许开发、授权应用等方式,鼓励更多社会力量进行增值开发利用”。对于这些举措,学者们均表示肯定,认为公共数据治理不应仅聚焦于开放共享,还要强调利用、激活公共数据的价值。然而,在利益驱动下,有些地方将公共数据转换为“数据财政”,过于强调利益与回报,使原本基于公共数据开放机制运作不错的公共产品出现停摆;公共授权运营在一些地方甚至成为个别企业获利的垄断行为。考察欧美的做法更值得反思,美国作为公共数据开放较早实践者,强调所有主体均可访问与利用公共数据。欧盟于2019年将2003年制定的《公共部门信息再利用指令》修订更名为《开放数据与公共部门信息再利用指令》,指出公共部门信息再利用主要是指个人或法人为商业、非商业目的对公共部门信息进行利用。修法对公共数据收费的问题加以关注,起初,公共数据再利用实行收费,但修订之后一律改以边际成本的方式来计算,即公共部门信息供给以及数据提供方仅收取复制、供给及发布成本,不再包括投资回报的费用。此外,还规定要防止公共部门与私营机构达成排他性协议。值得注意的是,欧美实践中尚存在着社会公益组织等为公众提供基础性数据产品或服务的现象。

2015年国务院《关于促进大数据发展行动纲要》对政府数据价值的认知主要体现在数据共享层面,故而,2016年《政务信息资源共享管理暂行办法》主要用以规范政务信息资源共享行为,包括因履行职责需要使用其他政务部门政务信息资源和为其他政务部门提供政务信息资源的行为。虽然该办法第四章名为“共享信息的提供与使用”,但是使用者仅局限于政务部门。此种理念影响了彼时的地方立法,有关公共数据的地方立法多以开放、共享为重要内容,聚焦政府部门的数据共享。2019年《上海市公共数据开放暂行办法》较早规定了“数据利用”,内容略显单薄。此后,地方公共数据立法在数量上逐渐增多,名称上既涉及开放、共享,也涉及(开发)利用主题。此处需要反思的是:第一,立法对“开放”的认知不一致,可能影响透明度、公众参与等民主法治价值。有的认为是单向度公开,如《山西省政务数据管理与应用办法》用了两个条款分别规定开放与利用;有的则认为开放涵盖利用等诸多丰富的内涵,如《山东省公共数据开放办法》第2条第3款规定:“本办法所称公共数据开放,是指公共数据提供单位面向社会提供具备原始性、可机器读取、可进行社会化开发利用的数据集的公共服务。”亦有认为开放系数据的“提供”,如《江西省公共数据管理办法》第3条第2款规定:“本办法所称的公共数据开放,是指公共管理和服务机构面向社会提供具备原始性、可机器读取、可供社会化利用的数据集的公共服务。”其通过公共数据平台开放公共数据,“利用”则以“开放”为前提。有的虽然对开放、利用进行了区分,但仍然将开放与利用置于同一规范之内加以调整,如《广东省公共数据开放暂行办法》,其一方面认为公共数据开放是指公共管理和服务机构面向社会提供公共数据的公共服务;另一方面将开发利用也纳入调整范畴。第二,在开发利用方面,立法特别强调公共授权运营制度的构建,在一定程度上忽视了公平与民主共享的价值。其主要用以回应公共数据开发利用制度本身面临的诸多挑战,如数据供给水平、能力、意愿存在不足,授权机制不健全并缺乏规制,数据应用挖掘不足等。为此,2023年8月《浙江省公共数据授权运营管理办法(试行)》将公共数据授权运营定义为:指县级以上政府按程序依法授权法人或者非法人组织(以下统称授权运营单位),对授权的公共数据进行加工处理,开发形成数据产品和服务,并向社会提供的行为。由此在公共数据发挥价值方面形成了两种样态:公益性与市场性模式。公共数据开放系实现公益性的方式,授权运营为发挥市场作用的举措。亦有部分观点认为授权运营系公共数据开放的一种具体执行路径,为“数据开放的基础上引入企业力量进一步优化公共数据应用”。显然,两个层面及其滋生的问题在于既对开放利用本质未有深入研究,又对两者的关联未加关注有关,导致实践中无论是公平利用、民主共享还是激发价值等层面出现一定偏差,未来需将公共数据开放利用置于强调数据流通所具有的三大内涵,即访问、共享和(再)利用的背景下加以考量,方可使公共数据立法及其实践体系化、系统化。

二、公共数据开放制度的民主观

目前,数据业已成为数字时代的关键要素,逐渐融入生产生活各方面,深刻影响并重构着经济社会的运行和社会治理。国家数据局成立后便着手从顶层设计开始推动数据流通体系建设,强调数据基础设施的架构。应当讲数据基础设施不仅仅涵盖了技术中的硬件与软件,尚须囊括数据空间、数据流通安全等方面的规则与制度。通过数据基础设施的构建,不仅要从技术、组织、法律层面切实促进数据流通交易,更为关键的是要为数据要素价值的发挥提供“公共基础设施”。市场与社会主体可以依据这些基础设施开展多元化的行为和活动,公共数据开放毫无疑问地属于此类数据基础设施,在这一点上,同公共数据开放制度本身所具有的民主功效是相通的。公共数据开放制度的主要目标在于通过实施必要的数据治理机制,确保数据开放政策的发展创新以及可持续性,并在根本上保障公民对自己数据的可控制性。数据标准化和生产的高质量化能够使数据开放的有效性得以切实提升,以实现更大的社会、政府和商业创新,而对公民特别是利益相关者提供参与数据流通的机会,将会极大地提升对政府的信任度。由此可见,公共数据开放制度必须秉持民主观,完善政府职能、构建数据基础设施与保障公众参与机制,从访问形式到内容获取均应惠及所有民众。

(一)作为数据保管人的政府及其职能

政府作为数据保管人的角色定位,可以克减权属争议的困境并发挥积极行政的功效,对此,政府应特别推动公共部门之间的数据共享,并在数据管理机制上加以回应。这是因为,公共机关内部数据管理制度的完善对外部开放有着支撑性的作用,既决定着开放数据的范围,更影响开放数据的质量,“政府部门只有将内部数据以共享、交换、分析、使用为主的内循环与外部运营的外循环结合,才能真正地发掘公共数据在促进经济社会发展方面的作用”。在政府信息公开阶段,政府仅关注将信息提供给公众的最终环节,却忽视了对政府信息收集、加工和储存等环节的规范管理。这体现在中国,至少从法律规范层面来讲,无论是《党政机关公文处理工作条例》,还是《档案法》《保守国家秘密法》《档案法实施办法》等,均未能与《政府信息公开条例》有效衔接。一般而言,政府信息管理的过程大致分为信息收集、加工、存储、开放、利用等步骤。在中国,由于缺少统一、常设性的管理机构,政府信息管理表现为缺乏协调与监督,壁垒林立,无统一标准、目标、指导思想,管理相对混乱。行政机关之间信息缺乏共享,信息的产生、加工、存储、利用、传播多数情况下并非同一机关或者同一机关内同一部门实施,不同职能、不同地域、不同级别的行政机关存在信息基础设施重复建设的情况。对公众而言,信息重复收集、多处保存现象时有发生。信息加工程度完全取决于行政机关的意愿,对公众需求漠视。信息利用的方式亦不规范,更难言根据不同信息而差异化利用。故而,唯有切实加强政府信息与公共数据的规范化管理,注重政府公文档案的一体化管理趋势,实现公文档案管理与信息公开、数据开放有效衔接,才能从根本上保障公民的信息获取权利,恢复政府在信息市场中的优势地位,提升政府的公信力。此外,对于权属问题,一些地方立法明确将政务数据属性界定为“国家所有”,但是却难以从法理上解答根本性的争议问题,因为其中尚包括大量的个人数据、企业数据;即使纯粹由政府自行制作且并不涉及个人与企业数据,至少目前数据的所有权问题仍然处于探索时期,武断地做出结论反而不利于数据的公平获取与使用。

政府作为数据保管人,需要关注公共数据的可访问性、可用性,须为数据再利用提供相关的支持。数据可访问性是衡量政府对于可理解数据(如开放许可、元数据)的无限制访问的正式要求,生态系统和平台在确保数据质量方面的作用,以及此类数据发布后数据可访问要求的实际实施情况。确保访问性是为了改善用户使用公共数据的体验,是为了让每个人均能够公平地获得公共数据,并实现所有可能的目的。可访问性要求促进不受限制地访问可用的数据,利益相关方参与数据质量和完整性及其实施机制。一般包括确保数据应当主动开放(即无须正式请求公布)、及时开放(及时更新或实时开放),并且数据对用户和机器而言均是可理解和可再利用的(如通过使用元数据描述、通用标准和API接口)。否则的话,开放数据仅仅是一种装饰,难以真正满足完全开放的标准要求。公共数据开放制度的建设意味着政府应当努力提高数据的可访问性,理想的情况是制定正式的标准要求,以确保开放和共享时,以开放许可证、再利用模式以及相关元数据免费提供公共数据,并及时和以分门别类的方式加以实施。当前,绝大多数国家都要求以机器可读的格式免费提供数据,并提供开放的许可证。如自2017年颁布《电子政府法》以来,德国一直在为提升数据可访问性作出努力。该法第12条要求德国联邦行政机关免费提供机器可读格式的数据,对元数据加以说明,并且可以不受限制地再利用。此外,该法规定开放数据时用户不应被要求注册或者证明他们希望再利用从联邦数据开放平台上获得的公共数据的原因。对访问的准确认知,可以使公共数据开放制度的目标与公众在数据方面的需求达致平衡。数据的可用性在于使政府有能力成为促进者,为多元主体合作提供平台。当今社会、经济和政府的数字化转型中,越来越多的私人、公共行为者将其数据作为开放数据向公众发布,这些开放数据集可以在数据流增加的基础上促进更加民主、合作和创新的社会的实现。公共数据开放可以减少数据垄断并解决市场失灵,是朝着数据共享、流通环境迈出的第一步。政府对数据再利用的支持是衡量政府在促进公共数据再利用方面发挥作用的程度,主要涉及数据促进方案和伙伴关系、能力建设以及监测和评估政策实施的机制。对于数据再利用的问题,各国采取的理念并不完全一致。美国坚持以开放为原则对数据开发利用持自由放任态度,欧盟则以规制为导向审慎推进。中国政府一方面鼓励各地方各部门大胆探索,结合具体实际开拓创新,完善公共数据开放的模式;另一方面,则需要结合公共数据的特点,不断优化顶层设计,既要关注从政府信息公开向公共数据开放利用的转变,以经济价值的考量为重要取向,又要坚持民主观念,要对共享、开放、利用等术语加以明确化,并通过修订相关法律规范健全公共数据治理机制。

(二)作为基础设施的公共数据开放

公共数据是民主法治制度的基础,公众只有依靠来源可靠、质量良好的数据才能够做出正确而合理的判断。政府应当依靠公共数据的充分开放,确保数据更易于访问和利用,关切所有的人并保护其隐私,使数据竞争的环境更为民主与法治化。为此,欧盟很早就提出“普遍的再利用权”作为公共数据开放利用的权利基础。要实现这种利用权,公共数据开放制度的一项重要任务就在于让所有人能够访问与获取数据,也即此时公共数据应当作为一种基础设施而存在,既方便公众访问、利用,亦有利于作为基础设施验证其他数据来源,或者为其他数据流通提供利用前提、安全保障等功能。与政府信息公开制度相比,公共数据开放制度的重点在于公开数据集而非单项信息,强调利用价值,但是如果一味强调两者的差异,将会忽视公共数据开放利用制度中“开放”因素,特别是对“访问”本质的关切及制度建构,最终导致政府日渐漠视透明度、个人权利的保障。当然,仅仅重视“开放”或者简单开放数据集,而不去与时并进地再发展“开放”的具体模式,反而也会分散公众对透明度的注意力。随着数字时代的到来,大量结构化、半结构化以及非结构化的数据不断呈指数级地增长,对这些数据的检索、分析、挖掘以及可视化的前提是技术的应用,同时,尚须关注“共享”理念的实现机制。否则,“这极易造成收集的信息量远超有效使用量。这即是所谓‘信息(数据)鸿沟’。政府数据并不是单纯地公布即可,大量如洪水般的信息涌入不仅不能实现公开、开发和利用政府数据的目的,反而会产生信息雪崩现象,事与愿违”。故而,公共数据开放、政府信息公开、公共数据共享、公共数据利用等概念之间既有分工,也需关联合作,强调制度演进性,才能够切实回应公众的多元化需求。

强调将公共数据开放作为数据公共基础设施而存在,是否会出现“公地悲剧”的现象?公地悲剧理论系针对消耗性与竞争性的资源而展开的讨论,对于公共数据并不会造成此种现象,反而会在一定程度形成“反公地悲剧”的效果。如前所述,公共数据是民主制度的基础,政府的任务之一就是为数据提供公平的竞争环境。对于政府而言,公共数据开放的益处在于提升政府与公众互动的质量,如利用数据并开发应用程序,共同发展和提供服务,从而使得政府获得更多的合法性。公共数据开放对于政府内部的合作亦有促进作用,数据共享的质量切实得到提升。对于公民而言,由政府外部开发并提供公共服务,显然能够节约财政支出、更为针对用户需求和更加灵活。公共数据开放的本质并不是使拥有数据访问权的企业拥有竞争优势,真正的竞争优势在于基于数据所提供创新的增值服务,以及为初创企业提供的机会。公共数据开放的兴起,正在成为公民自我赋权、更高数字参与度和公众参与度的关键促成因素和驱动因素。公民可以与政府就许多问题展开实质性地沟通,依赖数据作出更明智的决定,以提高他们自身的生活质量。同时,各方主体也在为公共利益生产数据。政府因此需要建立一个更为包容的“公共”数据基础设施,使数据更加民主化。为了满足各方主体多元化的需求,政府既需要建立一个全国性的组织结构,也需要与当地社区建立联系,让地区、社区建立自己的数据空间,进而促进善治的实现。总之,面对当前数据开放与透明度存在着巨大障碍的困境之时,需要对过时的数据治理体系加以重塑。政府不能为了利用而忽视公民个人的访问权,政府数据开放制度至少在权利设置或者目标设定时需要关注两项重要的内容:一是为了公民的权益提高透明度;二是应当加强公共和私营部门之间的协同,以帮助创建一个有竞争力的数据市场。公共数据本身独有的特性应当成为思考、构建其开放利用法理的前提,将之定位于国家所有或者类比自然资源,有一定的积极意义,但是国家所有过于强调利用与经营的因素,势必淡化公共数据开放作为基础设施的定位;类比自然资源则过于突出个别主体的控制与垄断行为,难以兼顾所有公众的公平访问、共享与利用权。

(三)公共数据开放中的公众参与

公共数据开放制度的运行涵盖以下内容:首先要了解公共数据的存在;其次则要提高数据透明度,改善开放的参与程度;最后加强开放合作,从而实现普遍的参与。因而可以看出公共数据开放的意图更在于朝着更高层次的公众参与迈进,本质为“开放型参与”“开放型合作”机制,其中数据透明与了解决公众需求可谓先决条件。为此,公共数据开放制度要为公众识别更高价值、高影响度的数据;在准确性、一致性和及时性方面改进与确保数据质量;促进不同参与者的数据需求和利用的实现。要了解公众的需求,并对公众和社会利用数据的案例加以广泛宣传,从而提升对开放数据益处的认知。开放数据可以为利益相关者参与提供新的数据来源、新的视角与更有意义的参与,数据利用固然可以建立有效的数据市场,但结果依然是为了公共数据的收集、开放、共享提供新的方式或者资金与创新动力。故而,公共数据开放对于公民充分参与民主社会和了解其权利、义务的程度至关重要,一个人参与社会、经济或者政治进程的能力在很大程度上取决于其能收集到的关于这些进程的数据以及处理这些数据的方式。对于公共数据开放中的公众参与问题,应当强调建立以公众需求为导向的制度理论,无论是数据开放的范围与广度,均应满足公众的需求;应强调公众全过程参与,建立反馈机制,强调与政府互动,不断提升数据质量;促进公众参与数据利用,激励社会创新。目前,与公共数据开放相伴随的是,许多商业或者非营利机构也在以某种方式向公民提供公共数据,并为他们创造价值。这些机构按照所获取的公共数据的原格式或以有价值的利用方式将其提供给最终的用户,此种重新包装的提供方式是建立于对公众需求分析基础之上的增值服务。这种公私合作的方式更能够激发公众的兴趣、设计想法和实验动力,更能够最大限度地提高数据的公共价值。同时,许多商业或者非营利机构也在以某种方式向公民提供自身的数据,以解决具体的问题。对于这两种类型,政府应关注数据的及时性与共享规则的建构,使公众更为积极地访问与利用这些数据。

从实际的情形来看,各国公共数据开放制度均极为重视与公众的有效互动。如美国联邦政府经常会邀请公众、软件开发者和企业家聚集于一起,共同利用公开数据构建和塑造新的方案,以解决美国社区、城市、州以及联邦面临的现实挑战。美国各级政府数据开放平台在建设中强调以用户为中心,时刻追踪用户感受。英国政府经常举办有关数据开放的比赛,收集公众的意见等。政府在开放数据之时应从公众即用户需求出发,及时回应用户反馈,才能有针对性地开放数据。开放参与意味着公众广泛参与政府的活动,而且积极利用网络工具介入行政过程。网络和信息技术的发展导致知识的创建和传播实现了“民主化”的趋势,信息加工变得更加容易,通过网络的获取也极为方便,“数据或信息开放(公开)的目的都包含政治诉求(公众知情权)和经济利益。同时开放性、可机读性等不仅是开放数据,也是现有技术条件下实现信息公开(自由)的基本要求”。总之,数字时代使公众能够更加平等地访问公共数据,积极参与行政过程。政府亦要能动地了解公众迫切需要的、再利用价值高的如交通、民生、环境、健康等数据,持续提升数据质量;不断扩大数据开放的程度和范围,简化数据开放的程序,建立高价值数据集服务民生的机制;加强政府部门和公众之间的互动交流与开放数据利用的成效评估和反馈。

三、公共数据利用制度的民主观

公共数据开放从运行伊始便与利用密不可分,两者融合既切实增强政府问责,又激发多方主体再利用数据并加以创新,为经济社会发展提供契机。如2020年4月以来,大量开放的公共数据通过数据仓库、门户网站、数据可视化工具等形式及时分享健康服务等重要信息,公共数据利用的成效显而易见。韩国私营企业利用公共数据向社会提供有关商店位置和生活用品的相关信息,实现了个性化的服务。再如法国政府部门开放了与失业相关、之前未能充分利用的公共数据,非营利组织使用算法开发了一个以公民为主导的数字服务应用程序,效果良好。公共数据利用制度受到各级政府高度重视,然而,该制度在运行过程中依然存在着一定的不足,如有学者指出公共数据并未在合理程度内以便捷的形式实现有效公开,限制了公众充分利用公共数据的能力。亦有学者表示公共数据开发利用并未全面发挥产业革新的引领作用。那么,公共数据利用制度需要什么样的法理,与公共数据开放如何实现既分工又关联呢?应当讲,公共数据利用仍然应当坚持民主观,在追求公共利益实现的前提下形成多样化的公私数据共享方式,关联访问、共享与利用的协作性,并完善利用规则。

(一)公私数据共享

数字时代鼓励民主的复兴,同时将直接民主和审议民主置于核心地位,导致公共数据不断得以高质量开放;而同时,在线平台更是允许政府与公众互动,并广泛开放自身的数据,为利益相关者的透明度和参与度创造新的可能性。从这个意义上讲,各国政府正在朝着开放政府、公共利益至上、支持民主和包容性增长的目标行进。公共数据利用的民主观意在提升公民和政府之间的信任,可以抑制新的数据鸿沟形成,遏制数据过载,防止公共部门数据能力欠缺,弥补数据提供和更新不足等弊端。民主观要求公共数据必须具有可访问性、可用性与再利用性,为此必须提供整个数据集,而且最好是免费的(或者不超过合理的复制成本),并可通过网络下载或者接口访问。民主观可以化解因数据权属滋生的争议,避免产生经济排斥的新形式。为了增强公众获取数据的权利,许多国家修正了既有的信息公开法,并附有实践守则,对与数据集可再利用相关的争议问题向申请人、公共机关提供指导。如前所述,开放的问题与共享关联较大,事实上利用的问题亦与共享形成了纽带,特别是公私数据共享既是公共数据开放的重要形式,也是公共数据利用的典型方式。

数字时代,经济、社会和政府的数字化转型得以渐次展开,相较于过去,越来越多的私人和非政府组织为追求公共利益将其数据作为公开数据向公众开放。例如优步平台公布了10亿次出行汇总数据,为城市规划制定提供辅助;世界银行的开放式发展数据亦是如此,目标在于为全球供给免费、公开的各国发展数据。数据开放平台不再仅仅被视为网站、数据清单或目录、自上而下的数据供应源,而应将其视为多元数字社区开放和民主参与、创新、协作和知识共享的空间,如此开放的“公共”数据更有助于使政府成为一个数据访问、共享与利用的平台。近年来,数据价值共创是多方主体间数据共享与利用的指导理念。如学者提出对于公共数据治理要展开“公共的”数据治理,这里的“公共的”应以实现公共价值创造为最终目的与导向。进而,亦有学者分析认为企业数据包含了大量基于个人同意或者其他企业授权取得的数据,质言之是一种“共创数据”,具有公共属性;同时企业因参与公共服务获得的数据亦具有一定的公共属性,如网约车、共享单车等获取的数据,根植于公共空间、事关公共服务供给,本质上亦具有公共属性。所以,国外许多企业均会将数据共享给政府或者社会组织,实现价值创造。如前所述,公私数据共享的模式多种多样,以下几种值得特别关注。数据慈善模式是指企业出于公共利益目的,在自愿的基础上将原始数据等企业数据免费向政府共享。数据协作模式是指企业和政府通过数据交换实现共创价值,包括公共接口、可信中介机构、数据池、应用竞争等形式。数据采购模式是政府与企业签订数据采购合同,从而获得企业数据。数据征用模式,也称强制数据共享,基于规制、税收或统计等公共目的,需要强制调取企业数据。此外,数据共享空间(data commons)的实践亦值得关注,其早期由医疗、科研等机构发起,如今则推广至诸多领域,能够为用户提供精确的数据资源和有力的决策支持。数据共享空间为各个方面共享有效数据集、信息和知识提供了载体,在本质上是一种多元主体共同开发的数据共享方式,特别强调用户需求定位及深化服务内容。目前在交通、投诉举报、餐饮、住房、建设项目等领域均有数据开放标准,且多是由私人主导。行文至此,从法理层面上可以对公共数据的提法做出回应,即“公共”一词应被理解为全社会或整个社区、地方单元或者国家,开放或供所有人使用、共享或公用的意思。也就是说,为了公共利益,公共数据有时也涉及其他主体的数据,很难在权属讲完全归于政府。

(二)公平利用与公平访问、共享

学者分析认为如果公共数据仅为个别主体所获取和利用,将带来数据垄断与不正当竞争的问题,而公平利用权可以确保公众充分参与利用公共数据。该观点与《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》指出数据基础制度建设应“促全体人民共享数字经济发展红利”的精神相一致,这就要求在制度设计之时不仅要考虑利益与收益,同时更要关注公平及其实现机制,例如要保障普通公众、中小企业对数据的利用机会。亦有学者指出公平利用权主要针对公开数据,利用的重点应放在公共数据使用的规则构建上,从而形成公平的公共数据利用法规范秩序。政府信息公开意在满足公众知情权和增强政府透明度,政府数据开放则更为积极,既提供公共服务,又在保障于公众参与权。两者是社会发展的不同阶段的产物,既有关联又有差异,在行政法学体系中皆可置于“行政信息管理”的框架下展开讨论。然而,行政法学对此问题关注较少,进入21世纪之后,才有一些教材对其加以研究。在讨论中,除了对传统的信息公开关注外,至少还应当包括行政机关信息管理、个人信息保护、数据开放利用等问题,而且更要对这些制度之间的相互关系加以重点研究。学者与实务界对利用予以了关注,指出存在政府单独开发利用(强调公开、公益,维护公众的权益与社会公平)、公私合作(弥补财政负担,质量较好)、民营化开发利用(充分依靠市场)等样态。亦有学者指出开放数据运动扩展了公共信息再利用空间,特别使再利用内容、方法与技术手段更加丰富。由于缺乏整体性认知,利用制度的设计过于强调政府的参与性。应当讲政府的主要作用在于培育市场,而非经营市场;在于将数据“提供”出来,而非亲自参与数据流通。基于此,为提升效率并促进数据供给,目前政府可以考虑对于一些高价值数据多掌握于政府部门或者相关事业单位手中的现状,与多元主体进行协作建立数据空间,从而由数据空间对接市场、社会,切实体现公平性。

公平利用权的实现,首先在于对公平本质的把握。信息技术加剧了社会中的不平等并由此形成数字鸿沟,公共数据利用制度需要对此回应。如欧盟保障中小企业利用机会、对公共数据收费的调适以及美国A-130号通告等均在强调机会平等。其次要从利用的目的加以讨论。公共数据利用意在激活数据(特别是公共数据)的价值,建立数据市场,创造更多的就业、更公平的竞争环境以及更少的合规成本等,那么公共部门自身利益的重视以及由此产生的狭隘的“数据财政”观念便不可取。政府应当从人人均能访问、获取、提升开发潜力、促进公平竞争方面着力,在这一点上,公平利用需要与公平访问、公平共享齐头并进,单纯强调任何一个要素均不利于公共数据开放利用制度的协同发展,亦无助于公平利用权的最终实现。再次政府需要建立高价值数据空间,并辅以公平利用的规则,才能最终实现任何人均可以自由访问、共享与再利用的目标。公共数据治理要以信息生命周期为全过程,注重从信息获取、数据开放、数据利用等重要环节加以协调和展开。学者指出政府要关注数据采集汇聚法律制度,认为其系政府数据开放的“上游”问题。由此可见,仅强调公平利用权未必充分,公共数据开放利用制度要想发挥应有的作用,就必须与公平访问、公平共享的权利共同发力,如此才可以使公众个人拥有对数据的决定权,使数据具有可访问性、可用性及可利用性;方可使公共数据利用摆脱完全商业化的桎梏,以多元化的取向实现公共价值。公平访问与公平利用息息相关,强调公共数据开放的方式要基于用户友好型界面,方便所有用户能够便利、快捷、无障碍地访问,除非是用于统计、调控等目的,否则一般无须强制用户实名注册便可访问;不能够拒绝批量下载要求和声明数据反爬取。公平共享与公平利用一脉相连,其既作为公平利用的一种方式,又为公共利益背景下数据整合提供了框架,让更多的数据得以发现,以缩减数据不对称的瑕玼,从而为利用奠定坚实的基础。当然,公平利用更是构成了公共数据利用制度的核心内容,既然是政府有意培育市场,便需要恪守公平竞争的规则,不得限缩利用范围和主体。

(三)默认开放原则与授权运营的协调

数据默认开放原则是以促进公共数据最大程度的开放为目的,便于数据访问、共享与利用用。这一原则受到域外推崇,如美国《开放政府数据法》便予以了规定,本质在于摆脱公共数据权属的纠结而转向强调公共数据的访问、共享与利用权。数据访问权强化了对数据的公平共享与利用,故而该原则认为公共数据的供给应当是一种公共服务与给付。一般情形下,政府尽量不直接参与到公共数据开发利用的经营活动之中,因为公共数据具有公益性与非物质性,所以本身并不存在构成所有权所必需的市场性“稀缺性”,进而也不存在所有权设置的基础。中国学者使用“国家所有”的观点试图化解公共数据所有权的争议,同时认为国家负有保障公共数据合理利用的义务,从而为国家机关之间公共数据共享、公民向国家主张公共数据开放提供了宪法上的依据,但该主张却难以充分保障公共数据的“公共性”。王锡锌、黄智杰两位学者主张的公平利用权在于机会均等,而丁晓东则倡导将数据视为权益混同的聚合型财产,通过行为规制与数据治理实现数据公平利用。那么沿着前者的思路,只要公共机关平等地为各方主体提供公共数据利用的机会,就可以实现所谓的“公平利用权”,而问题在于这一权利的达成严重地依赖于公共机关提供的数据的范围、方式。后者的思路则针对(用户或企业)数据生产如何与利用达致公平,如欧盟《数据法》强调默认情况下用户就能轻松、安全地访问其产生的数据,如果受到技术与场景等的限制,用户难以从产品中直接获取数据的话,数据持有者应当及时向用户免费提供使用产品或相关服务所产生的数据,在可行的情况下,此种提供应当具有连续性与实时性。用户还可以提出请求将自己的数据提供给第三方,数据持有者应“以公平、合理、非歧视的条件和透明的方式”向数据接收者提供数据。但企业认为将用户认定为数据生产者并不公平,并障碍数据的开发利用,数据显然是由多个主体共同形成的产物。一项制度存在争议在所难免,关键的问题在于其为个体确立了能够控制自己数据的权利机制则值得重视。当然,这并不意味着不对企业数据加以保护,一方面企业本身就在各方面比个人能够获得更好保护,另一方面保护个人用户则可防止对数据先占者的过度保护,并鼓励所有人能够形成数据利他主义的观念。由此,丁晓东主张制度设计的重要性,从而实现市场竞争秩序公平与数据公共治理公平,因应数据特征,在数据利用的制度规范上应以数据共享制度的构建为重心。对公共数据开放利用而言,难以形成个体控制数据的权利,于是共享制度的建构尤其值得重视。不过,也不能因此不去关注公众个人的权利,此种权利将迫使公共机关在访问、共享以及利用方面形成一定的规则供给。这里值得一提的是,强调公共数据公平访问权应当是公共数据开放利用中的首要任务,因为许多公共部门并不愿意开放、共享数据,从而限制了数据在其他市场的进一步利用。除构建激励措施外,确立透明度的要求、共享价值创造的原则、尊重彼此利益、确保竞争、最小化数据锁定(即尽可能允许并实现数据可移植性)等要求亦值得关注。与之配套的是需要结合相应的技术措施,以识别数据来源的可靠性,从而增加信任和利益共享。这需要发展能够追踪和链接数据来源的技术解决方案,以便检查数据的完整性,并与原始来源共享数据的再利用之间形成更大的价值。此种价值又将促进访问、共享数据的意愿,持续实现共享价值创造。要使用默认合同规则共享机器生成的数据,如出于统计、环境或交通管理目的等公共利益需要访问机器生成数据,可使用合同来达成企业与政府之间数据共享。此种共享要符合比例、目的限制原则,要制定数据再利用的规则,减轻私营部门数据共享的成本,提升透明度并激发公众积极参与。

在中国,需要与默认开放原则相协调的是当前各级政府力推的公共数据授权运营机制。根据学者总结,目前中国公共数据授权运营模式主要有三种:一是集中模式。主要由政府集中授权一家国有企业作为数据运营方,在数据主管部门监督管理下,开展政府数据管理平台建设和数据开发利用工作,并形成可流通的数据产品和服务。二是总分模式。主要按行业领域划分,由各政府部门分别授权一家国有企业作为领域型数据运营方,在数据主管部门的监督下,多家领域公共数据运营方共同运行,分领域对公共数据开展市场化增值服务。所谓总分是针对数据主管部门与行业主管部门之间的关系而言的,前者统筹建设统一的政府数据运营管理平台,后者则指导各领域运营。三是管运分离模式,即数据主管部门制定数据开发利用相关管理制度,统筹建设本区域内统一的政府数据运营管理平台,并通过政府集中授权方式,引入一家国有企业作为政府数据运营方开展政府数据运营工作。总的来讲,各地方大力推行的公共数据授权运营模式可化解数据权属不清的弊端并由政府以及国有企业引导数据市场的建构,但也会带来许多值得讨论的问题,如授权存在着排他性,可能产生垄断与不正当竞争现象,使被授权企业一家独大。由于行政的介入,被授权的国有企业还要受到国有资产监管和数据主管部门的双重管理,可能导致监管目标之间的冲突。默认开放开放与公共数据授权运营之间是否存在着矛盾,一些学者认为前者免费而后者开展具有收益性的运营,在一定程度上将导致后者存在有损公共利益的可能性。为此,有学者指出公共数据释放价值应在于开放与共享,而授权运营并非与公共数据开放、共享、利用、数据流通等并列的方式。事实上,公共数据授权运营仅为公共数据利用的一种形式,不应成为探索时期的唯一模式。由于利用能力、财政等原因,域外公共数据的运营还存在着数据信托、数据中介、市场化、社会化配置等方式,尤其值得借鉴。授权运营与默认开放之间的冲突在于不能过度地依赖授权运营机制,在中国目前的情形下有必要对之进行分门别类地观察和设计;需要在坚持访问、共享的前提下,可以发挥公共数据授权运营将数据的开发利用提供给专业性强的机构,从而有效挖掘数据的高价值的优势。但同时,也要关注其他利用方式,在这一点上,如欧盟《数据治理法》强调的数据利他主义原则极具现实意义。

四、结语

公共数据蕴含着巨大的经济社会价值,促进公共数据开放利用构成了深化数据要素市场化配置改革的关键。近些年因为认知不足与制度设计存在一定的偏差,导致公共数据开放层面受到忽视;而对数据权属、个人信息保护、数据安全等因素的考量,更使公共部门不愿开放所持有的数据。故而,政策层面依赖数据利用协议、授权经营等机制来推动公共数据开发利用,意在使公共数据的开发利用能够具有实效性,使公共数据能够高效流通、有效利用并发挥表率作用。然而,如果未能法理上厘清公共数据开放利用的本质以及相关机制建构的底层逻辑,无视公共数据开放的意蕴及其民主价值,并仅仅拘泥于公共数据授权运营一种方式或者作为主渠道的话,那么就会出现数据垄断、数据鸿沟、数据歧视等不利后果,反而遏制数据要素的价值发挥。未来,应重视公共数据开放利用的民主观念及其意义,坚持贯彻公平访问、公平共享与公平利用相关联的权利主张,使数据能够可访问、可用与再利用,如此才能够依赖公共数据开放利用制度激活整个数据市场、撬动社会数据与企业数据的利用。将公共数据视为国有资产有一定的合理性,但未能表明其对于数字时代的重要意义,也难以涵盖各种因公共服务提供而获得的数据。应秉持公共数据多元化利用的理念,有必要将公共数据视为基础设施、为数据要素市场的形成架构根基,此观念亦包涵私人数据中的公益性数据。

中国政法大学科技转化基地

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部