正如陈律师在前文中提到:
人工智能所构建的虚拟世界,是基于人工智能技术,通过平台提供了社会化技术与服务,在虚拟空间获得了个体信息,并利用算法处理这些信息。
法律要对算法进行规制,也要对平台数据利用进行约束。
那么,法律如何介入人工智能的算法规制?又如何对平台数据利用进行调整?
本期,陈律师先和您聊聊:我国首例大数据纠纷案“新浪微博诉脉脉案”。
在后续解读人工智能法律的系列中,陈律师会以“新浪微博诉脉脉案”为例回答这些问题。
欢迎关注!
从我国首例大数据纠纷案谈起:“新浪微博诉脉脉案”
特别说明:本文仅对“新浪微博诉脉脉案”的数据争议部分进行探讨,该案还涉及诸如脉脉对新浪微博是否构成商业诋毁等相关行为的判定,本文暂不对其他争议进行论述。
新浪微博(经营人:微梦公司)是知名社交媒体平台,脉脉(经营人:淘友技术公司、淘友科技公司)则是一款人脉社交应用。
2013年9月11日至2014年8月15日期间,新浪微博与脉脉通过微博平台Open API 进行合作,双方受微博平台《开发者协议》约束。
根据微博平台的《开发者协议》:
在合作期间,新浪微博允许脉脉接入微博平台并向微博用户提供服务;经用户同意,脉脉可以收集用户数据,但仅限于为服务目的必要的以及在微博平台或脉脉生成数据;并约定如微博平台终止与脉脉合作,脉脉必须立即删除全部从微博平台上获得的数据。
新浪微博认为:
根据《开发者协议》,脉脉仅为普通用户,可以获得新浪微博用户的ID头像、好友关系(无好友信息)、标签、性别。但是“职业信息(career)”以及“教育(education)”是高级接口,都需要单独申请。
脉脉未申请过“职业信息(career)”以及“教育(education)”高级接口,无法获得新浪微博用户的职业(career)和教育(education)信息,因此在合作期间非法抓取了新浪微博用户的教育信息、职业信息,并非法使用这些信息。
《开发者协议》还约定:如微博平台终止与脉脉合作,脉脉必须立即删除全部从微博平台上获得的数据。
双方合作结束后,脉脉不仅未及时删除双方合作期间获取的新浪微博用户信息,还非法抓取并使用新浪微博用户的头像、名称、教育信息、职业信息、标签信息等。
因此,脉脉使大量未注册为脉脉用户的新浪微博用户的相关信息展示在脉脉软件中,且双方合作终止后,脉脉仍使用大量非脉脉用户的微博用户信息。
但是脉脉认为:
其通过微博平台Open API与新浪微博合作期间,其拥有最高级别权限,能够访问微博平台的高级级别接口并获取新浪微博的用户信息,包括:“职业信息(career)”高级接口以及“教育(education)”高级接口。
脉脉认为与微博平台合作期间获取的用户职业信息、教育信息系合法抓取,其在双方合作结束后未继续从新浪微博抓取用户信息及微博内容,并明确脉脉的用户信息具有合法来源。
脉脉提出其用户信息来源主要有如下三点:
一是在与微博平台合作期间经用户授权同意取得的新浪微博用户的相关信息。
二是部分用户头像来自于头像淘淘软件。
三是通过协同过滤算法获得部分非脉脉用户的相关信息。
然而,新浪微博还指控:
脉脉用户是使用手机号或新浪微博账号注册脉脉的,脉脉需要上传个人手机通讯录联系人,脉脉用户账号的一度人脉来自该用户的手机通讯录联系人和新浪微博好友,二度人脉为一度人脉用户的手机通讯录联系人和微博好友。
可是,根据新浪微博的用户机制,除非用户主动选择公开,新浪微博用户的手机号默认不公开。脉脉却能精准匹配脉脉用户手机通讯录联系人与新浪微博用户的对应关系,并将该对应关系用于脉脉用户一度人脉中。
新浪微博因此认为:
脉脉非法获取并使用脉脉注册用户手机通讯录联系人与新浪微博用户的对应关系。
对此,脉脉抗辩:
脉脉并未获取微博用户的手机号,其是基于所获取新浪微博关于好友关系的授权,并通过协同过滤算法等技术手段,对脉脉注册用户手机通讯录联系人与此联系人的新浪微博账号名称、邮箱进行匹配,获得二者对应关系,并将未加入脉脉软件的新浪微博用户显示在一度人脉里。
脉脉从未展示脉脉用户手机通讯录联系人与新浪微博用户的对应关系,脉脉获取该等对应关系并非通过手机号进行匹配。
在审理中法院认为,新浪微博与脉脉之间关于数据纠纷的争议点主要在于:
一、脉脉通过何种方式获取、使用新浪微博用户信息?该种获取、使用新浪微博用户信息的行为是否构成不正当竞争行为?
法院认为:
从技术上讲,如果脉脉系通过微博平台开放接口(OpenAPI)获取数据,脉脉和新浪微博都可以保留调取数据的日志,但无论是脉脉还是新浪微博都没有提供相应调用日志。
也就是说,在案证据不能完整呈现脉脉通过OpenAPI获取微博用户数据的情况,亦不能以此证明脉脉并非通过OpenAPI获取微博用户相关数据。法院于是根据举证规则的具体要求确认法律事实。
在庭审中,新浪微博主张脉脉通过OpenAPI以外的非法手段抓取新浪微博用户的职业信息和教育信息,脉脉是否采用爬虫方式抓取新浪微博中用户数据,新浪微博的应提供相关日志证明脉脉采用爬虫方式抓取新浪微博数据的行为。但新浪微博未能提交任何相关证据。
而在脉脉提供了初步证据证明其通过微博平台接口获得相关数据的情况下,法院推定脉脉通过OpenAPI方式获取新浪微博用户的职业信息、教育信息。
根据《开发者协议》,OpenAPI开发合作模式中数据提供方向第三方开放数据的前提是数据提供方取得用户同意,同时,第三方平台在使用用户信息时还应当明确告知用户其使用的目的、方式和范围,再次取得用户的同意。
因此,在脉脉与微博平台的OpenAPI开发合作模式中,第三方通过OpenAPI获取用户信息时应坚持“用户授权”+“平台授权”+“用户授权”的三重授权原则。
虽然新浪微博对于OpenAPI开放接口权限管理、检测、维护等方面存在技术及管理等问题,导致脉脉可以通过技术手段获取用户的职业信息和教育信息,但很显然脉脉并未基于《开发者协议》在取得用户同意的情况下读取非脉脉用户的新浪微博信息。
不仅如此,在脉脉与新浪微博合作关系结束后,脉脉中仍存在大量新浪微博用户基本信息,并在清理相关数据期间,持续使用相关数据信息,存在非法使用新浪微博用户信息的行为。
据此,法院认为脉脉获取新浪微博信息的行为存在主观过错,其获取并利用新浪微博用户信息的行为不具有正当性。
二、脉脉获取、使用脉脉用户手机通讯录联系人与新浪微博用户对应关系的行为是否非法?
法院认为:
虽然,脉脉用户手机通讯录中的联系人在未注册脉脉账号的情况下,能够因脉脉用户上传个人手机通讯录,而使该联系人的新浪微博信息在脉脉用户的一度人脉中展现,但新浪微博未能提供证据证明脉脉实施了抓取新浪微博用户手机号码的行为。
但是,脉脉并未就其所采用的协同过滤算法的具体计算方法、如何精准的计算出新浪微博用户与手机通讯录中联系人之间的对应关系进行说明。
因此,法院认为脉脉主张其全部对应关系均系通过协同过滤算法计算得出的依据不足。
再有,从脉脉用户注册程序及双方合作情况来看,脉脉在与新浪微博合作期间,仅能通过新浪微博账号注册登录或通过手机号码注册登录,且脉脉用户注册登录的前提需要上传手机通讯录联系人,而大量新浪微博用户也通过手机号码注册登录。
由此可见,通过手机号码将手机通讯录联系人与新浪微博用户相对应成为最直接、最高效、最准确的方法。在没有证据证明脉脉采取了其他方式获取前述对应关系的情况下,法院推定脉脉在获取手机通讯录联系人与微博信息对应关系时存在通过手机号码、其他类似手机号码的用户精准信息进行匹配的行为。
法院认为,根据微博平台《开发者协议》规定:开发者应用或服务需要收集用户数据的,必须事先获得用户的同意,仅应当收集为应用程序运行及功能实现目的而必要的用户数据和用户在授权网站或开发者应用生成的数据或信息。
即使新浪微博用户的头像信息、标签信息、职业信息、教育信息通过新浪微博选择对公众公开,但脉脉未经新浪微博用户的同意,获取用户头像信息、标签信息、职业信息、教育信息并展示在脉脉软件的人脉详情,还将微博用户的信息与脉脉用户上传的手机通讯录中的联系人进行对应关系的展示,使得在脉脉软件运行环境中非脉脉用户的微博信息进行了公开展示,这严重损害了非脉脉用户的知情权和选择权。
脉脉在将微博用户的信息与脉脉用户上传的手机通讯录中的联系人进行对应的方法中,存在通过获得微博用户手机号码进行匹配的情形。
目前我国个人手机号实行实名登记,手机号码是微博用户的重要个人信息,获取、使用涉及到个人的重要信息或者敏感信息应得到用户的明确同意。无论脉脉通过何种方式获得微博用户手机号码,其均未提供证据证明已经取得非脉脉用户的明确同意。
因此,脉脉违反《开发者协议》,未经用户同意且未经新浪微博授权,获取新浪微博用户的相关信息并展示在脉脉应用的人脉详情中,侵害了被上诉人微梦公司的商业资源,法院据此认定脉脉展示对应关系的行为构成不正当竞争行为。
法院最终判决脉脉停止涉案不正当竞争行为,消除影响,并赔偿新浪微博经济损失及合理费用二百二十万八千九百元。
虽然“新浪微博诉脉脉案”尘埃落定,法律平定了新浪微博与脉脉之间的数据争议,但如何约束人工智能平台,法律需要进一步设定平台数据利用的规则。
下期,陈律师和您接着聊聊:
“三重授权原则”下的技术拒绝:法律如何介入人工智能的算法规制?
欢迎关注!
如果您需要法律咨询,欢迎联系陈律师。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有