您当前的位置 : 中国数谷 > 中文版 > 观察 > 最新文章

大咖访谈 | 张玉国:数据开放共享的十大误区

来源:精励联讯     时间:2020年12月24日    作者:

励讯集团中国区高级副总裁张玉国

转眼之间,2020年已到收尾阶段。距离中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》(2020年4月9日)也已经过去了8个多月。是时候总结一下,全社会对这份重要文件的落实做得怎么样,数据开放共享进展如何。数据之所以能够成为生产要素,必须进入生产过程,因此数据开放共享和流通是前提。个人以为,关于数据开放共享,还存在一些似是而非甚至错误的认识,突出表现在以下十个方面。

观点1:我国大数据产业已经发展得非常好了,下一步不能图快,需要谨慎行事。

不完全正确。

应该说是现状可喜,挑战很多,前景光明。尤其不能盲目乐观。据统计,2019年我国大数据市场1500亿美元[1],这个规模算很大吗?以中国的体量,还不算大。我所在的励讯集团(RELX,英国富时指数公司)是专门做大数据的专业公司,2019年收入就有100亿美元。在中国市场上,还没有看到像励讯集团一样规模、有国际竞争力的专业大数据公司出现。励讯集团在国外市场上可以从2万多个数据源公开获取数据,国内这样大规模的数据交易市场还没有建立起来。

我坚信中国大数据产业有广阔的前景。原因有三:一是人口红利。数据归根结底是人类活动产生的。我国拥有14亿人口,美国3.28亿,英国0.67亿。未来人工智能和大数据技术能够捕捉采集到更多的数据,触达更多的人群,我们因人口红利而带来的数据红利还会进一步显现。人口规模也意味着市场规模,中国拥有超大的市场规模,这些都是国外无法比拟的。二是某些领域技术领先。比如5G、人工智能某些技术应用、云计算、大数据等等。三是政府顶层设计能力强。国务院2015年就颁布《大数据发展纲要》,今年中央文件又把数据作为重要生产要素,与土地、资本、劳动力和技术并列。2020年全国人大发布的《数据安全法(草案)》《个人信息保护法(草案)》,也明确了促进信息数据依法合理有效利用等原则。

可以说,发展大数据产业,现在顶层设计和思路已经非常好了,关键是执行好、落实好。“万事俱备,只欠东风”。所以下一步要大力发展,而不是缩手缩脚。

观点2:数据安全高于一切,这个问题不彻底解决,不能发展大数据产业。

似是而非。

人类存在了170多万年,一直面临很多安全问题。比如火,曾经为人类文明发展做出过无与伦比的贡献,给人类带来了温暖、健康和光明。但是,火灾(自然或人为)至今仍然无法彻底解决,给人类生命财产安全带来巨大威胁,难道人类要停止用火吗?再举一个例子,谈到安全问题,什么安全最重要?当然是人类的生命财产安全。从这个角度看,有比交通安全更重要的吗?据世界卫生组织统计,每年死于交通事故的人数接近125万[2],但我们显然不能据此倡议:停止发展汽车行业,停止发展道路交通,步行最安全,让我们回到步行时代吧。数据安全虽然很重要,但我不赞成把这一问题无限上纲,它只是人类面临的诸多安全问题之一。

所以,数据安全与人类面临的所有安全问题一样,要在发展中解决。就像交通安全一样,数据安全也要通过规则制定(如交通规则)、基础设施建设(如道路质量、交通标识)、宣传教育(如不闯红灯),特别是技术进步(如更安全的交通工具)来解决。

观点3:涉及个人的数据关系到隐私,太敏感,不能随便开放。

似是而非。

首先,不是所有的个人数据都关系隐私,很多数据是个人数据,但无关隐私,或者说相对不敏感,比如手机号码,很多人都印在名片上,我们能说他把隐私公开出来了吗?其次,不是所有收集、使用个人数据的行为都是为了刺探个人隐私。很多时候,是机器和算法“看到”了你的个人数据,但不是背后的人。第三,大数据产业归根结底要服务于人类,要为人类提供价值。而最有用、最有价值的数据往往是涉及个人的数据。

比如,疫情之下,商业网站利用可视化的手段,展现最新的疫情数据,非常有用,背后就是个体的健康信息(属于个人隐私和敏感信息)。再比如,大家使用导航APP避开堵车路段,给生活带来了方便,给社会节约了资源,那是因为每个车主贡献了位置信息(也属于隐私和敏感信息)。打个比方,说个人数据太敏感不能随便开放,就像说“菜刀、打火机太危险,不能随便卖”一样,重要的是管制非法行为而不是管制数据本身,重点是研究如何保护个人隐私,治理非法利用个人信息、侵害个人隐私的行为,而不是把个人数据捂起来。隐私保护与数据安全一样,要在发展中解决,前文已有论述。

观点4:数据安全和隐私保护,世界各国都在加强管理,中国不能放松,不能出头。

似是而非。

各国都在加强管理,也都在强调发展。重要的是从国家利益和人民福祉出发,综合平衡看待大数据产业发展和数据安全、隐私保护。欧盟由于历史等种种原因(包括二战前法西斯非法收集犹太人信息),对于个人信息的使用管理过严,导致至今没有出现全球性的大型互联网企业,很多专家都指出了这一点[3]。欧盟自身也在转变,今年2月,欧盟委员会发布了《塑造欧洲数字未来》的战略规划,强调“数据是经济发展的命脉;欧洲已经为未来的数据经济做好了准备”,准备拿出22亿美元打造欧盟云计算平台,[4]又计划推出《数字服务法案》《数字市场法案》等, 扩大数据的共享及流动。

平衡安全与发展,是大数据产业行稳致远的基础,其中发展又是关键中的关键。这既涉及到国家利益,又涉及人民福祉。迅速发展大数据产业,增强国力,在全球竞争中取得先机,是维护国家利益的重要方面。充分发挥大数据产业沟通上下游和产业链的功能,为广大人民群众提供更多的就业机会,让更多人过上幸福生活,是提高人民福祉的重要步骤。今年疫情突如其来,很多中小企业面临困难,有些人甚至失去了工作。李克强总理在两会记者招待会上动情地说:我们有9亿劳动力,如果有工作机会,就是9亿双创造财富的手;如果没有工作机会,就是9亿张吃饭的口![5]

特别需要提出的是,疫情反而凸显了数字经济的重要性。网上购物、数字会议、远程教育、在线娱乐等等实现逆增长。励讯集团及其下属企业,在中国增加了上百个就业岗位。后疫情时代,数字经济、智慧经济的重要性将进一步上升。

从国际规则制定角度看,中国在互联网、5G、人工智能和大数据的某些领域已经领先世界,当你跑在队伍前头的时候,就不能往后看。在数据安全和隐私保护的立法立规方面,理应有中国自信,贡献中国方案。要实现从国际规则的学习者、遵循者到制定者的转变,要从跟跑、并跑到领跑。

在全球单边主义、保护主义和逆全球化抬头的今天,中国反而应该高举全球化和发展的旗帜。国务委员、外交部长王毅在2020年9月全球数字治理研讨会上代表中国发起“全球数据安全倡议”,其中包括“兼顾安全发展”等数据安全三原则,特别反对数字保护主义,他指出:“保护数据安全对数字经济健康发展至关重要。各国都有权依法保护本国的数据安全。同时,也都应为所有企业提供开放、公正、非歧视的营商环境。数字保护主义违背经济发展的客观规律,不符合全球化的时代潮流,不但有损全球消费者公平获得数字服务的权利,最终也会阻碍自身的发展。”

Cirium通过大数据洞察航班信息

观点5:大数据领域不能乱了再管,立法要走到前头,司法、执法要严。

部分正确。

中国社科院法学所周汉华老师写过一篇非常好的文章《网络法治的强度、灰度和维度》,特别强调网络和技术立法要注意“法治的灰度”。什么是灰度?就是在非黑非白、看不清方向、琢磨不透的时候,不要急于立法,限制了创新。他说:“进入互联网时代,等于进入无人区,面临的都是前所未有的新问题,而我们现在的法律大多是网络时代以前的法律,不少都难以适用网络时代的要求。网络时代的新规范究竟应该是怎样的,现阶段未必马上都能看得清,没有人有肯定答案,必须在未知中逐步探寻,不适合马上立法。”[6]为此,并非在所有的领域,立法都要走到前头。

司法和执法也要有大局观,对于新技术、新业态、新经济,要有包容审慎的态度,要慎重运用公权力,注意司法执法案例给社会传递的信息、带来的影响。李克强总理也曾讲过,“几年前微信刚出现的时候,相关方面不赞成的声音也很大,但我们还是顶住了这种声音,决定先‘看一看’再规范。如果仍沿用老办法去管制,就可能没有今天的微信了!”[7],并要求政府部门对待各类新业态、新模式要有“鼓励创新、包容审慎”的态度。

那是不是在过渡期就无法可依、无章可循,甚至放任不管了?从历史长期的角度看,一切良法善治,其最终目的都是实现社会公平正义。什么是最大的社会公平正义?就是人人都有饭吃,广大人民群众过上幸福生活。一切良法美意,都要兼顾“天理、人情与国法”。经济得到发展,人人都有饭吃也是最大的天理和人情。只要心里有这杆秤,就会在激流中站定脚跟,在迷雾中找到方向。

观点6:数据权属问题非常重要,这个问题不搞清楚,无法开放共享和利用数据。

似是而非。

数据作为一种资源和生产要素,有一个特点,就是非排他性,与土地、资本、劳动力和大部分的物理资源不一样。一个苹果被别人咬了一口,你就无法再吃到这一口,道理非常明显。但是数据资源不一样,被甲利用了,还可以被乙、丙,甚至无数的人利用。还有,一个人产生了数据,但这些孤立的数据不一定有价值,只有大量的数据集中到一起,被大数据技术进行分析和挖掘,才会产生价值。

数据资源的这种“柔性“特点,要求我们慎用物理资源的硬性强保护原则。浙江大学互联网法律研究中心的高艳东老师讲得很好:“数据资源的特殊性决定了确定数据权属时,不能采用类似房产那样的绝对权利理念,而应柔性赋权、减少数据交易壁垒。欧盟的《通用数据保护条例》采用了类似于所有权的强保护理念,确立个人信息自决权(如遗忘权、可携带权),为数据流动设置了极高的制度门槛。严格的绝对权属性导致欧盟的数据经济整体落后于中美。为此,欧盟有计划推出《数字服务法案》《数字市场法案》等,扩大数据的共享及流动。未来立法,不应一味强调数据的归属权,而应让更多主体有数据的共享权。”[8]

华东政法大学大数据政策法律研究中心的高富平老师说:“从经济学的角度讲,最基本的逻辑就是谁创造价值,谁控制数据。”[9]浙江大学高艳东老师说:“数据本身不产生价值,数据加工和分析才产生价值。在工业时代,超市、银行记录了大量的用户的消费、金融数据,但没有转化为生产力。数据成为生产要素,得益于互联网公司对数据的清洗和分析。”

数据权属问题很重要,但我并不认为在这个问题搞清楚之前,大数据产业就不能动。关于这个问题的争论,让我想起改革开放之初,关于“姓资姓社”问题的争论。小平同志一句话定调:不管黑猫白猫,抓住耗子就是好猫。同样道理,关于权属的争论,关键看能不能让数据价值发挥出来,为人民创造就业,从整体上为社会增加福利。

观点7:数据是消费者产生的。当前大数据产业,只让部分企业获利,广大消费者没有获得感。

错误观点。

数据既然是一种资源,就符合市场交换规律。现在形成的用户让渡一部分个人信息,换取使用互联网公司、大数据公司某种产品、某种功能的状态,也是一种市场条件下自然自发形成的状态。毕竟这里面没有强迫行为,逼着消费者交出数据,如果广大用户和消费者认为“吃亏了”或者利益受损,他们是不会给把数据无偿提供给企业的,或者“用脚投票”,把数据提供给能够给他们带来净利益的企业。

谈谈“获得感”:既然是一种感觉,比较个人化,我就谈一点个人经历。我年轻的时候,九十年代初上大学,那个时候火车慢,车次又少,从东北到西北,要坐近60个小时的火车,中间倒两次车,加起来路上走三天两夜。出发地还能勉强买到硬座票,但一到转车的地方就很难买到票(甚至无座票)。北京火车站的广场上人山人海,卖票窗口前排着长长的队伍,警察不得不提着长棍站在高处维持秩序。那个场景我到现在还记忆犹新,导致我很长一段时间内对火车站都有心理阴影。而现在拿着手机,可以买到全球任何一个地方的机票、车票,这就是大数据发展带来的获得感。为此我让渡了部分个人信息,甚至是敏感信息:身份证号码、银行卡号码等等,但我换来的是极其有价值的生活便利和效率提高,甚至很难用金钱来计算。这就是一种获得感。

我们所让渡的个人信息,还可能给其他人创造就业机会。有一次在上海出差,我使用叫车软件叫了一部车,司机是东北人,退伍军人,刚来上海做专车司机2周。他告诉我,在部队4年,没有学到任何特殊工作技能,除了站岗什么都不会,如果没有叫车平台,他在东北老家农村很难找到工作。上海路况复杂,没关系——有导航软件,哪里堵车也一目了然,如果没有车主共享位置信息,我们如何知道哪里堵车?

观点8:政府数据开放是政府信息公开的一部分,政府数据是通过公共财政采集的,是公共财产,不能再次收费。

似是而非。

政府数据开放与信息公开不同。复旦大学数字与移动治理实验室主任郑磊教授专门研究政府数据开放,他说:“第一个区别是开放数据要把数据开放到底层的、原始的数据,而传统的政府信息公开可以只公开经过加工分析的信息,甚至是一些文件。第二个区别是政府信息公开的主要目的是保障公众的知情权,而开放数据的主要目的是推动政府数据再利用。”[10]我认为这非常关键,不能把政府信息公开等同于数据共享。郑磊老师还提到“数据的温度”(价值),我们希望看到更多“有温度”的政府数据开放出来,而不是“冷冰冰”、没有价值的数据。

这里所说的政府数据,是指政府机构利用公权力行使行政职能时所采集的数据,也包括部分国有企事业单位代行政府职能所采集的数据。这部分数据往往是最有价值的数据,一旦开放共享利用得好,会给社会创造巨大价值。据2015年的统计,随着电子政务建设的不断发展,各级政府积累了大量与公众生产生活息息相关的数据,掌握着全社会信息资源的80%,其中包括3000余个数据库。[11]李克强总理在2015年两会上听取人大代表的建议后,立即表示:“政府掌握的数据要公开,除依法涉密的之外,数据要尽最大可能地公开,以便于云计算企业为社会服务,也为政府决策、监管服务。”中央十四五规划建议中提到“扩大基础公共信息数据有序开放,建设国家数据统一共享开放平台”,我们对此充满期待。

政府数据开放能不能收费?有争议。表面上看,政府数据是通过公共财政采集的,不应该再次收费。但高速公路、公共汽车、地铁,都是公共资源提供的,为什么可以收费?

有一句话说得好——免费的往往是最昂贵的。如果政府数据开放共享不收费,可能会带来两个不良后果:一是没有资质的企业甚至个人都可以免费获得政府数据,很可能会造成公共资源被滥用、被浪费。二是对数据拥有机构没有任何激励措施,他们不愿开放数据,即使把数据开放出来,很可能数据质量、服务质量也大打折扣,甚至走走形式和过场,敷衍了事。最后使整个社会综合成本上升——使数据开放变得更加昂贵。

最好的政策往往不是保证“程序正义”,而是保证“结果正义”,符合人性的政策才能持久。说一点个人经验:我曾经在某机关工作过十几年,有一年,单位食堂进行改革,伙食质量大大提高,并且免费,员工评价很高。但是不久发现一个问题:食物浪费现象严重。后来食堂进行了一个小改进:每人发一张卡,每次收费5毛钱,结果食物浪费现象大大改善。这就是抓住了人性(人类并不完美),只要增加一点成本,人们就更加珍惜食物。

政府数据到底要不要收费?我觉得要采用市场经济的思路。经济学家薛兆丰在“网红”教材《薛兆丰经济学讲义》中建议,治理大城市交通拥堵,可以考虑收取“拥堵费”。他说,收拥堵费当然不能多出几条车道,但是收了拥堵费之后,那些需求弱的人就会被劝退,他们空出来的道路实际上就是增加了供给。拥堵费越高,人们就越愿意把道路让出来,给需求更高的人。美国华盛顿市就实行“实时路权拍卖系统”。如果不收取拥堵费,大家都堵在那里,才是时间和金钱最大的浪费。

所以我认为,获取政府数据要设置一定的门槛,但这个门槛最好不要变成行政审批,容易造成低效甚至寻租和腐败。最好让市场规律来配置。其实,政府数据收费又何妨?收来的费用再用于公共支出就可以了。国外也有先例:励讯集团在美国市场上,可以从2万多个数据源公开获得数据,其中很多是政府部门的数据,需要支付费用,比如从50个州的交管部门公开购买交通违章信息,给保险公司提供车险大数据分析服务。

观点9:数据开放会导致数据黑市和灰市。

错误观点。

有一句话说得好:“当贪婪遇上管制时,黑市就产生了。只有贪婪,没有管制,或只有管制,而没有贪婪,都不会有黑市。”[12]数据黑市和灰市的出现,恰恰是因为没有正常的数据交易市场。这里必须说明,政府并没有管制数据交易,相反,从2015年国务院发布《促进大数据发展行动纲要》以来,各地纷纷设立大数据交易所、交易市场和大数据局等主管部门。为什么还会出现数据黑市灰市?

经济学原理告诉我们,黑市的出现主要有两种情况:一是法律禁止的产品(如毒品、武器),现实有需求,就形成黑市;二是监管严重抑制了市场供求关系和交易,就出现黑市。数据问题主要出在第二种情况。当大家“谈数色变”,数据变成“数惧”,数据拥有者不敢拿出来交易,当前文所说的“不敢、不愿、不会”抑制了数据的提供,现实又有需求,便给数据黑市提供了可乘之机。说到底,数据黑市的出现是因为公开、透明、健康的大数据交易市场还没有建立起来。据《财经》报道,作为国内第一家以大数据命名的交易所,贵阳大数据交易所从2015年4月成立以来,到2019年5月,累计交易额才4亿元,多位受访专家表示,这样的成果没有达到各界预期。[13]

2020年,“内卷化” 成为一个年度热词,它本是美国文化人类学者吉尔茨(Clifford Geertz,1926-2006)提出的一个概念。用俗话来讲,就是“看起来热热闹闹,其实没有实质性的进步,也就是没有发展的繁荣”。[14]大数据交易要切忌“内卷化”。而这又需要法律法规和执法的松绑,需要数据拥有者敢于提供“有温度的数据”。

观点10:为确保数据安全,数据应该直接开放给数据使用方(如银行、保险公司),减少中间环节,不能开放给第三方。

错误观点。

最基本的经济学知识告诉我们,分工是市场经济的一个基本特点,几乎没有不存在第三方的产业。打个比方,农民养猪、种菜、种小麦,屠宰场、菜市场、面粉公司和超市是第三方,我们都是最终的食品消费者。现在因为担心食品安全,要求农民不要通过面粉公司、屠宰场、超市这样的第三方,把生猪、蔬菜和小麦直接卖给消费者,让消费者自己杀猪、磨面粉,这显然是不可行的。现代产业分工越来越细化,一定会有第三方,甚至第四方、第五方出现。

回到大数据行业,银行、保险公司对大数据风控产品需求比较强烈,但这并不代表他们一定要在内部培植大数据处理分析能力,它们也不需要具备这种能力。它们需要的是提供好金融服务的本职工作,完全可以把大数据分析这样的工作交给专业数据公司来做,自己的风控和精算部门进行最后把关。

如果按照上面“排除第三方”这个逻辑去推理,连银行都不需要存在,因为银行也是第三方,我们直接把钱借给企业就行了。这可行吗?还有,银行保险公司的数据安全保护能力不一定比第三方强,金融机构当然也要做好数据安全,要提升这方面的能力,但第三方大数据公司是靠这个吃饭的,如果不做好数据安全工作,饭碗就砸了(西方市场已有案例出现),所以一定会按照最高的标准做数据安全和隐私保护。

为什么会出现这种简单的逻辑错误?在别的产业习以为常的第三方机构,在大数据行业反而不敢用?归根结底还是大环境让大家“不敢”。

律商联讯旗下品牌PatentSight提供丰富的专利数据

最后我想说,本文强调数据开放共享,法律法规和执法给数据松绑,绝不是反对监管。以我热爱的足球比赛来说,规则明确、执法严格,才有利于梅西这样的优秀运动员发挥,否则他会无数次被铲倒,无法给我们带来精彩的射门。还要排除一个误解,以为弱监管、不监管就会诞生更好的大数据产业。用上海交大何渊老师的话说,如果按照这个逻辑,世界上最好的互联网公司应该出现在非洲、中东地区。我们呼唤的是安全与发展的平衡,让大数据产业的价值充分释放出来。我曾经在另外一篇文章中提到,中央4月文件吹来春的气息,大数据产业的春天快要来了,但现在还处在“乍暖还寒”时候,整体氛围还比较“冷”。让我们共同努力,加快步伐,迎接中国大数据产业蓬勃发展的春天!

张玉国

张玉国自2012年起担任励讯集团高级副总裁。此前的五年间任爱思唯尔(励讯集团子公司)中国区总裁。2010年他创立了在华国际出版商版权保护联盟(IPCC)并担任常任主席。加入励讯集团之前,曾供职于中央某机关,从事出版管理工作长达 12 年。2002 年至 2003 年,曾以访问学者身份赴加拿大参加“中加学者交流项目”(CCSEP),先后在渥太华大学和西蒙·费雷泽大学(SFU)学习。主要研究领域为文化产业与文化政策,曾出版《国家利益与文化政策》、《文化产业与政策导论》和 《文化多样性与人类全面发展》(译作)等著作。