《数据要素流通的困境与对策研究.docx》由会员分享,可在线阅读,更多相关《数据要素流通的困境与对策研究.docx(19页珍藏版)》请在优知文库上搜索。
1、数据要素流通的困境与对策研究关键词:数据要素隐私权力不平等加剧数据治理一、引言正如电能、内燃机技术与原子能、电子计算机技术分别推动了第二、第三次科技革命的产生,近些年来大数据、人工智能、物联网等新兴技术的快速发展,推动全世界进入以数字经济为代表的第四次科技革命。在数字经济时代,数据成为第一生产要素,在整个经济社会发展中都起到非常重要的作用,被称作“21世纪的石油矿工数字技术对经济体中的生产、消费以及分配模式都产生了很大的影响,极大地提升了整个经济体的运行效率。2005年,我国数字经济规模只有2.6万亿元,占国内生产总值的14.20%,至2022年,已经达到50.2万亿元,占国内生产总值的41.
2、5%。我国政府也认识到数据对于经济发展的重要性。在此背景下,2015年9月,国务院在促进大数据发展行动纲要中首次从国家层面进行总体规划,将数据列为国家重要战略资源,肯定了其对于经济运行机制、社会生活方式和国家治理能力产生的重要作用。2020年4月,中共中央、国务院发布了关于构建更加完善的要素市场化配置体制机制的意见,正式将数据列为第五大生产要素,与土地、劳动、资本、技术并列。2023年3月,国务院成立了国家数据局,专门负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用。同年8月,财政部发布企业数据资源相关会计处理暂行规定,提出2024年1月1日起企业应在会计报表附注中对数据资源相关会
3、计信息进行披露。以上一系列政策的次第推出,充分体现出我国政府对于数据要素的重视,以及将数据要素作为经济发展新引擎的决心。目前很多研究对数据要素给出了不同的定义。其中较为权威的是国家信息通信研究院所定义的:数据要素是指参与生产经营活动,以电子方式记录并为使用者和所有者带来收益的数据资源。可以看到数据要素的存在形式和参与生产的方式与传统生产要素均有较大的差异,数据要素具有非竞争性、易复制性、部分排他性等完全不同于传统生产要素的特征。因此,在运用和治理数据要素时不能简单地套用传统生产要素的相关方法,应积极探索适合数据要素的新方法,从而发挥其在经济增长中的特殊作用。然而,我国对数据要素的使用和治理仍然
4、处于起步阶段,在数据收集、数据处理、数据交易等环节缺乏符合数据要素特点的规章制度,导致我国在数据要素使用过程中存在很多的问题。这些问题如果得不到妥善解决,就会成为数据要素发挥作用的绊脚石。目前,相关研究主要集中于个人隐私保护、数据交易市场与数据垄断中的某一方面,对其他方面的问题研究不足且缺乏系统性。本文将从个人维度、市场维度以及政府维度,较为系统全面地分析我国数据要素流通使用存在的问题,并提出相应对策,以为相关决策部门提供相应的理论支撑。二、数据要素流通中存在的主要困境及其原因分析1 .个人维度(I)个人数据攫取与数据主体知情权近些年来,大数据技术的发展让人们愈加关注其对个人信息造成的威胁,很
5、多企业都会通过各种渠道收集或提供产品与服务换取人们的隐私数据,并且这些数据的获取、流通与使用过程通常是在没有取得数据主体同意的情况下进行。GregOry指出大数据就是由人构成的,这意味着数据的获取过程通常都伴随着对人们非常有侵略性的探测、监视以及跟踪。目前信息技术高度发达,各种数字设备无处不在,人们的健康、习惯、信仰与行为等数据大多都被各种公司或研究机构在不直接接触的情况下获取。这致使人们对数据研究活动越来越不信任,以及数据化的需求与数据提供者自主权之间的不匹配等问题。当数据变为一种新的资本形式,企业或研究机构会用各种方式从任何可能的来源获取尽可能多的数据,这种动力会催生出更多新的数据收集方法
6、。Mezzadra和Neilson将数獴收集类比于资本主义早期对于土地的强占与资源的攫取,他们认为数据的收集过程从本质上应该被理解为数据掠夺。企业要想充分发挥数据要素的作用不仅仅需要被动地收集数据,同样需要积极地创造数据。对于很多商业模式来说,利润最重要的来源是人们使用某产品或服务产生的信息,而不是购买该产品或服务支付的货币。当人们谈论起“数据收集”“数据挖掘”等将各种数据搜集并且整理成可以使用的信息技术时,通常想象这些活动是一种中性积累。但是,从数据攫取这一角度分析这些技术的本质,就可以看到其对于目标人群的监控与剥削。现实生活中有很多可以免费使用的应用程序以及付出很少代价就可以得到的电子产品
7、,我们在使用这些产品或服务时不自觉地变成了为企业生产数据的工具。可以看到,数据要素的发展伴随着对个人信息的收集以及隐私的侵略。结合以上特点,Zuboff将这种新的经济形式称为“监视资本主义(Surveillancecapitalism)nO需要注意的是,这种对于日常生活的监视以及隐私的侵犯通常是在没有经过个体同意的情况下进行的。目前告知人们其数据被收集主要是通过收集数据的应用程序条款,然而这些条款通常非常繁琐。早在2008年,McDonald和Cranor就发现一个美国人平均每年要遇到1462个隐私条款,全部读完它们需要76天。这些条款不仅非常冗长,其内容也包含很多专业的法律知识。并且,在公司
8、提出这些条款时没有留给人们任何选择的空间。对于人们隐私权力的侵犯同样发生在数据的传播和使用阶段。我国民众对于自身被收集数据的流通途径和用途一无所知,并且也没有出台明确的法律防止企业将收集到的个人数据分享给第三方。这些侵犯居民隐私的活动会造成很多负面影响。首先,对于个人数据的科学研究和利用缺乏伦理标准,无法阐明收集与分析这些数据的原则和机制,可能会对被研究人群造成伤害。其次,姓名、证件号码等个人数据传播后容易被不法分子利用,进而实施电信诈骗等犯罪活动。最后,企业对大数据的使用也缺乏规范,现在企业可以肆意利用数据得到人们的生活习惯、支付意愿等信息,从而造成相同产品或服务对于不同消费者呈现不同价格的
9、现象。这种利用数据进行的价格歧视行为很大程度上榨取了消费者剩余,给消费者造成利益损失。(2)数据收集与算法歧视弱势群体在收集或使用数据要素的过程中很可能加剧社会中弱势群体受到的歧视,并且现有解决方法收效甚微。在收集方面,Runes发现进行社会调查时收集到的汇总数据掩盖了人们种族.收入、教育水平、职业等很多因素的差距,当运用该数据做出决策时,会让一部分群体获得过多的收益而忽略一些弱势群体的需求。各个机构在收集数据时也主要关注社会主流人群的利益,较少考虑弱势群体。有时数据收集不但不能使弱势群体获益,还会对他们造成伤害。比如美国在对亚裔的数据收集基础设施方面投入巨大,并且经常在对收集到的亚裔数据进行
10、分析后,以恐怖威胁、犯罪、非法滞留等理由对亚裔进行监禁和驱逐。在使用方面,数据要素对于弱势群体的歧视主要是通过算法实现的。算法指的是完成任务的一系列规则,这些规则在以前是由计算机程序员人工编写,而在数据成为生产要素后,机器学习开始使用一种利用大型数据集自动统计推断过程开发的特殊算法。这种算法先将要研究的对象量化,再从大量量化结果中归纳模型,然后运用模型研究新的对象,最后根据反馈进行改进。算法所使用的数据来源于社会中的人,而社会本来就是不平等的,因此算法会偏向于巩固现在社会存在的权力、边缘化和优劣模式。现在很多机构都运用算法来为刑事判决、福利分配、招聘流程以及其他资源分配活动提供指导,然而这种以
11、数据驱动的系统会产生有偏的结果,最终反映并加强社会中的不平等。例如,ThePrincetonReview是美国一家考试辅导公司,其通过算法将广告大量投放给亚裔群体,并且针对相同的服务有近两倍概率收取亚裔群体更高的费用。现在有很多学者都提议使用“反分类(anti-classification)”方法解决算法导致的歧视弱势群体问题,反分类的含义是在使用算法处理任何问题时禁止使用受到保护的个人特征。然而在实践中反分类方法并没有起到防止歧视弱势群体的作用,反而可能加重这一问题。在2014年,亚马逊运用算法将每个职位与申请者进行匹配后排序,并且将性别、种族等身份特征从中请信息中剔除,旨在提高效率并减少对
12、弱势群体的偏见,但结果却加深了在应聘过程中对于弱势群体的歧视。因为亚马逊和其他很多大公司一样,算法的训练数据主要来自白人男性,这会让一些女性以及其他种族特征降低申请人的分数,从而产生歧视弱势群体的恶性循环,亚马逊最终在应聘过程中放弃了使用算法。我国虽然不存在种族歧视问题,但是越来越多的公司在招聘时开始运用算法进行筛选,会造成一些与家庭条件相关的(比如社会实践、实习经历不足)或者与性别相关的(比如参加过女子社团)指标降低申请者的分数,从而导致对弱势群体的歧视。可以看到,反分类方法本质上是有缺陷的,这一方法看似从意识形态方面避免了对弱势群体的歧视,但没有从数理统计的角度真正解决这一问题。因此,如果
13、一直运用现在的算法而不进行改进,数据要素的使用就会加剧弱势群体受到歧视。2 .市场维度(1)数据正反馈机制与企业规模扩大加剧市场垄断数据要素主要通过自身正反馈机制、促使企业吞并与合并、帮助企业滥用支配地位等方面加剧市场垄断。在数据要素自身正反馈机制方面,现代企业以及其他机构都被一种“数据祈使(dataimperative)w驱动着,这种力量让它们要尽可能地从任何可能的来源获取数据。这就会形成一个反馈回路:拥有大量数据的机构才可以形成某些控制系统,而这些控制系统在运作的过程中又会产生更多的数据,导致数据会越来越集中在一些机构。对于企业来说,数据与权力和利润相对应,这种反馈回路会让某些企业产生无限
14、的权力和利润,从而加剧垄断。在促使企业吞并与合并方面,首先,数据的产生与收集需要吸引大批用户使用自己的产品,这需要高额成本开发出高质量的产品,并且需要给予使用者一定补贴,这一过程同样需要大量资金,因此一般只有大企业才有能力负担。这些大企业通过免费或低价的产品吸引顾客,然后收集他们的数据来获取源源不断的利润。而互联网产业的小型公司通常没有自己的数据库,很大程度上限制了它们的发展,最终只能倒闭或被收购。公司的合体并不局限于大公司对小公司的吞并,越来越多体量相同的公司也开始进行合并。因为数据集相互补充远比将数据储存在很多个“数据孤岛”里拥有更高的价值。在很多行业,数据的合并对于创新活动等方面有明显的
15、促进作用。如在2015年,也就是我国的“大数据元年”,很多互联网公司,如美团与大众点评、58同城与赶集网等,通过完成合并成为各自领域的巨头。除了企业的收购与合并造成的垄断外,数据要素也使得巨头企业能够滥用自身的市场支配地位从而造成垄断。这种支配地位指的是一些掌握大量数据资源的企业通过自身的力量与地位将其他竞争者挤出市场的一种状态,任何占据市场支配地位的企业都会阻碍其他竞争对手获取数据从而垄断市场。还有一部分企业通过自身的力量无法达到挤出其他企业的目的,便与一些企业通过协议的方式达成同盟,在同盟内部数据共享、协同经营,进而排除其他企业以实现垄断,当市场规模足够满足同盟内各企业的盈利需求时,这种“
16、共赢”的协议垄断模式就会持续下去。可以看到,数据要素让市场更容易形成垄断。(2)数据交易市场亟待完善现阶段,我国数据交易市场比较混乱,主要存在产权不明确、交易机构经营不力、安全性难以保障、分配机制不健全等问题。第一,数据产权不明确,发生交易活动时易产生纠纷。清晰的产权规定与合理的权属登记制度是数据能够在市场中顺利交易的基础。数据产权主要包含数据的所属权、使用权、收人权三个方面,明确数据产权就是要确定这些权利的界限与归属。然而数据要素由于不同于传统生产要素,其产权确定非常复杂,我国目前还没有法律对数据产权如何确定给出明确解释,也没有对数据这一新型生产要素建立符合其特征的产权登记制度。这使得数据在进行交易时主要转让的是交易权而非产权,从而影响交易各方利益分配。在数据产权确定困难的情况下,数据无法采用传统物品完备的交易方式进行交易,参与交易各方的利益也很难有法律保障。第二,大部分数据交易机构经营不善,无法发挥其促进