2015年12月10-12日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中国科学院计算技术研究所、北京中科天玑科技有限公司与ImapBox共同协办,以“数据安全、深度分析、行业应用”为主题的 2015中国大数据技术大会(Big Data Technology Conference 2015,BDTC 2015)在北京新云南皇冠假日酒店盛大开幕。 11日上午的数据市场及交易分论坛,中关村大数据产业联盟副秘书长陈新河、亚信智慧数据公司DataHub产品总监龚静、数据堂(北京)科技股份有限公司联合创始人兼副总裁肖永红、北京安理律师事务所管理合伙人王新锐、中国信息通信研究院高级工程师韩涵分享了他们在数据交易中的经验和观点。 中关村大数据产业联盟副秘书长陈新河分享了题为《数据交易之路》的演讲。他主要从以下四个方面进行了分享:数据是物理世界的DNA、数据交易之惑、数据交易之路、大数据产业发展展望。 数据是物理世界的DNA,数据洞察从古至今贯穿世界的历史,数据是物理世界在网络空间的客观映射,数据驱动多彩的生活。大数据是数据在这个时代的标签,大数据需要满足大规模、多样性、速度快、准确性。陈新河:数据交易之路

数据交易之惑。工业产品的商品交易的三方要件是卖方、买方、公允价格。其中,公允价格难以实现。他提出数据交易“四方问题”:当事人、服务提供方、数据交易市场、数据购买方。在数据交易之中,之所以有用户隐私侵犯甚至违法交易之忧,最本质的原因是数据交易“四方问题”是一个闭环的结构。也就是说,取之于用户的数据,被售卖到数据购买方后,有可能被用于利或不利于用户的行为之中。因为有这一闭环的存在,服务提供方在未经用户许可的情况下,单方面把数据提供给可能会为用户带来不利后果的购买方,无论是伦理上还是契约上都是不合适的。倘若上述闭环并未合上,则不存在隐私侵犯的问题。
在提到未来大数据的路径时,他认为之前把数据作为一种资产,忽略了数据本身的特性——数据的异质性和数据的可复制性。他认为应该用一个新的词“数据权益交易”来描述数据交易的未来之路。

大数据产业发展展望。他提到2015年中国大数据解决方案超过6亿美元,中国大数据市场超过万亿元指日可待。国家大数据战略启动,其要点包括一个核心三项任务:数据驱动人生、数据驱动新商业、数据驱动新工业。
亚信智慧数据公司DataHub产品总监龚静做了题为《“去中心化”的数据流动模式》的演讲。她从以下三个方面进行了分享:数据流动激发网络效应;克服流动中的“摩擦力”;“去中心化”的数据流动。
数据流动激发网络效应。她提出数据共享具有三个独特的魅力:无损复制、边际成本低、效益趋向无穷。她认为数据充分流动的激发了大价值,对个体、对团体都有很多价值的产生。数据流通的成本包括:信任成本、寻找数据的成本,实施的成本,权益的成本。充分发挥大数据价值的关键是必须竭尽一切可能降低数据流动的成本。

克服流动中的“摩擦力”。目前,大数据时代数据流动的隐私问题值得我们关注。
对于隐私问题,国际和国内已经做了一定的尝试,目前存在的难点是缺乏配套的法律法规以及创新的措施。接下来,她对最简单的两方流动、带中介的三方流动和完善的四方流动的寻找成本、实施成本、信任成本和外部成本进行了分析。以上三种流动方式都或多或少存在较高的成本,而我们最需求的是四种成本都很低。

基于上面对数据流动的一些诉求,她提到了亚信在数据流动这部分的一些尝试和想法。第一个想法是去中心化,在P2P下进行数据流通,可以在降低数据流动成本、提高效率的同时保障不被平台方数据截留,让数据不被“偷走”,从而建立信任体系。第二个想法是实现数据可用不可见,这种情况下需要可信度非常高的中介平台,在现阶段,由政府成立的交易机构的可信度比较高。第三个想法是去实现数据的版权保护。为保护数据提供者权益,对于转卖数据,平台会提供数据版权检查,通过中心化的授权机构在每次使用的时候验证是否具备权限。第四个思考是如何保障隐私数据,对数据所有权人他的权益如何去维护。她提到可以参考了OAUTH2协议,将数据作为一种资源进行授予粒度和授予时间的精确控制。这种模式下代理中介的价值是统一提供授权服务,简化数据连接的难度,降低数据连接的成本。这种模式下代理中介必须是有“信任权威”的,比如得到政府的背书。
数据堂(北京)科技股份有限公司联合创始人兼副总裁肖永红分享了题为《大数据共享交易与产业生态》的演讲。他主要从以下四个方面进行了分享:我国的大数据产业生态概述、以数据为中心的新产业生态、数据共享交易促进生态发展、数据堂数据银行实践与分享。

先从一张图谱来看,美国最早出的一个产业图谱。从这个图谱上可以看出两个问题:数据源在整个图谱上的重要性;第三方的数据平台会把这些数据资源汇集起来,以某种服务的形式提供给社会或者提供给大众,这是一种形态。数据源这一层在最早产业图谱中占据了一个比较重要的位置,这块主要是像基础设施,包括数据分析、工具、挖掘和数据的应用。国内的图谱也分了三层,底层是数据收集,中间是数据管理,上层是数据使用。
我国大数据产业生态现状是:互联网企业领跑,携“用户”以令诸侯;产业分布过于偏重应用环节;应用领域的行业分布仍不够全面;缺乏综合性的数据聚合流通平台。大数据产业生态良好发展的关键是数据互联。大数据交易的目的是为了让大数据很多资源应用流通起来,应用落地,产生它的价值,但实际上目前看到很多大数据交易的形态还没有做到很落地,或者做的非常扎实。还有一个大的特点,整个从数据资源供需市场角度来说是需大于供。这就是目前大数据共享和交易的状态。而且一个趋势,整个大数据产业生态,数据资源未来走的路子,必须要从工作、开放走到互联,而且它是一个大趋势,不可逆转。

数据收集有若干种方法。第一种,由于产生数据的形态和资源非常多,可能互联网上有大量的数据,BAT也有,传统也有,可以利用众包的形式采集线下分散的数据。人都在时时刻刻感知周边的数据,利用这个原理,建了一个数据众包的平台,上面有几十万的用户,可以在这个平台上发布一些数据采集任务。第二种,很多数据都是在各个行业领域的IDC或者数据中心或者在服务器上面,可以通过数据变现能力和形成闭环的商业模式来获取数据,或者找这些公司合作。大数据处理服务的流程包括:数据获取、数据清洗、非结构化数据处理、数据关联、数据服务。
北京安理律师事务所管理合伙人王新锐分享了题为《大数据相关的法律风险和合规建议》的演讲。他主要从征信、风控、营销、催收四个环节进行了分享。

他首先提到个人信息的概念和内涵。个人信息,是指可为信息系统所处理,与特定自然人相关、能够单独或通过与其他信息结合识别该特定自然人的电子数据。个人信息的内涵包括:一、个人的隐私信息,个人信息是个人隐私信息的上位概念,并非所有的个人信息都是个人隐私。二、能够识别个人身份的信息,具有相关性和可识别性。个人信息的处理环节包括收集(目的合法)、加工(加工目的及方法)、转移(转移目的和范围)、删除(目的达到后,删除)。
然后,他讲解了个人信息保护的八项基本原则。(1)限制收集原则:收集个人信息应合法、公平、并经信息当事人的同意或告知当事人。(2)资料内容正确原则:个人信息于特定目的利用范围内,应力求正确、完整及最新。(3)目的明确化原则:个人信息于收集时目的即应明确化,其后的利用应与收集目的相符,如果目的变更也应明确化。(4)限制利用原则:个人信息的利用,除法律另有规定或当事人同意外,不得为特定目的以外之利用。(5)安全保护原则:对于个人信息应采取合理的安全保护措施,以避免被窃用、篡改、毁损等情形发生。(6)公开原则:对于个人信息的处理,应采一般事项公开政策,例如信息管理人姓名及联络处、信息的种类、特定目的等事项,均宜公开。(7)个人参加原则:本人有权对他人持有自己的资料,行使一定程度的控制。(8)责任原则:信息管理人应负遵守前述原则的责任。

紧接着,他对保护个人信息的相关法律文件进行了介绍。网络服务提供者和其他企业事业单位在业务活动中收集、使用公民个人电子信息,应当遵循合法、正当、必要的原则,明示收集、使用信息的目的、方式和范围,并经被收集者同意,不得违反法律、法规的规定和双方的约定收集、使用信息。采集个人信息应当经信息主体本人同意,未经本人同意不得采集。但是,依照法律、行政法规规定公开的信息除外。企业的董事、监事、高级管理人员与其履行职务相关的信息,不作为个人信息。
最后,他提到大数据合规包括授权完整、数据脱敏、安全措施。
中国信息通信研究院高级工程师韩涵分享了题为《建设规范的数据流通环境》的演讲。她从以下三个方面进行了分享:需要明确的基本概念、数据交易所模式深度解析、建设规范的数据流通环境。
她提到数据交易和数据交换组成了数据流通。数据具有资产的属性,国内外相关政策,均赋予数据这一属性。从世界范围来看,公共信息资源归全民所有,开放是一种义务;从财产权、人格权来看,用户享有个人数据的所有权;从投入成本来看,企业对于去隐私后的数据集享有所有权。我国确认数据权利归属面临的困难是:数据归属单位不清、缺乏完善的个人信息保护法律体系。她从权、利、责三个方面对公共数据资源和非公共数据资源进行了介绍。以数据作为资产的角度,评估价值的方法主要包括:成本法,以资产建立时软硬件、人员等各项投入计算,补充历史和现实的差额以及长期运行费用;市场法,以当前市场相同或类似的已交易资产作为参照物;收益法,以预期收益折现评估资产。

首要责任是个人信息保护:世界范围内,保护个人隐私都是推进大数据工作的重点要求;发达国家对数据开放中涉及个人隐私的问题采用专人审查机制;初始为模糊期,最终形成白名单或黑名单;国内外数据开放网站均设立了“免责条款”;推动个人信息保护最终要依靠立法,地方法律(政府令)可先行。其次是数据全生命周期的管理责任。数据全生命周期包括:采集、清洗、融合、分析、销毁。数据全生命周期资产管理的内容包括:保护个人信息、做好规范记录(行为的原因、行为的内容、行为的结果)、经常比对结果。
数据交易所模式深度解析。公共数据资源不应被交易。公共数据资源的增值服务可以交易。数据交易所主要标的物存在三种模式:现货类交易,即数据产权交易;使用权的让渡;权益类交易。她提出数据交易所的模式面临诸多挑战,应该健全市场机制、开展数据交易试点、探索数据资产证券化新模式。以数据产权、使用权交易为基础,探索数据权益类交易,用市场的授权合理配置资源,分配数据带来的利益。

数据流通交易面临两个极端:黑市交易无序流动、数据冻结无法流动。数据流通需要统一的标准规范。应该建设规范的数据流通环境、完善数据流通的法律体系。
更多精彩内容,请关注直播专题 2015中国大数据技术大会(BDTC),新浪微博ImapBox@邮箱云存储,订阅ImapBox大数据微信号。
本文为ImapBox原创文章,未经允许不得转载,如需转载请联系market#csdn.net(#换成@)
本网页所有文字内容由 imapbox邮箱云存储,邮箱网盘, iurlBox网页地址收藏管理器 下载并得到。
ImapBox 邮箱网盘 工具地址: https://www.imapbox.com/download/ImapBox.5.5.1_Build20141205_CHS_Bit32.exe
PC6下载站地址:PC6下载站分流下载
本网页所有视频内容由 imoviebox边看边下-网页视频下载, iurlBox网页地址收藏管理器 下载并得到。
ImovieBox 网页视频 工具地址: https://www.imapbox.com/download/ImovieBox.5.1.6_Build20151120_CHS_Bit32.exe
本文章由: imapbox邮箱云存储,邮箱网盘,ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片,imoviebox网页视频批量下载器,下载视频内容,为您提供.
阅读和此文章类似的: 全球云计算
官方软件产品操作指南 (170)