《面向城市智能服务的数据治理体系与共享平台》项目组 赴京东城市(北京)数字科技有限公司调研
2021年6月29日,在项目牵头单位中国人民大学的带领下,项目负责人杜小勇教授、各课题负责人和课题代表前往项目参与单位京东城市(北京)数字科技有限公司进行应用需求调研。京东数科总裁郑宇先生会见了参会代表。杜小勇教授介绍了本次调研的目标,重点包括技术创新联合体VLAB的建设情况、京东城市数科在数据治理中遇到的痛点与难点问题、以及各课题组围绕项目目标的课题任务实施进展情况。
京东城市数据产品部负责人鲍捷博士向参会人员介绍了京东智能城市的发展历程、研发中心和“一核两翼”体系下的建设项目。他还介绍了京东城市在协同办公、社会治理、数字经济和数字生活等方面的建设情况,包括为北京市政府提供以任务为中心的协同办公工具,在南京开展“一网统管”场景,在广汉建立国家农业产业园大数据平台解决疫情中线上交易的需求,在成都天府新区落地智慧治理中心项目,此外在20多个省份的53个城市落地数字经济产业园,打造了40多条产业链,吸引4000多家企业入驻。京东城市将进一步推动产学研一体化,深入开展高校合作、国企协作。
京东城市市域治理产品组算法工程师易修文博士介绍了江苏智慧园博项目的开展情况。目前,京东集成了多个厂家,为江苏智慧园博项目打造了技术底座和创新底座,实现五网融合、数字孪生和三屏联动,通过实现园区状态一网感知、园博数据一网共享、景区治理一网统管、游客服务一网通行和景区运营一网通享,提升了园区管理精准化和游客体验数据化。
鲍捷博士还简要介绍了南通市域治理现代化项目,该项目是技术创新和体制创新的共同融合,为政府针对某一方面的决策而服务。他回顾了智慧城市建设过程中在调研阶段、需求阶段、设计阶段和实现阶段出现的“数据有没有、数据在哪里、数据怎么样、数据不好用”等问题。项目组围绕这些痛点问题进行了讨论,各课题承担单位结合工作进展中的技术和经验提出解决方案。课题一负责人卢卫副教授针对“数据有没有、数据在哪里”的痛点问题,介绍了课题组在对象化治理的研究工作:通过课题组建立的基于国家和行业标准的本体库,利用深度学习技术,对信息孤岛中的数据(表中的字段、表名)与本体库中字段进行映射,解决信息孤岛数据的标准化问题。课题二代表柳熠针对遗产系统数据开放难和可信共享的问题,介绍了课题组在基于黑盒式互操作的服务接口生成、基于数字对象体系的数据服务标识以及区块链技术,通过课题组的数据服务化引擎可以有效解决信息孤岛的数据开放问题,通过数字对象和区块链平台实现异主异构数据的统一标识和可信溯源和监管。课题三负责人刘世霞教授针对“数据不好用”的痛点问题,介绍了课题组在训练数据质量提升方面的研究工作:为解决监督机器学习中训练数据的弱标注、含噪声等质量问题,采用数据驱动和知识驱动相结合的思路,利用领域信息,搭建了数据-信息-知识相融合的多层次训练数据质量提升理论框架。主要研究:(1)有标注数据质量分析与提升方法;(2)无标注数据质量分析与提升方法。
项目负责人杜小勇教授分别从数据、组织、应用层面给出建议,在数据层面要抽取元数据;在组织层面签署协议,数据交易访问要留痕;在应用层面,快速形成基本数据服务供应。避免低水平重复进行数据汇聚,要构建数据方法论和工具,用对象图谱把基于人口、法人的本体给构建出来,做出诊断工具来衡量满足标准规范的成都,避免用人员去衡量。在数据质量方面,数据跟实际预期不匹配就需要进行回溯,通过数据接入、数据审核、数据异常识别做数据质量的确认。
依托技术创新联合体,各课题负责人与京东城市围绕城市数据治理中的痛点与难点问题,规划了后续的研究方向,项目组下一步将按照技术联合创新体的工作模式,结合项目任务书的研究内容开展核心技术攻关。