重点实验室举办数据科学与工程学术报告会,多位青年学者受邀作报告
为了更好地了解工业界的实际需求以及平台的使用情况,加强同行之间的学术交流,促进中国人民大学计算机学科的发展,11月14日下午14:00-17:30,来自滴滴大数据与数据挖掘研究院的李佩博士、苏州大学的李直旭副教授、刘冠峰副教授和刘安副教授四位青年学者受邀作报告。
李佩博士结合过去自己在LinkedIN公司的工作经验,给我们介绍了LinkedIN公司的大数据系统PYMK及其相关的生态系统。同时,也对当前流行的大数据处理平台Hadoop、Spark及各自的生态圈作了一个系统的介绍。此外,他还介绍了滴滴出行在大数据技术面临的机遇与挑战。最后,李佩博士结合自己在英属哥伦比亚大学的读博经历,向在校生推荐了大数据与机器学习领域必读的经典教材,并对他们未来的择业提出了一些中肯的建议。
李直旭副教授报告的题目是“借助Web大数据来处理数据质量问题”。李直旭副教授从六个维度( 错误数据、不一致性、丢失数据、过时数据、不适用、不确定性)介绍了数据质量问题普遍存在的一个基本事实,并简要地综述了围绕每一个维度处理数据质量问题的相关工作。结合其近年来的相关工作,以关系数据为依托,李直旭副教授分别介绍了如何借助Web中的大数据来进行记录连接(record linkage)和记录的补全工作。
刘冠峰副教授报告的题目是“社交网络与信任”。刘冠峰副教授首先介绍了社交网络及基于社交网络的各类应用,并着重指出社交网络中参与人之间的信任关系是整个社交网络各类应用的基础。基于此前提,刘冠峰副教授对其发表在ICDE‘2015(数据库A类会议)上就如何快速有效地挖掘出符合参与人之间预设信任关系的方法进行了详细的阐述。
刘安副教授系统地介绍了加密轨迹数据上的相似性计算问题。除了阐述了加密轨迹数据上的相似性计算面临的挑战,其还详细地介绍了如何通过重写三个操作符(欧氏距离计算、最大最小选择、条件执行),来实现加密轨迹数据上的相似性计算,并从理论上证明了该方法的安全性和可靠性。
以最近开源的大数据处理系统Greenplum为背景,Greenplum系统开发团队的刘奎恩博士即兴分享了其在大数据时代进行数据库开源的背景与意义。
除了在校师生,本次报告还吸引了来自工业界和学术界(包括CCF大数据协会、中科院、EMC/Pivotal公司、百度、先锋创投等)的相关人士近50人前来参会,大家提问踊跃,本次报告得到圆满的成功。
附:报告人简介
李佩博士:2010年硕士毕业于ダファベット 入金不要数据库与智能信息检索实验室,2014年底博士毕业于英属哥伦比亚大学计算机系数据管理与挖掘实验室。2013年6月到8月以及2015年初到9月,工作于美国加州山景城LinkedIn公司SNA(搜索、网络与分析)部门,担任关系推荐系统工程师,在大数据管理与挖掘第一线从事研发工作。2015年10月至今,在滴滴出行研究院负责数据挖掘项目。在知名国际期刊和学术会议上(包括KDD、ICDE等A类国际会议)发表论文近20篇,是数据挖掘知名会议SDM’10的最佳论文获得者。
李直旭副教授:2002-2009年就读于ダファベット 入金不要攻读计算机学士和硕士学位。2013年毕业于澳大利亚昆士兰大学获计算机科学博士学位。2013-2014年就职于沙特阿卜杜拉国王科技大学(KAUST)做博士后研究员,并于2014年入职苏州大学计算机科学与技术学院。目前主要从事数据质量,大数据应用,数据挖掘与信息抽取等领域的研究工作。曾参与国内外多项科研基金项目的研发工作。在IEEE TKDE, EDBT, CIKM, WWWJ等顶级国际期刊与知名国际会议上发表论文30余篇。
刘冠峰副教授:2013年毕业于澳大利亚 Macquarie 大学,获得计算机博士学位。 博士论文获得当年澳大利亚最佳博士论文提名。2013年1月至2013年8月就职于Macquarie 大学 (Research Fellow) 和 悉尼科技大学 (Visiting Research Fellow),并于2013年9月入职苏州大学。目前主要从事可信计算、社交网络信息挖掘、图数据库等领域的研究工作。曾参与多项澳洲科研基金项目研究。在ICDE、AAAI、TSC、FGCS、WWWJ、ICWS,等重要国际期刊与知名国际会议上发表论文20余篇。
刘安副教授:2009年获得中国科学技术大学和香港城市大学联合培养博士学位,2009年至2013年在香港城大-中国科大联合高等研究中心担任Senior Research Associate,2013年底加入苏州大学。研究方向主要集中在数据管理与分析方面,包括时空数据库,数据安全与隐私,云计算与服务计算等。在国际期刊和学术会议上(包括IEEE Trans., CCF推荐的A/B类国际会议)发表论文50多篇。