我院两位博士生论文被国际顶级数据库会议VLDB 2016接受为长文
近日,我院两位博士生:刘钰和史巨伟,作为第一作者的论文由国际顶级数据库会议VLDB 2016录取,两位博士生的导师都是陆嘉恒教授。
第一篇刘钰的论文标题是:“Towards Maximum Independent Sets on Massive Graphs”。该论文主要解决在大规模图上近似计算最大独立集问题,提出了基于半外存的Greedy算法和Vertex-Swap算法框架,在I/O高效的前提下得到了非常接近最大独立集的解;并且在power law图模型下给出了较优的期望近似比(expected approximation ratio)。由于计算最大独立集是NP-complete问题(即使对power law分布的图),该论文首次在大规模图上提出了实际可行的较优算法。
第二篇史巨伟的论文标题是:Clash of the Titans: MapReduce vs. Spark for Large Scale
Data Analytics。在目前的大数据时代,有各种各样大数据处理平台。其中Mapreduce和Spark是两个主流的开源平台。本文通过一系列完整的实验比较了两个平台的优缺点。在相同的机器环境中,我们的实验表明:针对wordcount,k-means和Pagerank任务, Spark 分别比Mapreduce 快 2.5倍,5倍和3倍。但是针对Sort任务, Mapreduce 却比Spark快两倍。这个实验结果纠正了以往通常认为Spark 总是比Mapreduce 运行的更快的观念。本文对于目前大数据项目中的平台选择具有较好的参考价值。
注:VLDB会议是国际上著名的数据库学学术会议,是中国计算机学会认定的顶级学术会议之一(CCF A类会议),素有数据库理论与技术研究“风向标”、“数据库界的奥林匹克”之称,是数据库管理领域最杰出的研究和发展成果的实时传播场所,其论文的平均录用率低于20%。。
自1975年举办首届会议以来,数据库领域最新最好的技术都会在该会上汇报,在会议上发表的论文,将立刻为全世界数据库领域的学者和厂商所了解。