我院两位博士生论文被国际顶级数据库会议VLDB 2016接受为长文

更新时间：2015-09-09 11:06:06 浏览量：

近日，我院两位博士生：刘钰和史巨伟，作为第一作者的论文由国际顶级数据库会议VLDB 2016录取，两位博士生的导师都是陆嘉恒教授。

第一篇刘钰的论文标题是：“Towards Maximum Independent Sets on Massive Graphs”。该论文主要解决在大规模图上近似计算最大独立集问题，提出了基于半外存的Greedy算法和Vertex-Swap算法框架，在I/O高效的前提下得到了非常接近最大独立集的解；并且在power law图模型下给出了较优的期望近似比（expected approximation ratio）。由于计算最大独立集是NP-complete问题（即使对power law分布的图），该论文首次在大规模图上提出了实际可行的较优算法。

第二篇史巨伟的论文标题是:Clash of the Titans: MapReduce vs. Spark for Large Scale

Data Analytics。在目前的大数据时代，有各种各样大数据处理平台。其中Mapreduce和Spark是两个主流的开源平台。本文通过一系列完整的实验比较了两个平台的优缺点。在相同的机器环境中，我们的实验表明：针对wordcount，k-means和Pagerank任务， Spark 分别比Mapreduce 快 2.5倍，5倍和3倍。但是针对Sort任务， Mapreduce 却比Spark快两倍。这个实验结果纠正了以往通常认为Spark 总是比Mapreduce 运行的更快的观念。本文对于目前大数据项目中的平台选择具有较好的参考价值。

注：VLDB会议是国际上著名的数据库学学术会议，是中国计算机学会认定的顶级学术会议之一（CCF A类会议），素有数据库理论与技术研究“风向标”、“数据库界的奥林匹克”之称，是数据库管理领域最杰出的研究和发展成果的实时传播场所，其论文的平均录用率低于20%。。

自1975年举办首届会议以来，数据库领域最新最好的技术都会在该会上汇报，在会议上发表的论文，将立刻为全世界数据库领域的学者和厂商所了解。