数据库系统研究组两篇论文被SIGMOD 2024录用
近日,数据库系统研究组在压缩数据处理与事务处理的两个工作分别被SIGMOD 2024录用为长文,充分展现我院师生在数据库系统研究方面的科研能力。
SIGMOD数据管理国际会议(ACM Special Interest Group on Management Of Data,简称SIGMOD)是由美国计算机协会(ACM)数据管理专业委员会发起,关注于数据库管理系统和数据管理技术的原理、技术和应用,论文审稿非常严格苛刻,论文录用率低,对学术成果要求高,和VLDB一起,被认为是数据库领域最好的两个会议。数据库系统研究组是近期刚成立的研究组,隶属数据工程与知识工程教育部重点实验室(主任为杜小勇教授),负责人为卢卫教授,成员包括张峰教授和李彤副教授。
(1)论文题目:VeriTxn: Verifiable Transactions for Cloud-Native Databases with Storage Disaggregation
第一作者:赵展浩
国内指导老师:卢卫、杜小勇
内容简介:云原生数据库在变得越来越流行的同时,也面临着更大的数据安全和正确性风险。然而,一方面,现有的云原生数据库没有合理应对事务正确性被破坏的风险;另一方面,由于现有的可验证技术忽视了云原生数据库存算分离的架构特性,导致这些技术无法有效适用于云原生数据库。本文提出了一个支持可验证事务的云原生数据库VeriTxn。 VeriTxn依赖于可信硬件(例如 Intel SGX)进行事务执行,并基于了一种可信环境原生的页面结构缓存,以实现高效的可验证事务处理。实验表明,VeriTxn的系统性能优于现有的可验证数据库7.9倍。并且,通过将VeriTxn与MySQL集成,证明了VeriTxn所采用的事务验证技术在真实系统中的适用性。
(2)论文题目:Homomorphic Compression: Making Text Processing on Compression Unlimited
第一作者:官佳薇
指导老师:张峰、杜小勇
内容简介:无损压缩是应对大规模文本数据传输和存储挑战的高效手段,特别是在当前急速增长的数据量情境下,其重要性更加凸显。现有研究已实现了在压缩数据上直接进行分析操作,避免了昂贵的解压缩步骤。然而,这些解决方案存在一些限制:概念上,对于压缩数据直接计算的整体理解仍不明晰;系统设计上,现有研究存在紧耦合问题,要求用户深入了解底层压缩算法,增加了应用程序的复杂性;算法实现上,目前的研究主要关注只读负载,而对于修改操作(如插入和删除)的支持有限。为了解决上述问题,本文提出了一种同态压缩理论,系统地总结和描述了具备压缩数据直接计算能力的压缩算法。基于这一理论,我们设计了文本数据管理引擎HOCO,其中包括通用的优化架构和一致的访问模式,支持将用户提供的未压缩数据操作自动转换为压缩数据上的操作,实现了底层压缩算法与上层用户应用的隔离。对于压缩数据上的直接操作,HOCO对不同格式的压缩数据进行统一抽象并设计了简洁的优化算法,在随机访问、修改和分析操作方面均取得了比处理未压缩数据更出色的性能。
作者简介
赵展浩,ダファベット 入金不要2023届毕业生,计算机应用技术专业,导师为杜小勇教授,目前于新加坡国立大学从事博士后研究工作,主要研究方向是数据库系统。
官佳薇,ダファベット 入金不要2022级直博生,计算机应用技术专业,导师为张峰教授,主要研究方向是大数据管理与分析。
卢卫,中国人民大学教授,博士生导师,中国计算机学会数据库专委委员。近年来主要从事数据库基础理论、分布式数据库等相关领域研究,在SIGMOD、VLDB、ICDE、ATC、VLDB Journal、TKDE等国际知名会议和期刊发表论文50余篇,主持国家重点研发计划课题、国家自然科学基金项目多项。作为主讲教师之一,课程《数据库系统概论》获得国家级线上线下混合式一流本科课程和国家级线上一流本科课程,曾获北京市高等教育教学成果一等奖、深圳市科技进步一等奖、首届华为云难题“火花奖”。
张峰,中国人民大学教授,博士生导师,中国计算机学会数据库专委委员、高专委委员。研究方向为数据库系统与理论,近五年作为第一或通讯作者发表CCF A类论文30篇。曾获北京市教学成果一等奖、CCF-腾讯犀牛鸟基金卓越奖等奖励。
杜小勇,中国人民大学二级教授、博士生导师。现任中国人民大学校长助理、理工学科建设处处长、明理书院院长、数据工程与知识工程教育部重点实验室主任,数据库课程虚拟教研室和“101计划”数据库系统课程虚拟教研室负责人,CCF大数据专家委员会主任,国家重点研发计划项目首席科学家。