6 月 13 日,记者获悉,腾讯云数据库三篇论文再次入选数据库行业顶会 sigmod,被 sigmod 2022 research full paper(研究类长文)收录。
本次被收录的研究成果中,新型数据结构设计、ai 智能调参优化等均属于业界首次提出。腾讯云数据库多次入选 sigmod,表明腾讯云数据库在存储、智能管控等方面的积累与前沿创新获得了国际权威认可。
sigmod,全称数据管理国际会议(special interest group on management of data),是由美国计算机协会(acm)数据管理专业委员会(sigmod)发起、在数据库领域具有最高学术地位的国际性学术会议。
第一篇入选论文题目为 hunter: an online cloud database hybrid tuning system for personalized requirements,由腾讯云数据库团队和华中科技大学合作完成,在 ai 智能调参优化上取得进一步突破。
通俗理解,数据库的参数设置多达几百个,这些参数控制着数据库的性能表现。专业运维人员会花大量时间,根据经验来调优数据库的参数,以匹配不同硬件、需求和业务场景。如何利用 ai 技术解决数据库系统性能问题变得越来越重要和紧迫。
在此篇论文中,腾讯云数据库 tdsql-c 团队提出了混合调优系统 hunter,主要解决了如何在保证调优效果的前提下显著减少调优时间的问题。实验表明:随着并发度提升实现调优时间准线性降低,在单并发度场景下调优时间只需 17 小时,在 20 并发度场景下调优时间缩短至 2 小时。
第二篇入选论文由中国人民大学和腾讯云数据库团队合作完成,题为 compressdb: enabling efficient compressed data direct processing for various databases,论文针对压缩数据的直接操作与处理,提出一项新型数据库处理技术——compressdb。
面对当下指数级增长的数据量,行业普遍使用数据压缩来减少存储空间。在大数据管理系统中,直接在压缩数据上进行操作,可以获得存储空间的节约和处理性能的提升。但是,当前的此类系统只关注数据查询,而一个完整的大数据管理系统必须支持数据查询和数据操作。
本研究提出并实现了新型数据库技术,利用上下文无关文法来压缩数据,通过新的数据结构和算法设计实现对语法规则进行解析,compressdb 支持直接对压缩后的数据进行数据查询和操作,并且支持各种数据库系统。实验表明,compressdb 平均达到 40%的吞吐量提升和 44%的延迟缩短,并实现 1.81 倍的压缩率。
第三篇入选论文由腾讯和北京大学合作完成,题为 blindfl: vertical federated machine learning without peeking into your data。针对数据隐私安全问题,该论文提出了一个新的纵向联邦学习范式 blindfl,可支持多种特征数据类型,且可以在半诚实安全假设下证明其安全性。实验结果表明,blindfl 可有效保护参与方的隐私数据,并具有更高的运行效率。
腾讯历来重视数据库领域的研发,通过校企联合实验室共建,面向青年学者的 ccf-腾讯犀牛鸟基金,腾讯犀牛鸟科研专项等与高校、科研机构构建“产学研”一体的长期合作,将技术研究成果转换为应用落地,校企联合持续输出前沿技术创新与示范性应用。
此前,腾讯云数据库 tdsql 曾多次亮相数据库三大顶会 sigmod、icde、vldb,以及数据科学领域的顶级期刊 ieee tkde 等。腾讯云数据库 tdsql 将继续加大对数据库基础研究创新、数据库产学研合作生态的建设投入,充分释放领先技术的红利,助力国产数据库学术人才培养和技术创新生态建设发展。
评论