聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

【学者风采】丁晓锋——聚焦查询优化,关注数据隐私

2022-02-28 10:48 浏览: 1513558 次 我要评论(0 条) 字号:

丁晓锋

华中科技大学副教授、博士生导师。1982年生,2009年获得华中科技大学计算机软件与理论专业博士学位,毕业后从事博士后研究工作,合作导师为金海教授,2011年博士后出站留校任教。曾分别于2010年和2012年在新加坡国立大学和南澳大利亚大学从事计算密集型查询处理和数据隐私保护方面的合作研究。

长期坚持在大数据查询优化和数据隐私领域开展研究和教学工作,研究方向包括Top-k查询、Skyline查询、可验证查询与差分隐私等。

主持国家自然科学基金项目3项,中国博士后基金项目1项,CCF-华为胡杨林基金1项,作为技术骨干参与国家高技术研究发展计划(863)项目、国家重点研发计划课题、国家科技支撑计划等多个项目。在ACM/IEEE Transactions等国内外重要期刊及VLDB等国际顶级学术会议上发表论文40余篇,获批国家技术发明专利10余项。


面向分布式系统,聚焦查询优化

查询处理被认为是数据库领域的核心研究方向,多年以来,丁晓锋一直面向各种数据存储与管理系统,围绕查询优化做脚踏实地的研究,研究领域涉及索引机制、Skyline查询策略、Top-k查询策略、数据安全访问控制机制等多个方面。

在博士后流动站工作期间,虚拟实验因计算机仿真技术、多媒体技术和网络技术的逐渐成熟而开始兴起,其利用计算机技术来实现各种虚拟实验环境,实验者以交互的方式进行实验操作,可以像在真实的环境中一样完成各种预定的实验项目,最大限度地模拟真实实验的场景,并提供与实际实验的操作方法相类似的实践体验,为实验教学提供了全新的教学模式。丁晓锋参与了实验室牵头的科技部“国家科技支撑计划”建设项目“虚拟实验教学环境关键技术研究与应用示范”等SOA软件架构相关重要项目的研发工作,并担任了支撑计划项目的项目秘书,深入开展了虚拟实验的支撑平台、统一构件建模和虚拟构建的访问与查询等研究和开发工作。

为了进一步加强实验室的国际交流合作,提升课题组国际顶尖会议和期刊论文的写作水平,且考虑到新加坡国立大学在全世界具有超强的数据库科研实力与影响力,2010年,作为导师的金海教授积极推荐丁晓锋赴新加坡国立大学从事博士后访学工作。

丁晓锋回忆说,初到新加坡还发生了一件让他记忆犹新的“乌龙事件”。那时他从樟宜国际机场出来,还未来得及落实住处,就第一时间到新加坡国立大学(NUS)的School of Computing(SoC)报到。在办理完学校的报到手续后,负责人事管理的老师告知他,还需要到新加坡签证处办理短期居住证,于是第二天他马不停蹄的又去办理相关证件事宜。彼时大家的通讯联络都是靠手机,但丁晓锋还未办理当地的手机业务,也未开通国际漫游,这就导致他当天处于“人间蒸发”的状态,也让找不到他人的金海教授十分担心和着急。

原来,在他抵达新加坡的第二天,金海教授就因公赴新加坡国立大学参加NUS-中国高校计算机学院院长论坛。金老师与时任新加坡国立大学SoC院长的Ooi Beng Chin教授会晤完之后,便第一时间关心和询问昨天已经抵新的丁晓锋的情况,可是联系了所有人都找不到他。一直到下午4点多钟丁晓锋返回NUS,金老师悬着的心总算放下了。金老师语重心长,细致地叮嘱了丁晓锋很多学习和生活方面的注意事项,要注意安全,保重身体的同时,要踏踏实实的专研学问做好研究等等。

在新加坡国立大学从事博士后研究工作期间,作为骨干研发人员,丁晓锋参与了数据通用平台Unicorn的研究和开发,该项目旨在为支持图数据、字符串数据等复杂异构的各种数据库系统提供安全可靠、可扩展、兼容性高且功能齐全的数据聚合平台。针对各个独立系统中数据采集的多源性、类型的多样性、数据取值的多态性和数据描述的多义性等问题,该平台以服务的形式封装各个数据库子系统,使得所有数据库系统能保持相对独立、透明、并对外提供查询服务。

数据质量直接影响异构数据建模的精度和多方联合查询的准确度,丁晓锋提出一种基于概率相似度的数据质量提升方法,对每行数据根据属性定义、值域等设置过滤规则发现空值、重复、错误和不确定的数据,并利用概率值衡量数据存在的不确定性。该方法在项目应用中取得了很好的效果,并可以大幅提高分布式系统中的Skyline查询效率,最后在金海教授的建议下,将成果以论文的形式投到了分布式计算系统领域的国际知名会议International Conference on Distributed Computing System (ICDCS 2010), 并在当年的录用率只有14.4% (84 out of 585)的情况下,以长文的形式发表,这也是实验室成立以来发表的第一篇ICDCS。


依托云计算安全,关注数据隐私

2011年,博士后出站后,丁晓锋留校工作。依托实验室主流的云计算、大数据等研究方向,他参与了实验室多项相关重要研究项目,包括973计划项目“云计算安全基础理论与方法研究”、863计划课题“内存计算系统软件研究与开发”等。开展的研究工作包括:1)安全云搜索平台:针对如何提高加密数据多关键字top-k相似性搜索的效率和安全性,提出了一种随机遍历算法,该算法实现了对于具有不同键的两个相同查询,云服务器可以遍历索引上不同的路径,并且数据用户可以收到具有相同查询精度的不同结果;2)面向云平台的匿名图安全:针对大图数据发布的问题,提出了k-dec算法并定义了信息损失矩阵,用于大图数据集的效用度量,设计了新颖的隐私保护框架,其可以与图存储、匿名化、查询处理和分析进行无缝集成;3)面向云安全的深度学习平台:针对深度学习提取到的中间特征往往不具有抗隐私分析能力的问题,提出基于模型分割的部署模式,通过传输中间特征而非原始数据,对用户数据进行隐私保护。

随着5G的发展,以网络边缘为落点的移动边缘计算(MEC)将极大推动物联网设备的普及及其数据的爆发性增长。与云计算架构下的隐私保护查询不同,由于MEC计算具有低时延和位置认知等特征,这使得隐私保护查询在效率和安全上拥有先天不足。该系列问题已经引起学术界的普遍重视,这也是丁晓锋近年来的主要研究方向。相关技术和研究成果发表在了IEEE TKDE、IEEE TDSC、IEEE TIFS、VLDB、IEEE ICDE、IEEE TNSE、IEEE JIOT、ACM CIKM、ACM TDS、《中国科学:信息科学》等国际、国内重要期刊和会议上,成果得到了普遍的认可,并得到了国家自然科学基金等多个项目的支持。同时,基于上述可验证查询和云计算安全相关研究成果,也与华为公司在数据库安全防护、学习型安全基础索引和可验证Skyline查询等方面开展了项目合作,得到诸如CCF-华为胡杨林基金等项目的资助,相关技术将有力支持华为数据库OpenGuass的核心功能。


结合技术前沿,沉心教学工作

始终站在人才培养的高度上开展课程教学,多年来,丁晓锋承担了计算机科学与技术专业本科生《数据库系统原理》、《数据库系统原理实践》、博士生《数据挖掘高级论题》等课程的建设工作,包括课程大纲、课件编写、题库建设、实验内容等。在教学工作中,丁晓锋努力提高自己的教学站位,着重学生四个能力的培养,注重理论与实践相结合,通过备课、作业、实验、答疑等各个环节提高教学质量。特别是在课程内容讲授过程中,注意穿插生动实例和实际系统的演示,并在作业和实验环节要求学生及时反馈教学内容的难易点。同时,注重结合查询优化和数据隐私领域的前沿发展趋势,及时将新技术和新方法融入到教学中,提高学生的学习兴趣,并引导学生进行大数据及隐私保护方面的研究。多年来,他的教学方法取得了较好的教学效果,得到学生的普遍好评。

近年,随着中华人民共和国个人信息保护法的颁布,为从事隐私保护的科研人员的提供了更广阔的发展空间和更具有挑战性发展机遇,丁晓锋老师将抓住大好时机,以严谨的态度、饱满的热情和不懈的努力,继续在查询处理和隐私保护领域的科教道路上脚踏实地,锐意进取,以迈向新的高度。



网友评论已有0条评论, 我也要评论

发表评论

*

* (保密)

Ctrl+Enter 快捷回复