(CWW)2023 年7月4日-5日,由中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)主办的“2023 可信数据库发展大会”在北京国际会议中心召开。中国移动信息技术中心政企业务支撑中心副总经理梁恩磊受邀参加了“共话数据库产业自立自强高水平发展”圆桌论坛,论道我国数据库自立自强之路,探索新形势下我国数据库产业的可持续、高质量发展。
论坛围绕四个议题展开:
把握数据库发展趋势,迎接海量数据处理与存储场景下新挑战
(资料图片仅供参考)
梁恩磊表示,随着5G、物联网等业务的快速发展,数据库技术也面临新的要求和挑战。下一阶段,数据库最亟待解决的问题是如何进一步提升在海量高并发场景下的数据处理能力以及存储能力。
高性能数据处理:5G和物联网技术的快速发展,给数据库在超高并发场景下的数据处理带来了巨大的挑战。数据库仍需要不断降低响应时延、提高并发处理能力,进一步降低5G、物联网等技术带来的数据处理压力,以满足在线计费、实时信控等各类实时业务场景的需求。
海量数据存储:5G及物联网将以前所未有的速度生成海量数据。以物联网计费话单为例,每天产生数百亿条话单且仍在高速增长,对数据库的存储能力提出了更高的要求。因此需要数据库拥有快速扩展的能力,以便有效地存储和处理海量数据。
在应对方案上,梁恩磊表示,目前分布式是个大趋势,也是解决海量数据处理与存储的金钥匙。从传统的Shared-Everything架构,再到当前的Shared-Nothing、Shared-Disk等分布式架构,都是为了更高效、更低成本地解决海量数据处理问题。未来,随着分布式数据库的不断成熟,数据库在各类实时业务场景下对海量数据处理与存储的能力必将跨上一个新台阶。
关注核心技术动向,实现数据库领域新发展
梁恩磊表示,未来应重点关注数据安全、数据库智能化、分布式与云原生等技术方向。
首先是数据安全方向。随着国内大众的数据安全意识提升,以及《数据二十条》等政策标准的陆续出台,可以窥见安全审计、数据加密、身份验证等正在成为数据库领域新的关注热点。未来行业将逐步补齐传统数据库在安全领域的短板。
其次是数据库智能化方向。伴随着ChatGPT等技术的发展,向量数据库以及数据库与这类AIGC技术的结合逐渐火热。前者解决此类技术在训练过程中的数据库存储问题,后者通过与AIGC技术的结合可以极大地降低数据库的使用门槛。
最后是分布式与云原生方向。万物互联时代,数据库也将从传统的存储“人”的数据转变为存储“物”的数据,给数据库层造成的压力将提升成百上千倍。未来,通过存储和计算分离等分布式技术以及与云原生技术的结合,将实现计算资源、存储的弹性伸缩,极大地降低业务架构的复杂度,为高效低成本地解决海量数据的处理与存储带来更多可能。
围绕“三高一低”的主旋律,助力产业高速发展
梁恩磊表示,在未来十年里,数据库领域毫无疑问地将发生各种变革和创新,但不变的是数据库的发展始终会围绕着“三高一低”(高性能、高稳定、高安全、低成本)的主旋律。
在性能方面,以电信行业为例:在集中式数据库时代,业务场景主要是通话与短信,相对单一且数据量较小,采用传统的集中式数据库即可满足大部分业务对数据库性能和成本的要求。随着通信行业快速发展,对数据库的性能有了更高的要求,逐步过渡到分库、分表时代。同时各类垂直、水平拆分技术也在快速发展,在运营商中最常见的是按省份、地市进行垂直拆分,但分片间数据的不均衡、业务分片架构的高复杂度等因素给这类方案带来了巨大的压力。随着移动互联网、物联网、5G技术的发展,数据库也通过与分布式、云原生等技术的深度的结合有了更进一步的发展。
同理,业务对高性能、高稳定、高安全、低成本的诉求与数据库的发展也是相辅相成、互相促进的。围绕着“三高一低”的主旋律,数据库始终会将不断革新,持续满足业务发展需求。
深化数据库产学研结合,推动我国数据库行业高水平发展
梁恩磊表示,如果把数据库的自立自强比喻为一场攻坚战,那么学术侧主要提供武器的研究,产业侧负责武器的供应,应用侧则提供一线的实战。只有通过产学研的通力配合,才能实现优势互补,共同为数据库技术的发展奠定坚实的技术基础,实现从“攻出来”到“用起来”的紧密衔接。
为了进一步推动数据库产业的高质量快速发展,中国移动信息技术中心充分发挥多应用场景优势,联合深圳大学和香港科技大学(广州分校)成立广东省重点实验室,并作为组长单位参与信通院组织的数据库创新实验室,针对数据库产业、技术、生态发展等问题及对策展开研究,助力数据技术的联合攻关。
梁恩磊表示,科技自立自强是国家强盛之基、安全之要。未来,中国移动将进一步加深与政府、高校和研究机构的合作,共同推进数据库技术研究成果的产业化进程,推动国内数据库技术迅速走向世界前列。