logo

十年沉淀,国产数据库研制之路 | CCCF精选


嘻嘻
嘻嘻 2024-01-14 23:42:35 16249 赞同 0 反对 0
分类: 资源 标签: 大数据
阳振坤,CCF会士,教育部首批长江学者,原生分布式关系数据库 OceanBase 创始人,北京奥星贝斯科技有限公司首席科学家。2023年2月,CCF授予阳振坤2022年“CCF王选奖”,以表彰其在计算机及相关领域取得的显著学术成就和对社会的重要贡献。笔者受CCCF动态栏目之邀采访了他。

阳振坤,CCF会士,教育部首批长江学者,原生分布式关系数据库 OceanBase 创始人,北京奥星贝斯科技有限公司首席科学家。2023年2月,CCF授予阳振坤2022年“CCF王选奖”,以表彰其在计算机及相关领域取得的显著学术成就和对社会的重要贡献。笔者受CCCF动态栏目之邀采访了他。

 

与阳博士的访谈安排在晚上8点,这是他的日常工作时间。去往会议室途中,我们经过一个普通的工位,阳博士说这是他的办公工位,我们才知道这样一位带领上千名研发工程师进行数据库研发攻关的专家,并没有为自己设立一间独立的办公室,而是与所有的工程师一起站在研发一线。

图片

 

 

投身国产数据库研发

 

 

问:阳博士,感谢您接受CCCF的专访。您早期在北京大学从事教学科研工作,后来进入工业界开展数据库管理系统产品创新研发。能否与大家分享一下,您被评为教育部首批长江学者特聘教授后,为什么选择离开高校前往企业界?

 

阳振坤:感谢CCF和社会各界的认可。我离开高校前往企业界的原因有三。其一,我的导师是王选院士,他经常教育我们要把研究立足于工程之上,并在此方面有长期的积累。我个人偏向于软件研发,北京大学在文理方面氛围浓厚,相较而言,企业界在工程上的投入会更多一些。其二,激光照排系统经过一些年的发展逐渐进入成熟阶段,我希望尝试更多自己感兴趣的新东西。其三,我认为互联网是一个重要的时代发展机遇。综合以上原因,我下定决心离开高校进入企业界。

 

问:您早期主要关注激光照排系统的研发,是什么原因让您选择数据库作为研究方向,并且开始了长达十余年的OceanBase研制?

 

阳振坤:我认为在选择研究方向时,应该做四点考量:其一,技术顶天(门槛高、难度大);其二,产品立地(市场大、价值高);其三,行业契机(要求高、需求新);其四,舍我其谁(我们能做、别人难做)。前两点是王选老师总结出来的,后两点是我总结出来的。在我看来,数据库有着广泛的市场规模与价值,同时在技术上具有较高的门槛和难度。

 

在互联网早期,用户数量少、数据少,大家都是用终端机访问数据,数据库的并发量并不高。随着互联网的发展和移动端设备的普及,用户数据快速增加,数据库的并发量快速增加,成本激增,导致业务矛盾变大。这种现象用一种很形象的比喻就是“小马拉大车”。此外,这个变化对数据库的可靠性提出了更高的要求,因为一旦数据库出现了问题,整个业务系统就会垮掉。同时,由于数据量太大,在实践中会把交易系统(TP系统)与分析系统(AP系统)演化成两套独立系统,使很多实时报表业务无法实现。

 

那时,数据库产品已经落后于工业界的实际业务需求了。但已有的数据库已经足够稳定,用户没有理由选择一个新兴的数据库,加之数据库本身研发投入大,周期又长,这就导致新的数据库难以诞生。

 

2010年,淘宝和支付宝的后台数据库系统承受着较大的压力(有6500个数据库),让我深刻地意识到集中式数据库发展到头了。并不是所有的用户都能用大型机,并且国际上一直没有更好的解决方案,这让我看到了机会。

 

但是我在研发OceanBase项目前并不是做数据库研究的,只有一些分布式系统经验。因此,这个项目在立项时是备受争议的。

 

问:在这么多年的研发过程中,最令您难忘的事情有哪些?您能否谈一谈遇到过的困难以及是如何克服的?

 

阳振坤:对我而言,长期的困难就是团队的人力和物力总是有限的。我需要权衡和判断今年该做什么,明年该做什么,然后与团队的骨干达成一致。

 

OceanBase项目刚成立的时候,并不是我们定个目标,然后就开始招人干活,而是需要先找到业务(用户)。如果没有业务,我们就不知道哪些功能该做,哪些功能不用做。

 

但早些时候,没有业务愿意用我们提出的新产品。那个时候我们连一行代码都没有写,但找到了2个潜在业务。一个是淘宝的收藏夹(属于二级业务),我敢干;另一个是淘宝的购物车(属于一级业务),我不敢干。这两个业务的特征都是有2张大表的连接(join),用于查看商品价格、是否下架、是否有促销等。

 

收藏夹的表有几百亿条数据,商品表有10亿条数据。对于数据库的连接操作来说,如果是一个大表和一些小表连接就较容易,采用将小表全部加载到内存的方式就解决了。而如果是两个大表做连接就非常困难。我在技术上做了冒险:基于日志结构合并技术(LSM)做了实时物化视图,原理是周期性地在特定时间(比如每天凌晨2点)更新物化视图,假设在那个时间点,数据库中的数据是静态不变的,那之后所有的商品修改都先暂时放到内存中。其实对于购物车业务,也可以这么做,但是一旦出问题,对淘宝来说损失将是巨大的。因此OceanBase项目的第一个业务,我选择了影响较小的淘宝收藏夹业务。

 

后来,我负责支付宝业务线。那时我可以算是一个“大销售”,主要任务是寻找业务用户。支付宝的主要问题在于它占用了很多存储空间。因为其业务规模大,又没有足够的资金购买昂贵的高端磁盘阵列,只能使用中低档阵列,发生故障的概率非常高。一旦发生故障,就需要把整条业务线的人聚集起来应急:把所有网关数据都拿出来,与备份库比对是否缺数据。支付宝业务线的同事说只要能解决这个问题,就用我们的系统。我们采用三个副本的技术,通过副本投票修复数据。当时关系数据库没有系统地做这部分,但是副本投票确实能够解决这个问题。虽然当时我们的数据库系统有很多其他问题,但是如果能够把他们最痛苦的问题解决掉,他们就再也不用半夜把整个业务线的人员拉起来查找问题了。这个问题一解决,很多业务线都愿意用我们的系统了。

 

所以,工作的核心是要做好“大销售”,抓住合适又恰到好处的痛点问题——我们能够做出来,又能解决他的问题。而像购物车业务,我觉得我当时做不了,所以就不做。

 

 

数据库管理系统技术创新与未来趋势探讨

 

 

问:您是怎么让大家愿意使用OceanBase的呢?

 

阳振坤:兼容性是我们做得最成功的一个功能。在OceanBase开发过程中,我们实现了各种数据库方言,与MySQL和Oracle兼容,显著地降低了业务迁移的成本。因为没有用户愿意被特定产品绑定,因此我们不做自己的数据库方言。一个典型例子是国内某大型保险公司,他们曾经使用了数百套集中式数据库来承载核心系统,一年时间内,仅微调了部分业务,就全部迁移到了OceanBase上。受益于OceanBase的高压缩特性,他们的机架节省出2/3的空间。而且我们不需要用昂贵的高可靠存储和高可靠服务器,在性价比上有巨大的优势。

 

如果一个产品想要活下来,就一定要覆盖尽可能多的用户。我们的系统设计除了帮助大型企业,还能够帮助中小微企业,这些企业的业务往往具有曲线特点(即有访问波峰和波谷)。如果用传统方案,他们的业务机器处理能力必须能够覆盖其业务曲线的峰值,但在其他时间就会导致资源浪费。而如果使用我们的分布式方案,就可以利用分布式扩缩容能力更好地贴合业务曲线,也就带来显著的成本优化。

 

问:2021年OceanBase提出要做单机分布式一体化,2022年底做成落地。为什么选择做单机分布式一体化?

 

阳振坤:OceanBase的整个系统是依靠蚂蚁集团的业务场景成长起来的,支持的是大业务、大数据量和大访问量场景,而很多小用户、中小微企业并不具备这种场景。在蚂蚁的业务场景下,每台机器的配置都非常高,普遍有512 GB以上的内存,80~100个核,为此我们有非常多的功能优化都是针对这种高配置服务器的。例如,在这种机器上,系统启动时会把所有的调度和管理功能全部开启。但对于1个4核的机器,自然不能这么做,不然这个机器就没有资源运行了。为此,我们做了一次大的架构调整,对于小机器或者低配机器,我们将参数降低,并随着访问量和数据量的增加,逐步增加管理资源,这些管理资源都是按照百分比调整的,不是完全线性的。

 

问:您觉得OceanBase在关系型数据库这个赛道有哪些优势?

 

阳振坤:OceanBase几乎所有的模块都是我们自己做的。其他很多数据库的实现大都使用了开源或者已有的模块,这对整个系统的性能影响比较大,也就导致其系统性能与OceanBase 差距比较大。现在整个蚂蚁集团,包括支付宝上的数据库全部运行在OceanBase上,我们有好几万台数据库服务器在昼夜运行。即使在业务低谷的时候,每秒钟都有几百笔交易,在业务高峰的时候可能有几万笔,甚至几十万笔交易(只要出现1秒钟的问题,就至少有几百个人受到影响),我们有足够大的场景持续打磨数据库。

 

问:在很多应用场景下,数据库的一些问题都是通过测试发现的。但原则上,应该是在设计和开发的过程中尽可能把问题避免掉,而不是通过测试的方式发现问题。您怎么看待这个问题,以及有没有一些切身的体会?

 

阳振坤:测试只能证明一个系统有bug,而不能证明一个系统正确。OceanBase是我人生中第一个不亲自写代码的系统。以前开发模块、系统,我都要写很大一部分代码,但是这次我决定不写,而是把这个系统想清楚。只要功能想清楚了,大方向是对的,哪怕最初的性能不是很高,都是可以逐渐改进的。但如果整个算法和方向是错的,那就很难达到目标。所以很多时候,先把事情想清楚,然后再去做,这是最重要的。

 

问:OceanBase是唯一一个在事务处理和数据分析两个领域测试中都获得过TPC测试世界第一的数据库。OceanBase后续的发展方向是什么?

 

阳振坤:OceanBase的核心是分布式架构。只要有线性扩展能力,那么上榜TPC就不是问题。在这个榜单中,我们的硬件成本只占整体价格的百分之十几。

 

2014年时,OceanBase提出要做一个真正的分布式系统,2021年时,OceanBase决定做混合事务分析处理(HATP)系统,后面要把这两个特征持续做好。

 

问:未来除了关系型数据库以外,其他专用数据库还会继续发展吗?还是说未来会统一?

 

阳振坤:我认为各种不同类型的数据库还会持续发展的,就像网上购物平台,有淘宝、天猫和京东,还有很多垂直的电商,数据库也一样。

 

问:OceanBase未来会从关系型数据库向外延展吗?

 

阳振坤:关系型数据库占据了整个数据库市场的大部分,OceanBase的优势目前还没有完全发挥出来。我们目前主要在做联机事务处理(OLTP),在联机分析处理(OLAP)上的投入还要进一步加大。至于是否外延,核心点还是要回答“为什么我们能够做,而别人做不到?”因此,目前我们的核心想法还是基于OLTP场景,在其周边进行扩展,最后慢慢扩展到OLAP。

 

 

开源协同创新发展

 

 

问:OceanBase为什么不在开源的基础上进行修改,而是选择完全自研?

 

阳振坤:我认为理解一两百万行开源代码的难度比自己写一遍还要高,而且我们难以完全掌握它。此外,最关键的是开源的代码本身不是分布式的,而是集中式的,难以用此参与到国际竞争中。

 

问:OceanBase在2011年和2021年做了两次开源,有什么考虑因素吗?您是如何看待开源对软件发展和产品商业化的影响呢?

 

阳振坤:开源对于数据库来说是很重要的。数据库成熟和成长的周期太长,并且需要让大家广泛接受。如果数据库是一个很封闭的系统,就没有人愿意用了。2011年OceanBase的开源没有及时更新,主要是因为团队人力不足。目前OceanBase只维护一个版本,如果维护两个版本(即开源版和闭源版)会把人累死(和安全相关的以及极少数功能是闭源的)。OceanBase的开源用户数量增长速度很快。

 

我认为开源对产品商业化没有什么负面影响。第一,使用OceanBase的用户越来越多的是公有云用户,他们本质上是买服务,没有必要买开源版。第二,企业级用户本身就有一定的付费意愿。综合这两点,OceanBase开源后对业务的促进还是比较明显的。

 

问:对于数据库而言,每一行代码每秒钟都可能运行几百万次,这对每一行代码的质量要求很高,而外部贡献者贡献的代码质量难以把控。开源社区里除了用户以外,贡献代码的人多吗?

 

阳振坤:有一些。我们有一套代码审核的流程,不管是内部提交的还是外部贡献的,代码的审核流程都是一样的。

 

 

人才培养与寄语

 

 

问:数据库研发难度很大,同时对软件工程有所理解的人才就更加稀缺,您有什么特殊的人才培养体系吗?

 

阳振坤:我自己做软件工程比较多,会把我的想法、思路告诉学生。今年是OceanBase项目设立的第13年,很多早期的骨干都留了下来,有不少人加入这个项目组已经超过10年。经过多年的培养,这些人都有了丰富的工作经验,是宝贵的财富。

如果您发现该资源为电子书等存在侵权的资源或对该资源描述不正确等,可点击“私信”按钮向作者进行反馈;如作者无回复可进行平台仲裁,我们会在第一时间进行处理!

评价 0 条
嘻嘻
粉丝 0 资源 63 + 关注 私信
最近热门资源
当“ventoy启动盘”遇到“主板安全启动”  404
最近下载排行榜
当“ventoy启动盘”遇到“主板安全启动” 0
作者收入月榜
1

prtyaa 收益354.19元

2

风晓 收益207.84元

3

IT-feng 收益197.65元

4

zlj141319 收益173.23元

5

777 收益169.89元

6

1843880570 收益160.33元

7

信创来了 收益103.8元

8

Fhawking 收益99.6元

9

克里斯蒂亚诺诺 收益91.08元

10

技术-小陈 收益79元

请使用微信扫码