数据库,作为企业商业活动的基础命脉,其发展经历了很多阶段。随着大数据和云计算时代的到来,更是获得了全新的定义。11月6日,腾讯Techo开发者大会在北京召开。腾讯云副总裁、腾讯数据平台部总经理蒋杰表示,经过10年的积累,腾讯大数据平台的算力资源池目前已有超过20万台的规模,每天实时数据计算量超过30万亿条,腾讯已经成为中国实时数据计算量大的公司。
腾讯云副总裁、腾讯数据平台部总经理蒋杰
开源生态大繁荣是腾讯愿景
此次在Techo大会现场,腾讯宣布正式开源资源管理平台核心TKE和分布式数据库TBase,随着在大数据开源领域的开源逐步加速,腾讯正在成为中国大数据领域开源最全面的厂商。
蒋杰表示,从开始的技术引进、局部优化到如今的自主创新,腾讯的大数据技术也在实践中不断完善和创新。“十年前,腾讯管理几百个节点都很困难,调度性能差,规模上不去。后来为了有效解决计算能力和大规模集群问题,腾讯自研调度器,相对原生调度器性能提升150倍,大大提升了集群可扩展性。现在,腾讯大数据平台每天有1500万个分析任务,每天数据接入条数达35万亿条数据。”
在谈到开源的初衷以及腾讯的优势时蒋杰表示:“开源我们是希望更好的回馈社区,希望开源生态能有大的繁荣,也希望能有更多的开发者和团队能加入到这么一个生态来,这样的话整个数据库的功能会越来越多。其实对于腾讯来说,首先是有影响力,能够吸引更多的开发者和腾讯一起研发;另一方面整个开源生态的繁荣,能够让开源软件的功能更加完善,从而让腾讯的业务获得更好支撑,这是我认为我们去做开源主要的两点”。
在谈到本次开源项目之一的TBase时蒋杰表示,TBase数据库目前应用于政企金融等诸多行业,具体的案例有云南省公安、数字广东及十多家其他传统行业企业,应用广泛且场景众多。在多数据库管理方面,TBase作为替代传统集中数据库的新一代分布式数据库,目前效果良好。一些关键应用实现了迁移及生产上线,TBase经过专门设计,很好的做到了HTAP,可以同时支持高效的OLAP和海量的OLTP。
行业合力才能促进开源生态繁荣
现在在各行各业都在谈论自主可控,在数据库领域关于去IOE的呼声也是日渐高涨。由于可以增强国家的核心竞争力,摆脱我国对国外产品的依赖,带动经济社会转型升级。自主可控已成为国家战略安全和产业转型升级的基础,是摆脱依赖的根本出路。
关于开源和自主可控,蒋杰认为,没有基础去谈自主可控是很难的,而开源给自主可控提供了一个比较好的物理基础。在这个基础之上来谈自主可控,可以通过吸收到自己以外的一些能力和资源,更好的让自己自主可控。
腾讯在2017年就已经把第一代计算平台Angel实现了开源。到了2019年,新开发的Angel3.0平台也已开源,现在已经有像华为、小米、新浪微博等公司在使用这一平台。今天大会上,腾讯又宣布开源了资源管理平台核心TKE和分布式数据库TBase。未来,会开放漂移计算、联邦学习数据库等这样的能力,我们都会陆续去开源。腾讯也希望能够由众多行业企业一起,共建一个繁荣的开源生态。如果好东西永远都留在自己家里,那其实这个生态很难去繁荣。行业内的诸多企业合力而为,才能带来开源生态的欣欣向荣。
最后蒋杰表示,腾讯做的开源产品更多是为了回馈开发者。在这样的背景下,腾讯目前对开源没有直接商业化的要求或者诉求。事实上,全世界很多企业都在做开源,其中云计算公司的开源项目最多,如果这些开源软件在云上跑的越多,我相信也会给云公司带来更多间接的商业价值和资源,至少服务器网络等服务会大规模增加,这也是我们应该值得去期待的一个时代。