11月13日,开放计算中国社区技术峰会(第二届OCP China Day)在北京举行,超过600多名IT工程师和数据中心从业者参加了此次大会,来自Facebook、Intel、微软、浪潮、百度、腾讯、阿里、NVIDIA、诺基亚、中国移动、希捷、燧原科技等开放社区成员参与了峰会,分享了在开放计算技术的最新进展和创新实践。
5G和AI等新技术的普遍应用和快速发展,给数据中心带来更多新兴场景。在OCP开放计算社区,面向AI加速器芯片统一的OAI、面向5G边缘计算场景的OpenEdge和开放网络标准的SONiC正在成为新一波开放计算产业化发展的重点方向,这些技术正在OCP(Open Compute Project,开放计算项目)社区得到积极的响应。在本次OCPChinaday大会现场,来自浪潮、百度、阿里、朝亚、东方物探等企业的嘉宾围绕开放计算价值,开放计算行业的特质,开放计算的未来进行了讨论。
以下为圆桌讨论实录:
主持人:E企研究院首席分析师张广彬
圆桌讨论嘉宾:
沈荣,浪潮信息副总裁、服务器产品部总经理
王富,阿里云资深技术专家服务器产品首席架构师
王雁鹏,百度主任系统架构师
赵元辅,天津朝亚运维总监
熊健,东方地球物理公司研究院设备物资部副主任
张广彬:大家好,在开始讨论前我想问大家一个问题,和每个人的生活及会议主题有很大的关系。天猫购物节刚过,想问各位11月11号,这除了和购物节、光棍节有什么关系,这和我们行业有什么关系?
观众:OCP和天蝎成立的日子。
王雁鹏:大家知道为什么叫天蝎?
观众:天蝎座。
赵元辅:ODCC的忠实粉丝。我们是2011年成立天蝎这个项目。当时百度、阿里、腾讯,大家一起说服务器上做点什么事,大家碰了一下。开会的时候就是11月,说起一个名字吧,大家想了想也没有什么,功科男没有好的想法就说天蝎吧,宏大的愿望就是12个星座,每一个星座都起一个名字吧。
张广彬:2011年11月1号这是碰头的日子,天蝎,然后2011年11月11日发布。同一年,OCP稍微早了一点,也是2011年成立。不管从哪一个算,先已经迈入第十个年头。过去的十年里,开放计算领域有非常大的进展,也包括OCP来说现在有超过200个会员,台上坐着至少4家会员。阿里、百度、浪潮、朝亚都是会员。
今天探讨三个话题,开放计算价值,开放计算行业的特质,开放计算的未来。阿里和百度共同成立天蝎项目,演变成了ODCC,现在也是OCP基金会的铂金会员。由你们谈对开放计算的认识,这个作为开场是非常合适的。
王雁鹏:OCP或者ODCC组织给整个行业带来大的改变,是云计算基础设施体系下的一个真正融合产业链的机会。因为原来大家都知道,我们基本上数据中心服务器,每一层都有各自不同的设计,都是隔的比较远。再往上的应用系统,那就差的更远了。我们当年为什么起这个,也是百度、阿里、腾讯率先进入了十万规模,一年可能买十万规模级别的服务器的阶段,这样大家才有机会一起做联合创新。开放的硬件平台给大家带来了大的一个机会,就是软硬件一体化的设计,一体化的融合。英特尔的同事分享的很有意思,一条曲线,英特尔的CPU的TDP五干年都维持在一百瓦左右,原来选择85瓦和105瓦的。为什么最近几年一下到三四百瓦,甚至是更高。核心的推动力就是后端大家的融合,数据中心真的和服务器同样的设计,与CPU同样定规格,这样的情况下推动,大家可以看到这是对整个生态链的推动和演变。刚才谈到了液冷,我相信在我们这种融合数据中心的推动下,它会比我们想象预料快的多的节奏去真正的让大家进入液冷的时代。
张广彬:其实我觉得九年或者十年IT行业当别的行业三年多,王雁鹏作为行业的元老头发这么茂盛不容易。
王富:对我本人而言,对OCP或者ODCC是新人,但对数据中心的基础设施是老兵。从阿里的情况看,我正好借此机会也跟大家汇报OCP方面的工作。2017年正式加入OCP,其实我们加入就全面拥抱OCP组织,OCP开始,数据中心建设,一直到最终新的一些异构互联技术都做了开源或者合作。刚才讲了液冷也是大家了解的,整体也开始部署。另外,前面的ODCC会议上也开源一个架构,也是希望跟浪潮以及共建整机柜的规范,然后加快交付和研发。我们在美国这边的OCP也讲了关于开放的技术,如何利用OCP的技术提高整体的软硬结合,这也是我们想在OCP里和大家一起共建的。人工智能、AI领域,我们想重构阿里技术和业界的同仁怎样共同,我们称之为是ODLA的技术,也是基于存储的技术。最后我们在前面的新的方向上,比如说在异构也好,或者说互联也好,我们做了内存领域的架构,希望后面作为一个新的点和大家共建。
张广彬:王富作为阿里的代表非常谦虚,但刚才听的内容还是很充实的,包括ODLA。浪潮也是一个标签,所有的开放计算组织的深度参与。从一开始到现在一直是很看好的,而且越来越看好开放计算。浪潮的角度,希望沈总再系统阐述您的观点。
沈荣:浪潮从第一分钟和百度一起实现天蝎的所有一些想法,把它变成了这样一些事情。这么多年一路走过来,我们的确参与了所有的比较大的开放计算的标准组织。做到现在,我们越来越坚信开放计算就是未来。今天为止,如果说只是一个厂商推一个标准往前走的话,基本上讲直白一点就是死路一条,也没有人跟着你发展。刚才讲到了价值的问题,从两个方面吧,用户角度看,阿里巴巴和百度是非常大型的互联网厂商。不光是互联网厂商,对所有的用户看到了调研,第一件事情为什么要找开放计算,它们想找到这个最新的技术,最成熟的技术。因为很多的东西是封闭的不知道好坏,用了才知道。开放的话,用了以后大家知道怎么回事。还有成本,大家很看重成本,成本是大家希望通过开放计算的路能够解决的事情。还有就是安全的问题。前面演讲嘉宾讲了白盒化的问题,黑盒闭源到开放白盒化的事情,这对用户的价值就是我们作为厂商要追求的事情。从长商的角度来看,供应链的角度来看有两件事情,开放计算真的是能够使得我们的业界创新变的更快。因为今天刚刚说的一个厂商单独关起门做事情真的很慢,今天的社区的活动,社区所有的人都是参与者,大家对技术挑战一同研究和指导方法,创新的速度会加快。创新本身加快以后,对浪潮这样的厂商,我们也感谢促进必须跑的快,跑的慢就没了,浪潮非常坚信开放计算带来的价值,也希望后续与在座所有会员一起把开放计算做的更加红火,让更多用户受益于开放计算。
张广彬:我个人的观点,因为大家可能也知道OCP刚开始成立,它的发布契机是Facebook交付了自建的第一个数据中心,这是契机。数据中心一开始就是OCP很重要的项目,天蝎是开始从服务器开始,2014年改名为ODCC,把数据中心加进来。但我个人的感觉,其实很多在国内很多时候开放计算的场合,其实大家更多的还是,阿里、百度、腾讯,这些自身既有服务器,既定制服务器,然后又自己建设数据中心的用户,其实好像第三方的数据中心,纯数据中心厂商发言的并不是很多。今天请来了天津朝亚的代表赵总,一会儿自己介绍。主要想你从你们算是第三方数据中心的角度,虽然定制可能也是你们的客户之一,从你们的角度怎么看待开放计算?
赵元辅:OCP的标准对我们意味着什么?首先意味着我们具备一个和其它的友商不同的能力,就是我们可以基于这个标准快速的去覆盖用户的需求。刚才英特尔的人说,我们要大面积的利用这个液冷,那我们需要这个硬件。如果不具备OCP条件的,你让它在现有的风冷的数据中心做液冷会有一个漫长的改造过程,而且对现有的设备会有影响。朝亚是全亚洲第一个OCP全套验证的数据中心,所以这是一个能力。对我们来讲也是一个机会,大家都谈到了,其实我们前面谈到了数据中心存储网络,其实这些都是可以解决的,因为这都是有备份的。而且出现问题的,风火和水电出现问题都是人为造成的。我们一直在探讨这个问题,有没有做成一个无人职守的数据中心,这是一个长期的话题。在一个宽度、高度,以及整个尺寸都是预设定的环境中,我们当然可以利用现在的机器人的技术,让它安排做巡检,出故障的时候采集第一手的信息,这样可以降低人为因素。数据中心的运维者提供机器人的服务,通过远端和iot的方式做到远端无人职守,这是未来数据中心发展的机会。OCP给朝亚的就是给大家提供更快服务的能力,未来给大家提供更丰富的服务,这是OCP给我们最重要的价值。朝亚第一个数据中心设计的时候,开始申请的时候一直想拿到OCP,就是这样的思路。
张广彬:关于OCP认证在下一个环节还会详细的讲。不管从服务器的角度,还是从数据中心的角度,大家都是在努力的让开放计算的技术能够受惠于更多的行业。时间长了,大家还是容易有思维惯性,还是会觉得开放计算是大的互联网和云计算公司搞出来的,适不适合其它的行业?熊主任作为能源行业的代表,能源行业也是很重要的,有可能拜登上台了以后美国的能源行业还是会受到一定的影响。
熊健:大家都是OCP的会员单位,我是代表能源客户,我来自东方物探。按照传统的思路做数据中心,我们自建的数据中心和云服务厂商建的可能经历,设计,能力和物力的差别很大。我们都是按照思路去做好了以后,最近几年发现OCP以后与浪潮合作,我们也引进浪潮天蝎的整机柜的交付。感觉以前的应用,要集成一套集群,从交付上一般都要在30-40天,集成大概在半个月左右。但通过整机柜可以快速的交付,应用上可以提前预知。我们把研发环境集成在应用,大大节省了运营交付的时间。我们发现通过OCP的整体交付以后,我们的机柜的密度性能和管理方便性有提高,因为很多的标准,任何的标准如果是封锁的都是各自成体系的。从传统的行业应用角度,也是可以引进天蝎整机柜的模式。我一直有一个想法,不管是在新建数据中心,或者说改造数据中心的时候。从未来的发展角度去看,OCP的模式是一个发展的未来。并且利用很多开放的接口,开放的管理,可能会给大家带来更低的TCO。
张广彬:感谢熊主任的分享。熊主任说周围的都是会员,就我不是会员,是不是有点丢人。其实根据我们短暂的当了一年会员的经历,还有之前的了解,其实当会员不是那么容易的,要交钱,还得贡献人和时间。如果不想生产产品,或者说不想怎样的,作为一个用户好好用就可以了。强调我们是会员,可能一部分原因也是说我们挺苦逼的。
第二个环节,熊主任也提到了开放计算与其它的行业,超大规模的互联网、云计算以外有没有那么大的规模。这里很重要的一点,根据我粗浅的了解,天蝎也好,开始主要想的就是改革,或者说传统的机柜19英寸的机柜,其实有的设计还不是很理想,大家去做了很多的工作。但现在也越来越重视灵活性了,因为可以给大家提供20英寸或者说各种各样的选项。天蝎3.0也体现了这样的趋势。王雁鹏作为元老,你经历这些年的历程,可以讲讲对整机柜的产品和标准怎样用在其它的千行百业。
王雁鹏:我们在设计第一代和第二代产品的时候,更多的就是极致的能效和性能的考虑。我们尽量打破所有的界限,把所有的能够想到的东西设计好,所以有20英寸,因为整个布局会更加合理。为什么会有集中的散热效率更高,集中的供电,我们做了非常好的方案。我们第一阶段也是主要在内部使用,如果大家关注的话就可以看到,天蝎3.0的标准其实就是在思考现在的问题。我们怎样能够把这个技术真正的推广到更多的行业,更多的产业,与现在业界实际的趋势融合,实际的情况融合。天蝎3.0有几个很重要的点,做了不同规格的节点,1U、2U,有的时候1U不见得是好的,1U那么大功率密度的很多的情况下不需要,所以我们有1U、2U的节点,这是节点的温度。我们把散热,散热原来是整机柜的,整机柜的散热带来比较大的问题,跟你机房的配置关系都非常大,要调优,把风扇的东西调到最优。而且也基本上没有说可以节点之间互相切换,如果说要搬迁的话这种能力都很弱,我们把散热放在了整个单节点去。做了兼容19英寸的方案。一切的努力都在思考一个问题,希望更多的现实场景可以用起来,因为我们还有很多的机房不是我们完全定制的东西。行业内的能不能兼容,很多的机柜原来已经设计好了就是19英寸,我们能不能把这些技术引入进去。一方面是我们自己的考量,自己做云和这些以后有更多的需求,除了自建的数据中心需要跟更多的合作伙伴合作,很多都是合作伙伴的数据中心,我们怎么做兼容。另外,更大的就是希望产业更快的享受技术,推动产业更快速的进步。
张广彬:紧耦合变成松耦合,先优化再兼容。像百度和阿里这样的公司,咱们先不说公司本身的规模,先从基础设施的规模来说都是国内前几名的。能力越大,责任就越大,所以你们在各个开放组织里都是顶级的会员,而且也参与很多的项目。不仅是整机柜了,百度,OAI、OAM,阿里有很多开放的项目。从阿里的角度,你们怎么把这些年积累下来的能力以什么样的形式输出给其它的千行百业。它们用你们的云是一种方式,其它的方式也是大家很感兴趣的。
王富:作为会员也是有压力的,压力挺大。对我们来说,整机柜怎样构建研发和交付的快速高效率,这是我们在ODCC一直讲的。除了整机柜以外,其实我们在核心部件,比如说三星的同仁讲到的,如何做存储。对我们来讲,比如说在单个的部件开源里也贡献了一些思路。对于软硬结合是一个非常好的技术,但挑战在于同样需要组织的成员大家一起配合,包括部件的技术,软件的技术,应用的技术结合起来。我们在OCP里,把如何与应用的结合开放出来,大家共同的共建这样的一个部件的技术,也更加丰富我们这个形态。现在讲数据爆炸性的增长,但另外一个就是你所有的CPU提升的时候,是为了更多、更高效的处理数据。但另外一个趋势,我们愿意把自己的技术开放在OCP的组织里与大家共建。因为这里不光涉及到存储,还有计算,还有计算和存储的配合,这也是一个多厂商协同的一个架构共同建设。我们希望通过这样的一些技术来提升整个数据中心的能效,或者说是单功率下的这个计算能力,也是想与大家一起共建的点。这是我们最近也已经在做的事。
张广彬:回到朝亚,大家也提到了对OCP数据中心,对OCP场景规范的支持。微软可能要选择数据中心的时候,微软也是OCP非常重要的一个成员。微软可能会觉得有了OCP以后,我可能会多看你一眼,看看有没有更多的机会,这是我的想象。除了这个以外,吸引不同的用户,对你们业务以及不同行业的用户来说,有多大的价值?
赵元辅:我们现在都知道,刚才大家也谈到了硬件技术和软件技术的迭代非常快,我们现在看到的15千伏安的机柜到处都是,但它的极限在哪里我们都不知道。当技术迭代比较快的时候,你需要更快的更新这些东西。如果你的场地没有准备好,你的场地不支持设备,你会被一个很简单的例子挡住,比如说承重不够,不具备新的技术也需要等。刚开始做新技术的技术,只是在一个领域做一些尝试的时候,很难在不影响其它机柜的情况下进行更改,这是一个很漫长的过程。对OCP的客户来说,如果它用我的技术中心,它在技术迭代的时候只需要划定一个区域告诉需要是什么,我们根据标准灵活的开始。更新的时间从几个月到几天,这无疑是很重要的。但非OCP验证的数据中心里有问题,这很难把握。OCP验证过的数据中心可以给大家提供的作用很大,你说现在不是OCP,愿意用OCP的产品,你也可以有这样的优势。
张广彬:其实我们前面提到了阿里、百度、朝亚,大家都会想到超大规模的数据中心,是不是不是超大规模就无地自容了,不是这样的。而且大是一个相对的概念,东方物探在能源行业里是非常大的公司,而且在计算需求上有可能总的服务器有可能没有那么多,但高性能计算方面非常有代表性。我也看过这个报告了,OCP很关注互联网和云计算之外的场景的拓展。高性能计算垂直的应用这也是很重要的增长点,东方物探已经部署了天蝎整机柜,但目前的量现有的处于评估阶段,后续有没有加大投入力度的打算。你们还有什么建议可以提出来,让我们能改进的改进一下。
熊健:我们和浪潮建立了战略合作伙伴关系,所以有了天蝎在我们这应用的结果。我们对高性能计算的算力要求基本上可以说是极致的,因为很多算法的实现没有那么强的算力,所以没有真正的实现。像汽车开着一样太耗油。最近勘探技术也在进步,我们现在讲大数据,其实原来讲大数据体,就是单个的特别大,几十T,甚至是几百T也是很常见的。单纯的数据处理存在的问题,将来我们在天蝎上对行业用户来说需要改进的地方,数据在中间运算的过程中希望能够快速的转出。需要的存储要特别量大,我们现在存储的量不是很大。新的技术在推广以后对存储的要求更大了,我们现在在提交算力的时候,一般传统用的就是GPU的架构增加算力。对网络的要求也是非常严格的。如果下一步继续合作的话,与用户的应用结合起来。不同的行业是不一样的,对东方物探来说还是需要改进的,需要把IO系统提升一下,算力可能是没有问题的。易用性和可管理性是没有问题的,我们现在也有现成的机房,智能的环境也有了,当时设计的还是比较先进的,有一定的富余的空间,期待着更加积极的合作。
张广彬:您可以自信地把相对这两个字去掉,就比较先进。台下有希捷,台上有阿里,不管是用硬盘还是SSD,加入到开放社区的大家庭里,大家都可以共同的推动技术和应用更快的进步。但这里很重要的一点也是要有厂商做整合的,包括像浪潮在致力于开放方计算,对每一个开放计算的社区都很了解。因为有很大量的用户,所以站在浪潮的角度,怎么帮助开放计算走进更多的行业?
沈荣:浪潮蛮自豪的,因为作为会员很辛苦,会员要承担责任的,不是交钱就可以做会员的。要贡献产品,去年开始OCP说鼓励怎样把开放计算真正的用起来。过去的一段时间,本人跑了很多的各行各业,有一件事情高兴地告诉大家,今天社区的活动第一个注册的是一个银行客户。我们老老实实的把这件事情,把好的东西宣传出去,而不是酒香不怕巷子深让人家找上门。我们的确也看到社区活动吸引很多国内的比如说新的海归回来,他们在建数据中心的时候说找最新的,用OCP的事情,而不是别的事情。我们浪潮还是积极的让更多人知道有这样的东西。百度做了天蝎的事情,Facebook做了OCP创意的一些事情。很多的时候是以自己的应用角度极致化的设计。浪潮是一个用户,我们也是厂商,更好的进行平衡不同用户之间的需求,综合过后变成各行各业都可以适用的产品。还有一件事情就是怎样把很多的用户需求反馈回来,回到社区去,让大家共同解决问题,比如说IO性能要突破。这样社区才会更加繁荣,开放计算才能更加有活力。
张广彬:不管是铂金会员,还是金牌银牌,社区会员,还是前会员,还是将要成为会员,大家都可以来在这里。我今天上午主持了连线的关于OAI和OAM的环节。微软是服务器项目的负责人参加,他们说就是把大家的聪明才智连接在一起。以前百度有一位人也说过一句话,独行快,众行远,这是社区的价值。
展望未来是最后一个环节。我们刚才说其实百度有OAI、OAM,在这方面其实百度也是积极的发起者之一,一定的程度上说百度是因为这个进入OCP。这是牵一发而动全身,熊主任肯定也清楚,不管是TPU,还是GPU,功耗比CPU高一倍,供电的要求上来了。跟王雁鹏交流说机柜密度达到什么样的水平,利用12伏也就不够了,现在也有48伏了。未来不管是48伏,还是OAI、OAM,这些都是很重要的未来发展方向。这部分在今天不同的专场里都有嘉宾介绍了,但我觉得王雁鹏很重要的特点就是特别关注和业务的结合。希望你能够结合着业务的需求和发展趋势发表对这些问题的观点。
王雁鹏:我个人理解数据中心底层硬件的发展在云的环境下有两个大的趋势,一个就是异构计算,现在算力是一个大问题,刚才熊主任也提到了各行各业的算力都是一个大问题。原来CPU的时代一定已经过去了,以后是越来越多的异构,或者说GPU也好有更多的异构芯片引入。另外就是极致的结耦,以后网络的技术会越来越强大,我们以后可能就是计算存储。刚才王富也提到了,以后的内存可能都要提升,我认为这是整个硬件技术大的问题。对应这个,刚才也提到了OAI,48伏这些技术,这些技术也是应对机构必须做的,就是咱们原来12伏的,现在基本上往上走12伏的已经解决不了问题了。48伏的其实最早是谷歌提出来的,就是谷歌最先进入OCP的组织,就是因为要推48伏这件事情。我觉得这是一个共识,就是48伏这件事情一定要做。现在和英特尔都在探讨这件事情,就是48伏是一个必然的选项。对OAI来说,异构的芯片也越来越多了,我们怎样保持这个生态的繁荣,不能锁定在一家。OAI大的好处是共建一个好的生态,大家可以各自发挥各自的所长,一起来共建这件事情。从应用的角度更不用说了,刚才也提到了,对算力的需求是无止境的翻倍。对算力的翻倍,那一个GPU不能完成这件事情,怎样组织一千个GPU做这件事情。包括存储也是,做更加高速的存储,组织一个更快的网络然后来做这件事情。这件事情需要整个行业推动的,这不是一家公司可以从上到下的方案全部做好,我认为这是OAI大的一个愿景和驱动力。
张广彬:刚才王雁鹏说CPU的时代已经过去了。大家最近也知道陈佩斯已经回到了央视的舞台,他当年有一句话,没有想到英特尔浓眉大眼的也开始做GPU了。很自然的有一个问题,你解决了GPU、TPU的问题,那怎么用起来。
王富:未来已来,展望未来。但提到未来不提AI好像不行。刚才王雁鹏也提到了对多生态的问题,包括底层的芯片和上层的应用,也包括框架的多厂家问题。阿里使用过程中,其实也遇到了这样的问题。我们也相信大家在业界使用的过程中也有这样的问题,具体是什么样的?大家都想GPU之外找到一个能够同等使用算力的芯片。往往这迁移的过程中,为什么GPU用的很好,就是因为生态非常的完整,大家拿到了GPU很快可以用。但如果是非GPU的芯片,大家用起来可能库不全,可能框架对接不完善。遇到这样的问题望而却步就用不起来,其实阿里也同样遇到这样的问题。但怎么解决呢,我们提到了一个ODLA,我们做的事情就是把底层芯片和框架之间定了标准的接口,接口的目的是什么?如果芯片厂商和框架厂商两头对接的话,你就可以凭着硬件底层的差异。上半年积极的开放到了OCP的整个组织里,希望芯片的厂商和框架和算法的厂商一起建这个生态,这样将来对快速的从一家厂商迁移到另外一家厂商,或者说软硬结合提升性能,这是非常快速的一个标准。我们非常希望和OCP的社区,把这个事情做好,也应对好这个未来已来的场景。这就是我们ODLA标准。
张广彬:非常好,大家各展所长,补齐产业链中的各个环节,缺一个环节都用不起来。现在大家经常说ABC,突出的特点都是规模大。如果从技术上溯的话,很多都是在高性能计算领域实践过的技术,有更大规模的应用。比如说异构计算,包括很多的网络,有很高的功率密度,我相信站在熊主任的角度来说都有很多作为过来人的经验进行分享。
熊健:作为企业一直关注AI在企业关注数字化的应用,我们很早以前就组织了专门针对AI的攻关小组,主要就是高校和企业、以及云计算厂商进行联合攻关。我们的应用主要就是解决AI计算,我们有自建的数据中心,AI的硬件平台有。我们主要就是软件的生态上,我们还要开发行业的软件,就是通过软件去利用AI的技术,把以前的代码移植,在AI的生态环境下运行,这是我们的一个难题,也是难点。我们的很多应用不一定都适合AI的环境,我们就是通过专家的努力找出了十几个模块,比如说精度不够的,提高效率的模块,规范AI在软件改进方面的应用。我们做了一些探索,也取得了很好的成果。现在和浪潮合作,我们的效率达到95%以上,这个效率比传统的高级技术人员的准确率都高。AI技术确实给我们企业带来很多成本和计算上的优势。
张广彬:熊主任着重讲了在软件和应用的层面上你们做的工作,不管怎么说软件和应用最后还是要落在基础设施上,如何高效的实现。我们经常说阿里、百度、腾讯,为什么你们做互联网运算的要自己建设数据中心呢,其实也是很多传统的数据中心,像刚才王雁鹏讲的80万机柜是什么概念,我们可以说其实北京很多的数据中心20万的机柜有很多。别说40万了,40万就已经非常高了,如果不说高性能计算行业的话,中国大多数的数据中心里。我们数据中心怎么提高功率密度,满足未来用户的需求,包括满足液冷的挑战。请朝亚分享一下,怎样让行业变的更好,怎样变的更加先进,你们肯定有自己的想法。
赵元辅:从数据中心本身的设计来看只有两个目的,把我们的费用降到极致,我们的PUE1.3在之前都很低了,现在谈1.15,朝亚内部实测是1.14,我们不停地在追。我们需要把数据的可用度提高到100%,我们要让技术迭代更快一点。在此之上看到技术的发展,15千伏安的机柜和20千伏安的机柜都有了。我们是利用什么样的办法拥抱新的技术?我觉得很重要的一点就是,我们自己是做不了的,今天我觉得这个环节很重要的就是把各个角度的,把这个产业的各个参与者都拉到一起,可以更好的阐述我们的需求是什么。我很多年都参与IT行业,国外标准和国际标准就是达到了就可以了,中国的市场规模是远远领先于这个世界,很多的时候是我们发现了问题让别人弥补,这是OCP对朝亚的价值。希望通过OCP社区,我们从各方面更加清楚的知道用户需求是什么,然后在数据中心的设计和技术迭代上可以跟上。当你们的技术前瞻到了那个地方的时候,我们朝亚的基础设施也到,我们可以一起发展,这是很重要的。
张广彬:人越多,人和人之间产生更多的连接,其实就像AI一样模拟更多的神经元之间的连接,才能有更快的计算的处理,更大的工作负载。站在浪潮的系统整合者,或者说是一个系统方案的提供商的角度,除了这些以外,还有哪一些趋势是大家需要特别关注的。
沈荣:技术的角度,各位都讲了很多。第二个就是用户的角度,用户角度关心什么会变成趋势的事情。我们自己拜访很多的客户,很多人不是说买几万个柜子才算事,很多人一次买两个,很有意思吧,觉得这个东西很符合应用的事情。如果我们今天听到很大的声音,讲到了资源的利用率,很多的人买了以后没有用到。前面一个嘉宾,英特尔的嘉宾讲数据中心的利用率只有50%,硬件设备。这方面怎么用起来,前面很多人谈到了资源池华的事情,我想这是需要解决的事情。很多的用户说怎么做到池华的事情,怎么真正的提升资源的利用率。从用户的角度和需求来说,这是一个趋势。另外,人会变的越来越懒,是不是通过机器来管理这些机器,而不是通过人管理。如果说一个人看七八十台的机器,超过这个数就不行了。现在很多的数据中心是监控的状态,而不是通过算法和数据模型,历史使用的特点,来自动化的运行,无人职守。用户非常需要这个技术。
这么多的数据,大的问题就是安全,安全的事情会变成一个巨大的话题。这个安全的事情,各个国家有各个国家的要求,不同的标准。社区在这方面怎么解决这样的问题,可能也还有待社区和会员的共同探讨,看怎样解决这个问题。
张广彬:谢谢沈总发言。给我的感触,企业关注不是大小的问题,而是效率的问题,快和慢的问题。不是大鱼吃小鱼,而是快鱼吃慢鱼。大的公司不但大,其实像阿里、百度、腾讯,它们的利用率比传统的数据中心高,我们还是希望回到今天的主题,就是让开放计算的成果更快的,更加广泛的应用到其它的互联网和云计算规模不是那么大,但同样甚至是更需要提高效率的行业。我想这也是我们在座的几位,有4个会员,我们把会员费补上。OCP、ODCC,希望可以更快的迎来300个会员,500个会员,1000个会员,大家共同开放,共同进步。
再次感谢各位嘉宾。谢谢大家。
主持人:开放社区的成功离不开各位。
OCP CHINA DAY2020 直播回看:https://zhibo.ifeng.com/video.html?liveid=136937